岗位职责:
1.负责持续跟踪分析爬虫系统的技术缺陷,对策略架构做出合理地调整和改进;
2.完成对指定网站的信息采集配置及维护工作;
3、负责网页信息抽取等研发和优化工作。
任职要求:
1. 熟悉linux平台,有5年以上Python或java编程经验,熟悉xpath、正则表达式等知识;
2. 常见网站的反爬技术如js加密混淆等;
3. 熟悉Web等数据抓取的工作原理及流程;
4. 具有优秀的团队合作和沟通协作能力,善于学习,乐于分享,能承受较大工作压力;
5. 熟练使用Mysql/MongoDB/Redis者优先;
6. 有互联网主流网站重点数据大规模采集经验者优先。
Copyright sciencehr.cn Corporation. All rights reserved. 中国科学人才网 版权所有 京ICP备2022022249号-1
地址: EMAIL:850081096@qq.com
Powered by sciencehr.cn