职位详情
五险一金
年终奖金
绩效奖金
带薪年假
子女福利
节日礼物
优秀员工奖
定期体检
餐费补贴
通讯津贴
岗位描述:
1、负责设计和开发分布式爬虫系统,可以实现高并发、分布式多平台抓取和分析;
2、负责研究网页和app的防屏蔽规则,提升网络抓取效率和质量;
2、负责研究网页信息抽取、数据清洗、数据入库等研发和优化工作。
任职要求:
1、大学本科及以上学历,计算机相关专业,2年爬虫开发经验;
2、精通Python,熟悉Scrapy框架或其他分布式爬虫框架,有设计开发分布式网络爬虫系统经验和海量数据爬取及处理经验优先;
3、熟练掌握主流爬取技术,如协议破解、模拟点击等;熟悉掌握常用框架,如Scrapy、Selrnium、Puppeteer和Splash等;
4、熟悉MySql、Redis、MongoDB等数据库,熟悉Linux系统、mq等消息队列;
5、熟悉网页抓取原理及技术,熟练掌握正则表达式、XPath等网页信息抽取技术;
6、有良好的逆向思维,有解决过市面上主流反爬技术经验者有限。
(待遇面议)