logo
更新:2024-04-26
爬虫工程师
1.4-2万
北京东城区  | 1-3年  | 社招
去申请
收藏
举报
职位详情
五险一金
年终奖金
绩效奖金
带薪年假
子女福利
节日礼物
优秀员工奖
定期体检
餐费补贴
通讯津贴
岗位描述:
1、负责设计和开发分布式爬虫系统,可以实现高并发、分布式多平台抓取和分析;
2、负责研究网页和app的防屏蔽规则,提升网络抓取效率和质量;
2、负责研究网页信息抽取、数据清洗、数据入库等研发和优化工作。

任职要求:
1、大学本科及以上学历,计算机相关专业,2年爬虫开发经验;
2、精通Python,熟悉Scrapy框架或其他分布式爬虫框架,有设计开发分布式网络爬虫系统经验和海量数据爬取及处理经验优先;
3、熟练掌握主流爬取技术,如协议破解、模拟点击等;熟悉掌握常用框架,如Scrapy、Selrnium、Puppeteer和Splash等;
4、熟悉MySql、Redis、MongoDB等数据库,熟悉Linux系统、mq等消息队列;
5、熟悉网页抓取原理及技术,熟练掌握正则表达式、XPath等网页信息抽取技术;
6、有良好的逆向思维,有解决过市面上主流反爬技术经验者有限。
(待遇面议)

工作地址
北京-东城区77文创园
公司介绍
国研大数据研究院由国研科技集团全资设立,是在国务院发展研究中心大数据应用研究与指导委员会和宏观决策大数据实验室直接指导下,开展创新型研究和数据增值服务,是中心利用大数据实现研究方式创新的重要平台。
研究院以“让决策更早更好”为使命,致力于运用大数据、人工智能等方法开展经济社会行为认知与计算研究,对经济社会运行提供实时预报、监测预警、智能预测和分析研判,为各级政府、企事业单位的决策提供支持服务,不断提升大数据时代决策科学性和精准性。
作为推进学科交叉融合和开放合作研究的平台,下设多个研究方向和多条业务线,与政府、企业、高校、科研机构和国际组织开展多领域合作。
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于猎聘网