Python爬虫工程师_星河激荡(南京)数字科技有限公司招聘

更新：2024-04-18

Python爬虫工程师

1-1.5万

贵阳观山湖区｜ 3-5年｜本科｜社招

去申请

职位详情

岗位职责：
1.负责爬虫引擎核心功能开发及优化、架构设计、系统规划，以及爬虫技术的技术调研；
2.负责大数据的数据采集与爬取、解析处理、入库及备份等数据日常工作；
3.负责数据的清洗、整理、整合及合并等工作；
4.破解反爬机制，优化爬虫路由调度策略，同时负责反爬策略的设计及优化；
5.负责高性能爬虫系统的后台监控、报警模块的开发。
职位要求：
1.熟练使用C/C++、Java、C#、.Net、Go中一种编程语言，熟悉至少一种脚本语言，如shell、python进行工作；
2.熟悉爬虫的设计及实现流程，至少4年互联网数据抓取及爬虫经验；
3.熟悉缓存数据库redis,关系型数据库mysql、Oracle等，非关系型数据库MangDB,具备sql调优经验；
4.了解各种Web前端技术，包括XHTML/XML/CSS/JavaScript/AJAX等；
5.了解文本分类、统计分析、自然语言处理、机器学习算法等技术；
6.熟悉反爬虫机制并有对应的破解方案；
7.处理爬取过超过百万数量级的数据量；
8.有大数据相关开发经验者优先，熟悉分布式计算，有多线程、分布式、网络数据抓取及处理经验优先；
9.有政府政务行业工作经验优先，尤其社会信用方向。

工作地址

贵阳-观山湖区中天会展城

公司介绍

星河激荡(南京)数字科技有限公司，成立于2021-08-23，位于南京市江北新区研创园华创路68号景枫乐创中心B2栋713室，所属行业是科技推广和应用服务业。专业技术服务 100-499人

若用人单位提供虚假招聘信息，以担保或其他任何名义收取财物，扣押或以保管为名索要证件，都属于违法行为，应当提高警惕。

发布于猎聘网

公司基本信息

激

星河激荡(南京)数字科技有限公司

其他咨询和中介服务

私营/民营企业

100-499人