logo
更新:2024-04-28
数据处理工程师
1.3-1.5万
深圳南山区  | 1-3年  | 本科  | 社招  | 招1人
已结束
职位详情
Python
反爬虫
数据采集
requests
XPath
Scrapy
BeautifulSoup
JavaScript
CSS
岗位职责:
1. 基于分析、模拟、逆向工程等手段获取互联网公开数据;
2. 负责外部论坛、问答、博客、新闻、小说、剧本等各种数据源的内容抓取;
3. 能够独立分析爬虫需求,针对目标网站制定合适的爬虫策略,并实现代码编写与维护;
4. 具备良好的沟通能力和团队协作精神,能够与产品、数据等团队有效配合;
职位要求:
1. 计算机相关专业本科及以上学历,拥有2年及以上相关工作经验者优先;
2. 了解并应对常见的反爬虫策略,如 User-Agent 伪装、IP 代理和验证码识别等。
3. 熟练使用 Python 语言,以及 Requests、BeautifulSoup、Scrapy 等库和框架开发爬虫应用程序。
4. 熟练应用 XPath、CSS 选择器等技术,从 HTML 文档中定位和提取所需数据。
5. 熟练处理动态网页内容,如使用 Selenium 或其他方法抓取 JavaScript 生成的数据。
6. 熟练使用多线程、多进程或异步编程技术,提高爬虫的抓取速度和效率。
工作地址
百度国际大厦东塔楼
点击查看地图
公司介绍
上海微创软件股份有限公司2002年由微软与上海市政府共同创办,是微软在华投资的第*家合资公司。微创始终秉承高标准的服务品质与“成就客户”的服务理念,在全球设有20余处交付中心,分布在中国、美国、日本、澳大利亚,凭借在汽车、保险、高科技、金融、互联网等行业的深厚积累和丰富经验,与2500余家企业与政府客户达成了长期、稳定、友好的合作。
工商信息
以下信息来自
企业类型
股份有限公司(中外合资、未上市)
经营状态
存续
行业类型
软件和信息技术服务业
成立日期
2002年05月22日
注册地址
上海市闵行区吴泾镇紫星路1000号
统一社会信用代码
91310000738547192N
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于