logo
更新:2024-03-24
大模型数据爬虫工程师
2.5-5万
北京海淀区  | 本科  | 社招
去申请
收藏
举报
职位详情
五险一金
交通补贴
年终奖金
定期体检
免费班车
专业培训
岗位职责:
1. 设计和开发高效、可靠的数据爬虫系统,能够抓取大量的数据。
2. 优化现有数据爬虫系统的性能和稳定性,提高数据抓取效率。
3. 研究和分析目标网站的结构和反爬虫机制,制定相应的解决方案。
4. 实现数据的清洗、去重和格式化,确保数据的质量和一致性。
5. 与数据分析和机器学习团队合作,了解他们的需求,并提供相应的数据支持。
岗位要求:
1. 计算机科学或相关领域的本科及以上学历。
2. 熟悉Python编程语言,有使用Scrapy、BeautifulSoup等数据爬虫框架的经验。
3. 熟悉HTML、CSS、JavaScript等Web技术,能够分析网站结构和数据提取。
4. 了解常见的反爬虫机制,能够应对动态加载、登录验证等问题。
5. 熟悉数据清洗和数据处理的技巧,能够处理大量的数据。
6. 良好的团队合作和沟通能力,能够与数据分析和机器学习团队合作。
7. 对机器学习和大数据技术有一定的了解和兴趣,愿意不断学习和探索新技术。
优先条件:
1. 有使用分布式爬虫系统的经验。
2. 有使用云服务提供商(如AWS、Google Cloud等)的经验。
3. 有参与过大型数据爬取项目的经验。
职能类别:数据建模工程师
关键字:数据分析csshtmljavascriptweb大数据数据支持机器学习数据清洗计算机科学
工作地址
搜狐网络大厦
公司介绍
公司于2012年成功在国内A股市场上市交易。是中国振动筛行业上市公司(股票简称:鞍重股份,股票代码 002667 );公司为高新技术企业,国家火炬计划重点高新技术企业,省级技术中心,拥有发明专利11项、实用新型专利102项;
2021年,公司在确保原有业务正常发展基础上开发新能源业务版块,最终计划形成原矿开采、选矿、含锂原材料提锂、电池级碳酸锂制备、磷酸铁锂生产的完整新能源锂电上游产业链,成为电池原材料供应商企业。
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于前程无忧