logo
更新:2024-03-28
搜索算法工程师(爬虫)
3-5万
北京东城区-王府井/东单/北京站  | 3-5年  | 本科  | 社招
去申请
收藏
举报
职位详情
五险一金
年终奖
股票期权
加班补助
带薪年假
节日福利
交通补助
员工旅游
包吃
要从全球(国内/海外)互联网里获取和构建优质信息,因此需要你:
1、通过最先进的机器学习模型,研发链接质量算法,从互联网里找出最优质的链接,提高覆盖率、时效性等指标;
2、对网站、网页、链接进行深入研究,应用graph相关算法知识研发优质站、领域站、垃圾站等识别和应用算法;
3、利用Bert/大模型等NLP技术对网页进行语义理解,从网页中抽取所有信息构建知识库;
4、研发网页信息的去重、分类、安全识别等算法,提高网页库的各种评估指标;
5、其他数据采集建设相关的工作。
职位要求
1、出色的分析问题,解决问题能力,能从纷繁复杂的数据中分析出问题本质;
2、优秀的代码能力,数据结构和基础算法功底,精通C/C++语言,熟悉linux平台、python/shell编程;
3、熟练掌握深度学习、传统机器学习、数据统计模型、熟悉使用一种或几种深度学习框架(如tensorflow、pytorch),熟悉hive/spark/flink/mr等分布式计算编程者;
4、熟悉数据分析,数据挖掘,对网页抓取/页面解析等有经验者优先。
工作地址
北京东城区明阳国际中心4
公司介绍
昆仑万维科技股份有限公司(股票代码:300418.SZ),是一家全球领先、业内前沿的综合性互联网集团。昆仑万维围绕“打造海外领先的社交媒体和内容平台”的发展战略,依托研发及运营核心优势,下设移动游戏平台(GameArk)、休闲娱乐平台(闲徕互娱)、内容分发平台(Opera)、音频社交平台(Star Group)以及投资五大业务板块。
工商信息
以下信息来自
企业类型
股份有限公司(上市、自然人投资或控股)
经营状态
存续
行业类型
科技推广和应用服务业
成立日期
2008年03月27日
注册地址
北京市海淀区知春路118号B座605E
统一社会信用代码
91110000673814068U
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于boss直聘