logo
更新:2024-04-30
大模型算法实习生-电商业务
300-400/天
北京海淀区  | 硕士  | 4天/周  | 实习
去申请
收藏
举报
职位详情
职位描述:
ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。

1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型;
2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等;
3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率;
4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。

职位要求:
1、2025届硕士及以上学历在读,计算机相关专业;
2、扎实的深度学习技术基础,有CV/NLP/多模态相关的项目经验,发表过高水平学术会议论文或者有竞赛经验者优先;
3、熟练掌握python/c++等至少一门编程语言;熟练pytorch训练框架;熟悉hunggingface-transformers框架;
4、熟悉常用的大语言模型架构优先;
5、了解模型压缩&推理加速的研究和技术进展,包括但不限于模型量化、剪枝、蒸馏、TensorRT推理优化等;
6、了解业界常用的大语言模型推理加速框架,如VLLM,TensorRT-LLM;
7、了解混合精度训练、分布式训练等训练加速方法优先。

工作地址
北京-海淀区中国大陆北京北京市海淀区花园东路19号中兴大厦1层,邮编:100191
公司介绍
字节跳动有限公司成立于2016年05月04日,注册地位于北京市海淀区北三环西路43号院2号楼5层503室,法人代表为张利东。经营范围包括技术开发、技术推广、技术转让、技术咨询、技术服务;计算机技术培训(不得面向全国招生);计算机系统服务;数据处理(数据处理中的银行卡中心、PUE值在1.5以上的云计算数据中心除外);基础软件服务;应用软件服务(不含医用软件);设计、制作、代理、发布广告;从事文化经纪业务;组织文化艺术交流活动;影视策划;电脑图文设计、制作;从事体育经纪业务;会议服务;企业策划;演出经纪;文艺表演;从事互联网文化活动;互联网信息服务。(企业依法自主选择经营项目,开展经营活动;演出经纪、文艺表演、从事互联网文化活动、互联网信息服务以及依法须经批准的项目,经相关部门批准后依批准的内容开展经营活动;不得从事本市产业政策禁止和限制类项目的经营活动。)字节跳动有限公司对外投资13家公司。
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于猎聘网