logo
更新:2024-04-25
大模型研发工程师
1.7-2.6万
上海长宁区  | 3-5年  | 硕士  | 社招
去申请
收藏
举报
职位详情
五险一金
交通补助
通讯津贴
定期体检
高新落户
企业年金
商业保险
岗位职责:
1、负责生成式大模型研发,包括但不限于prompt优化、模型的微调训练、检索增强生成、模型加速、优化和评估等,并将其应用到垂直场景;

2、负责开发多模态大模型,包括图像、文本等多种模态的融合,参与模型的微调训练和优化,并将其应用到垂直场景;

3、参与开发大模型应用在各个场景业务中,包括对话系统、自动摘要、标签提取等方面;

4、负责算法的部署、性能测试和调优,保证算法准确性和推理效率。

任职资格:
1、硕士及以上学历,计算机相关专业,3年以上人工智能领域工作经验。

2、对NLP主流大模型原理和差异有深入的理解;

3、优秀的算法和编程能力,精通python或C++等;熟悉主流深度学习框架pytorch;

4、熟悉常见的量化/剪枝/蒸馏等,掌握至少一种模型的微调原理并实际使用过;

5、了解数据并行、流水线并行、Tensor并行等训练方法,有多机多卡并行的大规模联合训练经验优先。

6、具备良好沟通能力、团队合作精神、创新思维以及持续学习动力。

工作地址
上海-长宁区联通大厦
公司介绍
上海联通是中国联通在上海的重要分支机构,拥有包括移动和固定通信业务在内的全业务经营能力。按照上海主要行政区划分,上海联通下设13个区分公司,全面服务于对口区域的经济建设和社会发展,其中,专门新设了自贸区临港新片区分公司,服务临港新片区开发建设。
为顺应数字化转型、服务数字经济,上海联通不断优化调整组织机构,承接国家、集团公司和上海地方政府的有关决策部署,全面服务公众及各行各业的通信及综合数字服务需求,助力上海智慧城市建设。
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于猎聘网