职位详情
年终奖金
绩效奖金
交通补助
免费班车
加班补贴
发展空间大
岗位晋升
带薪年假
定期体检
六险一金
工作职责
1、负责大规模预训练模型构建,为下游各种业务场景算法提供支持;
2、负责多模态融合、多模态图文生成、文本生成音乐、视频编辑生成等领域算法的开发与业务场景落地;
3、负责计算机多模态方向前沿问题的研究,持续跟进业界SOTA模型,制定多模态理解技术路线。
任职要求
1、硕士及以上学历,5年以上工作经验;
2、熟练掌握计算机视觉领域的基础理论和方法,在一个或多个领域有深入研究:
3、大模型预训练、跨模态检索与生成、图像视频理解、多模态融合等;
4、在计算机视觉、自然语言处理、语音识别等具备扎实的理论基础和工程能力;
5、在语音、计算机视觉或NLP等领域顶会(ACL/EMNLP/NIPS/ICML/AAAI/CVPR/ECCV/ICASSP/Interspeech等)有发表过论文的优先;
6、具有广阔的技术视野、良好的逻辑分析、表达和沟通能力,优秀的分析和解决问题的能力,出色的团队管理能力。
其他信息
语言要求:英语、普通话