手机咨询更便捷
扫码立即和HR沟通
岗位职责:
1、完成VQGAN或VAE在视觉生成或视觉理解任务上的应用
2、完成多模态视觉生成与视觉理解任务上的创新性改进
3、完成上述方法的应用探索
4、深入研究视觉、多模态大模型等前沿算法研究,包括但不限于图像(视频)生成、图像(视频)/分割/检测/深度估计、图文对话等;
5、参与多模态大模型等项目的研究与应用落地。
专业技能:
1、具有扎实的编程能力,熟练使用python编程、PyTorch、TensorFlow、MindSpore等深度学习框架,熟悉Linux基础环境;
2、具有良好的数理基础与创新能力,有CV/ML/NLP方向顶会论文发表或在公开竞赛中取得优异成绩者优先。
素质要求:具备良好的沟通能力与团队合作精神
实习时间:3个月及以上,每周至少3天