职位描述:
1. 负责大模型增量预训练、高效微调、推理优化和效果评估等,并在汽车后市场领域场景中实现落地
2. 研发多轮对话信息融合、copilot和agent相关技术实现等
3. 负责问答系统的内容安全,指令安全、隐私安全等
4. 追踪NLP/多模态等大模型前沿技术
职位要求:
1. 每周4-5天,3-6个月优先,25届毕业生优先
2. 熟练掌握NLP基础理论和算法,有NLP相关行业经验,熟练掌握Transformer系列模型架构和原理
3. 熟练掌握python编码语言,熟练使用pytorch、tensorflow、paddle等至少一种深度学习框架
4. 熟悉使用deepspeed、megatron、colossal-ai等至少一种大模型分布式训练框架,了解langchain原理以及llama、chatglm等常见开源基座大模型