岗位职责:
1.负责大语言模型的数据建设,包括但不限于指令微调数据的构建、清洗、标注和存储;
2.深入理解长文档问答、检索增强生成(RAG)的数据需求,根据团队的反馈优化指令数据,提升数据质量和数量;
3.参与大模型的版本迭代测试,持续迭代提升模型能力;
4.跟进业界最新技术,完成大模型相关的文献与技术调研类等工作。
任职要求:
1.在读本科及以上学历,计算机科学、统计学、数学、人工智能等相关专业;
2.熟练掌握Python、Shell等编程语言及数据处理工具(如Pandas, NumPy);
3.具备大模型(如ChatGPT)prompt调优能力,有指令数据构建经验者优先;
4.具有大数据处理或大模型相关实习经验者优先;
5.具备细致严谨的工作态度,能应对工作压力,具备强烈的责任心和团队协作能力;
6.具备良好的沟通和协作能力,有较强的问题解决能力;
7.每周至少能工作3天,持续工作时间不少于3个月。