岗位职责
1、负责大模型的整体数据规划,通过构建完整的数据体系,为大模型的训练数据质量负责
2、负责大模型预训练数据获取和清洗系统性方法研究,通过分类/聚类/多样性评估等方法清洗出高质量数据,提升基座模型效果
3、负责大模型prompt数据工程方法研究,构建高质量的 prompt数据,研究批量生成 prompt 的技术和方法,提升大模型效果
任职要求
1、本科及以上学历,工作满一年
2、在大数据处理领域拥有工作经验,熟悉大规模数据处理流程和技术的优先。
3、具备编程技能,熟悉Python、Java等编程语言的优先
注:此岗位为第三方用工,入职后与第三方公司签约