职位详情
1、职位描述
负责公司机器学习平台计算引擎开发,为平台提供稳定易用、高性能的计算引擎。
业内机器学习系统与平台前沿技术进展跟进调研、落地。
参与模型训练、模型服务等机器学习相关项目的开发。
2、职位要求
1、计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力。熟悉计算机体系结构以及并行计算基本技术。
2、熟悉GPU硬件架构,熟悉GPU
软件栈(CUDA,cutlass),具备 GPU 性能分析的经验。
2、至少熟悉一种主流深度学习编程框架(TensorFlow/PyTorch/Paddle)并了解底层原理;熟悉Megatron/DeepSpeed/ColossalAI等开源框架和系统优先。
3、在机器学习、深度学习、大规模分布式机器学习以及在搜索、广告、推荐、机器翻译等领域有经验者优先。
4、有大型预训练大模型落地项目,包括大语言(Large Language
Modeling, LLM),视频大模型或者多模态大模型相关经验优先。