职位详情
职位描述:从事AIGC相关领域的平台级软硬件解决方案开发与性能优化工作,具体包括以下二者或二者之一:
1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作;
2、AIGC主流模型(SD/类Sora)在训练/推理侧的性能分析与优化工作。
任职要求:1、对AI领域的基本理论与常见模型算法,有深刻的理解;
2、熟练使用tensor flow或pytorch,进行模型训练或推理优化;
3、有使用GPU做AI算法加速相关经历,熟悉GPU CUDA编程;
4、对使用Megatron/Deepspeed等框架做TP/DP/SP等训练优化有深刻理解;
5、有开发类NCCL通信库,或者类DNN,Cutlass等算子加速库经验的优先。
其他信息
所属部门:快手