职位详情
岗位职责:
1.利用深度学习编译技术,结合专家级经验(算法/系统/硬件),解决搜广推、CV、NLP,以及多模态、大模型的训练和推理场景挑战。
2.系统化分析模型,提炼/抽象优化方法,寻求解空间(包括算子调度,融合,Schedule,异构调度等)。
3. multi-framework(例如Tensorflow、Pytorch等)计算图优化Pass开发,手段包括不限于编译 IR优化,专家经验模板化等等。
4. multi-device(例如GPU,CPU,NPU)专项 SIMT、SIMD 计算加速,包括核心Gemm 算子,Reduce算子,以及复杂融合算子等等。岗位基本要求:
有扎实的计算机理论基础,熟练掌握C++和 Python语言具备以下优先:
1.熟悉PyTorch 或TensorFlow等引擎的架构和运行原理,有深度定制经验优先
2.熟悉TVM/MLIR/XLA等DL编译器,有Cutlass技术经验,具备计算图翻译至IR并优化的经验优先
3.在深度学习领域有丰富的模型优化经验,熟悉 GPU或NPU架构,有CUDA或NPU编程经验优先
4.学习能力和好奇心强,具备良好的问题分析和解决能力,有团队合作精神和沟通能力
其他信息
行业要求:全部行业