职位详情
职位描述
- 负责实现GPU、CPU、特殊芯片架构下的算子定制开发工作;
- 负责实现算子融合的调研、实践、开发工作;
- 负责实现PyTorch算子工具库的开发工作;
- 与算法团队一起协作,针对常见LLM、AIGC等算法框架进行性能优化;
职位要求
- 硕士以上学历优先;
- 精通C++编程;
- 精通CUDA或ROCm编程框架;
- 熟悉TVM、MLIR、Triton或其他CodeGen框架及其底层原理者优先;
- 熟悉LLM、AIGC等常见模型结构,有优化经验优先;
- 有FasterTransformer、TensorRT等使用和分析经验者优先
工作地址
东升大厦A座
点击查看地图