岗位职责:
1. 负责高性能计算平台和人工智能计算平台的部署、维护及问题修复;
2. 优化产品部署流程与手段,提高平台的运维效率;
3. 研究和应用新技术,推动适合的技术应用于高性能计算和人工智能平台的生产环境;
4. 提供技术支持,快速响应并解决平台运行中出现的问题;
5. 监控和优化计算平台的性能,确保系统的稳定性和高效运行;
6. 编写和维护相关技术文档,确保技术知识的积累和传递。
任职要求:
1. 正规专科及以上学历,3年以上运维经验;
2. 熟练使用Linux系统,熟悉常用的命令和工具;
3. 熟练掌握业界主流开源技术,如InfluxDB、Elasticsearch、Kafka等;
4. 至少掌握Python、Go等一种编程语言;
5. 熟悉Kubernetes等容器化技术;
6. 具备人工智能技术的基础知识和应用能力,了解高性能计算相关技术;
7. 良好的沟通能力和故障排查能力,具备较强的责任感和抗压能力;
8. 能够快速响应并解决问题;
9. 具有编写文档能力者优先。