职位详情
年终奖
12%公积金
股票期权
带薪年假
节日福利
定期体检
补充医疗保险
餐补
五险一金
职位描述:
1、负责小爱、AI实验室、大模型训练的运维工作,技术栈涵盖GPU集群、k8s容器的运维工作;
2、工作涵盖容量管理、灾备管理、活动重保、日常Oncall、troubleshooting、业务巡检、故障预案、架构优化、技术运营等,做到7*24快速响应;
3、与DEVS共同设计产品后端架构,实现分布式、全球集群化运维管理,制定并实施相关运维技术方案,确保服务高效、稳定的运行;
4、研发设计自动化运维工具,减少日常重复性工作,用DevOps工具化思维解决业务问题,提升运维效率;
5、通过技术手段进行成本控制及优化,通过工具化及流程提升服务管理效率。
职位要求:
1、有大型互联网产品、集群运维和设计经验者优先;
2、熟练SHELL编程,熟练PYTHON/GO中的任意一门语言;
3、熟悉网络协议,有互联网应用、人工智能、AIoT开发运维经验者优先;
4、有k8s docker运维工作经验优先;
5、阳光热情、积极主动、逻辑清晰。