职位详情
上市公司
周末双休
带薪年假
零食下午茶
员工旅游
年终奖
餐补
晋升空间大
每年多次调薪
免费培训
六险一金
节日福利
岗位职责:
1. 负责公司业务的稳定性保障,性能调优及应急处理等工作;
2. 参与设计与开发DevOps工具,包括容量管理、成本管理、多活容灾、故障演练等功能的开发维护和管理工作;
3. 参与运维体系精细化数据运营工作,在监控指标、历史事故、资源利用率等数据中挖掘系统薄弱点并改进落地;
4. 探索、研究新的SRE及运维技术方向,积累最佳实践,为业务架构设计与组件选型提供指导并形成技术文档。
岗位要求:
1. 计算机相关专业,至少2年以上在互联网公司的业务运维经验,熟悉SRE体系,有SRE实践者优先;
2. 有扎实的网络、系统、计算机体系结构方面的知识,熟悉Linux了解内核机制和性能优化的方法,熟悉TCP/IP、HTTP协议,能对常见的应用系统隐患或故障做出系统性分析和处理;
3. 熟练掌握Docker等容器化技术,并具备Kubernetes集群管理经验;
4. 熟练使用Python和Shell进行编程,能独立编写运维工具,有Golang和Web系统实践经验者优先;
5. 熟悉阿里云、腾讯云、AWS等主流公有云平台的产品,熟悉大型互联网平台的架构并有丰富的实践经验;
6. 工作细致,热爱技术,善于思考,有清晰的故障排除思路和谨慎的操作意识,对问题的推进解决有较强的责任感;
7. 良好的团队精神和服务意识,有较强的项目执行力和沟通协作能力。