岗位职责
1、负责公司业务系统的运维保障工作,通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张;
2、主导应用系统运行过程中的事件处理和问题跟进,主动发现运行风险,协调资源解决瓶颈问题,推进系统性能调优及架构优化;
3、应用系统重大故障快速诊断及解决,跟进及推动故障改进措施实施;配合运维团队使用应急预案快速恢复应用运行;
4、负责撰写或审核应用系统运营运维类文档,如系统安装、配置文档,系统维护手册,用户使用手册,FAQ,应急切换方案等;
5、全方位提升部门运维能力(持续集成、应用发布、持续部署、监控告警、应急预案、自动化运维等)。
任职要求
1、三年以上运维经验,精通Linux操作系统的配置,管理及优化,能够独立排查及解决操作系统层的各类问题;
2、至少熟练掌握Python/shell/go等1种语言;
3、熟悉git/svn等版本管理系统和持续集成工具(Jenkins),对CI/CD有深入理解,有集群管理经验者优先;
4、有web server,分布式系统,负载均衡,系统监控等运维经验;
5、有Docker技术及k8s技术优先;
6、热爱运维工作,能承担压力,具备较强的交流、沟通和表达能力,具备很强的逻辑判断、问题分析和解决能力。