岗位职责:
1. 合理规划、使用云资源,对云资源运行情况监控及告警,持续完善监控及告警机制;
2. 负责平台应用版本发布操作;
3. 监控程序、中间件及业务的运行情况,制定、落实监控与告警策略,并持续完善;
4. 能够自主编写脚本或使用第三方工具实现运维工作自动化,以提升工作效率;
5. 责任心强,对于所负责的工作要有始有终,对于耗时较长的工作能够自觉定期汇报进展。
6. 与同事轮流值班,手机 24 小时开机,能够及时响应、处理产品出现的各种问题。
任职要求:
1. 熟悉 Linux 系统的管理,熟练使用基本指令;掌握云主机、云存储、云负载、公网 IP 等资源的管理维护。
2. 至少熟练掌握 Shell 和 Python 语言,能够编写脚本维护操作系统、程序稳定运行,能够对文本内容进行筛选和统计;
3. 熟悉主流数据库及缓存中间件使用与维护,如 MySQL、MongoDB、Redis、RocketMQ、Zookeeper、ElasticSearch、Hadoop、Kafka 等,掌握对应中间件的常规操作命令。
4. 熟悉监控软件 Promethues 的使用与配置,能够结合 Grafana 将监控数据实现可视化;
5. 熟悉 tcp/ip/http 等网络协议,掌握 tcp 抓包分析数据能力;
6. 学习能力、适应性、认知能力、处事能力强,能够快速上手不熟悉的工作,综合分析并处理问题;
7. 具有良好的文档写作能力,沟通协调能力,能完成技术文档和运维报告的编写;
8. 熟悉 docker 容器原理和使用,或 vm 虚拟化技术经验者优先。
PS:如果你是开发型的运维会优先考虑哦!