职位详情
就近租房补贴
餐饮及下午茶
免费健身设施
年终奖
定期体检
弹性工作制
意外险
节日礼品
年度体检
带薪年假
节假日加班费
家属自选保险
五险一金
加班补助
包吃
法定节假日三薪
家庭关爱假
绩效奖金
零食下午茶
补充医疗保险
职位描述
关于我们:
我们是国际支付的Global SRE团队,通过业务稳定性保障、SRE技术风险平台建设,来保证国际支付业务高质量服务水平。
主要工作是,解决国际支付在稳定性、运维效率上的痛点问题,并从国际支付稳定性需要的角度,持续提升可观测性、应急响应水平以及技术风险保障的质量和效率。
业务挑战:
国际支付业务在高速增长期,上游业务也在高速增长,业务复杂度、迭代速度、数据规模同样在快速增长。随着业务国际化进程加快,我们需要在全球各地提供业务稳定性保障。
技术挑战:
国际支付在全球各地构建机房,基础设施、团队协作、不同时区和文化、权限管控,多种因素叠加在一起,需要我们从复杂业务稳定性、全球机房稳定性两个视角来构建业务和技术SRE体系,保障业务服务水平。
1、业务稳定性保障,构建并优化可观测性大盘,积极参与响应和应急,持续提升MTTR和SLA;
2、参与SRE技术平台研发,提升运维效率,推动风险治理,不限于监控告警、变更管控、风险巡检、预案演练等能力;
3、参与建站及日常运维工作,积极响应各子域相关诉求,确保运维交付水平。
职位要求
1、本科及以上学历,计算机相关专业;
2、5年及以上相关SRE平台建设、复杂业务运维经验,
3、扎实的计算机软件基础知识,了解 Linux 操作系统、存储、网络 IO等相关原理;
4、熟悉一种或多种编程语言,如 Python/Go/Java/Shell/C++等;
5、善于沟通协作,积极响应解决问题,善于发现运维痛点,并提出方案进行优化。