logo
更新:2024-04-01
AML机器学习系统SRE工程师
3-6万
北京海淀区-中关村/海淀黄庄/知春路  | 1-3年  | 本科  | 社招
去申请
收藏
举报
职位详情
弹性工作制
餐饮及下午茶
法定节假日三薪
年度体检
带薪年假
补充医疗保险
节日礼品
绩效奖金
零食下午茶
包吃
定期体检
家庭关爱假
节假日加班费
加班补助
意外险
家属自选保险
就近租房补贴
免费健身设施
年终奖
五险一金
工作职责:
AML(Applied Machine Learning)机器学习系统团队专注于机器学习系统领域的前沿技术研究和落地,提供高性能、高可靠、可扩展的机器学习系统架构、丰富的异构计算资源和极致的端到端的机器学习服务体验,为全公司的产品和业务提供核心技术支持和服务。

1、负责维护机器学习系统的稳定运转,支持模型开发、训练与部署的多个环节;
2、负责资源的管理与规划,成本与预算,包括: GPU/CPU机器资源,存储等资源;
3、负责多地域、多机房的系统容灾、服务部署管理和集群机器治理;
4、负责集群、业务服务的稳定性治理,资源利用率提升和运维人效提升。

任职要求:
1、一年以上运维开发项目经验;
2、熟练掌握 Linux 环境下的 Go/Python/Shell 等1至2种以上语言;
3、有大型分布式系统的资源管理和任务调度系统运维经验,熟悉 Kubernetes生态和架构,具备1年以上相关的运维经验;
4、熟悉 Docker/Kata 等容器化技术,具备1年以上运维经验;
5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,良好的团队合作精神;
6、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;
7、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。

加分项:
1、从事过大规模分布式系统的运维;
2、有 GPU 服务器的运维经验。
工作地址
北京海淀区大钟寺广场2号楼1层
公司介绍
北京字节跳动科技有限公司是一家技术驱动的移动互联网公司,公司致力于采用先进的推荐引擎技术,提供基于移动设备的信息分发解决方案,主要产品“今日头条”资讯客户端,是一款基于数据挖掘技术的个性化推荐引擎产品,致力于帮助用户在移动互联网上方便快捷地获取最有价值的信息,它会根据用户的兴趣为其推荐内容,对传统信息的分发方式产生了巨大颠覆。
工商信息
以下信息来自
企业类型
其他有限责任公司
经营状态
存续
行业类型
商务服务业
成立日期
2012年03月09日
注册地址
北京市海淀区北三环西路甲23号院1号楼2层222
统一社会信用代码
911101085923662400
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于boss直聘