logo
更新:2024-05-01
SRE专家
3-5万
杭州萧山区  | 5-10年  | 本科  | 社招
去申请
收藏
举报
职位详情
岗位职责
• 参与项目规划、设计以及架构评审,确保大规模集群项目的实践性与落地;
• 与开发人员、及项目经理、QA合作确保AI软件栈的高可操作性,可扩展性以及高可用性,为客户提供高质量的使用体验;
• 参与大规模集群的维护、更新以及保障; 了解应用客观测性、可维护性与可操作性的价值,不断提高集群的高可靠性与可维护性;
• 结合新技术的研究,持续总结与开发优化系统运维的自动化以提升运维效率与提高集群易用性;
• 开发相关自动化工具以改进大型分布式系统的开发、测试以及交付流程的各个环节;
• 识别项目的关键技术要求与技术范围,领导项目关键技术的识别、讨论以及推进,深挖背后需求。
• 提前预判团队所需的技术要求,进行预研以及帮助领导做出技术趋势的研判,能提供最佳实践指导。
• 参与团队建设,参与合作方的沟通与项目配合,帮助团队达到项目需求。

岗位要求:
• 精通Linux 操作系统,有Linux系统上的相关开发经验;
• 至少精通两门编程语言,包括但不限于c/c++、go、 python,至少精通一门脚本语言shell、python;
• 熟悉云计算的底层逻辑,精通其中一种(Kubernetes、OpenStack、Slurm等)者优先;
• 有云计算(包括 但不限于Kubernetes OpenStack等 )相关的开发能力与维护经验, 有二次开发经验者优先;有AI平台开发经验优先;
• 有云计算集群架构能力与自动化的相关技能,有过大集群运维经验;
• 具备系统化解决问题的能力,拥有清晰的问题分析逻辑与思路,有全局看问题的能力,良好的沟通技巧与责任感以及团队合作意识,有分布式作业系统运维与问题分析经验;
• 熟练掌握运维相关的知识、流程、方法、工具和实操技能, 包括但不限于 centos、ubuntu等Linux系统,数据库、Prometheus、Grafana、ansible、ELK、dump、rsync等工具、KVM、OpenStack、docker、K8s、istio等与计算相关技能;
• 具备高度的自驱能力,有良好的工作记录与总结习惯,能够将相关工作进行详细的记录以及总结反思与提高;
• 有网络以网络安全相关的技能与实操经验,能够独立完成集群可观测行与可运维性系统的构建;
• 良好的解决方案与问题分析的文档写作能力与经验,有良好的分享意识;
• 认同公司与团队的价值观;

工作地址
杭州-萧山区萧山科创大厦
公司介绍
燧原科技(Enflame)成立于2018年3月,在上海、北京、深圳、成都等地均设有全资子公司,专注人工智能领域云端和边缘算力产品,致力为通用人工智能打造算力底座,提供原始创新、具备自主知识产权的AI加速卡、系统集群和软硬件解决方案。凭借其高算力、 高能效比的创新架构和高效易用的软件平台,产品可广泛应用于泛互联网、智算中心、智慧城市,智慧金融、科学计算、自动驾驶等多个行业和场景。
近期完成D轮融资20亿元人民币,由上海国际集团旗下子公司及产业基金领投,腾讯、美图公司、武岳峰科创、允泰资本、弘卓资本、红点中国、广发乾和、达泰资本、浦东投控等多家新老股东跟投。
其研发团队均来自国内外半导体名企,拥有10+年的研发实战经验,覆盖从软硬件架构定义、SoC设计及验证、IP设计及验证、及芯片流片和验证等整个设计生产环节。燧原硬件团队研发主要负责人曾成功领导开发和量产了数十个大型芯片。
燧原软件团队既有来自Google、AMD、Intel、ARM等跨国公司的核心软件研发力量,也有来自腾讯,华为,大疆等行业知名民营企业的新生力量;既有在专业领域深耕了10~15年的“老法师”,也有来自清华、复旦、交大、浙大等国内一流高校以及加州大学洛杉矶分校(UCLA)、德州大学奥斯汀分校(UT-Austin)、巴斯大学(University of Bath)等国际一流高校的学霸们。
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于猎聘网