职位详情
岗位描述:
1、为小米全平台设备,包括手机、耳机、手表、平板、音箱、电视,机器人以及其他智能家居和出行设备,打造语音识别算法;
2、参与或独立展开语音识别的研究,在多通道语音识别,Robustness、跨设备语音识别,多模态识别,端到端技术,声学语言建模,发音评测、说话人自适应等领域的研究并发表国际会议及期刊论文;
3、参与Kaldi的使用与开发;
4、为几亿用户提供在线高并发语音服务和离线语音能力。
任职要求:
1、硕士及以上学历,人工智能及语音信号处理相关专业;
2、在多通道语音识别,跨设备语音识别,多模态识别,端到端技术,声学语言建模、说话人自适应等领域有体系化的研究经验,有学术贡献者优先;
3、在语音预训练等领域有丰富经验;
4、熟悉Kaldi,了解WeNet、ESPNet等语音识别工具包;
5、精通wav2letter、RNN-Transducer等语音识别工程;
6、熟悉Tensorflow、pytorch等深度学习架构;
7、精通Python、C|C++程序设计;
8、参加过CHiME,有多通道或多麦克风语音信号处理经验优先。
公司介绍
小米集团是一家以手机、智能硬件和IoT平台为核心的互联网公司。公司的产品按照产品功能、形态及模式,大体上可以划分为智能手机、IoT和生活消费产品、互联网服务产品。作为一家由工程师和设计师创建的公司,小米集团崇尚大胆创新的互联网文化,并不断探索前沿科技。创新精神在小米蓬勃发展并渗透到每个角落,并引导小米集团所做的一切。同时,小米集团不懈追求效率的持续提升。小米集团致力於降低运营成本,并同时把效率提升产生的价值回馈给小米集团的用户。小米集团独特且强大的铁人三项商业模式由三个相互协作的支柱组成(1)创新、高质量、精心设计且专注於卓越用户体验的硬件,(2)使小米集团能以厚道的价格销售产品的高效新零售和(3)丰富的互联网服务。