logo
更新:2024-05-06
大数据工程师
2-4万
北京通州区  | 3-5年  | 本科  | 社招  | 招3人
去申请
收藏
举报
职位详情
一、工作职责
1. 为Scilit数据库进行大数据数仓的设计、开发、维护工作,同瑞士数据和分析团队协同,整合MDPI公司级数仓体系,建构丰富稳定的数据资产;
2. 建立和提高数据模型的准确性、易用性、灵活性、可扩展性,提升查询效率,为可视化报表和开发、数据分析、工程项目和算法开发等数据应用提供良好的条件;
3. 收集、清洗、整理Scilit数据,提升Scilit数据质量、数据可用性和数据效率,使得数据准确、一致、完整、有效、及时。搭建数据质量校验、报警、自动整理机制;
4. 协同相关方,将产品/数据分析/算法需求转化为数据工程需求,构建数据Pipeline和ETL任务,增进相关合作方的数据理解;
5. 建立数据字典,将常用维度和指标的技术口径文档化;
6. 承担大规模复杂指标的快速计算和维护任务,解决动态复杂指标的并发性请求问题;
7. 协助实体消歧等数据质量优化,构建网站用户行为数据体系。

二、职位要求
1. 熟练运用书面和口语英语交流数仓技术,可以胜任同瑞士公司级数仓总部协同工作;
2. 计算机、信息技术、信息管理、数据管理、数据科学等相关专业本科及以上学历;
3. 熟悉Hadoop生态相关技术并有独立项目开发经验:熟练掌握hdfs、MapReduce、HIVE、Spark、Airflow、HBase等相关技术;
4. 具备较好的维度建模方法论,独立负责过 (主题数据模型架构) 数仓架构设计和优化,熟练ETL、数仓分层、性能调优,了解云生态,了解MySQL数据库模型和数据结构;
5. 熟练掌握MySQL的复杂查询分析、熟练掌握Python,熟悉Solr/Elasticsearch, Shell;
6. 熟悉一门或多门面向对象的编程语言:Python/Java//Scala/C++;
7. 熟悉从数据生产到数据消费的全链路,具有将技术和优秀的业务理解相结合的能力,发掘机会、解决问题;
8. 两年以上对口行业经验,优秀者工作年限可适当放宽;
9. 逻辑清晰严谨,对数据敏感,跨团队协作能力、沟通能力强。
加分项:
1. 有学术出版行业、文献计量学/科学计量学、实体消歧、用户行为埋点和追踪等知识、技能、经验;
2. 了解数据分析/机器学习/NLP,或有将数据分析/算法和业务洞察能力结合的经验;
3. 熟悉PHP语言;
4. 对前沿数据工程技术保持高度关注。

三、薪资福利
1. 薪酬待遇:20-40K;
2. 基础福利:六险一金,带薪年假,年度体检,节日福利,活动经费,丰富茶歇,营养晚餐等;
3. 进阶福利:子女福利,团队奖励,培训津贴,岗位津贴;
4. 职业发展:导师培养,技能培训,管理培训。
工作地址
北京-通州区 保利大都汇T2写字楼 10层
点击查看地图
公司介绍
MDPI创办于1996年,是全球领先的开放获取出版公司之一,总部位于瑞士巴塞尔,同时在中国、西班牙、塞尔维亚、英国、日本、罗马尼亚、加拿大、波兰、新加坡以及泰国设有分公司。MDPI在中国5个城市设有办公室,主要承担瑞士MDPI编辑出版相关的离岸外包业务,分别位于北京、湖北武汉、天津、江苏南京、辽宁大连。MDPI致力于开放获取出版服务,目前出版英文学术期刊400余个,其中SCIE期刊90余个。期刊领域覆盖生物、化学、医药、机械、能源、环境等各学科,其中包含众多国际知名期刊如 Molecules , Sensors, International Journal of Molecular Sciences, Marine Drugs, Energies, Toxins等。
工商信息
以下信息来自
企业类型
有限责任公司(自然人投资或控股)
经营状态
存续
行业类型
科技推广和应用服务业
成立日期
2008年05月29日
注册地址
北京市通州区观音庵北街4号院2号楼9-14层
统一社会信用代码
91110112676640737N
若用人单位提供虚假招聘信息,以担保或其他任何名义收取财物,扣押或以保管为名索要证件,都属于违法行为,应当提高警惕。
发布于国聘