工作职责:
-参与百度网盘数据体系建设,设计和开发对应的离线与实时数据仓库模型
-面向PB级超大规模数据问题,理解业务需求,完成离线/实时ETL作业的开发以及相应数据治理工作
-负责大数据相关的离线&实时计算、交互式多维查询、数据建模等技术方向
-建设通用化的数据开发分析工具,不断提高数据生产效率
任职要求:
-计算机或相关专业本科以上学历,两年以上互联网数据开发和数据治理工作经验
-扎实的数据结构和算法基础,具有较强的编程能力和问题解决能力。熟练使用Java、Scala、Python、shell等至少一门语言
-精通Hadoop,Hive,Spark,Flink,Kafka,Olap 等大数据框架原理及应用,善于处理性能调优
-精通数仓架构及原理,有大型数据仓库架构设计、数据治理、模型设计相关经验
-善于沟通,工作积极主动,责任心强,具备良好的团队协作能力
