工作职责:
-负责大模型相关数据处理工作,包括大规模数据的清洗、合成、去重,确保高质量数据输入
-参与文本、图像等多模态数据的预处理,优化数据质量及增强流程,确保数据的高质量和高可用性
-负责内部数据管理平台的后端设计和开发,提升数据存储、查询及可视化管理能力
-支持大模型在业务场景中的应用,深入理解业务需求,主导数据准备和处理流程的优化
-参与数据处理流程的自动化和工程化改进,优化数据流转效率,提升平台稳定性与可扩展性
任职要求:
-具备扎实的后端开发及工程设计经验,精通 Python/Go 等至少一种后端开发语言
-深入理解 MySQL、MongoDB 等关系/非关系数据库,具备复杂数据建模、设计能力
-熟练掌握 Docker 和 Kubernetes,具备容器化部署、微服务架构和 CI/CD 流程经验
-熟悉大数据处理框架如spark,ray等原理并有实际使用调优经验优先
-有大模型数据处理或大模型相关项目经验,具有大规模数据处理经验者优先
-具备良好的沟通和团队协作能力,能够高效理解并响应业务需求,推动数据驱动的应用落地