工作职责:
-参与智能数据基础设施平台建设,聚焦多模态大模型研发,提升模型在跨模态理解、生成、语义对齐等关键任务上的性能
-参与平台高质量多模态算子开发和高质量工作流构建,支持文档、图片、视频、音频等多种模态数据的高效处理
-参与大语言模型和多模态大模型微调、模型服务搭建、落地项目以及自动化评测体系构建
-参与垂类领域多模态大模型效果优化,从模型结构、训练策略、训练数据等多角度对模型进行优化,打造业界SOTA级模型
任职要求:
-熟悉常见的大语言模型(Llama/Qwen)、多模态大模型(Llava/Qwen-vl)、模型架构(Dense/MOE)
-熟悉大模型微调(全参微调/指令微调/PEFT等),了解训练优化策略(DPO/GRPO/GSPO等)
-熟悉视觉-语言等不同模态对齐策略(对比学习/跨模态注意力/生产时对齐)
-熟悉多模态模型训练数据集生成构建,能够根据训练结果对训练样本进行优化调整
