工作职责:
-基座模型优化:研究多模态大模型的图像、视频理解能力,支撑百度文心基座模型的训练优化;
-推理能力探索:进行 RLHF 研究与实践,探索多模态思考模型推理能力上限;
-数据体系创新:创新多模态合成数据生成与增强技术,支撑关键场景的多模能力突破;
-业务价值落地:深度对接业务需求,探索多模态大模型的落地路径,推动技术价值转化;
-技术前瞻布局:跟踪国际前沿动态,复现并改进关键技术,保持团队技术领先性。
任职要求:
-背景与经验:计算机/AI相关专业硕士及以上,2年以上多模态或大模型研发经验,有大规模预训练模型落地项目者优先;
-工程能力:编程能力扎实,熟练掌握 Python / PyTorch,具备良好的团队协作和工程实现能力
-技术深度:熟悉多模态模型及框架,如 LLaVA、Qwen、ERNIE 4.5等优先,具备大模型微调经验优先
-影响力与贡献:在ACL/CVPR/ICLR/NeurIPS等顶会发表过高影响力论文,或主导过开源多模态项目(如Hugging Face贡献)者优先。
