工作职责:
-研发突破性多模态大模型架构,探索视觉-语言-语音-3D全模态理解、生成
-研发新一代Agent架构,实现感知-决策-执行-进化的闭环能力突破
-优化大模型训练策略,攻克模态对齐、知识蒸馏、强化学习等技术难题
-优化长期记忆、推理、Agentic RL机制,实现复杂场景下的自主学习能力与策略泛化
-推动前沿技术产品化落地,在百度网盘、百度文库、TeraBox、橙篇等产品场景实现价值闭环,改变十亿级用户产品体验
-持续跟踪ICLR/NeurIPS/CVPR等顶会最新进展,保持技术领先性
-深入挖掘产品潜在价值和需求,通过技术创新推动产品成长
任职要求:
-包含但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、电子工程、统计学、应用数学、物理学/量子计算、信息安全、信号与信息处理等专业的博士和优秀硕士
-精通Transformer/Diffusion/Reinforcement Learning/AI Coding/Agent中一种或多种技术
-对新技术和新算法保持敏锐的触觉,具备快速学习和应用的能力;良好的沟通能力、团队合作精神以及较强的问题解决能力
-主导过大模型训练优化或模型调优,兼具工程实现能力与理论推导功底
-顶级会议论文(CVPR/ACL/ICML等)或开源项目核心贡献者优先
