工作职责:
-研发突破性多模态大模型架构,探索视觉-语言-语音-3D跨模态融合新范式
-优化大模型训练策略,攻克模态对齐、知识蒸馏、强化学习等技术难题
-推动前沿技术产品化落地,在百度网盘、百度文库、TeraBox、橙篇等产品场景实现价值闭环,改变十亿级用户产品体验
-持续跟踪ICLR/NeurIPS/CVPR等顶会最新进展,保持技术领先性
-深入挖掘产品潜在价值和需求,通过技术创新推动产品成长
任职要求:
-包含但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、电子工程、统计学、应用数学、物理学/量子计算、信息安全、信号与信息处理等专业的博士和优秀硕士
-精通Transformer/CLIP/Diffusion等技术,具备多模态预训练实战经验(图文/视频/3D等领域),熟悉MoE、模型蒸馏,深入理解对比学习、提示工程、RLHF等技术原理
-对新技术和新算法保持敏锐的触觉,具备快速学习和应用的能力;良好的沟通能力、团队合作精神以及较强的问题解决能力
-主导过大模型训练优化或模型调优,兼具工程实现能力与理论推导功底
-顶级会议论文(CVPR/ACL/ICML等)或开源项目核心贡献者优先
