工作职责:
-预训练和微调多模态大模型,建设在地图应用场景效果领先的模型,针对落地场景中遇到的实际问题进行算法改进与效果提升
-研究持续预训练技术,通过高质量领域数据增强垂直领域基座模型
-研究垂直领域的奖励规则和奖励模型,通过强化学习后训练,提升基座模型的领域知识推理能力
-研究前沿的文本/多模态模型架构与高效的训练推理技术,在先进模型结构、对齐训练算法、强化学习、推理时scaling、高效奖励模型设计、视觉推理、机制解释等方向深入研究并产出有影响力的结果
任职要求:
-有自动驾驶或地图行业经验,有自动驾驶端到端大模型预训练经验者优先
-计算机相关专业,对大模型有兴趣、有信念、有激情;发表过高水平论文的优先
-动手实践能力强,有大模型预训练和RL训练的实践经验
-深入研究或参与过主流大模型项目优先,有Github相关项目、竞赛项目者优先
-熟悉多模态大模型相关算法, 包括但不限于CLIP、Diffusion、PPO/ DPO/ GRPO、Agent等
-了解开源大模型,包括但不限于Qwen、LLaMA、DeepSeek等
-责任心强,积极主动,有良好的沟通能力和团队合作能力
