工作职责:
-建设在重点应用场景效果领先的VL视觉理解大模型
-研究持续预训练(CPT)及退火训练技术,通过高质量领域数据增强垂直领域基座模型
-研究垂直领域的奖励规则和奖励模型,通过强化学习后训练,提升基座模型的领域知识推理能力
-研究前沿的文本/多模态模型架构与高效的训练推理技术,在先进模型结构、对齐训练算法、强化学习、推理时scaling、高效奖励模型设计、视觉推理、机制解释等方向深入研究并产出有影响力的结果
任职要求:
-计算机相关专业,对大模型有兴趣、有信念、有激情;发表过高水平论文的优先
-动手实践能力强,有Pretrain/SFT/RL等经验者优先,有Github相关项目、竞赛项目者优先
-深入研究或参与过主流大模型项目优先
-熟悉多模态常用算法, 包括但不限于InternVL,llava,mini-Gemini,Qwen-VL,Shikra等
-动手实践能力强,有多模态模型预训练经验者优先
-责任心强,积极主动,有良好的沟通能力和团队合作能力