工作职责:
-参与大模型预训练和后训练(文本、图像、视频)的算法研发和模型训练工作,聚焦大模型在逻辑推理、长文本处理等核心任务的性能提升
-优化 verifier,实现强化学习训练的稳定性突破,推动模型能力迭代升级
-探索高效的模型调优策略、高质数据建设方法,研究大模型前瞻技术和趋势
-设计、实现、优化分布式系统和并行计算框架,提升训练和推理效率
-提升 Agent 自主决策与任务执行效率,加速大模型智能体在多元实际场景中的落地应用,探索技术创新边界
任职要求:
-大模型、NLP、多模态相关研究方向的博士或硕士研究生
-具备良好的算法实现能力,熟练掌握PyTorch、TensorFlow等深度学习框架
-在NLP、CV、ML等领域顶级学术会议发表过高质量文章者优先
-有较强的竞赛成绩,获得过 ACM,NOI,NOIP 或其他商业代码竞赛的任意奖项者优先
