加入我们

大模型算法工程师-模型评测方向(J98466)

申请职位
| 社会招聘 | 北京市
发布时间:2026-05-01

工作职责:

-及时跟踪大模型技术前沿,承担基础模型与创新应用的效果评估工作,驱动模型迭代与优化,直接影响前沿技术落地效果与用户体验
-研究并跟踪国内外最新的大模型技术进展,搭建和维护科学、高效、可扩展的模型评测体系,打造医疗行业权威评测基准Benchmark
-深入参与团队内部模型训练的性能分析与评估,尤其聚焦在基础语言模型、多轮对话、多模态、AI Agent、强化学习等前沿技术方向的能力定量分析,对医疗模型进行能力水位衡量
-开发自动化、可扩展、可靠的评测系统,挖掘模型潜在瓶颈并提出改进建议,提高自动评估的占比,缩短评测周期,敏捷高效提升模型的效果
-参与制定模型评测的中长期规划,推动评测工具与流程自动化和标准化,构建业界领先的完整评测体系,结合人工和自动化评估手段,实现最佳的业务效果和用户体验

任职要求:

-本科及以上学历,计算机、人工智能相关专业优先
-具有扎实的编程功底,至少精通一门主流编程语言(C++/Java/Go/Python等),具备良好的工程实践能力
-在大模型训练、智能体应用、强化学习、提示词工程、数据集构建、数据挖掘、大模型评测等领域实践经验者优先
-有高水平论文发表经历者优先,包括但不限于ACL、EMNLP、COLING、WWW、AAAI等
-具备优秀的分析问题与解决问题的能力,对前沿技术具备敏锐的洞察力
-有好奇心,对新技术有热情,善于团队协作,具备创新精神和抗压能力