工作职责:
-数据标注与评测:参与大模型数据的标注、复核、整理统计等工作,对标注结果进行质量评估,优化标注质量,协助撰写数据分析报告
-模型效果评测:对大模型效果进行评测,输出效果分析报告
-自动化评测框架开发:参与自动化评测框架的开发、评测方案的制定与评测数据集的建设
-完成其他日常运营工作,如对竞品模型与行业发展情况进行分析调研等
任职资格:
-本科或硕士在读,计算机及相关专业优先,2026年及以后毕业
-需要熟练掌握Python等工具,具备良好的编程能力,能够阅读和编写代码
-对大规模语言模型或多模态模型有深入理解,日常高频使用大语言模型解决问题
-有大型AI项目测试经验或参与过大模型评测相关工作经验的优先
-具备良好的沟通、学习能力和自我驱动力