工作职责:
-负责桌面端Agent应用的评测体系构建,包括评测指标、评测流程、数据集建设等建设,以及前沿评测方法的研究和设计
-负责评测方案设计,提升评测方案的全面性、真实性,确保评测流程高效、结果可复现
-协同算法工程团队,通过评测推进 Agent 策略优化形成闭环(评测->分析->优化->验证)
-跟踪业界 Agent 交互体验与能力基准对比,输出竞品评测分析报告,为产品规划、功能迭代及体验优化提供决策依据
任职要求:
-本科及以上学历,熟悉大模型、Agent 的基本原理
-有 Agent 评测集设计经验,有良好的沟通能力和团队协作能力
-具备良好的抽象能力,能够将 Agent 能力转化为可评测的任务与指标
-良好的沟通与项目推进能力,能够高效协同工程团队落地方案
-有 Agent 评测或产品设计相关的经验为加分项
