工作职责:
-围绕 Agent 场景,参与数据、训练与评测基础设施建设,支持 Agent 能力的持续迭代与效果优化
-参与 Agent 训练与评测数据链路建设,包括任务环境配置、数据采集与清洗、轨迹数据组织、质量检查和版本管理
-参与轨迹合成流程的设计与实现,围绕多轮交互、工具调用、任务执行等场景构建样本、模板和质检规则
-开发和维护数据处理、训练启动、评测执行、日志统计等脚本,提升实验流程的自动化、稳定性和可复现性
-参与模型训练、对齐和偏好学习相关实验,协助完成样本采样、实验配置、结果记录与对比分析
-建设和完善 Agent 离线评测流程,包括小型评测集构建、指标设计、结果可视化、问题归因和优化建议沉淀
-与算法、工程和产品相关同学协作,跟进实验效果,沉淀可复用的数据处理、评测分析和训练支持工具
任职资格:
-计算机、统计、数学、人工智能等相关专业在读,具备扎实的编程基础和机器学习基础,熟悉 Python
-熟悉 PyTorch、Transformers 等常用训练框架,具备基础的数据处理、模型训练或实验脚本开发经验
-熟悉 Linux、Git、SQL 等常用开发工具,了解常见数据处理流程,有良好的代码规范和工程开发习惯
-了解大模型训练、模型对齐、偏好学习、SFT/RLHF 等基础概念,有相关课程、项目或实习经验者优先
-具备基础的实验设计与分析能力,能够完成数据清洗、样本采样、实验记录、结果可视化和结论总结
-熟悉 Docker 等开发环境;有 Kubernetes、Spark、Ray、分布式训练或分布式数据处理经验者优先
-对 Agent、多轮交互、工具调用、自动化评测等方向有兴趣,具备较强的学习能力、执行力和问题定位能力