百度昆仑芯定制网申网申系统--招聘详细

agent训练工程环境研发实习生(J99851)

招聘类别：
实习生招聘
工作性质：
实习
薪资范围：
面议
招聘人数：
2

发布时间：
2026-05-09
截止时间：

工作地点：
北京市

工作职责：

-围绕 Agent 场景，参与数据、训练与评测基础设施建设，支持 Agent 能力的持续迭代与效果优化
-参与 Agent 训练与评测数据链路建设，包括任务环境配置、数据采集与清洗、轨迹数据组织、质量检查和版本管理
-参与轨迹合成流程的设计与实现，围绕多轮交互、工具调用、任务执行等场景构建样本、模板和质检规则
-开发和维护数据处理、训练启动、评测执行、日志统计等脚本，提升实验流程的自动化、稳定性和可复现性
-参与模型训练、对齐和偏好学习相关实验，协助完成样本采样、实验配置、结果记录与对比分析
-建设和完善 Agent 离线评测流程，包括小型评测集构建、指标设计、结果可视化、问题归因和优化建议沉淀
-与算法、工程和产品相关同学协作，跟进实验效果，沉淀可复用的数据处理、评测分析和训练支持工具

任职资格：

-计算机、统计、数学、人工智能等相关专业在读，具备扎实的编程基础和机器学习基础，熟悉 Python
-熟悉 PyTorch、Transformers 等常用训练框架，具备基础的数据处理、模型训练或实验脚本开发经验
-熟悉 Linux、Git、SQL 等常用开发工具，了解常见数据处理流程，有良好的代码规范和工程开发习惯
-了解大模型训练、模型对齐、偏好学习、SFT/RLHF 等基础概念，有相关课程、项目或实习经验者优先
-具备基础的实验设计与分析能力，能够完成数据清洗、样本采样、实验记录、结果可视化和结论总结
-熟悉 Docker 等开发环境；有 Kubernetes、Spark、Ray、分布式训练或分布式数据处理经验者优先
-对 Agent、多轮交互、工具调用、自动化评测等方向有兴趣，具备较强的学习能力、执行力和问题定位能力

现在申请

返回职位列表

热招职位更多 >>

长招职位更多 >>