加入我们

百度公有云模型训推加速工程师(J95356)

申请职位
| 社会招聘 | 北京市,上海市
发布时间:2026-05-01

工作职责:

-负责大模型核心算子的开发/性能分析优化
-负责模型算子以及模型编译精度验证
-负责VL/VLA模型中一种以上模型的训练/加速/精度评估
-负责针对VL/VLA模型的强化学习训练框架开发和优化工作

任职要求:

-掌握cuda/cutlass dsl等编程,发掘GPU硬件特性,完成常见算子flashattention/gemm等优化工作
-对常见算子attention/mlp的底层计算过程有深入了解和分析
-熟练使用Nsight Systems/Compute对算法的运行效率如速度、显存占用等进行优化,保证模型精度下提升模型的计算效率
-掌握VL/VLA模型中一种以上的常用模型
-掌握Verl/OpenRLHF/SimpleVLA-RL/Isaac Lab等一种以上的强化学习训练框架