百度公有云异构加速工程师(J91679)
  • 招聘类别:
  • 社会招聘
  • 工作性质:
  • 全职
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 2
  • 发布时间:
  • 2026-05-01
  • 截止时间:
  •  
  • 工作地点:
  • 北京市,上海市

工作职责:

训练框架二次开发与优化(大语言模型与多模态模型)
-基于 Megatron-LM / DeepSpeed / Verl 等框架,进行并行策略及显存的优化
-集群化的 SFT、RLHF 等训练稳定性与吞吐优化
-多模态图文/视频/音频数据跨模态对齐训练
推理加速与集群化部署(大语言模型与多模态模型)
-PD 分离框架开发与优化
-落地量化、投机解码等优化策略
-基于新的异构硬件做算子开发适配与算子性能优化
性能观测与调优
-利用 PyTorch Profiler、Nsight Systems 等工具定位分析性能瓶颈并产出优化方案


任职资格:

基础
-计算机相关专业,5 年以上高性能计算/深度学习系统经验
-精通 PyTorch / CUDA,精通 Megatron-LM / Deepspeed / Verl 或 sglang / vllm,熟悉 C++/Python 混合开发,熟悉 Ray 等分布式框架
-深入理解 Transformer、Diffusion、MoE 等模型结构
加分项
-主导过大模型训练或千卡级训推集群性能调优
-开源训推框架的贡献者
-对 TPU、Ascend、AMD MI300 等异构芯片有移植经验

©2026  百度昆仑芯定制网申   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by