大规模AI系统优化与异构计算实习生(J98266)
  • 招聘类别:
  • 实习生招聘
  • 工作性质:
  • 实习
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 1
  • 发布时间:
  • 2026-05-01
  • 截止时间:
  •  
  • 工作地点:
  • 北京市

工作职责:

-负责自动驾驶大模型在 NVIDIA GPU 上的推理算子研发与极致加速
-设计与优化支持千卡级别的分布式训练框架,提升集群整体的训练吞吐量与稳定性
-针对大模型结构进行显存优化、算子融合(Kernel Fusion)及通信性能(如 NCCL)调优
-追踪业界最新的 AI Infra 技术(如 Triton、vLLM、Megatron),并推动其在团队业务中的落地部署


任职资格:

-计算机体系结构、高性能计算等相关专业,精通 C/C++ 与 CUDA 编程
-深入理解底层硬件架构,熟悉并行计算、分布式系统原理或深度学习编译器(如 TVM/TensorRT)
-有深度学习框架底层开发经验,或向核心开源社区(如 PyTorch, Triton)贡献过代码者优先

©2026  百度昆仑芯定制网申   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by