百度昆仑芯定制网申网申系统--招聘详细

大模型推理研发实习生(J98277)

招聘类别：
实习生招聘
工作性质：
实习
薪资范围：
面议
招聘人数：
8

发布时间：
2026-05-01
截止时间：

工作地点：
北京市,上海市,广东省-深圳市

工作职责：

-负责百度文心大模型的推理性能优化
-参与飞桨深度学习平台(PaddlePaddle)推理框架的设计、开发和业务支持
-负责深度学习框架的性能优化工作，包括但不限于功能模块在CPU/GPU上的深度优化工作
-负责深度学习推理框架前瞻技术的跟踪调研，实现技术创新突破
-参与深度学习框架的易用性优化工作，使开发者能够以更简单的方式实现各类任务，降低学习成本和开发成本
-负责异构高性能计算平台的设计、研发，高性能计算库、通信库开发与优化

任职资格：

-热爱编程，精通C++/Python,精通CUDA编程
-具有独立开发能力，精通计算机体系结构，有汇编级别开发经验，对AI算法和主流框架有丰富的应用或开发经验
-了解FlashAttention、PagedAttention、MoE、Chunked Prefill 等大模型核心技术；
-掌握大模型量化(如 AWQ、GPTQ等)、稀疏(如DSA、SWA等)、投机解码(如Egale系列)等加速技术
-了解大模型通信算子（如Allreduce 等）及计算通信 overlap 实现；
-有分离式部署(PD分离)开发经验。
软素质：
-目标驱动，并有探索精神
-团队协作及沟通能力
-具备分析和解决问题的能力
-有极强的学习能力和知识迁移能力
具有以下条件者优先：
-精通PaddlePaddle、Pytorch等主流开源框架，做过源码级优化移植等工作，有vLLM、SGLang、TensorRT-LLM等大模型推理框架的使用或优化经验；

现在申请

返回职位列表

热招职位更多 >>

长招职位更多 >>