百度昆仑芯定制网申网申系统--招聘详细

2027AIDU-AI异构计算研发工程师(J99964)

招聘类别：
校园招聘
工作性质：
全职
薪资范围：
面议
招聘人数：
若干

发布时间：
2026-05-12
截止时间：

工作地点：
北京市,上海市

工作职责：

我们致力于构建全球领先的AI异构计算加速引擎和加速平台。建立融合推理（Inference）、训练（Training）的软硬件一体的AI计算加速解决方案，并应用于行业最大的规模的AI数据中心，解决云计算、搜索、信息流、图像、视觉、语音、自然语言处理等的算法优化与计算加速问题。
1. 负责大规模AI前向计算引擎（Inference Engine）框架和底层算子开发与优化；
2. 负责大规模AI计算通信库及通信算法开发与优化；
3. 负责面向CPU/GPU/FPGA/ASIC等多元化计算架构的编译系统开发、编译优化和算法加速；
4. 负责异构高性能计算平台的设计、研发，高性能计算库、通信库开发与优化。

任职资格：

精通以下一项或多项专业技能，或在相关领域具备丰富经验
专业技能：
1. 热爱编程，精通C++/Python；
2. 具有独立开发能力，对AI算法和主流框架有丰富的应用或开发经验；
3. 精通GPU/ARM/MIPS/DSP等任意异构计算平台；
4. 精通计算机体系结构，有汇编级别开发经验；
5. 精通GPU/ARM/MIPS/DSP等异构计算平台的通信库；
6. 精通MPI，对不同网络拓扑结构的通信算法及底层通信函数有深入研究，对RDMA，GPU direct等技术有了解；
7. 对分布式计算有深入理解，特别是同步，异步等通信策略在AI计算中的应用。
软素质：
1. 目标驱动，并有探索精神；
2. 团队协作及沟通能力；
3. 具备分析和解决问题的能力；
4. 有极强的学习能力和知识迁移能力。
具有以下条件者优先：
1. 精通PaddlePaddle、Caffe/Caffe2、MXNET、TensorFlow等开源框架，做过源码级优化移植等工作；
2. 熟练使用Cublas、Cudnn、MIopen、OpenBlas、MKL、Eigen等主流计算库；
3. 熟悉AI training通信过程，熟悉MPI，NCCL，RDMA，GPU Direct等通信技术；
4. 精通CUDA/OpenCL开发，有SASS或PTX级别优化开发经验；
5. 精通Neon或ARM-GPU开发，有过大小端并行计算优化经验及ARM-GPU协同开发经验；
6. 精通常用硬件平台性能分析工具链，如CodeXL\NVVP\GPA等；
7. 精通LLVM；
8. 有Linux内核相关开发和优化经验。

招聘部门：大模型基建部、预训练部

现在申请

返回职位列表

热招职位更多 >>

长招职位更多 >>