工作职责:
1. 构建AI异构计算加速引擎,负责底层算子、通信库、编译系统开发与优化;
2. 面向CPU/GPU/FPGA/ASIC等架构进行性能调优;
3. 设计自适应分布式系统,优化大模型训练与推理效率;
4. 探索算法与算力协同优化,降低大模型成本。
任职资格:
1. 计算机、电子等相关专业硕士及以上学历;
2. 精通C++/Python,熟悉计算机体系结构;
3. 有GPU/ARM/MIPS/DSP等异构计算平台开发经验;
4. 熟悉MPI、NCCL、RDMA等通信技术;
5. 有CUDA/OpenCL编程或LLVM经验者优先;
6. 有大规模AI集群或超算系统软件开发经验者优先。
招聘部门:AI计算部