工作职责:
-结合前沿业务场景,构建昆仑芯AI大规模训练系统
-持续提升系统效能
-主流AI模型对昆仑芯AI芯片的适配和性能优化工作
-探索昆仑芯AI芯片分布式训练方案
任职要求:
-计算机及计算机相关专业本科及以上学历
-熟悉C/C++,良好的编程习惯,熟悉计算机基础算法和数据结构,熟悉 Linux 开发环境
-有深度学习框架(Pytorch, Tensorflow, PaddlePaddle等)开发或使用经验优先
-熟悉MPI,有大规模训练调优经验优先;有深度学习算子开发优化经验优先