工作职责:
-负责语音场景大模型/跨模态大模型分布式训练框架搭建和高性能计算优化工作
-负责大模型推理引擎在GPU/NPU/XPU等平台性能优化工作,构建高并发低时延的推理引擎
-与算法团队深入合作,支持语音大模型在多终端多场景工程优化和落地
任职资格:
-精通C/C++编程,有良好的编程习惯和扎实的算法基础
-了解深度学习/LLM算法,熟悉主流大模型训练推理流程,熟悉Pytorch/Paddle等框架的加分
-对高性能计算/分布式系统/异构计算/编译系统等有了解,有过mpi、gcc、gpu等开发经验加分
-了解多线程加速、DSP相关移植、进程间通信,有过DSP的指令集以及加速方法开发经验的加分
-优秀的分析问题和解决问题的能力,沟通能力、团队合作意识强,热爱挑战,踏实勤奋