工作职责:
-参与大模型AI系统的研发,研究面向生成式大模型的训练和推理加速技术
-深度优化大模型推理的核心算法,如算子融合、cuda-graph调优、软硬协同、通讯计算的overlap等
-参与大模型相关产品的研发落地
-持续研究大模型的算法创新,研发下一代大模型训练、推理范式等
任职要求:
-具有计算机科学、人工智能、软件工程或相关专业大学本科及以上学历学位
-精通Python/Cuda编程,有cublas、cutlass等研发调优经验
-有算子融合、算子调优、cuda-graph等调优手段的实践经验
-熟悉gpu硬件体系架构,了解各代系硬件特性和调优手段
-为人正直,具有较强的动手能力、责任心,以及优秀的人际沟通和团队合作能力