加入我们

大模型训练引擎研发工程师(J97120)

申请职位
| 社会招聘 | 北京市,上海市,深圳市
发布时间:2026-05-01

工作职责:

-负责大模型训练引擎的架构设计与核心模块开发,确保系统的高性能与可扩展性
-优化训练引擎的分布式计算能力,提升大规模数据训练的效率与稳定性
-研究和实现先进的模型架构与训练算法,并将其集成到训练引擎中
-解决训练引擎在实际应用中的性能瓶颈问题,从算子/并行/通信/显存等多维度,持续改进系统性能

任职要求:

-本科及以上学历,计算机科学、人工智能或相关专业
-熟悉C++或Python编程,具备良好的代码规范与开发习惯
-熟悉深度学习框架、分布式计算、并行计算等相关技术原理,有Megatron/FSDP等大模型训练引擎开发经验者优先
-熟悉CUDA 等芯片算子研发,了解硬件架构,有算子研发经验者优先