加入我们

高性能计算研发工程师(J95967)

申请职位
| 社会招聘 | 北京市
发布时间:2026-05-01

工作职责:

-负责公司基础大模型和专精大模型业务适配优化工作,通过SFT、RL、模型压缩、知识蒸馏、推理加速等技术保障大模型能力更好的落地业务
-负责构建各类大模型(文本、图像、语音)的高效分布式训练框架并持续优化,支持各类Post-train、RL、蒸馏技术方案高效训练和实验,跟踪Megatron/Deepspeed等框架核心进展,优化并行策略、通信掩盖、混合精度等持续提升模型效果
-对核心场景、核心模型的推理引擎极致优化,不限于pd分离、KVcache、投机解码、量化压缩等手段,降低TTFT持续提升decode吞吐,对超万亿参数模型积累部署推理优化经验;持续为上亿流量产品的大模型部署推理成本优化负责
-构建高效、灵活的强化学习工具链,探索Agentic、多轮环境交互的RL链路,提升训推rollout一致性;设计复用离线验证评估链路,支持算法高效迭代评估

任职要求:

-精通C/C++/python一种,有良好的编程习惯和扎实的算法基础,有大模型相关框架、工程实践经验
-了解前沿ai技术,熟悉大模型基本原理,熟悉Pytorch等深度学习框架,熟悉Megatron、DeepSpeed等分布式训练框架
-具备GPU集群性能分析和调优经验、熟悉CUDA编程、算子优化,及主流推理框架(vLLM、SGlang等),能够分析计算和通信效率
-优秀的分析问题和解决问题的能力,沟通能力和团队合作意识强,热爱挑战,自驱力强持续学习