昆仑芯官方招聘

工作职责:

-负责Post-training工具链开发：负责千帆MAAS平台大模型SFT、蒸馏、强化学习（RL）等后训练环节的工具链开发，提升大规模训练的稳定性与执行效率
-负责RLaaS能力落地：参与“强化学习即服务（RLaaS）”的方案调研与实现，通过解耦算力资源与算法逻辑，让内外部客户能够高效低成本在自身业务数据上启动高效率的 RL 训练
-提升平台易用性与扩展性：快速定位并解决用户线上问题，将高频业务需求沉淀为平台通用功能，通过组件化设计优化工具链的复用性
-前沿技术落地：跟踪调研业内主流后训练技术，负责将其转化为平台核心能力，保持产品的技术领先性

任职要求:

-教育背景：计算机、人工智能等相关专业本科及以上学历
-编程功底：熟练掌握 Python、 PyTorch，具备扎实的数据结构与算法基础，具备良好的工程实现能力
-大模型经验：熟悉 Transformer 架构及大模型训练原理、熟悉后训练常用技术（SFT、 DPO、 RFT）、熟悉分布式并行策略（ZeRO、TP、PP、EP）
-加分项
-深度参与过开源或者闭源大模型的post-training项目
-熟悉 verl、llamafactory、ms-swift、slime、openrlhf等微调框架，理解后训练技术原理
-具备大规模集群（如千卡以上）训练优化经验者优先

加入我们

大模型平台策略算法工程师(J97419)

工作职责:

任职要求: