工作职责:
-基于前沿 SOTA 模型训练与推理优化原理,深入理解模型结构与设计理念,将训练与推理优化方法工程化落地,为客户提供系统化的加速解决方案,提升整体训练及推理效率
-面向自研芯片适配主流大模型,基于深度学习训练/推理框架特性开发或调优关键算子,持续提升模型在芯片上的性能与精度表现,并为客户提供芯片选型与应用支持
-负责面向 CPU/GPU/ASIC 等多元计算架构的通用编译系统设计、编译优化及相关前沿技术攻关
-跟踪业界前沿技术发展,参与 LLM、强化学习、Agent 等开源社区建设,参与原创算法或系统方向探索
任职要求:
-计算机、人工智能等相关专业在读学生,优先27届毕业生,表现优秀有转正机会
-熟练掌握至少一门编程语言(Golang/Python/Java/C++等),具备算法与数据结构基础
-对PyTorch框架有基础认知,了解Megatron、vLLM、SGLang等工具者优先
-接触过AI训练/推理优化(如模型压缩、分布式训练、混合精度调优)等工作优先
-熟悉 LLVM/TVM 等编译系统及优化原理并具备实践经验优先
-逻辑清晰,具备良好的沟通能力和团队协作意识
