加入我们

推理优化资深研发工程师(J84735)

申请职位
| 社会招聘 | 北京市
发布时间:2025-04-24

工作职责:

-参与公司深度学习推理引擎、AI编译器的架构设计、开发和优化,确保领域内推理引擎技术的先进性
-参与多模态LLM、视频生成模型推理性能性能的极致优化,保持业界SOTA
-研究最近的推理优化技术,跟踪最新研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并应用到业务
-和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战

任职要求:

-计算机软件或相关专业本科以上学历
-扎实系统功底和编程能力,熟练掌握C++/Python,熟悉常见数据结构和设计模式;
-熟悉深度学习基本原理和Pytorch深度学习框架,有对Pytorch框架二次开发经验者优先
-熟悉常见AI编译技术,如Torch.compile、TVM等,有相关二次开发经验者优先
-拥有高性能计算或模型优化经验和兴趣,熟练掌握Cuda,或拥有计算密集型优化经验
-热爱技术、有较强的学习能力、复杂问题归纳梳理能力
-追求极致的心态