加入我们

大模型AI系统架构工程师(J82517)

申请职位
| 社会招聘 | 北京市
发布时间:2025-02-14

工作职责:

-参与大模型AI系统的研发,研究面向生成式大模型的训练和推理加速技术
-深度优化大模型推理服务中的关键技术,如推理引擎、动态batching、模型量化、服务请求调度、低资源推理、投机式推理等
-参与大模型的产品落地,包括基于反馈和强化学习算法的调整等
-推动大模型的技术研发,包括算法创新、系统评测等

任职要求:

-具有计算机科学、人工智能、软件工程或相关专业大学本科及以上学历学位
-优秀的编程能力,精通Python/C++,熟悉PyTorch框架
-对常见开源推理引擎(vllm,sglang,triton etc)有深度掌握的优先
-掌握常见的大模型优化方案,熟悉主流的推理和训练加速算法
-工作态度积极主动,具备较强的逻辑思维和表达能力
-为人正直,具有较强的动手能力、责任心,以及优秀的人际沟通和团队合作能力