加入我们

推理架构研发(J90729)

申请职位
| 社会招聘 | 北京市
发布时间:2026-05-01

工作职责:

-负责生成式大模型推理框架研发,提供高性能、高稳定、低延迟、低成本的推理服务
-负责推理服务化相关工作,包括模型部署,模型服务开发
-根据整体技术方案完成高质量的开发、自测及项目文档编写
-和团队一起攻克不同技术场景下的技术挑战

任职要求:

-计算机相关专业本科及以上学历,扎实的计算机基础理论知识,深刻理解数据结构和算法设计
-熟练使用Python语言开发,有推理系统研发经验,了解主流推理框架,如vLLM,transformer等
-熟悉Linux/Unix、多线程编程、网络编程及脚本编程
-熟悉Docker/K8s,了解基本原理及常规操作
-优秀的分析解决问题能力,对挑战性问题充满激情
-技术热情高,善于思考,具备良好的沟通能力和改进建议能力
-工作主动,责任心强,具备团队合作精神