工作职责:
-负责生成式大模型推理框架研发,提供高性能、高稳定、低延迟、低成本的推理服务
-负责推理服务化相关工作,包括模型部署,模型服务开发
-根据整体技术方案完成高质量的开发、自测及项目文档编写
-和团队一起攻克不同技术场景下的技术挑战
任职要求:
-计算机相关专业本科及以上学历,扎实的计算机基础理论知识,深刻理解数据结构和算法设计
-熟练使用Python语言开发,有推理系统研发经验,了解主流推理框架,如vLLM,transformer等
-熟悉Linux/Unix、多线程编程、网络编程及脚本编程
-熟悉Docker/K8s,了解基本原理及常规操作
-优秀的分析解决问题能力,对挑战性问题充满激情
-技术热情高,善于思考,具备良好的沟通能力和改进建议能力
-工作主动,责任心强,具备团队合作精神
