加入我们

云原生高级研发工程师(J100116)

申请职位
技术 | 社会招聘 | 北京市,上海市
发布时间:2026-05-20

工作职责:

-建设业界领先的云原生 AI 基础设施,帮助客户在百度智能云上构建超大规模、高可用且高性能的 AI 集群,建设极致的集群弹性和智能运维等能力,打造 AI 时代智能且易用的企业级云原生产品
-负责 AI Infra 和 Agent Infra 云原生底座的设计与研发工作,建设稳定、高弹性和大规模集群基础设施
-负责云原生产品 Kubernetes 容器引擎、serverless 服务等产品的设计与研发工作,提升用户体验及产品竞争力
-持续提升 Kubernetes 容器引擎和 serverless 产品服务及基础设施的稳定性,优化服务性能,提升架构的可扩展性
-探索业界最新技术方向,参与开源社区,提升百度云原生核心竞争力

任职要求:

-本科及以上学历,计算机、软件工程及相关专业。2 年及以上相关工作经验
-熟悉操作系统原理及计算机网络原理,具备良好的数据结构和算法基础,熟练掌握 Go/Python/Java/C/C++ 中至少一门语言,熟练使用 Linux
-熟悉 Kubernetes 原理和使用,具备二次开发经验。有大规模训练/推理等场景下 Kubernetes 集群稳定性和性能优化经验优先
-熟悉容器实例、函数计算产品,有 serverless 服务开发经验优先
-至少具备以下经验之一:
-具有云原生基础设施编排系统的开发经验(IaC),熟悉 Kubernetes 集群的部署和构建流程及容器技术,了解虚拟化技术等云计算技术基本概念和原理,具备云计算、大规模分布式系统架构设计经验者优先
-熟悉 GPU 异构计算架构、集合通信基本原理,具有 AI 工作负载调度/编排/运行时组件开发和优化经验(Volcano/KubeFlow/device-plugin/GPU 虚拟化等)。熟悉 PyTorch、Ray、vLLM 等训练/推理框架,了解大模型训推加速技术者优先
-具有容器镜像仓库开发经验,熟悉 P2P 分发、懒加载等容器镜像分发和加载加速技术。有模型分发加速等大规模高并发镜像分发及加速技术落地经验者优先
-善于学习新知识,乐于钻研新技术,动手能力强,有强烈的自驱力和责任心
-拥抱 AI 技术,善于使用 AI 技术解决实际问题。了解 AI 智能体或有智能体的实际开发落地经验者优先
-具备良好的逻辑、沟通和协作能力,注重工程质量,能够独立分析和解决复杂问题,善于思考和总结