百度百舸机器学习平台研发工程师(J97339)
  • 招聘类别:
  • 社会招聘
  • 工作性质:
  • 全职
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 4
  • 发布时间:
  • 2026-05-18
  • 截止时间:
  •  
  • 工作地点:
  • 北京市,上海市

工作职责:

-负责百度百舸大规模AI计算集群基础设施和产品的设计与研发工作,支撑内部业务和外部客户需求
-基于标准Kubernetes技术,构建异构多芯计算集群,优化GPU集群自愈、资源调度、虚拟化、Serverless等核心能力,有效提升AI集群资源效率
-基于AI算力集群,研发大规模分布式训练、分布式推理系统技术,有效提升系统容错能力和性能
-研发大模型时代的机器学习平台,支持模型开发、模型训练、模型部署、数据工程、工作流等AI工程全周期场景
-提升服务和产品的稳定性,优化服务性能和可扩展性


任职资格:

-计算机及相关专业,本科及以上学历
-熟悉Kubernetes工作原理,熟悉调度器、资源扩展机制、容器运行时、容器网络等技术,有Kubernetes开发和维护经验
-对Kubeflow、Volcano、Pytorch、Ray、GPU芯片架构有一定了解者优先
-具备良好的沟通能力和团队协作精神,严谨的工作态度,注重工程质量,有独立解决各种系统问题的能力
-善于学习新的知识,动手能力强,有强烈的责任心,喜欢钻研技术

©2026  百度昆仑芯定制网申   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by