工作职责:
-建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持智驾、AIGC、金融能源、智算中心客户AI应用高效部署
-负责云原生AI容器相关产品的架构设计和产品研发,引入开源社区先进的AI框架、AI调度、AI工作流和AI可观测能力组件构建全栈AI应用云原生解决方案
-构建异构多元芯算力底座,支持国产化信创,支持GPU虚拟化和混部调度,提升AI应用资源效率
-无缝对接客户和云上AI开发平台,支持文心和开源大模型训练推理任务部署,提供训练容错和弹性伸缩能力
-对接客户基础设施环境构建异构算力平台解决方案,支持大模型训练/推理ToB交付
-探索业界最新技术方向,参与开源社区,提升百度云原生AI核心竞争力
任职要求:
-本科及以上学历,2年以上工作经验
-优秀的编码能力,熟悉Golang/Python/Java/c/c++至少一项,有扎实的算法及数据结构基础,有良好的编程习惯。
-精通kubernetes基本工作原理,了解调度器、device-plugin、容器运行时运行机制、容器网络、RDMA通信;有Kubeflow、Volcano等相关开发经验优先
-熟悉开源大模型GLM/LLaMA/GPT3优先,熟悉Tensorflow/Caffe/Pytorch框架者优先,有大规模训练实践经验者优先
-对异构芯片虚拟化、CUDA编程、RDMA有一定了解者优先
-优秀的团队协作能力;具备较强的ownership,以结果为导向,负责领域内善于思考并积极改进