机器学习架构工程师(J82075)
  • 招聘类别:
  • 社会招聘
  • 工作性质:
  • 全职
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 10
  • 发布时间:
  • 2026-05-01
  • 截止时间:
  •  
  • 工作地点:
  • 北京市,上海市

工作职责:

-负责商业广告场景生成式推荐大模型的端到端架构设计与落地,覆盖从预训练/微调、推理到在线评估的全流程,搭建高可用、高扩展的模型工程架构,支撑商业广告场景的生成式技术创新
-负责生成式模型的训练加速与推理优化攻关,深入应用 Transformer/DeepSpeed/FlashAttention/SMoe等前沿技术,解决超长序列、编译优化、显存优化等关键瓶颈,打造业界领先的高吞吐、高稳定训推平台
-深度协同算法策略团队,将 CTR/CVR 预估、序列建模及多模态大模型等前沿算法转化为高效的生产系统,建立从“实验原型”到“线上服务”的快速迭代机制,解决复杂场景下的工程适配难题,显著提升策略迭代效率与商业变现能力
-跟踪推荐系统、生成式 AI 及大模型领域的最前沿学术论文,负责工程优化和策略算法的评估、复现和落地


任职资格:

-计算机、人工智能、数学等相关专业本科及以上学历,博士学历或在 MLSys, SIGIR, KDD 等顶级会议有论文发表者优先
-熟悉以下技术或者具备实战经验者优先:主流训练框架(PyTorch/TF/Paddle)、分布式训练架构(DeepSpeed/Megatron-LM)或者前沿训推加速技术(FlashAttention/PagedAttention/vLLM)
-熟悉C++/Python/Linux/CUDA编程,具备GPU集群性能调优与问题诊断经验,能够独立解决内存、通信与计算瓶颈
-熟悉搜索、广告、推荐系统领域,了解 CTR/CVR 预估、embedding技术、离散特征、序列化建模等技术
-具备主动钻研新技术、学习能力强,对行业前沿的推荐、信息检索、生成式AI等技术动态有敏锐嗅觉,乐于探索、挑战难题并推动成果转化
-具备良好的沟通与团队协作意识,责任心强,具备大型复杂业务背景下的项目推动与闭环能力

©2026  百度昆仑芯定制网申   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by