电商多模态大模型算法工程师(J86922)
  • 招聘类别:
  • 社会招聘
  • 工作性质:
  • 全职
  • 薪资范围:
  • 面议
  • 招聘人数:
  • 1
  • 发布时间:
  • 2026-05-01
  • 截止时间:
  •  
  • 工作地点:
  • 北京市

工作职责:

-基于开源底模和后训练技术研发电商场景的图片和视频生成模型,应用到电商数字人、电商搜索及推荐场景
-研发电商直播场景下的多模态语言模型,用于多模商品理解,视频人物动作、表情理解
-研发视频/图片内容理解,识别低质内容,建设高准召的图片/视频质量分级
-协同产品和运营持续提升产品能力,拓展技术应用规模,协同工程架构提升视频产能


任职资格:

-深入理解GAN、 VAE、AR、Diffusion Model/CFM、DPO、蒸馏等视觉生成技术,有成功的模型算法优化和应用经验。有3D人脸建模,talking-head生成,唇驱等数字人相关技术背景尤佳
-熟悉条件生成技术和应用,如ControlNet,IP-adapter等
-CV相关领域3年以上经验,具有扎实的算法理论和研发基础,熟练掌握常用CV算法和工具(分类、分割、超分等);有顶会论文发布着优先
-勤于钻研前沿技术,具备较强的自学能力,能够将技术应用到具体业务上

©2026  百度昆仑芯定制网申   京ICP备05051632号-16 京公网安备 11010802032024号隐私政策 Powered by