加入我们

电商多模态大模型算法工程师(J86922)

申请职位
| 社会招聘 | 北京市
发布时间:2026-05-01

工作职责:

-基于开源底模和后训练技术研发电商场景的图片和视频生成模型,应用到电商数字人、电商搜索及推荐场景
-研发电商直播场景下的多模态语言模型,用于多模商品理解,视频人物动作、表情理解
-研发视频/图片内容理解,识别低质内容,建设高准召的图片/视频质量分级
-协同产品和运营持续提升产品能力,拓展技术应用规模,协同工程架构提升视频产能

任职要求:

-深入理解GAN、 VAE、AR、Diffusion Model/CFM、DPO、蒸馏等视觉生成技术,有成功的模型算法优化和应用经验。有3D人脸建模,talking-head生成,唇驱等数字人相关技术背景尤佳
-熟悉条件生成技术和应用,如ControlNet,IP-adapter等
-CV相关领域3年以上经验,具有扎实的算法理论和研发基础,熟练掌握常用CV算法和工具(分类、分割、超分等);有顶会论文发布着优先
-勤于钻研前沿技术,具备较强的自学能力,能够将技术应用到具体业务上