加入我们

可控人像视频生成算法工程师(J91590)

申请职位
| 社会招聘 | 北京市,上海市,深圳市
发布时间:2026-05-01

工作职责:

-负责百度视觉AIGC、多模态相关技术、系统、产品的研发工作
-包括但不限于:多模驱动人像视频生成、视频主体编辑以及模型的训练、推理优化
-支持面向多模态生成和编辑相关业务的数据生产和质量优化,支持百度相关业务达到业界领先的产品体验
-具有图像/视频理解和数据生产相关项目经验,在国际顶尖会议或期刊(CVPR、ICCV、ECCV、SIGGRAPH、TOG、TPAMI、ACL、EMNLP、NeurIPS等)发表相关论文优先
-具备极强的代码能力,编程比赛和学术评测竞赛高名次(ACM/Kaggle等)者优先

任职要求:

-熟练掌握Python,熟悉PyTorch/Paddle/TensorFlow/MXNet等框架之一
-独立分析和解决问题的能力,对图像/视频Caption和数据生产流程具有深入理解
-良好的沟通能力和团队合作能力