加入我们

多模态理解与生成数据算法工程师(J91588)

申请职位
| 社会招聘 | 北京市,上海市,深圳市
发布时间:2026-05-01

工作职责:

-负责百度视觉AIGC、多模态相关技术、系统、产品的研发工作
-包括但不限于:面向图像/视频生成及编辑的Caption能力建设、数据生产
-支持面向多模态生成和编辑相关业务的数据生产和质量优化,支持百度相关业务达到业界领先的产品体验
-具有图像/视频理解和数据生产相关项目经验,在国际顶尖会议或期刊(CVPR、ICCV、ECCV、SIGGRAPH、TOG、TPAMI、ACL、EMNLP、NeurIPS等)发表相关论文优先
-具备极强的代码能力,编程比赛和学术评测竞赛高名次(ACM/Kaggle等)者优先

任职要求:

-熟练掌握Python,熟悉PyTorch/Paddle/TensorFlow/MXNet等框架之一
-独立分析和解决问题的能力,对图像/视频Caption和数据生产流程具有深入理解
-良好的沟通能力和团队合作能力