工作职责:
-基于开源基模和后训练算法,研发电商场景图片和视频生成与理解模型,基于商用和自研模型构建Agent,应用到电商数字人直播,短视频生成
-研发多模理解Agent,应用于多模商品理解,视频人物动作、表情理解;构建分镜脚本智能生成系统,支持基于商品卖点或剧情梗概自动输出专业分镜方案
-研发视频人物和背景分割、风格迁移等相关算法,结合电商数字人带货场景做极致算法性能优化,降低生成成本、提升生成效率
-协同产品和运营持续提升产品能力,拓展技术应用规模,协同工程架构提升视频产能
任职要求:
-深入理解GAN、 VAE、Diffusion Model/CFM等视觉生成技术,精通DPO、LORA、蒸馏等训练方法,有成功的模型算法优化和应用经验。有3D人脸建模,talking-head生成,唇驱等数字人相关技术背景优先
-熟悉Wan、CogVideoX等开源视频生成基座模型,精通DiT和mmDiT架构,了解可控生成技术和应用,如ControlNet,IP-adapter等
-CV相关领域3年以上经验,具有扎实的算法理论和研发基础,熟练掌握常用CV算法和工具(分类、分割、超分等);有顶会论文优先
-具有AIGC电商带货,广告营销或AI短剧相关项目背景,对分镜语言、剪辑节奏有技术审美者优先
-勤于钻研前沿技术,具备较强的自学能力,能够将技术应用到具体业务上
