工作职责:
-带领团队进行生成式语音合成的研发,包括 VAE、Flow、Diffusion、LLM 等模型
-推动 zero-shot / few-shot、跨语言、跨音色等前沿 TTS 技术在实际产品中的落地
-建设语音数据生产与评测体系,确保高质量数据和评测标准
-与产品、业务团队紧密合作,推动 TTS 技术在数字人直播、智能助手、车载、IOT 等场景的规模化应用
-负责团队管理、人员培养和梯队建设,营造良好的技术氛围
任职要求:
-语音、计算机、电子工程、人工智能相关专业硕士及以上学历,博士优先
-3年以上语音相关研发经验,1 年以上技术团队管理经验
-深刻理解并有实践经验的技术:VAE、Flow-based models、Diffusion、GAN 、LLM等
-具备 zero-shot / few-shot TTS、跨语言/跨音色、风格化/情感语音合成经验
-熟悉端到端 TTS 技术(FastSpeech、Glow-TTS、VITS 等),具备从 0-1 搭建系统的能力
-具备百万小时规模语音数据处理与建模经验,了解数据清洗、增强、仿真全流程
-具备优秀的沟通能力,有项目成功落地经验
