加入我们

语音算法实习生(J84146)

申请职位
| 实习生招聘 | 北京市
发布时间:2026-05-01

工作职责:

-实验最新语音合成、理解方案,并对其中的模块进行解耦和分析。
-结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统。
-参与到具体的语言合成业务落地工作
-参与语音大模型的评测及优化。

任职要求:

-计算机、人工智能、信号处理、通信、数学等相关专业,本科及以上学历。
-精通 Python/C/C++等编程语言,熟练使用 Pytorch进行深度学习模型开发。
-熟悉TTS、ASR等语音基础理论和算法,了解或使用过VITS/VALLE/FishSpeech/CosyVoice,有LLM理论和训练基础的优先。
-有语音合成等相关实际项目经验者优先。
-具备良好的沟通能力,对技术充满热情。