工作职责:
-研发前沿的跨模态语音交互相关算法和技术方案,支持端到端语音语言大模型、文本可控语音合成大模型和语音增强大模型等研发工作
-研究跨模态数据表征方法、高质量数据萃取方法、高效算法算力融合的创新算法,探索跨模态端到端大模型的前瞻技术和趋势
-负责语音合成、语音识别、声纹识别、语音唤醒等核心技术及产品研发
-支持语音大模型的平台化和规模化创新应用落地
任职资格:
-具备机器学习/深度学习/自然语言处理/语音处理/计算机视觉的理论背景和实践经验
-熟练掌握Python编程语言以及Pytorch、Tensorflow、PaddlePaddle等其中一项深度学习开发框架
-具有较好的团队沟通合作能力、分析问题和解决问题的能力
-有较强的工程实践经验,发表行业顶级论文者优先
加分项
-获得过 ACM,NOI,NOIP 或其他商业代码竞赛的任意奖项
-有较强的钻研精神,对部分语言、系统、算法有深刻的探索和理解