APP下载

微软展示智能合成声音定制技术新玩法,让每一…

消息来源:baojiabao.com 作者: 发布时间:2024-10-06

报价宝综合消息微软展示智能合成声音定制技术新玩法,让每一…

  8 月 18 日消息 智能语音技术的飞速发展,让 AI 合成语音的听感更加自然、逼真,让越来越多企业实现了与客户的多模态互动。基于微软 Azure 云平台创建声音定制服务定制的专属个性化声音,已被广泛应用在诸如语音助手、聊天机器人、在线学习、有声读物或新闻播报等多种使用场景。

  传统上,完成一个定制声音时间周期长、复杂度高。需要发音人录制成千上万句语料作为训练数据,再由拥有深度神经网络和语音合成专业背景的专家针对客户的语音数据进行声学模型和语音合成器的训练及调优,整个过程往往需要数月的时间。微软推出基于深度神经网络的声音定制服务,所需训练数据更少,只要 300 至 2000 句语料数据(约 30-120 分钟);训练调优的难度和复杂度更加简化,即使没有深度神经网络和语音合成专业背景的用户也可实现自助训练,得到媲美人类发音的效果。用户需注册 Azure 云平台 Speech Studio,申请获得深度神经网络声音定制权限后,即可一键完成个性化声音模型的训练,并快速部署 API,适用于各种场景的应用开发。

  除平台自助服务,微软专家还可为有需求的客户提供包括声音画像设计、发音人选择、录音指导、模型评估和调优等全流程的语音定制支持和辅导,帮助英国 BBC 广播公司、Swisscom 瑞士电信、美国 AT&T 旗下的华纳兔八哥体验店、美国 Progressive 前进保险公司、Duolingo 多邻国和国内的小米、华人运通等不同行业的客户成功打造了自己的专属定制声音。

  据悉,美国 AT&T 体验店兔八哥语音助手,采用了微软的声音定制服务,并以兔八哥配音演员的授权声音创建了这一虚拟动画人物的语音模型,以奇趣的风格与顾客对话,回答常见的问题,增强了顾客粘性。

  微软 AI 语音技术在 AT & T 体验店的兔八哥上的应用:

2021-08-18 17:51:00

相关文章