您的位置: 首页 >互联网 >

百度的新系统可以学习模仿每一个口音

2019-05-21 17:42:34 编辑: 来源:
导读 今年年初,中国搜索巨头百度推出了一款名为DeepVoice的新系统。它使用深度学习,一种流行的人工智能技术,来构建一个可以转换文本到语音的

今年年初,中国搜索巨头百度推出了一款名为DeepVoice的新系统。它使用深度学习,一种流行的人工智能技术,来构建一个可以转换文本到语音的系统。第一个版本能够产生简短的句子,至少在粗略的听觉上,几乎与真人无法区分。该系统可以一次学习一个语音,并且需要数小时的数据来掌握每个语音。

DeepVoice 2于5月份首次亮相,只需半小时的数据即可模仿语音,单个系统可以学习数百种不同的口音。今天,百度正在推出DeepVoice的第三个也是最终版本 ; 该公司表示,这个版本可以学习2,500个声音,每个声音只需半小时。百度说,“拥有一个能够有效产生各种声音的系统,打开了许多用例的大门,否则这些用例将无法实现。例如,有声书或视频游戏中的每个角色都有自己独特的声音,可以提升用户体验。“

百度从DeepVoice 3中展示的合成语音的例子与最初的例子不同。它们显然是合成的。该公司辩称,这不是它的目标,并说,“如果我们只产生一两个声音,正如我们的单个扬声器样本所示,我们的系统已经被证明能够合成非常自然,类似人类的声音,很容易被用作数字助理。“

百度试图做的是制作一个能够掌握多种口音或人物细微差别的系统。虽然2,500是目前的限制,但该团队表示,它认为使用更大的数据集的未来版本可以掌握10,000或更多。“这是展示可扩展性可能性的初步工作。我们的系统成功地将训练扩展到以前发布的文本到语音模型中从未做过的大小和幅度。我们相信,通过使用大量高质量数据集进行额外的机器学习工程,可以在不久的将来大幅提高质量。“

百度并不是唯一从事计算机语音合成的搜索巨头。谷歌的DeepMind部门一直在与WaveNet进行类似的项目。它的最新版本在掌握重音方面得到了更好的表现,甚至产生了“嘴唇”,使声音听起来更人性化。它现在正在现场使用,为英语和日语的Google智能助理生成语音。


免责声明:本文由用户上传,如有侵权请联系删除!

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。