您的位置: 首页 >商业 >

亚马逊的文本语音转换服务Polly具有新闻广播员的风格

2020-04-06 15:16:13 编辑: 来源:
导读 亚马逊网络服务公司(AmazonWe bServicesInc )正在接受GoogleLLC的人类语音复制,今天给亚马逊Polly增加了两个新功能,这是一种基于云的服务,将文本转换为逼真的语音,并用于创建可以说话的应用程序。 第一个新特征被称为神经文本到语音,亚马逊说,它通过提高合成声音的“自然性”和“表现力”,在语音质量上提供了“显著的改进”。 关于神经文本技术的一个伟大的事情是,它能够学习

亚马逊网络服务公司(AmazonWe bServicesInc.)正在接受GoogleLLC的人类语音复制,今天给亚马逊Polly增加了两个新功能,这是一种基于云的服务,将文本转换为逼真的语音,并用于创建可以说话的应用程序。

第一个新特征被称为神经文本到语音,亚马逊说,它通过提高合成声音的“自然性”和“表现力”,在语音质量上提供了“显著的改进”。

关于神经文本技术的一个伟大的事情是,它能够学习新的演讲风格,只需几个小时的培训,这要归功于亚马逊去年在一篇研究论文中写的一个新的人工智能模型。 该模型通过将大量标准、中性的语音与仅几个小时的目标语音风格的额外语音数据结合起来来工作。 可以根据需要添加新的补充数据,以创建各种附加的说话样式。

下面是一个神经文本语音的例子:

亚马逊利用Neural-Text-To-Speech的底层算法,创建了它的第二个新功能,这是一个新闻播音员风格的声音,在阅读新闻文章和类似内容时,叙事声音“更真实”,AWS福音传道者朱利安·西蒙在一篇博客文章中写道。

西蒙说:“语音质量当然很重要,但可以做更多的事情来使合成的声音听起来更加真实和吸引人。 ”“风格呢? 当然,人类的耳朵可以分辨出新闻广播、体育广播、大学课堂等等之间的区别;事实上,大多数人类都采用了正确的演讲风格来适应正确的语境,这无疑有助于传达他们的信息。

西蒙说,包括环球邮报、大英百科全书和TIM媒体在内的组织已经在使用波莉的新闻播音员风格。 这一功能也被引入亚马逊Alexa支持的设备,在那里它被用来讲述每日新闻简报和类似的内容。

这是一个新闻播音员声音的快速演示:

亚马逊说,新闻播音员的风格有两种英文声音,而Nural-Text-To-Speech有11种,包括3种英国英语口音和8种美国口音。 这些声音都是实时和批量工作的,可以从亚马逊的美国东部(N.弗吉尼亚)、美国西部(俄勒冈州)和欧洲(爱尔兰)AWS地区访问。

星座研究公司(Constellation ResearchInc.)分析师霍尔格·穆勒(HolgerMueller)表示,所有主要的平台服务公司都在认真对待聊天机器人和会话接口,因为这些平台正在迅速改变客户和员工的体验。

穆勒说:“有了这些新的功能,亚马逊就专注于会话平台的三个重要部分之一,即语音输出。 “它在制作软件制作演讲稿方面的进展令人印象深刻,但我们必须看看企业采用新功能的速度。

亚马逊波莉竞争谷歌的文本到语音服务,这是由其浪潮网络框架,目前提供57种语音风格的21种语言。 微软公司还提供类似的服务,称为Azure语音服务API,它提供75个标准声音和三个人工智能生成的声音。

显示您对我们的任务的支持,我们的一键订阅我们的优管频道(下面)。 我们拥有的用户越多,你就越能向你推荐相关的企业和新兴技术内容。 谢谢!

支持我们的使命:>;>;>;SUBS CRIBE NOW>;>;>;到我们的优管频道。

我们还想告诉你我们的使命,以及你如何帮助我们完成它。 硅谷媒体公司的商业模式是基于内容的内在价值,而不是广告。 与许多在线出版物不同,我们没有付费墙或经营横幅广告,因为我们希望保持我们的新闻开放,没有影响或需要追逐流量。 硅谷的新闻、报道和评论-以及我们硅谷工作室的现场、未经剪辑的视频和CUBE的环球视频团队-需要大量的艰苦工作、时间和金钱。 保持高质量需要赞助商的支持,他们与我们的无广告新闻内容的愿景一致。

如果您喜欢这里的报道,视频采访和其他无广告内容,请花点时间查看我们的赞助商支持的视频内容样本,推特您的支持,并继续回到硅安格尔。


免责声明:本文由用户上传,如有侵权请联系删除!

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。