智能助手应用普及,对于文字转语音的要求也逐渐提升。谷歌近年有推出云端人工智能机器学习服务,最近就公布推出新的文字转语音API,可以把文字变成自然的发音,支持各种语音应用需求。
这个云端文字转语音(Text-to-speech)API 可以支持12种语言并转变成32种自然语言,把电脑中的书面内容,变成口语形式读出。而这个API也配合新的WaveNet发音模型,令读音变得更加自然而准确,运算速度比原先快1000倍,只需要50毫秒就可以运算出1秒钟的语音讯息,而且读音样本的解析度也由8位元提升到16位元。谷歌表示在美式英文WaveNet的测试中,有超过20%的人认为电脑读音比真人读音要好。
现在不同的物联网或者智能助手,都需要用到文字转语音服务,谷歌自家的服务例如地图、搜索等都有内置文字转语音服务,而现在推出了API之后,第三方的物联网应用例如电视、汽车等都可以受惠于这个技术,令电脑与用户之间的互动可以更加自然流畅。
网友评论 ()条 查看