中国妇女报

我给版面打分

1分 2分 3分 4分 5分

本版得分：0.0参与评分人数：0

新闻排行榜

《中国妇女报》（电子版）的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供中国妇女报网读者阅读、学习研究使用，未经中国妇女报及/或相关权利人书面授权，任何单位及个人不得将《中国妇女报》（电子版）所登载、发布的内容用于商业性目的，包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式，或将之在非本站所属的服务器上作镜像。否则，中国妇女报将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段，追究侵权者的法律责任。

正在加载广告……

放大

缩小

默认

“听”一分钟，就能说“人话”

仅靠一个人1分钟的讲话内容，就能完全模仿这个人说话。其市场前景非常广阔，可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。

据《科学美国人》杂志网站近日报道，加拿大新创公司琴鸟（Lyrebird）发布了新款人工智能（AI）语音系统，其能通过分析讲话录音和对应文本以及两者之间的关联，在1分钟内模仿人类“讲话”，比如，模仿特朗普、奥巴马和希拉里三个人的声音展开一段对话。

让声音听起来更自然，是计算机程序在将文字转换成语音过程中面临的核心挑战，即使目前最好的语音助手，如苹果公司的Siri和亚马逊公司的Alexa，一发声给人的第一感觉仍然是，“哇！这是计算机。”背后的原因在于这些语音助手系统的工作原理：根据预录的声音文档整理出词汇，再通过另一个新的音频文档将这些词汇拼凑在一起发声。

而琴鸟公司的AI使用了一种全新的语音合成系统，能在“倾听”过程中“掌握”每个人说话时字母、音位和单词的发音特点，通过推理并模仿这个人声音中的情感和语调，“说”出全新的语句。

新系统使用模仿人脑思维的算法创建出一种人工神经网络，能利用深度学习技术将所听到的转换成语音，并仅靠一个人1分钟的讲话内容，就能完全模仿这个人说话。其市场前景非常广阔，可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。

开发该系统的蒙特利尔大学学习算法实验室博士后亚历山大·布瑞比森表示，在学会并模仿了几个人的声音后，再模仿任何一个新对象的语音就会变得更快，因此新语音系统不需太多信息，1分钟足以捕获某个人声音的核心特点。

但美国卡内基梅隆大学语言技术研究所教授迪莫·鲍曼表示，琴鸟的语音系统和真正的人声之间还是有差距。“我仔细听过琴鸟系统的发声，其带有背景噪音，以及微弱的机器人特征。而且，它还不能模仿人们在讲话中的呼吸和唇部运动，因此仍然能听出其计算机语音特征。”鲍曼说。他认为，语音系统真正令人信服地复制人声，还需再等几年。（聂翠蓉）

分享到：QQ空间微信新浪微博

放大

缩小

默认

朗读