中国妇女报数字报纸

2017年5月9星期二
国内统一刊号:CN11-0003

中国妇女报科技新知 高利:小麦保护神 始终被人掌控才是人工智能的方向 “听”一分钟,就能说“人话” 高精准数字人脸模型 让犯罪嫌疑人多角度显形 创意与发明

按日期检索

12 2013
上个月
下个月

中国妇女报

电子报刊阅读器
我给版面打分

1分   2分   3分   4分   5分  

本版得分:0.0参与评分人数:0

新闻排行榜
版权声明
《中国妇女报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供中国妇女报网读者阅读、学习研究使用,未经中国妇女报及/或相关权利人书面授权,任何单位及个人不得将《中国妇女报》(电子版)所登载、发布的内容用于商业性目的,包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式,或将之在非本站所属的服务器上作镜像。否则,中国妇女报将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段,追究侵权者的法律责任。
正在加载广告……
放大 缩小 默认

“听”一分钟,就能说“人话”

仅靠一个人1分钟的讲话内容,就能完全模仿这个人说话。其市场前景非常广阔,可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。

据《科学美国人》杂志网站近日报道,加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音系统,其能通过分析讲话录音和对应文本以及两者之间的关联,在1分钟内模仿人类“讲话”,比如,模仿特朗普、奥巴马和希拉里三个人的声音展开一段对话。

让声音听起来更自然,是计算机程序在将文字转换成语音过程中面临的核心挑战,即使目前最好的语音助手,如苹果公司的Siri和亚马逊公司的Alexa,一发声给人的第一感觉仍然是,“哇!这是计算机。”背后的原因在于这些语音助手系统的工作原理:根据预录的声音文档整理出词汇,再通过另一个新的音频文档将这些词汇拼凑在一起发声。

而琴鸟公司的AI使用了一种全新的语音合成系统,能在“倾听”过程中“掌握”每个人说话时字母、音位和单词的发音特点,通过推理并模仿这个人声音中的情感和语调,“说”出全新的语句。

新系统使用模仿人脑思维的算法创建出一种人工神经网络,能利用深度学习技术将所听到的转换成语音,并仅靠一个人1分钟的讲话内容,就能完全模仿这个人说话。其市场前景非常广阔,可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。

开发该系统的蒙特利尔大学学习算法实验室博士后亚历山大·布瑞比森表示,在学会并模仿了几个人的声音后,再模仿任何一个新对象的语音就会变得更快,因此新语音系统不需太多信息,1分钟足以捕获某个人声音的核心特点。

但美国卡内基梅隆大学语言技术研究所教授迪莫·鲍曼表示,琴鸟的语音系统和真正的人声之间还是有差距。“我仔细听过琴鸟系统的发声,其带有背景噪音,以及微弱的机器人特征。而且,它还不能模仿人们在讲话中的呼吸和唇部运动,因此仍然能听出其计算机语音特征。”鲍曼说。他认为,语音系统真正令人信服地复制人声,还需再等几年。 (聂翠蓉)

放大 缩小 默认
关于我们 | 联系我们 | 在线投稿 | 手机触屏版
主办单位:中国妇女报社 版权所有:中国妇女报网 2014 COPYRIGHT
备案号:京icp备05037313号