在线咨询
eetop公众号 创芯大讲堂 创芯人才网
切换到宽版

EETOP 创芯网论坛 (原名:电子顶级开发网)

手机号码,快捷登录

手机号码,快捷登录

找回密码

  登录   注册  

快捷导航
搜帖子
查看: 843|回复: 0

[转载] 安卓语音识别新后台 神经网络或打破语言障碍

[复制链接]
发表于 2013-2-19 23:56:14 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

x

一提到 Android 最新版本 Jelly Bean ,我们可能会马上想到“黄油计划”。“黄油计划”改变了人们对 Android 系统卡顿的看法,算是 Android 发展的一个里程碑。不过,Google 在开发 Jelly Bean 时候还进行了另一项同样重大工程,就是语音识别后端的改进。《连线》杂志对此进行了报道,并谈到了神经网络的一些发展。


从 Jelly Bean 开始,Google 语音识别开始使用神经网络。这是一个像人脑一样的学习系统。 Google 神经网络系统,可能会让你想起 1000 台电脑找出一只猫的往事。那是 Google 进行的一场有趣试验。Google 工程师 Jeff Dean 表示,Google 已经神经网络的算法运用到了许多产品中,比如图片搜索、Google 街景,而 Jelly Bean 的语音识别对于神经网络的运用最为凸显。
推动这次改变的人是 Vicent Vanhoucke——Google 的研究科学家。他表示,成效是巨大的,“我们只是改变了模式,就取得了如此大的进步,这有些让人惊奇”。他说,与以前的软件版本相比,新的语音识别错误率降低了 25%,并使得人们更乐意使用语音命令了。
通过神经网络,研究员们能够分析大量的模型。关于语音识别上,他们需要分析语音的频谱图,并预测新的模型具有什么含义。神经网络是多层的,Google 的软件首先会挑出语音的个别部分,即组成单词的声母和韵母,然后使用这些信息来进行复杂的猜测。神经网络不同的连接层增加了判断的准确率。
神经网络并非新鲜名词,但是它的快速发展却是近几年的事情。多伦多大学的计算机科学教授 Geoffrey Hinton 说,多层分析非常困难,但从 2006 年开始,出现了两个重要的改变。一是他和自己的团队发现了绘制深层神经网络的更好方法,二是低价图形处理器的出现,研究人员可以更快更省钱地处理大量的计算。
除 Google 以外,微软IBM 也在研究神经网络。去年,微软的首席研究官 Rick Rahsid 展示了基于神经网络的语音处理软件。在演示中,Rashid 说完一句英语后会停顿一下,微软的软件翻译他的话,然后把中文播放给听众。那个软件甚至能够调整语调,使翻译后的语音听起来像是 Rashid 的声音。
Rashid 认为,这是一项非常有前途的技术,“我希望在一些年后,我们能够打破人们之间的语言障碍。个人来说,我觉得这会带来一个更好的世界”。
在未来更好的世界里,你的上司很可能是一个机器人。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐 上一条 /1 下一条

小黑屋| 手机版| 关于我们| 联系我们| 隐私声明| EETOP 创芯网
( 京ICP备:10050787号 京公网安备:11010502037710 )

GMT+8, 2025-1-26 04:14 , Processed in 0.027358 second(s), 24 queries , Gzip On.

eetop公众号 创芯大讲堂 创芯人才网
快速回复 返回顶部 返回列表