微软：电脑口语辨识能力比美人类

时间：2016-10-20 22:31:11 来源：安徽热线

默认

中

大

特大

宋体

黑体

雅黑

楷体

条评论

微软周二公布一项报告，指出微软开发的口语辨识技术在一项测试中，首度达到错误率和人类相去不远的辨识能力。

微软人工智慧研究中心公布的报告中研究人员及工程师运用业界常用的电话口语对话测试集NIST 2000 CTS，针对微软自有技术及专业听打员进行测试比较。其中在Switchboard子测试集中，微软技术的字词错误率由上个月的6.3%降到5.9%。

微软表示，这个成绩大约等于辨识同一组对话的人类成绩，也是Switchboard口语辨识测试历来最低的错误率。这表示电脑辨识对话口语字词的能力，首次达到人类相同水准。

主管微软人工智慧研究中心的执行副总裁沈向洋也指出，他们去年立下使电脑语音辨识能力达到人类水准的目标，不到一年就达到了，也出乎他们意料之外。

微软研究团队运用该公司电脑视觉专家开发的深度神经网路，以大量资料训练电脑辨识出图像或语音中的模式。为达到和人类相仿的辨识能力，他们使用名为Computation Network Toolkit的深度学习系统。这套系统透过在多台搭载专用绘图处理器的电脑上快速处理执行深度演算，并大幅提升研究能力，最终拉高到人类水准。微软去年也将此工具组开源于GitHub 释出。但微软也指出，一如人类会犯错，电脑也不是所有字都能辨识无误

微软表示，这项研究结果将对消费及商用产品有深远影响，包括Xbox游戏机、身障辅助工具，如口语听写，并使Cortana成为真正的个人数位助理服务。

除了微软，Google、脸书、IBM及百度也都积极投入人工智慧为基础的语音辨识，用以作为人机的自然语言互动介面。