沐鸣2注册登录_讯飞王智国:人工智能技术发展趋势和智能家居应用前景展望

科大讯飞研究院副院长 王智国博士

人工智能的起源与三次发展浪潮

讲到人工智能,我们首先要追本溯源,看一下人工智能是怎么起源的?“人工智能”这一名词的诞生并不是很久,由四位图灵奖得主、信息论创始人和一位诺贝尔奖得主,于1956年在美国Dartmouth会议上,一起将人工智能的名词定义出来。

应该说人工智能发展的这60年,起起伏伏,经历了三次的浪潮。自从Dartmouth会议以后,人们陆续发明了第一款的感知神经网络软件和聊天软件,证明了数学定理,那个时候大家都惊呼“人工智能来了,再过十年机器要超越人类了”。不过,很快到了70年代后期,人们发现过去的理论和模型,只能解决一些非常简单的问题,很快人工智能进入了第一次的冬天。

随着1982年Hopfield神经网络和BT训练算法的提出,大家发现人工智能的春天又来了。80年代又兴起一拨人工智能的热潮,包括语音识别、语音翻译计划,以及日本提出的第五代计算机。不过,到了90年代后期,人们发现这种东西离我们的实际生活还很遥远。大家都有印象IBM在90年代的时候提出了一款语音听写的软件叫IBM Viavoice,在演示当中效果不错,但是真正用的时候却很难使用。因此,在2000年左右第二次人工智能的浪潮又破灭了。接下来是第三次人工智能的浪潮,随着2006年Hinton提出的深度学习的技术,以及在图像、语音识别以及其他领域内取得的一些成功。大家认为经过了两次起伏,人工智能开始进入了真正爆发的前夜。

工业界人工智能成功过的三大法宝

人工智能在第三次最近十年浪潮中,工业界取得了一些进步的成果。首当其推深度神经网络,其模型和算法和传统的方法是有本质的不同,虽然它与我们人类的神经网络相比,还有很多不足,但是确实在架构和描述方面有其强大之处;其次,大数据。随着移动互联网的迅猛发展,数据每天都是以指数级增加,通过手机和微信等,人们可以随时随地把视觉、听觉上的这些数据轻松地传到网上,汇聚起来形成大数据;第三,涟漪效应。随着移动互联网的发展,各种软件、各种设备接触用户的门槛极大地降低了。例如,当一款新的APP找到第一批用户时,他们使用的行为和记录就被后台记录下来了,开发者再对这种行为和记录进行迭代的改进,当再把APP投向第二批用户的时候,软件行为已经比第一代提升了,这就是涟漪效应。随着迭代的波浪越来越大的时候,软件会变得更加好用、更加智能。

涟漪效应推动语音辨识与图片识别发展

语音识别实用化得益于“涟漪效应”。讯飞的语音识别2010年推出的时候,坦白说它的识别率只有60%左右水平,刚开始大家都觉得很难用,但是有一批尝鲜的用户。随着技术的迭代、更新,以及数据持续的迭代,如今讯飞语音识别率已经达到了95%以上的水平,达到完全实用的状态。图片识别也同样如此,在ImageNet图像识别任务中,2012年的时候错误率高达26.2%,但是到2015年底已经降到了3.57%。基本上可以说这个技术使得我们只要通过一个摄像头,就能将家中的各种物体很轻易地分辨出来。

除此以外,随着这两年的深度的学习的热潮越来越大的时候,各行各业中各种应用都铺面而来。最近最有影响力的当属3月15日谷歌机器人AlphaGO四比一战胜了围棋世界冠军李世石。AlphaGO也是利用深度学习模型,对局势做了评估,并收藏了3000万盘棋谱的特性,最后形成综合方案。从而在围棋这一规则相对比较固定的项目上,达到人类最顶尖的水平。回顾了这么多人工智能的进展和浪潮,回过头想一下,我们所做的人工智能还是从1到N这样的事情,即“弱人工智能”。

语音和语言为入口的认知革命

那什么是“强人工智能”?实际上,计算机什么时候能够自动从互联网上无监督地汲取知识,进行学习甚至是思维,才可以称为“强人工智能”。如果我们想要做“强人工智能”的突破,可以从哪些地方得到启示?人类从200万年前发展到如今经历了农业革命、工业革命、信息革命,但实际上在此之前还有一次很关键的革命——认知革命。大约7万年以前,有一种人发生了突破性的变化,使得整个进化和迭代的周期加快,产生认知革命的原因就是7万年以前的这些人突然会说话了,发明了语言。语言的广泛使用,可以表达非常复杂的信息;有了语言以后就可以反馈社会的信息,可以组织和形成更有凝聚力,更大的团体;语言可以传递一些虚构的或者是抽象的概念,有了这样的概念,大量的陌生人就可以进行合作、进行创新,这就是语言的重要性。

反过头来,如果机器想要从“弱的人工智能”变成“强的人工智能”怎么办?我们也需要一场认知革命。因为大量的知识和技能都被记载在人类的语言、文字、知识库、网络和各种说明书中。人工智能想要突破,实现更长度的进化,也需要认知革命,把这些知识学习起来。

突破人工智能认知技能发展

如今业界基本上将人工智能分成三个阶段:计算智能、感知智能和认知智能,计算智能就是计算机与人类比存储、比记忆,在此方面已经远远超过人类了。不过,在感知层面,计算机在语音识别、图象识别的方面,让计算机真正能理解、会思考、进行自我学习,还是很欠缺的。科大讯飞在2014年8月20日,发布了讯飞超脑的计划,现在从要能听会说,能理解会思考。语音不仅通过传感器和算法来感知世界,而且我们要能真正理解用户的一些需求、行为和语言,再进行认知。认知智能其实不简简单单做一些基础性工作,发现人在认识这个世界的时候,其实感知和认知是组合在一起的。当我们耳朵去听一些话的时候,除了听脑海中在运算,理解话中的意思,同时我们的认知技能也在发展,反过来又能推动像语音识别基础任务的进步提升。

IT产业从上世纪60年代到现在经历了五次浪潮,我们已经进入了万物互联的时代,在无屏、移动、远场状态下,以语音为主,键盘、触摸等为辅的人机交互时代正在到来。为此,科大讯飞在2015年12月21日正式发布了AIUI的人机交互界面,来定义了这样的一个万物互联时代的人机交互的标准。其目的是让人和机器交互更加地自然和便捷。可以实现一键获取,用形态丰富的麦克风阵列来进行试音,进行很轻松的SDK的计算开发,然后在云端做深度的适配,做专署的贴心的服务,最终让智能家居都能够和人互动起来。

用人工智能一起来改变世界

基于这样的技术,我们搭建了人工智能开发平台,可以看到我们的合作伙伴和服务量都有非常迅猛地增长。这次浪潮中人工智能的到来比想象中要来得更快。麦肯锡研究报告显示,现在45%的活动可以当前技术实现自动化,不仅底薪工作甚至高薪工作中相当一部分的日常活动会被自动化。或许再过三五年,可能真的很多行业都可以通过人工智能技术进行一次升级。日本软银公司总裁孙正义定义了复活方程式,即“生产性×劳动人口=竞争力”。众所周知,中国经过30多年的计划生育,劳动人口呈现下降的趋势,那未来怎么办?如果保住竞争力,其实要让更多的机器参与进来,来提高我们的生产总量。“未来的产业机器人将决定GDP的全球排名”这绝不是一句空话。我们的愿景就是与大家一起,用人工智能一起来改变世界,来提高我们的国家竞争力。

此条目发表在 沐鸣2平台注册 分类目录,贴了 标签。将 本文链接 加入收藏夹。

Comments are closed.