挑战Siri:IBM拟用超级计算机打造语音服务

avatar
作者
筋斗云
阅读量:0

说起苹果操作系统iOS5,想必大家一定会想到新奇而又实用的语音控制功能---Siri。Siri是苹果公司在其产品iphone 4S上应用的一项语音控制功能,利用Siri用户可以通过手机读短信、介绍餐厅、询问天气、语音设置闹钟等。因此Siri一出,模仿者众多,但是效果一直差强人意,而近日,蓝色巨人IBM却准备用超级计算机打造“沃森”(Watson)超级语音控制系统,正式向苹果的Siri开战。

IBM “沃森”的Logo

Siri确实是个神奇的东西,单不说语音识别率的问题,而且对于语法的组合、词性的辨别都可谓智能,而且支持语言众多,例如英语、中文、日文等,而且有一点笔者不知道也没有去验证的就是对方言的识别能力……也许是笔者邪恶了,不过Siri又不是一个简单语音识别控制系统,在给我们带来惊喜和方便的同时,背后一直提供默默支持的就是强大的云计算系统和庞大的数据库系统。大概原理其实就是语音采集(由iPhone完成)、数据传输(手机必须能上网)、语音识别和处理(由强大的云计算机完成)、终端接受远端计算机的指令进行操作(由iPhone完成),但是实际上远没有这么简单,所以,虽然苹果Siri语音助理功能吸引了众多模仿者,但多数服务的功能都很有限,而IBM却希望借助“沃森”(Watson)超级计算机改变这一现状。

“沃森”与人的知识问答大赛

其实,早在几年前,IBM的研发团队就计划研发出一种能够理解人类语言,并能利用已知信息给出最佳答案的电脑,这种计算机系统不仅要能听懂不同口音的发音,还需要能理解包括俚语和双关语等语言在内的复杂表述,并剔除一些错误信息,而最后IBM制造出了现在这台以创办人“沃森”名字命名的超级电脑。而且,还举行过“沃森”和人类的知识问答大赛,并且以大比分优势获胜,但是也仅限于本机而非网络,并且也只能是通过问答方式来显示答案,而苹果的Siri显然是突破了这个极限,不仅可以实现问答,而且还能实现例如订票、播放本机音乐、问路,甚至用语音来操作手机等一系列功能,让人以为电话的另一端是一个真实的人在帮你做这些事情。显然这些都是IBM所始料未及的,而且谁也不会想到的是苹果居然会把Siri给搬到了手机上。

IBM“沃森”的强大的服务器系统

“沃森”需要理解人类语言,这些具有模糊性和歧义性,并且需要大量的知识库,这就是“沃森”优越之处。据悉,“沃森”现有的数据库中包括辞海和《世界图书百科全书》等数百万份资料,而相对于Siri,这个数据库的内容显然还不算强大和全面。在研发方面,全球共有4个IBM实验室参与对于的工作,包括中国、美国、以色列和日本。中国实验室主要负责核心算法,包括结构化信息,尤其是帮助排除愚蠢答案,还负责改进学习算法,而这些则对服务器的性能提出了很高的要求。目前构成““沃森””的是90台Power 7服务器,占地面积接近一个房间,每台服务器中拥有4个8核Power 7处理器,使得其能在3秒钟之内检索数亿页的材料并给出答案。但是,如果要实现或者超过Siri的功能,那么相信IBM搭建的服务器数目肯定要数倍于当前的“沃森”。

苹果iPhone 4S的Siri

显然,IBM的的“沃森”向Siri发起挑战也是打算走下高端是神坛,向普通用户靠拢。虽然IBM在数据库的方面做的比较完备,信息量也非常大,但是在移动终端方面显然还没有相应的经验,无论是终端和运算主机的通信,还是超级计算机怎样发布指令让移动终端做出响应的动作,并且目前“沃森”并不与互联网相连,其给出的答案都是从现有知识库中搜索处理获得,但是如何能像Siri一样通过网络来实现众多的功能,IBM仍然需要下很大的功夫。不过笔者认为IBM并不会独自去做这个事情,至少在移动终端方面不是IBM的强项,所以最大的可能是会联合某个大型的移动终端开发商或者移动终端操作系统集成商来进行移动终端的研制和测试(大家可以自由想象)。所以,当IBM下定决心采用超级计算机来应对苹果的Siri的时候,再加上IBM强大的语音识别系统,能否战胜Siri,让人充满了期待,只是,何时实现依然是时间问题,而且,届时“沃森”可能将要面对的则是Siri二代了。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!