去年年底,微软联合全球各大计算机厂商发布了平板电脑(Tablet PC)产品。由此长期以来人们一直思考的“我们需要什么样的人机界面”这个老话题引起了更多人的关注。
尽管随着科技的进步,计算机的计算能力、存储能力和多媒体处理能力已经有了很大的发展,但是人们使用计算机的方式并没有发生本质的改变。如我们的主要输入方式靠键盘、鼠标和屏幕来完成,这是因为目前计算机的使用方法是按计算机本身的方便而设计的,并不是很符合人们主要依靠语音和视觉的交互习惯。也就是说用户要适应计算机,即“以计算机为中心”的计算模式。人们使用计算机时需要坐到计算机前,也就是说计算机并没有与人们的生活环境融合在一起,仍然是桌面计算(desk-top)的方式。这样用户到计算机的输入宽带与计算机到用户的输出宽带产生了不平衡,用户的输入宽带低于计算机输出的宽带。结果计算机软件功能的灵活性与人机交互能力的巨大反差。基于此,促使人们不断探索更为自然的人机交互方式和技术手段。
本文向大家介绍和分析未来的计算机人机界面发展方向。
1.无所不在的计算
前施乐公司的首席科学家Mark Weiser在1991年提出了"无所不在的计算(Ubiquitous Computing)"的思想,强调把计算机嵌入到环境或日常工具中去,让计算机本身从人们的视线中消失,让人们注意的中心回归到要完成的任务本身。
虽然很难对"新一代人机界面技术"下一个准确的定义,但我们可以这样理解未来的人机环境,它将是以"人为中心的计算",即计算机的使用将更加符合人的习惯,建立一个自然人机界面与和谐的人机环境。
计算机将"嵌入"人们的日常环境(如办公室、住家)和常用设备中,我们与这样的环境交互就像与他人交流一样自然,设备的使用也将更为简便;。今后计算机应能听、能看、能说,而且应能"善解人意",即理解和适应人的情绪或心情。未来计算机的发展是以人为中心,必须使计算机易用好用,使人以语言、文字、图像、手势、表情等自然方式与计算机打交道。
2.信息内容的智能处理
信息技术产品逐步进入后PC时代,各式各样的信息家电、网络接入终端以及集成计算与通信功能的产品繁多。易用性、善解人意已逐渐变成信息设备参与市场竞争的关键。甚至一个具有重大创新的知识产权将带动一个新产业。如中文和汉语信息处理,面向信息内容的智能化处理技术,包括文字与语音的识别、翻译、查询、分类、摘要等。这方面的技术突破将极大地推动信息服务业和计算机产业。
将信息转变为知识、将信息基础设施发展为知识基础设施是21世纪的重要科研方向。这里,在软件方面要重点解决:数据发掘、知识发现、Internet网上海量信息的智能化检索和网上软件机器人等。
3.移动互联时代的语音识别技术
语音识别是新一代人机界面中最重要的技术之一。但到目前从听写机到电话语音识别,语音识别的应用不是十分成熟。这种局面将会随着移动无线互联网以及新一代移动通讯的发展而产生变化。现有语音技术会在未来几年在嵌入式系统、无线互联网以及语音翻译应用起来,这对信息产业将产生的深刻影响。将来用户无论是在办公室、家中,还是在旅行的路上都可以通过移动或者固定电话与语音门户网站进行自动对话,倾听语音门户为您提供的服务,得到感兴趣的诸如天气、航班、酒店、交通和股市行情等各种信息,使"浏览"互联网的过程不再局限于计算机。
据统计,在日常生活中人类的沟通大约有75%左右是通过语音来完成的,语音无庸置疑地成为人与计算机等信息设备进行交互的最重要的"人机界面"。语音识别技术的研究工作始于20世纪50年代,经过近半个世纪来的发展,语音识别技术开始走出实验室,进入到社会生活的各个领域。
语音听写技术(即大词汇量连续语音识别技术)始终是语音识别研究的核心问题,基于这一技术的产品也是语音识别技术产品在大众中知名度最高的一种。这个领域国内外已经出现了一些商业化的产品,其中比较有代表性的是IBM公司的Via Voice和DRAGON公司的Naturally Speaking。
语音识别技术的另一重要应用是用在各种产品的命令导航中,它使得我们不必再用按钮或遥控器来操作,而可以直接用语音下达指令。
目前为止,多数的语音产品没有像人们预期的一样给人机交互方式带来本质性的影响。人们发现语音识别技术产品还存在着很多的问题。如语音听写技术对计算资源和存储资源的要求较高,对于含有口音或非新闻类文本输入的准确率不高。所以能否找到一种"合适的应用"决定了语音识别技术发展的前景。
无线移动互联网的服务理念是结合Internet和移动通信的技术优势,在不受信息源的限制和用户访问时位置限制的同时,以统一的标准向用户提供无处不在的信息网络服务。依托无线移动互联网概念,已经出现了许多新技术,如WAP、移动IP和蓝牙技术等,这三种技术从手机、计算机以及数字设备出发,为我们展现了一个具有无穷想象空间的活动互联世界。
各种嵌入式设备的操作过程如下:用手机来采集用户的语音指令并进行前端信号处理,然后利用蓝牙技术把前端处理的中间结果传送到相应的嵌入式设备上,该设备用语音识别芯片进行识别分析之后就可以做出正确的反应。
4.其它研究方向
无所不在的计算代表了计算机人机接口的发展方向,它是以计算机为中心的桌面计算方式的革命。而这种交互方式的实现需要心理学的支持、需要各种计算技术的支持,并逐步体现在新的业界标准接口技术上。
计算机本质上是一个可编程的机器,因此人总期待它有更多的用途且用起来更加方便。我们现在的人机交互方式依旧很机械,因此,人们一直从不同角度探索更为自然的人机交互方式和技术手段。
计算无所不在时代的一个新的研究方向还有如:
智能环境,嵌入了多种感知、计算设备的物理空间能够根据上下文识别人的身体姿态、手势及语音等,进而判断出人的意图,以有效提高人们的工作和生活质量;
多通道用户界面及人类认知方面的研究,目的是让人们能够在任何时间、任何地点用更自然、高效的方式与互联网上的任何计算装置进行通讯和交流的新一代网络用户界面;
可穿戴的计算(Wearable Computing),士兵身上佩戴了具备感知、通信、防备和进攻能力的装置,与人的智能融合在一起就成为战场上一个灵活完备的作战系统等;
信息设备(Information Appliance)、移动计算(Mobile Computing)的研究方面,目前已经有一些成果,如自动监控老人的房间,可判断老人出现的意外并及时通知相关人员。
作为新兴的边缘学科,人机接口研究需要多学科的专家和学者协同工作。如著名的麻省理工学院媒体试验室中有搞物理的,也有搞艺术的,而里面的学生大多背景是搞计算机的,感觉是艺术与技术结合的一个很好的研究环境,有条件和能力做一些看起来异想天开的研究与实验。
我们相信:在不久的将来,PC机将成为提供基本的计算服务的智能化的小盒子,该计算服务可以通过Internet得到实时的服务。你购买的小盒子将包含一个计算代理,它可以根据你的需求在网络上为你找到合适的资源。技术的进步会使每个人都能够使用,而不只是只有技术专家才能使用。
>> 进入作者陈运迪专栏