7月12日消息,下一个人机界面会是什么呢?谁将会取代键盘和触控屏呢?《大西洋》(Atlantic)近日发布文章对此进行了深度解析,称计算机的问题在于,它仍然是人类与他们想要做的事情之间的中介者,增强现实未来或许可以将计算机剔除在外,产生下一个重要的界面。不过,有的专家还有要激进得多的想法:开发界面来支持大脑与计算机之间的直接通讯。
以下是文章主要内容:
电脑键盘对于正在使用它的人来说并不显眼。它设计得为人所感知,产生的声音被人听见,但大多时候它的存在都不会引起注意。一旦你习惯使用它了,你通常都不会将注意力放在你所按的按键或者那些按键所产生的咔嗒声上。相反,你是沉浸于电脑屏幕上出现的东西。
从这方面来看,技术一直以来都是扮演中介者的角色,通过它人类能够与他们的环境产生关联。最早期,当人类能利用身体来完成工作时,他们开发了工具,让它们来帮忙完成那些事情,如斧头、锤子和皮带轮。一千年来,机器变得能够处理越来越复杂的体力劳动,而人类仍要承担大部分的信息处理工作。在上一世纪,这一点发生了巨大的变化。
由于计算机能够处理诸如密码破译、复杂运算的任务,该平衡发生了变化。可处理数据的机器需要比简单的杠杆或者车轮复杂得多的界面。不过,同样的在信息任务上带来全新人机协作方式的界面也会受到其自身设计的制约。
信息处理问题
“这催生了信息处理问题。”美国国家自适应神经技术中心副主任格文·沙尔克(Gerwin Schalk)表示,“忽然之间,在我们与环境的交互中,并不只有人和某种工具了,当中还有某样东西——它就是计算机。”
在沙尔克看来,问题在于,人类和计算机能够做的事情要远远多于横在二者之间的界面允许他们做的事情。
“计算机非常快速,它们非常先进,它们能够在刹那之间处理海量复杂的数据。”他说,“人类则很擅长其它的事情。对于某个场景,他们能够一眼就看出正在发生什么事情。他们能够建立起复杂的关系。现在出现的问题是通讯问题。所以根本性的问题在于,极其强大复杂的人类要如何与日益复杂能干的环境进行交互?机器人非常复杂,计算机非常复杂,我们的手机也非常复杂。”
在技术史的当前阶段,界面设计的目的是使得计算机能够在人类感知运动系统的界限内做尽可能多的事情。鉴于众人使用电脑的目的,这一安排非常合理。大多时候,人们是用电脑来浏览资讯,编写文本,或者看照片视频。“就那一点而言,键盘和鼠标——还有触控板,以及由于可靠性相对不足而不那么普遍的语音控制——仍然很便宜,很适合处理那些任务。”机器人专家、Mayfield Robotics首席技术官Kaijen Hsiao指出。但对于其他人来说,传统的界面其实并不足够。
“如果我想要给计算机解释我大脑中的某个复杂的计划、意图或者看法,我们无能为力。”沙尔克说道。
简单来说,这是一个比人际沟通更有挑战性的沟通问题——它本身就很复杂,且有多面性。人际沟通中通常都会伴随某种程度的语言转换。而与机器沟通所需的额外步骤则极其麻烦。
“当你试图向计算机或者机器人解释同一件事情时,你得将大脑中的鲜活意象转化成符合语法和语义学的语言,这一过程已经丧失了很多的鲜活性和语境。”沙尔克说道,“之后,你将那些语言转化成手指运动,通过计算机键盘输入那些句子。认真想想,你就知道这有多荒谬。”
从实践层面来看,对于大多数人说,这种荒谬是不存在的。毕竟,要编写邮件,你得使用键盘来输入内容。
“然而,如果你站在很高的层面来思考相比以往我们与环境的交互已经变得有多可悲,你就能发现问题所在,事实上该问题还可以量化。”沙尔克指出,“任何形式的人类交流速度都不超过每秒钟50拍——不管是口头交流还是敲字交流。那基本上就是人类给外部技术设备传输信息的最快速度。每秒50拍可以说远远不够,简直是可悲。想想计算机和大脑每秒钟能够内部处理多少GB的数据,就知道这是何等量级的错配啊。”
微妙的通讯形式
随着机器变得越来越先进,这种错配会变得愈发明显。数位机器人专家称,要是没能改进现有的界面,那么人类最终将无法在机器学习、人工智能等领域取得进展。“随着语音识别、自然语言处理、脸部识别等技术变得越来越出色,我们与机器的通讯应当能够超越屏幕,包含部分我们用来与其他人互动的较为微妙的通讯形式。”在麻省理工学院研究人机交互的凯特·达林(Kate Darling)指出,“如果我们希望机器能够模拟人类的情感状态,那么让它通过音调、活动及其它线索表达出来,它的能力就会得到更加完整的表现。”
这种线索必须要成为整个流畅交互过程的一部分。举例来说,要保证能够给与飞行员共事或者在手术室与医生共事的机器人打造微妙的通讯形式——在那些场景中,人类需要能够预测机器人要做什么,同时还得将注意力集中在他们自己在做的事情上。“人们会在各种场合与机器人共事,他们需要知道机器人的下一步行动。”杜克大学机器人实验室主任米西·卡明斯(Missy Cummings)指出,“跟其他人一块时,我们会利用我们的周边视觉来观察他们的细微动作,从而推断出他们的行动,而机器人则不能像人类那样流畅行动。因此,我们必须要知道该如何理解更加细微的交互,比如通过结合利用光和声。”
在一些场景中,如人在驾驶,需要注意路况的时候,语音通讯仍然是最好的交互界面。“当然,语音通讯的问题在于,语音识别系统还不够出色。”卡明斯说道,“我不知道语音识别系统未来能不能达到识别语境的程度。语境可以说是对话的艺术。”
目前已经有公司在大力改进基于语音的界面,像Siri这样的数字助手和像亚马逊Echo这样的智能设备将会在人们的日常生活中扮演越来越重要的角色。与此同时,其它的中介型界面也很可能将迎来改进。
增强现实和虚拟现实
触控屏在某种程度上已经获得了改进。该界面曾在很长一段时间里被认为对于流行设备毫无价值,因为该技术不够出色。“触控屏按钮?”2007年iPhone推出时有人在Engadget网站上评论道,“坏主意,这玩意永远都会行不通。”(沙尔克认为iPhone是人机交互“意义深远的进步”,但也只算是“缓解策略”。)不过,到目前为止,其它的界面——语音控制、手写数字转换器、运动控制等等——都还没真正实现腾飞。
很多技术专家认为,增强现实和虚拟现实的兴起将会产生下一个重要的界面。但有数位工程师和学者指出,这样的跃进将需要目前还未出现的技术进步。
一方面,时下最先进的混合现实平台在实时绘制用户所在的现实世界方面都不够精确。也就是说,该类系统便于将网页或者其它的虚拟元素投射到你所在房间的墙壁上,但它们还远未能够做些足够革命性的事情来彻底改变人类思考人机交互的方式。
对于开发者来说,这些系统的关键问题之一在于,理解非虚拟世界在不同时候对人类的重要程度。换言之,你周围的现实世界需要变得可见吗?多大程度上需要变得可见?乔治亚理工学院交互式计算教授布莱尔·麦金泰尔(Blair MacIntyre)举例说道,对于电话会议,使用增强现实要比虚拟现实好得多。“你肯定不只是想要电话会议的虚拟现实版本,因为我可能需要看看我的笔记,或者在电脑上输入信息,又或者需要小心拿起我的咖啡杯,避免将其弄翻。”
麦金泰尔喜欢将这一问题称作“喝啤酒问题”,即你在玩视频游戏时会需要停下来喝口啤酒。“在虚拟现实中,那不容易做到。”他说,“但在增强现实中,那就好办点。”他认为,最终,增强现实将能够追踪较小的物体,扩增现实世界中较小的东西,这会使得它的应用程序和界面变得更加先进。显示屏将会变得更加清晰。例如,在机场查看航班信息,会意味着利用混合现实来在你眼前查阅信息,而不是通过智能手机查找相关信息,也不是在机场中寻找实体的展示板。
“但我觉得我们仍需要键盘和触控屏来输入信息。”他说,“触觉反馈非常重要。我在HoloLens上试过通过空中的虚拟键盘触控输入。它们不大好使是吧?因为到你看到手指输入所产生的视觉反馈或者听到听觉反馈时,你还会有意识地控制手的输入动作。”
他说,未来,对于智能手机用户而言已经标准化的操作动作最终可能会应用于增强现实当中。对于这种界面,很多人都会联想到科幻电影《少数派报告》(Minority Report)。在该电影中,一系列的手势可以用于执行复杂的计算任务。“我对未来的HoloLens有这种愿景。”麦金泰尔说,“到那时候,我或许还会用手机或者小型平板电脑来进行精确的交互,而当视觉追踪技术变得足够出色的时候,我就可以在空中做出缩放或者拖动旋转手势,因为系统能够准确追踪我的手指动作。不过,HoloLens必须要做得比现在出色,我想未来它会变得更好的。”
计算机的问题
不过,更好的界面不仅仅要在技术上具有可行性。它们还要能够取悦用户。这或许是iPhone最大的成就之一;该设备本身外观时尚漂亮,人们喜欢与之交互。出色的设计让iPhone感觉很直观,尽管有吸引力的界面可能比直观的界面来得更加重要。例如,当基于手势的界面不是很直观的时候,有一整个研究社区致力于对其进行改良。杜克大学的机器人专家卡明斯认为,这不一定是好事。她说,人类习惯于将手势当做是强调某事的方式,但除了需要打手语的人之外,“我们实际上有多经常使用手势呢?”她补充道,“那种方式实际上增加了你的心理工作负荷,因为你必须要记住所有不同手势的意思。”
另外,并不是说键盘特别直观。现在,它们对于很多人来说或许是第二天性,但以往情况则不一样。“想想看,即便是现在,你是在使用水平的指向设备,鼠标与屏幕是呈垂直关系。”杜克大学的另一位机器人专家迈克尔·克拉曼(Michael Clamann)表示,“这种交互很怪异。然后触控屏出现了,一定程度上解决了那一问题,但其分辨率受限于你的手指的宽度,每一次你触摸屏幕,你都会覆盖它的一部分。尽管这些界面都变得更好了,但它们仍存在局限性。”
“计算机的问题在于,它仍然是人类与他们想要做的事情之间的中介者。”他补充道。
人机直接通讯
我们具体要如何将计算机剔除在外呢?一旦在技术上达成特定的里程碑,增强现实就会开始解决这一问题。但相比之下,还有要激进得多的想法。在沙尔克位于纽约奥尔巴尼的实验室,科学家们正致力于开发界面来支持大脑与计算机之间的直接通讯。他们的主要挑战之一是,开发更好的方式来实时估量大脑在做什么,以理解这背后的含义。沙尔克和他的同事已经证明,从大脑活动推知意义理论上是可能的,这一想法对于人机交互的未来有着令人惊讶的意义。
“如果你能够通过某种方式与计算机直接交互,绕过你的感知运动系统带来的种种限制,那你就可以让人的所有感觉、观念和欲望能够被技术直接访问。”他说,“你可以完全消除这种通讯瓶颈,在技术和大脑之间打造一种共生关系。”
我们有理由相信这终有一天有可能会实现。“我们已经能够将大脑信息转化成完整的句子。”他说道,“通过观察大脑信号,我们可以分辨你是在说某个词,还是在想象说某个词。这并非科幻小说。这是已经刊登的、且经过同行评议的论文。”
然而,如果有某种新界面不久之后改变我们与机器通讯的方式,那它不大可能会是直接的人机连接。目前,沙尔克和他的同事在研究因为临床原因大脑被植入电极的病患。即便那样,他们的研究也容易出错。正如丹尼尔·恩贝(Daniel Engber)今年早些时候在《连线》的一篇有关人脑侵入的深度文章中所说的,沙尔克的方法“充其量只是概念验证”。沙尔克也这么向媒体解释。他说,他正期待的是,有更好的技术出现,使得大脑活动的精密测量无需侵入体内的大脑植入物。他说,这如果发生的话,“那我们将非常接近于颠覆整个世界。”
“如果你能够实现那一点,那它所产生的影响将会远远超过人类迄今为止所做过的任何事情。”他补充道。你只需要想一想就能让计算机执行你的指令。你只需要用你的意愿就能控制一群无人机。潜在的影响简直匪夷所思,而不只是有点令人毛骨悚然。“它会远远超越人类迄今为止借助技术对社会所做的事情。不仅仅社会将会改变,生为人类的意义也将会改变。”