想要了解未来的交互方式是什么样?我们可以参考一下众多的科幻作品,从中寻找答案。科幻作品一直是引领技术进步的重要线索,因为他可以不受既有技术水平制约,并且不从利益角度出发,不受产业链规则限制,展开想象的翅膀尽情意淫,从而让我们感受到各种理论上可能实现的场景。
让我们先从去年风生水起的文(ke)艺(huan)电影her开始吧。影片讲述的是男主角西奥多使用最新型人工智能软件,并渐渐爱上“她”的故事。相比较于获得奥斯卡大奖,更引人注目的是,女主角嘉斯丽在本片中从未现身,仅凭借声音就获得了第8届罗马电影节影后桂冠,成为“声音影后”第一人。
对影片的思想核心在此不予置喙,直接进入技术主题:产生爱情免不了要进行大量的沟通交流,影片中是如何解决男女主(人与机器)的交互问题呢?主要通过两种方式,语音和手势(连图像都没有,竟然就能两情相悦,这让饱受单身之苦的小伙伴们情何以堪),其实google glass等产品的控制方式也属于这两种的结合。下面我们分别予以讨论。
一. 语音
毋庸置疑,影片中女主的声音充满磁性和魅力,很容易让人想入非非,但如果作为严谨的人机界面还能那么潇洒吗?个人认为难度很大。
1. 输入难以有效识别,原因有三:
a. 方言种类繁多,口音各异,需要建立及其庞大的数据库才能分辨。因此指令的准确性难以保证。
b. 语言含义非常丰富,歧义甚多,且与语言环境和表达习惯关系密切。同样一句话,因场合不同或者说话的人不同,可能表达完全不同的意思。
c. 采用异步串行单工模式,传输效率极其低下,且完全不支持多人操作。
因此语音输入受其特征所限,目前仅支持采用标准发音的简单指令,未来也难有大的突破。
2. 输出方面也有类似的问题无法解决。
a. 异步串行模式无法实现快速交流,就像听新闻一样,必须从头听到尾,否则就不知道中间拉了什么内容。
b. 同样由于理解障碍,很难用正确的语气表达,现有的机器朗读基本没法听。
二. 手势识别
这种方式以手势作输入图像信息,完成人与计算机的智能交互功能,其优点在于采用非接触方式,不受距离和显示设备尺寸的限制,在某些特定应用场合,具有较好的前景,但它的很多缺点也是致命的。
1. 手势识别采用的是类似鼠标的相对定位系统, 它需要一个光标来标识当前位置,要移动到一个地方首先要知道光标身在何处,往哪个方向去,每时每刻还需要不停的给用户反馈当前的位置才不至于出现偏差。换句话说,相对定位系统是需要二次定位的,先判断当前位置,再判断运动轨迹。如果说鼠标始终在屏幕上,第一次定位还可以大体忽略的话,那么手势的二次定位就几乎是不能忍受的。试想一下,你本来就是要点一个按键,却还得先找到自己的手在哪?这绝对是反人性和效率低下的。
2. 手势识别定位精度低。由于每个人手的结构不完全相同,很难通过捕捉动作实现精准定位。如果两个目标距离很近,比如两个字,就无法分辨具体指向。
3. 信息量小。通过手势只能识别一些简单动作,对于复杂操作无法有效分辨。
4. 手势目标检测和识别困难。
a. 手是弹性物体,同一种手势之间的差别很大;
b. 手位于3D空间,计算机获取的图像是在2D空间的投影,投影方向不同时图像差别很大,对手进行定位也有一定难度,因此投影方向很关键;
c. 手的表面是非光滑的,易产生阴影,对手势的识别也会产生影响;
d. 手指特征是识别手势的关键,手掌特征是冗余信息,在复杂背景下需要明确分辨目标特征,特别是手脸遮挡和手腕的去除等,也是难以克服的问题。
如果语音和手势都不靠谱,那还有什么可能的方式呢?看看下面这幅剧照,是不是感觉很熟悉呢?
这个貌似PAD的东东是《2001:太空漫游》里为我们描绘的设备。(值得一提的是,苹果与三星对簿公堂,在庭上怒斥三星平板电脑侵权的时候,三星的反击证据就有这一科幻的理由。三星原文是这样的:”该(《2001:太空漫游》中的)平板电脑为矩形,屏幕占据很大空间,边很窄,前后表面很平,整体很薄。”也就是说,三星认为平板电脑早就不是新点子了,我抄袭你,你丫还抄袭了《2001:太空漫游》呢!)
必须指出的是这部影片的出品时间是1968年,今天的大叔们还没有来到世间,所以很遗憾估计在当时由于特效无法达成,在屏幕上戳戳点点比比划划和这机器互动一下的桥段都没能看到(依然不妨碍它赢得当年奥斯卡最佳视觉效果奖)。时至今日,幻想成为了现实,随着技术的突破,手机、PAD这些小玩具以迅雷不及掩耳盗铃之势铺天盖地席卷而来,抢占了我们的时间和精力,与我们每天朝夕相对。其定位似乎已经不是奢侈品,而几乎成了生活必需品。究其原因,触摸操作为我们带来了近乎完美的用户体验,从而压倒了一切旧势力,实现了江山一统。现在的智能设备采用的如果不是触控操作方式,都不好意思和别人打招呼。毫无疑问,触摸的时代来临了!
让我们沿着科幻作品的轨迹继续前行,更加震撼的场景出现在我们视野当中:我们生活中无处不在的各种死的表面,像桌面、墙壁等等,他们都活了,变成了能和我们实时交互的界面。
触摸操作有很多颠覆性的优点:不需要二次定位、操作直观方便、定位精度高、信息量大、同步并行效率高、轻松支持多人操作等等,大家已经非常熟悉,不再赘述。但只到现在为止,触摸屏的真正优势还远远没有发挥出来。我们现在所使用的触摸屏产品都是以小尺寸为主,包括手机各种pad,他们确实很方便,可以随时随地使用,但是受尺寸大小制约,小尺寸触摸屏产品也有很大局限。首先是信息量小,比如要去淘个宝就很费劲,远没有在电脑屏幕上过瘾,浏览网页,获取资讯也都很累。再有它的用户体验不足,看电影听音乐玩游戏,所有这些涉及享受的体验都比较勉强。还有就是只能支持单人使用,我们经常会看到这样的画面:熟识的人们坐在一起各自摆弄手机,它表面上缩短了人们的距离,但实际上使人与人之间的沟通变得程式化,减少了最本能的近距离沟通,让人们更冷漠、心灵更疏远了。还有很多问题不一一列举了,总之小尺寸触摸屏更像是一种快餐,能够吃饱但不能吃好。与之相比,大尺寸触摸屏才是真正的饕餮盛宴,它能让人们充分体验到科技带来的,前所未有的震撼感受。
在大尺寸触摸屏上的畅快感受,不需多言也能很容易的想象。《三体》中更是清晰地勾勒出了让人无限憧憬的未来世界,至少在人们认为三体人的威胁已经消除的日子里,就像生活在世外桃源一样美妙。(真心期待三体搬上银幕,我将会拿出脑残粉的精神熬夜等首映—难以想象降维攻击之类的大招使出来会是怎样一幅华丽丽的场景)。然而要想让屏幕真的替代家具、墙壁甚至地板确实不是一件容易的事,无论是脆弱的电容屏,还是笨拙的边框屏,都面临着无法逾越的鸿沟。大尺寸触摸屏达到实际应用水平需要满足几个基本条件:
1. 它不能像传统的娇嫩的电子产品,要小心翼翼的使用,必须足够坚固,并且不能有妨碍使用的辅助部件,从而提供像家具一样的用户体验。
2. 需要足够智能,在各种复杂的应用场景下都要识别出目标信息,过滤掉干扰信息,比如分辨出茶杯、书本等物体,排除手掌和手臂的干扰,从而准确无误地判断出人的意图并将它实现。
3. 触摸作为输入方式,其最大的优势在于自由意志的实现,而自由意志最核心的体现就是自由书写。触摸屏的目标应该是黑板、白纸等介质,而借助电脑的帮助,其体验甚至应该超过它们。自由书写的前提是无延迟、无漂移,能够体现力度。
幸运的是,这次我们不需要再等上几十年了,由紫霄公司自主研发的X-BOARD已经帮我们实现了梦想:)X-BOARD完全能够替代家具甚至墙壁和地板等等,让原先没有生命的冷冰冰的物体变成随时可以与你互动和交流的平台。在未来,应用X-BOARD产品可以使触摸屏无处不在,家里的茶几餐桌,办公室的办公桌,马路上的广告屏,商场里的橱窗,餐厅咖啡店夜店的娱乐桌都可以是一个大触摸屏。它也在再没有单人使用的限制,全家老少、我们的朋友、单位的同事,大家都可以一起在上面写字画画,玩游戏,讨论问题,喝茶聊天。可以想象在不久的将来,XBOARD能够让人获得前所未有的用户体验,它将又一次颠覆人们的生活习惯。感兴趣的朋友可以移步观看产品的视频简介x-board3—在线播放。(请原谅我在此做的广告,但追求真理的脚步又何必受到各种形式的限制呢?)
x-board3最后,我们再着重分析一下触摸屏的书写功能。纸和笔,是人类最有价值的工具之一,它不仅用于记录和展现,更重要的是提供了一种有效组织思想的工具。
1,视觉是人类最丰富的信息来源,无论是输入输出,其数据量都远非其他方式可比。同时,人的思维在很大程度上需要借助视觉的帮助才能实现,比如一张设计图,一盘棋局等等,几乎无法通过其他方式表示清楚。
2,人们在头脑中整理思路的能力有限,而简单的一张纸就可以帮助我们轻松的任意组织逻辑结构,在所有需要创作,比如设计,写作等工作中,纸和笔都是我们最好的工具。
由此,X-BOARD以黑板,白纸为假想敌,进一步提出了rich paper的概念。它不但可以自由书写,绘画,还能无限缩放,任意排列组合,同时能够支持各种媒体文件,图片,文档,视频等都能在我们的屏幕上以任意大小和方向展现,还可以在媒体内部对其进行修改和批注。在此基础上,还有一些拓展功能也能够得以实现,比如圈住内容即时搜索,通过树状结构管理思想等等。
综上,我个人认为,在未来的世界,在大尺寸条件下的触摸操作将是主流的交互方式。
— 完 —
本文作者:孙大圣
【知乎日报】
你都看到这啦,快来点我嘛 Σ(▼□▼メ)
此问题还有 40 个回答,查看全部。
延伸阅读:
下一个重大的人机交互方式的创新在哪?
好的人机交互设计 (UX) 有哪些主要评判标准?