VUI ，GUI与DUI不同场景下的优劣对比

为方便讨论，先做一下定义。市面上关于交互的常见的几个词汇，GUI、VUI、DUI。

一、三种基本概念

1. GUI

GUI（Graphical UserInterface）图形界面，市面上最常见的交互方式。点触，滑动，作为主要输入方式。图像显示作为主要输出方式。

GUI界面

2. VUI

VUI（Voice User Interface）语音界面，常见没有屏幕的智能音箱/耳机，靠音轨输入，音轨输出。

VUI还有一个前身，即IVR（Interactive Voice Response）交互式语音应答，类似我们拨打营业厅电话，通过选择数字，来选择进入某某业务。

VUI产品

3. DUI

DUI（Dialogue User Interface）对话界面，当然还有另外一种说法叫做CUI（Conversational User Interface），举例子就是苹果的SIRI，或者某种对话机器人，以对话式窗口作为主要功能界面。这种方式是混合式方案，故而不在讨论范围之内。

二、交互形态

为方便理解，更容易代入角色，理解交互形态，大家需要在限制的条件下体会。

交互形态

只有封闭了自己的功能，如此才能做到设身处境，继而理解两种不同交互形态的差异。不妨把自己想象成：听力正常且发音标准的盲人，以及视力正常且四肢健全的聋哑人。

GUI（Graphical UserInterface）图形界面

特性：使用鼠标键盘、手指点触，作为主要输入方式，以图形展示作为输出方式。通俗来说：动眼动手与硬件进行交互。当前市面上最为常见的交互方式。

VUI（Voice User Interface）语音界面

特性：使用语音作为输入，语音作为输出。能听见，能发音，那么就能使用VUI。通俗来说：动耳动嘴与硬件进行交互。未来一定会走入我们生活的交互方式。

VUI与GUI区别

日常生活中有很多场景，双手是被占用的，如果有好的VUI的解决方案，那么就存在交互空间。

解放双手是一个特性，不足以成为优点，是一种特定情况下的解决方案。

VUI与GUI区别

VUI的缺点，只能在安静和隐私的环境下进行，在公共场合使用，必然引起他人的围观，继而造成自己的心里压力。GUI则不存在输入压力问题，仅依赖光线。

VUI与GUI区别

输入速度，是VUI的一个巨大优势，需要什么说就好了，然后通过ASR转化为文字，由计算机理解，并执行命令。

GUI的界面上显示了太多的信息，如果不熟悉的话，需要判断点哪里（如果你教老人使用智能手机就能懂得其痛苦）有些时候还需要调用键盘，输入速度就很慢。

播放周杰伦的《烟花易冷》如果用点触的话，操作成本非常高（打开APP，寻找搜索框，输入指定信息，搜寻，选择列表中的一个播放）。而使用VUI，成本就非常低。

VUI与GUI区别

VUI可以无视层级，一句话直达目标。例如：播放2020年NBA全明星正赛第4节，或者是打开APP的签到功能/活动页面这类话术，可以直达熟悉的位置。

而GUI则是预设路径的交互方式，强迫用户沿着单一路径去完成操作的人机交互方式。每一步操作正确或者错误都会给予反馈，通过信息结构层级去展示指定内容，这非常方便人们学习和摸索规律，故而不是缺点而是特点。

VUI与GUI区别

VUI的缺点，由于人类的输入不可控，导致计算机难以理解——

用户本身发音模糊；依赖ASR（语音识别：Automatic Speech Recognition）技术的表现。
人类表述差异化较大，无逻辑，上下文表述会使用指代关系，会歧义或者双关。而计算机推理较难，此处考验NLP（自然语言处理：Natural Language Processing）的能力。

GUI的优点就是输入精准，任何操作都有着边界约束，流程可控，选择明确，计算机容易理解。

VUI与GUI区别

交互是一个双向的过程，语音作为输入动作确实很快，而纯语音输出的话，效率非常低。几乎没有人愿意做太多的等待行为。且语音输出携带的信息量非常少。

比如展示2020福布斯前10名的结果，语音输出的效率就是悲剧。而视觉层面展示的内容可以无限多，可以使用表格图形的方式进行展示，眼睛接受效率也非常高。

在计算机输出的过程中，语音输出要求人不可分心，需消耗注意力，视觉展示则没有，即使走神，也无压力。

VUI与GUI区别

在语音交互的过程，如果是多轮交互，当计算机说完之后，立刻留给人决策，注定会给人压力。GUI则不存在这个过程。

比如一个简单的机票业务查询结果，为你找到从[城市]到[城市]，[几月几日][几点几时几分]出发[航空公司][飞机仓位][机票价格]，是否需要定这张票？

当语音播放完毕后，我是不是要思考和比较一下？如果我想更新下查询条件，语音应该如何处理？而这交给GUI，就非常容易处理。

基于此，我们整体来看一下两种交互形式的优劣表现：

VUI与GUI区别

由于GUI的特性大家非常熟悉，所以本文偏重于总结提炼纯VUI的特性。

三、VUI的特性

1. 基本特性

VUI语音交互的特性是解放双手，动嘴就可以搞定。在某些业务场景下，是存在于双手被占用，通过语音指令完成目标的需求。（作者吐槽：GUI交互总不能写，不用动嘴且不依赖光线就能解决问题吧，这很奇怪）

VUI语音交互依赖安静、隐私环境，公共场合有使用压力。声音输入，和声音输出都可以通过空气这个介质传播。即使是耳机可以管理计算机的输出行为，但是人类的输入行为也会引起他人的围观。这一点就局限了VUI的使用场景。

当【基本特性】掌握后，对寻找VUI的使用场景有了方向，即

光线不太好，不方便点触操作
双手被占用，不方便点触操作
隐私，安全，的无场景
使用语音无压力的场景

所以目前看来，卧室、客厅和车内这种相对隐私的空间是VUI的主要交互场合。

开车的时候，双手被占用，VUI有发挥空间
骑车或者跑步锻炼的时候，VUI有发挥空间
晚上都关灯了，不想睁眼睛，VUI有发挥空间
快递员/外卖小哥在送东西的时候，VUI有发挥空间

2. 输入表现

GUI是一种预设路径的交互方式，VUI则聚焦于如何发挥语言和表意的强大力量，采用人们日常的语言来交流。

GUI需要人类适应工具。VUI则是由工具适应人。

语音输入门槛非常低，只要会说话，就能模仿，输入速度快捷，相比GUI拥有巨大的优势。而图形界面则具备相当的学习门槛，难点就是在于，用老年人学习手机的委屈状态“这个上面字那么多，按钮那么多，我不知道点哪里”以及“这个太多了记不住”。

VUI另外一个特性优势是没有UI层级，可以一句话直达，这点对于熟悉的事物具备巨大的优势。不需要像GUI依照层级关系一路点过去。而GUI的特性是流程明确，对于复杂的流程，明确交代了层级关系。

VUI的巨大劣势是，用户的输入表述不可控，这是自然语言处理的核心，即，如何让计算机理解人类的各种表述。而图形界面则输入非常可控，计算机易于理解。

VUI与GUI区别

3. 交互表现

VUI语音输出的效率非常低，且依赖注意力。这是巨大的劣势。而对GUI而言，则是巨大的优势，不要求人类过于集中注意力。

VUI反馈设计，注定无法输出大量内容，最好的表现还是GUI。多轮对话中，尽量控制用户的表述范围，才能够得到更好的体验。

基于输入表现和交互表现，我们对处理VUI交互有了方向，即

一句话能搞定的用户熟悉的任务
决策压力低的的任务
管理用户输出，让其做选择题或填空题
语音输出的内容不应该太长
不让用户做挑挑拣拣的任务

综上，只有理解其优势和劣势，才方便展开业务。

附一张当前智能音箱的技能列表，笔者已经就自己的理解做了归纳，这是当前市面上，相对比较成熟的语音交互技能。

image

我们还是回归正常，未来一定是多模态交互的场景。

人类与计算机打交道的方式不断演变，随着科学技术的发展，从最早的命令行，鼠标键盘，到如今最为主流的点击和触摸，到未来的语音交互以及手势交互。

image

想做好交互设计，只有了解各种交互形式的优缺点，硬件相关知识，技术相关知识，才能够做好选择，然后叠加出多模态交互方案。

生活中，带屏幕的音箱越来越多，而且耳机也是搭配各种屏幕的硬件使用的，而且在未来，就跟科幻电影里面一样，几乎每一块屏幕都可以用来操作。

从实际的发展趋势上来看，未来注定是万物互联的世界，几乎任何硬件都可以搭配麦克风、扬声器和WIFI模块三件套，由于其硬件成本低，普及极其容易。各方数据表现，可穿戴智能硬件出货量巨大……语音又是最为自然的交互形态，一定会在我们生活中占据一席之地。

语音交互，将会给我们的产品设计带来极大的改变，提供更为丰富立体的交互乐趣。在即将到来的万物互联时代，对各位交互设计师/产品经理而言，也是一种进步和挑战。

做好语音交互，不需要掌握任何画图技巧，上下文对话，就是UI本身，如何管理用户输入，全凭内容结构。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

VUI ，GUI与DUI不同场景下的优劣对比

一、三种基本概念

1. GUI

2. VUI

3. DUI

二、交互形态

三、VUI的特性

1. 基本特性

2. 输入表现

3. 交互表现

推荐阅读更多精彩内容