未来的UI如果不是纯VUI,那是什么样?

一、理想VUI的一条边界

本节试图说明,许多服务,即使是被普遍看好能让自然语言交互落地的那些服务,也经常是需要持续的提示(信息供给)来支持用户走完整个流程的。

我们使用“理想VUI”来指代一个可以完全准确地感知用户语境、理解用户意图的VUI。事实上这主要是NLP的工作,UI只是一种体现,但为了行文方便就这么叫了。之所以把讨论放在理想VUI的前提下,是为了规避目前VUI在技术上差强人意的效果带来的影响。

我们可以为VUI和GUI总结出各种各样的差异来。在我看来,最重要的差异在于人机交互中人摄取信息的形式。

我寻找了几类难以通过VUI实现的需求。一是信息结构复杂的场景,用户需要在几个不同的指标间权衡取舍。二是用户对目标内容或目标服务的信息掌握度低以至于不能很好地描述它们的场景。三是用户在使用服务的过程中需要浏览大量信息并从中选择的场景。作为举例,考虑以下几个情景:

1.买机票

一个不怎么有钱的人(笔者)选购机票主要考量的因素有:价格、日期、时间、航空公司等。最重要的是价格。但一般情况下最近几天的低价票是会卖光的,所以在对旅行的日期要求不严格的情况下会权衡票价差距和日期差距来作决定。例如类似图1的情况,我会选择买最近的票,图2情况下则会选择推迟几天,买1月1日的机票。

图1 即使等也只能便宜几十块钱
图2 等到1月1日再飞的话能买到大约1/2价格的票

AI能帮助我们做这种决策吗?可能我们必须帮它预设一些规则,然后它的Policy可以很好地分辨什么情况下该把最近的机票放在第一位推荐,什么时候该推荐最近的价格大幅下跌的机票。事实上我截图的这个网站已经能为用户标出“最近的价格大幅下跌的机票”了。

可是用户恐怕宁愿不要费事去教这些规则。很多时候只有票价呈现在眼前,我们才能做出这种取舍,而且很难用言语总结出自己所遵循的究竟是何种规律。

上面两张图展示的也是比较理想的情况。有时候票价是随时间平滑地下降的。这时可能我自己也要纠结一阵子。

再来考虑更多的因素。如果我是乘飞机回学校,那就不能夜间到,因为我的宿舍每天22:30锁门。联合航空我一般也不买,因为它没有免费行李额度,但它真的很便宜,如果我的行李少,还是可以考虑的。另外,有些城市有不止一个机场,我可能还想知道哪个机场离我的目的地比较近……

这个例子代表的是信息结构复杂的场景。在这类场景下,用户需要在几个不同的指标间权衡取舍。

2.听歌

音乐不是只能作为背景存在的东西,有相当一部分用户(严格的说法应该是人次或者人分钟)是把它作为注意力聚焦的对象来专门欣赏的。

啊,突然想听那个了。

“播放攻壳机动队1的主题曲。”我唤醒了音箱,对它说。

音箱开始播放押井守剧场版《攻壳机动队》第一部的主题曲,可我想听的是神山健治TV版《攻壳机动队》第一季的主题曲《オープニングテーマ》。读者大概也发现了,这个名字我根本不会念。

如果是现在的GUI呢?我会搜索“攻壳机动队”。虽然我不知道我想听的那首歌叫什么,但我知道一定不是《傀儡谣》,名称里出现这几个字,或者只是出现了谣字的曲目我就不会点。此外我记得《オープニングテーマ》是菅野洋子的歌?看了看发现这没什么帮助,菅野洋子是作曲家,界面上显示的是歌手.无所谓了,因为我发现了TV版的片尾曲《lithium flower》。这个我认识!哦,这儿有首《inner universe》跟《lithium flower》出自同一专辑,下面还写着“《攻壳机动队》动画主题曲”,想必就是这个了——哦,原来歌名是英文吗。(注:オープニングテーマ是inner universe用日语念出来的发音)

图3 根据各种信息定位出了想听的歌

这个例子代表的是用户对目标内容或目标服务的信息掌握度低以至于不能很好地描述它们的场景。GUI会提供各方面的信息,用户可以在多个维度上一一对比这些信息来帮助自己作出决策。

3.订外卖

不知从什么时候起,“中午吃什么”作为一个难题成了保留节目。我来负责给大家订外卖好了。您一边看着电脑办公,一边跟我说:“看看满减最多的那家都有什么吃的?”

因为已经在您这儿工作一个月了,差不多也知道了一顿午饭吃多少,满减额度怎么算。我找出一家合适的店,看了看,说:

“蒸羊羔的月售量最高,订这个?”

“蒸羊羔这个月吃两次了,换换。”

我记下了近期不要推荐蒸羊羔,然后继续看。

“蒸熊掌也挺多人订的。”

“那个太贵,什么时候我想奢侈一把再说。”我也忙不迭记下。

“蒸鹿尾儿评价最高。”

“还有什么别的吗?”

“烧花鸭,烧雏鸡儿,烧子鹅 ,卤煮咸鸭,酱鸡,腊肉,松花,小肚儿 ,晾肉,香肠,什锦苏盘, 熏鸡,白肚儿……”

“你报菜名呢?”

这个例子代表的是用户在使用服务的过程中需要浏览大量信息并从中选择的场景。

听故事是不是有点听走神了?咱们总结一下:例1代表信息结构复杂的场景,用户需要在几个不同的指标间权衡取舍。例2代表用户对目标内容或目标服务的信息掌握度低以至于不能很好地描述它们的场景。例3您看上一段就行了。

以上三个例子有一个共性:需要持续的提示(信息供给)来支持用户走完整个流程,作出决策。接受VUI输出需要用户付出很高的成本,这使得用户在这些场景下很难离开GUI.

与GUI不同,这类需求在VUI上的交互成本在针对性或准确性维度上是递增的——感觉上有点类似“边际递增”,是不是?不太针对性的需求完全可以hold住,但需求越是准确,在VUI上得到结果的流程越长,而且很快就会长到不可接受。需要注意的是,需求准确不意味着目标清晰。像是那个买机票的故事,最后我只能买一张机票,在浏览购票网站之前我并不知道自己想买哪张,但肯定不是哪张都行。

事实上这样的例子还能举很多,像是听完推荐突然进来个电话,挂了电话发现自己还得重听一遍推荐;或者通过VUI买一本书,它很难向用户推荐另一本相似的书,等等。总之,许多服务,即使是被普遍看好能让自然语言交互落地的那些服务,也经常是需要持续的提示(信息供给)来支持用户走完整个流程的。我们说语音交互解放了人的双手,但并没有解放人们的双眼。

我们可以分析一大堆两种交互方式的差异来指出是什么造成了上述这些情况。不过,已经有不少前辈作了这样的总结,笔者也就不再赘述。

任何方式都有它的优点和局限,未来这也是不会变的。根据对速度、准确度、广度、是否人性化等不同需求,可以选择相应的方式。不过我不打算给一个“交叉交互”的结论就结束这篇文章。现在我们列举的是“纯VUI不适合的场景”,这类场景找得越多就意味着VUI的潜在应用范围越小。那么反过来想,纯VUI不适合就意味着只能使用传统交互方式了吗?是不是有什么办法可以让用户的需求被更好地满足呢?

接下来我尝试具体地刻画一些未来交互的特性,希望可以藉此找到更多的VUI落地的切入方向。

二、未来交互

诚然,用户欢迎的不是最高效率而是最满意。可是KANO模型告诉我们,体验满意的基础是基本型需求,也就是说基本的效率还是要保证的。就像进度条只能化解用户的一部分不满一样,当过于低效的语音交互引起用户的不满时,再怎么情感化的设计都是枉然。因此,我试着作了一些合理的推测来解决上面的问题。需要说明的是,我的推测——或者说建议——只适用于近未来(虽然理想VUI短期内也不太可能出现,但这里探讨的不是准确率或语义理解带来的问题)。我相信长期来看一定能出现更深刻地改变人机交互,甚至人与服务、人与内容交互的变革。

1.活用输入输出分离,语音多用于输入和辅助输出,只在有必要的场景下主要以VUI输出。

理由一:基于上文的论述(光讲故事了吧喂),我们可以知道,持续的信息供给是用户使用服务的重要保障之一,而VUI无层级结构的特性对输出来说是个灾难,但非常有利于输入。这可以说是自然语言交互中最令人愉悦的部分,用户说了一句话,然后机器就像真人一样听懂了。体现到上面的例子里,可以是语音输入旅行目的地或歌曲名,屏幕显示结果。

理由二:语音输入时,用户并不觉得自己在等待。理性上我们知道说“下一首”可能还不如去按屏幕方便,但“用户欢迎的不是最高效率而是最满意”说的就是这种事啊。

另外,这里我想讨论的一个点是近场与远场交互。我们知道,交互距离的决定其实是输入与输出各自在起作用,因此除触摸屏外我们经常可以见到非零距离的交互——像是家用游戏机、线控耳机和无人机——原因就在于它们的输入和输出不像触摸屏那样是一体的。语音确实可以支持数米内的交互,但显然很累。这也是为什么百度的音箱提供了一个可拆卸的触控板。通过分开考虑输入和输出,有时候可以产生意外地非常舒服的设计。

2.全场景VUI支持。

我们不希望什么事都去找一个VUI入口再说,本质上这没怎么改善GUI交互需要找入口的问题。一款搭载语音助手的手机应该允许通过唤醒词唤醒VUI,同时不影响GUI.

3.在任务流程中用用户说的query尽量填槽,并允许用户在交互过程中通过GUI选择没填的槽。

在用户说的内容不足以一次性填完所有槽时,GUI停在需要填槽的位置,等待用户输入。举个例子,像“打车到国家大剧院”算是很美好的VUI应用场景了,但滴滴还是可能希望你选择一下是用顺风车还是快车还是专车,这时GUI停在相应的界面,用户可以用语音或点击方式填上这个槽,然后流程继续,直接到下一个没填的槽(如果有)对应的界面。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,607评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,047评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,496评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,405评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,400评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,479评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,883评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,535评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,743评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,544评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,612评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,309评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,881评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,891评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,136评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,783评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,316评论 2 342

推荐阅读更多精彩内容