聊天机器人-需要跟踪的10个硬指标

[前沿理论][用户体验]

封面用研整编文章

不同的产品形态,重点关注的指标也不相同。当前新闻资讯领域内,聊天机器人的产品形态正火,针对这样的产品,我们整合了相应的重点跟踪指标。

BotAnalytics的联合创始人İlker Köksal在计算整理后得出结论:40%的聊天机器人用户只会参与一次会话。这表明,开发聊天机器人的企业需要投入更多精力来研究测量指标,跟踪其性能,争取在有限的交互机会中,挖掘更多的服务空间,提升产品体验,为用户创造价值。

传统指标和分析工具,比如每日活跃用户数(DAU),谷歌的Analytics 或 Mixpanel,它们很适合跟踪网站和移动应用的表现,但聊天机器人独特的会话特点需要从不同的角度来审视。

传统的指标甚至可能产生误导。例如,会话时长通常被用作是网站和APP上用户参与度的重要指标,然而,许多聊天机器人是助手型的,它像是一个内嵌的的功能性快捷方式,会话时长的增加可能意味着用户混乱或会话效率低下。

随着人气暴涨的聊天机器人的普及,开发者已经收集到足够的数据来确定它是否在正常运转。像Dashbot和Botanalytics这样的分析公司已经推送了近1亿条信息,并对哪些指标是最有用的进行了概述。其平台上的开发者尝试了数十个新措施来改进机器人。

下面是我们所研究的十个聊天机器人指标。

1:有效用户数

有效用户数是最重要的,如果样本不够大,如下所有数字都将不会如您所愿的相关或有意义。因此,为了保证所有指标的有效性,您首先要关注到达的的有效用户数。

做一个简单的对比,如果您的机器人与1,000个或更多用户进行了互动,那么您可以使用的样本大小相对合适,而假如您只有10位用户,那您的样本量就显得不可信,也说明您的聊天机器人还有很多地方尚需完善。

2:活跃用户数、参与用户数

活跃用户与参与用户之间的主要区别在于,只要使用机器人并阅读机器人发送的信息的用户,就是活跃用户,而参与用户则会响应机器人,发出请求或询问。

其中,用户参与时发出的消息反映了他们对机器人表现的期望,模拟他们的心理模型,通常能促进参与度的提高。

用这两个指标区分用户的参与度非常重要,因为您可以从不断参与的用户中学到很多东西。他们的反馈将为机器学习提供素材,也为您调整策略提供帮助,以便更好地服务这些深度参与的用户。

3:会话时长(均值、分布)

一旦确认机器人与足够的用户进行了互动,您就可以开始查看基本的统计信息,这将给您提供一个基本的使用概况。 其中,平均会话时长是一个很好的衡量指标,但您必须将其落地在具体的行业和场景上。

例如,一些聊天机器人是为了回答问题和服务客户而设计的,在这种情况下,会话时长应该要短。 相对的,处理订单或讲故事的机器人,应该让用户停留更长的时间,参与更多有意义的交互。

而会话时长的均值和分布情况,则可以反映用户会话时长的不同侧面,为决策提供更丰富的参考。

4:每个用户的会话数量(均值、分布、时序)

40%的聊天机器人用户只会参与一次会话,这可能说明,对于用户正在寻找的答案,它并没有给到。关注每个用户的会话数量是非常重要的,因为它能表明您的机器人是否在正常工作。

进一步看一下用户与机器人的对话,我们至少可以确定哪些问题是无法解决的。同时,您也应该关注那些进行了多次会话的用户,以便了解机器人是什么地方做得好,让用户能够多次前来使用。 然后,您可以基于此画下蓝图,优化策略,提高此类型会话出现的概率,以让更多的用户进行多次会话。

同时,您也要关注用户会话数量随时间的波动,这可以帮助您了解到机器人潜在的缺陷,找到问题点并解决它们。

5:每个用户的交互次数(均值、分布、时序)

机器人性能的另一个重要指标是每个用户的交互次数。 这个指标类似于会话时长,不同类型的机器人对应的交互次数也不同。

如果您的机器人的主要目的是销售,交互次数多可能意味着客户很感兴趣,并且,如果客户询问了许多有关产品的问题,这就很容易促成真实的购买行为。另一方面,针对客户服务型的机器人,如果交互次数过多,则可能意味着服务效率低,用户没能快速获得答案。

6:会话步骤(对话回合)

这又是一个因人而异的指标,会话步骤的合理数量取决于机器人的目的。如果您的机器人服务于简短直接的对话,那么步骤应该尽可能少。 另一方面,如果您希望机器人能与观众建立有意义的连接,更多的步骤可能更好。

“每一个开发者都需要知道它们的平均会话步骤”,Köksal说。助手型聊天机器人比娱乐型聊天机器人的平均会话步骤少。但是,不管聊天机器人是什么类型,对话回合数大大超过或低于平均数量,通常都表明这是一次糟糕的用户体验。用户放弃得太快或机器人花了太长的时间来完成用户目标,都是典型失败的用户体验。

7:点击率(CTR)

虽然CTR不是当前的主要指标,但它无疑将成为未来需要注意的重要因素之一。同样的,不同的业务模式下,应该关注不同的点击率指标。

8:混乱触发器

您不仅应该考虑用户的反应,还要考虑到在遇到困难任务和请求时,机器人的行为。

由于用户的沟通方式多种多样,所以机器人常常因不同的表达方式而感到困惑,甚至误解用户的意思。很可能会出现类似于“我不明白”、“听不懂”等回应。 因此,请关注触发机器人混乱状态的次数,并分析每个案例中的对话内容,制定相应的策略,以降低混乱触发的比例,让您的机器人看起来更聪明。

通过密切关注混乱情况,您甚至能捕捉到原本可能会错过的问题。例如,输入同样的内容,但可能因为输入方式的不同(打字/语音/快速按钮),而导致机器人出现困惑。

需要人为干预时,跟踪混乱率也有助于任务分流。正如糟糕的客服会毁掉您的品牌口碑,糟糕的聊天机器人也会带来同样的问题。因此,在高风险的情况下,我们要着重改善机器人的表现,并培训员工进行人为介入。这可以大幅降低客户流失率,并为您挖掘用户真实需求提供宝贵的机会。

9:响应时间

毫无疑问的,用户需要快速响应。即使大多数机器人的响应都需要耗费一点时间,您也要确保您的机器人没有意外掉链子。(如果能在响应时间上做到出类拔萃,当然最好。) 

为此,您可以进行针对性的测试,或者简单地,您只需与机器人进行自然交互,看看响应所需的时间是否在可接受范围内。

10:留存率

针对这个指标,您也应该根据具体的应用场景,来关注不同的留存率指标。每个会话的生命周期与机器人的留存周期,都因人而异。

如果您的机器人提供每日更新的内容,则需要关注1至3天的留存率。 如果您的机器人帮助用户下订单,则希望他们保持参与度,至少直到产品签收为止。

最后......

找到正确的衡量指标,是开发一款成功的机器人的关键。关注以上我们提到的指标,细分用户,优化您的机器人,提供最佳的用户体验,提高长期使用率和用户参与度,让机器人能够更好地为您的品牌和产品口碑提供帮助。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,490评论 18 139
  • 点击查看原文 Web SDK 开发手册 SDK 概述 网易云信 SDK 为 Web 应用提供一个完善的 IM 系统...
    layjoy阅读 13,588评论 0 15
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 171,042评论 25 707
  • 股民朋友们,大家晚上好! ☞盘面回顾: 午后市场再次突破短期新高,一扫节前即将破位的颓势,不过今天强势突破新高存在...
    老石股道lsgd88阅读 239评论 0 0
  • 抄袭是一种欺骗他人的行为,书中列举了许多抄袭后的结果。抄袭也是欺骗自己、对自己不负责的行为,抄袭其实就是对自己不诚...
    sxrunn阅读 512评论 0 1