最好的输入就是输出,最近进行了一次可用性测试的分享。分享会上和大家交流,了解了一些实操过程中的重要点,大多是网上没有的资料,是一些宝贵的经验:
1、正式测试时,单个任务的时间怎么计算。一个测试者需要完成3-5个任务,一个任务一个卡片,一次发一张卡片。在测试前,主持人会介绍说“当我说开始的时候,你就可以开始读任务完成任务了”之类的话。所以从拿到任务卡片就可以开始计时。
2、用户的行为是不可预期的。如在实际测试的过程中,就算用户完成了一个任务,他会继续点击查看其他的内容,原因可能是他不确定是否完成了任务。
3、一些资料会推荐一个用户的时间大概是25-40分钟,时间长了可能不耐烦。但是,如果用户是通过层层筛选选来的,是有偿的,那么测试时间可能达到90分钟/人,因为要尽量不浪费资源。
4、测试过程中,有的用户会表现出烦躁、敷衍等行为,主持人要及时的停止测试,因为测试数据可能不准确。
5、对于“精品用户”,如第3点中提到的,每个用户需要测试90分钟,那么一般一下午只能安排3名左右的测试者。
6、做了就比不做好。专业的可用性测试需要专门的设备、资源,但是也可以根据自己的实际预算、产品的阶段进行简单的可用性测试。
以下是分享会的内容,分可用性测试的介绍和步骤两部分,其中步骤又分为测试前的准备、正式测试、测试后数据的分析3个小部分。
一、介绍
1、定义
在特定场景中,通过观察用户完成特定任务时,所产生的一系列指标。常见的3个指标是:有效性、效率、用户满意度。
·有效性:用户完成任务的完成度,对应用户目标;
·效率:用户完成任务需要耗费的时长;
·用户满意度:用户对该系统的舒适度和认可度,偏主观。
2、可用性测试方法有哪些?
网上搜索“可用性测试”或“usability method”,会发现有很多的研究方法,比如原型测试、问卷调查等几十种。这是因为可用性测试并不是单一的方法,它是由多种方法组成的。
根据自己产品的性质、所处的不同阶段、经费等,采用不同的方法组合来做可用性测试。比如在产品初期,可能只有概念稿、纸质版原型,也是可以做可用性测试的;公司经费允许,想做的更专业,可以找第三方公司做可用性测试,比如眼动测试就需要专业的设备。
此外,可用性测试并不是专门给用研人员用的。产品经理可以验证原型、交互设计师可以发现可用性问题、视觉设计师有类似图标的可用性测试和内容的可用性测试等,所以掌握可用性测试,是一个非常基本的技能。
下图列出的是可用性测试中常见到的一些方法:
在这种图中,大部分的方法我们工作中都有接触。从最底部往上看:红色的是面向专家的方法,比如公司内部设计方案评审;绿色方法比如面对面测试,如我们平时找同事寻求意见等;卡片分类法常用在互联网行业中,规划和设计信息架构。……所以可用性测试的很多子方法,我们都或多或少接触过。
3、可用性测试分类
这么多的方法如何排列组合,怎么用呢?
一般情况,把可用性测试分为2大类:形成型可用性测试和总结型可用性测试。简单看来这两大类的区别是:前者适用于项目前期,后者适用于项目上线后期;前者简单快速,后者专业要求高;前者目的是快速发现问题,后者更倾向于看指标数据。
下图是这2大类的具体区别以及常用的方法:
4、为什么做可用性测试
所以可用性测试的本质就很好理解了,功能与流程含有不确定性,找到目标用户还原使用场景进行测试验证,以评测设计是否行得通、哪里需要改进,为功能上线减少风险加强容错,减少试错的成本。
5、可用性测试流程概况
如同餐厅推出一个新系列的菜品试吃一样,可用性测试可与试菜环节相类似。为了便于理解,我们以餐厅试菜做比喻。
二、步骤
以试菜为类比,接下来就讲一下可用性测试的流程是怎样的。
tips1
就像上新菜一样,试菜往往是针对一系列新品的研究,并不是面向整个菜品的,可用性测试很少用于研究用户对产品或服务的整体体验。
tips2
试菜流程根据餐厅实际情况,可以招募一波试吃路人,也可以小范围内不试吃。所以所,我们给出的可用性测试步骤,是通用的而非标准,根据实际情况取舍。
将可用性测试的整个过程分为:测前准备,测试,测后分析3大块。每一块的关键内容如下图:
测前准备
首先要确定目标,有了目标才能安排计划。试菜的目标可能是:推出新系列产品,并且借机宣传。那么它的计划中就要包含邀请媒体报道了。
1、确定测试目标
2、准备测试计划
计划中包括:目标、测试内容、方法、时间计划、用户招募方案
在规划测试过程之前,我们需要明确测试的方式,比如是远程测试还是与用户面对面的测试。注意为了不影响最终测试结果,需要保证样本用户的测试方式统一。
3、界定目标测试用户
用户招募方案,根据产品的不同,可能需要不同类型的方法。比如管理员类用户和普通员工,就是典型的两种类型的用户。这2类用户可能存在重叠,但是测试功能模块时候,要分开模块进行测试。
4、撰写大纲和脚本
5、招募&筛选用户
可以通过官方发布召集令,报名表信息含有:基本信息、产品使用情况、相关竞品使用情况、是否有测试经验、方便时间。再根据报名内容,进行层层筛选。
根据第3点中,测试用户分类,每类大概招募6-8名用户。
一般可用性测试单个模块有5个测试者,就可以发现80%左右的问题,但是要多出1-2人备选。
专业类用户4-5人,自由招募5-6人
6、准备测试物资
分两类,一类物料(会议室、记录设备),一类文档类。
常用文档资料如下图:
可用性测试中的定量的问卷
我们在做产品或系统的可用性测试后,都想把结果更好地传递给相关方。除了定性的研究结果之外,还有定量的可用性问卷,这些可用性问卷是标准化的,不仅可以科学地量化用户体验,也方便相关方之间有效沟通。
常见的标准化可用性问卷有:整体评估问卷、任务评估问卷和网站感知可用性评估问卷,如下所示:
整体评估问卷
用于完成一系列任务场景后,对产品或系统整体的感知可用性测量。目前使用较广泛的有:QUIS(Questionnaire For User Interaction Satisfaction)、SUMI(Software Usability Measurement Inventory)、PSSUQ(Post-Study System Usability Questionnaire)、CSUQ(Computer System questionnaire)、SUS(System Usability Scale)。
任务评估问卷
每完成一个场景任务,让用户对该任务进行感知可用性测量。目前使用较广泛的有:ASQ(After-Scenario Questionnaire)、SEQ(Single Ease Question)、SMEQ(Subjective Mental Effort Questionnaire)、ER(Expectation Ratings)、UME(Usability Magnitude Estimation)。
网站感知可用性评估问卷
大部分标准化可用性问卷最初在20世纪80年代中期到后期被开发,在网络开始流行时,出现了更有针对性的评估网站感知可用性的问卷,目前广泛使用的有:WAMMI(Website Analysis and Measurement Inventory)、SUPRQ(Standardized Universal Percentile Rank Questionnaire)。
测中(正式测试)
终于开始测试了,正式的测试也分了几个步骤。
1、测试介绍:
向用户简单介绍测试目的和流程,尽量让他们处于一个比较放松的状态,取得录制视频和使用数据的许可,签订保密协议;
2、测试前问卷:
测试产品前,填写一个简单的问卷,除了简单的个人信息外需要了解用户对相关产品使用经验和习惯等;
3、测试场景与任务:
开始进行测试,在用户完成任务过程中观察用户的表情和肢体动作,在完成任务后提出一些简单的口头问题;
4、任务后问卷:
在完成一个任务后,用ASQ(After Scenario Questionnaire)梯度问卷调查满意度,再进行下一个任务的测试;
5、测试后问卷:
在所有任务完成后,用户需要填写一个关于整体满意度的梯度问卷,通常使用的是SUS(System Usability Scale)——系统可用性量表。
注意事项:
保持测试环境免受干扰
向被测试人员说明:测试内容、目的、流程、时长、刚刚填写的个人资料表的处理方式。让被测试者有好的认识同时打消顾虑
测试过程中的记录,录音、录像、笔记
记录人员不要直接告诉被测试者怎么操作
测后分析
通过可用性测试,我们得到了单个用户的记录内容。测试时的记录点:求助节点、问题描述、微表情反应。所有跟数字相关的数据如时间:后期根据录音、录屏进行整理。
下面来看如何得到文章一开始说的3个指标,有效性、满意度、效率
1、有效性
有效性对应用户是否能成功完成任务。
功能有效性计算公式:有效性=(完全完成任务用户数x1+部分完成任务用户数x0.5)/用户总数
2、满意度
满意度是一个主观的感受,为了量化,我们通过问卷调查的方式来获取。满意度又分为单个任务的满意度和整体的满意度。分别用ASQ问卷和SUS问卷获取。
3、效率
效率对应时间,用用户完成单个任务的耗时长短来衡量。四舍五入精确到秒,数值越大效率越低。
效率=平均用时/熟练用时
熟练用时:对功能熟悉的人(PM、测试、设计师)按照任务提示进行操作,记录完成操作所需的时间,多个人操作取平均值,四舍五入按秒计时。
限定时间:根据熟练用时而定,熟练用时的3~10倍,保证一个任务不超10分钟。计时单位:四舍五入精确到分。
完成时间:
开始时间:用户拿到任务卡开始计时。不要等用户读完任务卡计时,因为有人喜欢读一条记一条,有人喜欢读完所有任务再操作。
结束时间:不要在观察到任务完成了就结束,而要用户宣布自己已完成再结束,因为有人在操作完喜欢检查自己是否操作成功。计时单位:四舍五入精确到分。
4、可用性水平
通过以上3个指标,我们可以得到功能的整体的一个可用性水平。对有效性,效率,满意度做量化处理,按照5:3:2的权重计算得分:可用性水平=有效性x0.5-效率x0.3+满意度x0.2
注意,这里的权重不是固定5:3:2,根据实际项目的需求,来决定占比水平。
5、结果的利用
注意点:
·可用性测试得出的结论可能是体验的优化、方案的决策、设计的输入,不会动产品大的方向,是微调而不是改版
·要做减法而不是加法。发现了问题要取优先级,发现了更多的需求也要取优先级,上线压力要减去一些功能
·做了优化要去验证,优化是否有效
通过可用性测试,我们会得到很多的反馈、问题,用Excel表整理问题清单,用高中低标注,在修改问题时有先后顺序
参考文档
1. Why You Only Need to Test with 5 Users
https://www.nngroup.com/articles/why-you-only-need-to-test-with-5-users/
2. Usability Test, Even When You Know the Answer
https://www.nngroup.com/articles/test-when-you-know-answer/
3. Usability Testing 101
https://www.nngroup.com/articles/usability-testing-101/
4. SUS超全解析
http://www.lanlanwork.com/blog/m/?post=8275
5. 写任务需避免的10大错误
https://mp.weixin.qq.com/s/BrBWxBc9zl3WvhNQPfqI5Q
最后,关于可用性测试的一些知识思维导图、模板等内容,感兴趣可以私信。有问题欢迎交流。