必威体育Betway必威体育官网
当前位置:首页 > 运营推广

SUS(系统可用性量表)在用户研究中的应用

时间:2019-06-18 06:41:03来源:运营推广作者:seo实验室小编阅读:61次「手机版」
 

系统可用性

我们在做产品系统可用性测试后,都想把结果更好地传递给相关方。除了定性的研究结果之外,还有定量的可用性问卷,这些可用性问卷是标准化的,不仅可以科学地量化用户体验,也方便相关方之间有效沟通。常见的标准化可用性问卷有整体评估问卷、任务评估问卷和网站感知可用性评估问卷,如下所示:

1. 整体评估问卷

用于完成一系列任务场景后,对产品或系统整体的感知可用性测量。目前使用较广泛的有:QUIS(Questionnaire For User Interaction Satisfaction)、SUMI(Software Usability measurement inventory)、PSSUQ(Post-Study System Usability Questionnaire)、CSUQ(Computer System questionnaire)、SUS(System Usability scale)。

2. 任务评估问卷

每完成一个场景任务,让用户对该任务进行感知可用性测量。目前使用较广泛的有:ASQ(After-Scenario Questionnaire)、SEQ(Single Ease Question)、SMEQ(subjective Mental Effort Questionnaire)、ER(Expectation Ratings)、UME(Usability magnitude Estimation)。

3. 网站感知可用性评估问卷

大部分标准化可用性问卷最初在20世纪80年代中期到后期被开发,在网络开始流行时,出现了更有针对性的评估网站感知可用性的问卷,目前广泛使用的有:WAMMI(Website Analysis and Measurement Inventory)、SUPRQ(Standardized Universal Percentile Rank Questionnaire)。

SUS是什么?

SUS最初是Brooke于1986年编制,量表由10个题目组成,包括奇数项的正面陈述和偶数项的反面陈述,要求参与者在使用系统或产品后对每个题目进行5点评分。

经过翻译,我们可以看到中文版如下:

注意:在使用SUS的过程中,可以对题目的词语进行替换,这些替换对最后的测量结果都没有影响。比如“system”可替换成网站、产品或者自己产品的名称等。

何时使用?

同一产品或系统,新旧迭代版本的对比。比如:某APP首页改版后,新旧首页的对比。

同一产品或系统,不同终端之间的对比。比如:某产品的PC端、App端进行比较。

同类型竞品之间的比较。比如:苏宁,京东,当当三款App使用后进行比较。

为什么使用?

量表公开免费。

整个量表题目陈述简单,只需参与者打分,实施起来很快。

测量结果是介于0-100之间的分数,容易理解。

可测量多种用户界面,比如网页手机平板等。

多个实证研究表明SUS效果较佳。如Tullis等人研究表明,在样本量有限时,SUS可以最快达到效果(如下图)。也有大样本的研究(Bangor,2008)得出SUS的信度系数为0.91。

如何使用?

计分

当参与者做完一系列任务后,就可以快速对SUS进行打分。然后就需要对每个题目的分值进行转换,奇数项计分采用“原始得分-1”,偶数项计分采用“5-原始得分”。由于是5点量表,每个题目的得分范围记为0~4(最大值为40),而SUS的范围在0~100,故需要把所有项的转换分相加,最终再乘以2.5,即可获得SUS分数。

除了获得SUS量表总分之外,还可以获得分量表得分。SUS中,第4和第10项构成的子量表为“易学性”(Learnability),其他8项构成的子量表为“可用性”(Usability)。为了使易学性和可用性分数能够与整体SUS分数兼容,范围也是0~100,需要对原始分数进行转换:易学性量表转换分数的总和乘以12.5,可用性量表乘以3.125。

Tips:因为SUS记分时是用的0~4个距离,为了让总分是100,所以计算SUS总分时要乘以2.5。但是可用性的题目为8个,总分值在0~32,所以应该是计算出8道题的总分,然后乘以100/32。易学性的计分类推。

为了方便计分,我编制了一个SUS计分器。如果有需要,可在我个人微信公众号回复“SUS”获取。

解释

SUS分数反应的是总体可用性,当然,也包括两个分量表的特性。对于总体可用性,已有研究者(Bangor,2009)得出了文字、字母、可接受范围与SUS分数之间的关系,在图中可以直观地查看并解释SUS分数的意义。

除此之外,也可以将SUS分数换算成百分等级来解释,百分等级的意思是指测量的产品或系统相对于总数据库里其他产品或系统的可用性程度。比如SUS得分是73分,其百分等级大约为67,意味着比大约66%的产品可用性更好。

注意,这里的总数据库是Jeff Sauro(2011)通过446个研究,超过5000个用户的SUS反馈的数据库。如果从企业研究团队的角度来看,可以沉淀以往的研究,建立企业自己产品或系统的SUS数据库,从而获得自身的基准数据。当然,这个基准数据也有可能是内部团队制定。

最后

在使用SUS的过程中遇到了两个小问题:

10个题目中,个别题目对于参与者来说难以理解,比如第2题和第6题,这时需要和参与者进行解释。

最终的SUS分数并不是一个百分数,需要给受众解释清楚,当SUS分数为70时,其实是接近SUS总体的平均分,即对应的百分等级接近50,也就是说比大约一半的产品可用性更好。

对于第一个问题,我们需要灵活应变,在使用题目时注意措辞,避免歧义;对于第二个问题,需要查阅书籍文献(建议阅读文末的参考文献),这些理论的根源还是需要有充分的了解,否则就是半瓶子醋。

SUS最初的目的是快速而粗糙地测量可用性,现在已经被广泛使用。在定性研究的基础上,利用定量的结果来辅助会使研究结论更具有说服力,也是一种研究趋势。然而,在使用过程中,会遇到一些问题,作为研究人员,我们需要不断的在理论中思考实践,在实践中思考理论,以促进自身的成长。

更多阅读

Bangor, A., Kortum, P. T., & Miller, J. T. (2009). DeterMining what inpidual SUS scores mean:Adding an adjective rating scale. Journal of Usability Studies, 4(3), 114-123.

Jeff Sauro.(2014). 用户体验度量. 机械工业出版社.

John Brooke. (2013). SUS: A Retrospective. Journal of Usability Studies, 8(2), 29-40.

Tullis, T. S., & Stetson, J. N. (2004). A comparison of questionnaires for assessing website usability. Proceedings of UPA 2004 Conference. Minneapolis, Minnesota.

相关阅读

霸屏广告进行用户营销推送

屏信通知平台优势一:可以批量发送屏信消息,对于企业或者公司商务人员,电脑发送屏信可以明显提升工作效率。屏信除了可以通知客户之外

小众领域的公众号,如何才能获得精准的用户?

很多运营人都觉得自己公众号阅读量做不起来,是因为目标用户太少,太小众了。但其实什么样的群体才算小众呢?你是否搞清楚你的目标粉丝

微信推出小程序“用户留存”利器 用户回流更容易

随着用户和开发者的信息推送诉求日益增长,10月12日,微信官方消息显示,微信小程序模板消息进行优化调整,将支持一次性和长期性订阅消息

都大数据时代了,你还不能算出你的用户值多少钱?

用户的价值可分为现有价值和未来价值,本文主要讨论现有价值。目前中国有超过400万APP,有的已经远去,有的还活在当下,做为一名移动产品

超越可用性,为设计增加说服力

设计是感性和理性的混合体。但在UX设计领域,我们更多依靠的还是理性。本文从产品的完整用户流:注册产品 — 首次使用 — 持续使用,分

分享到:

栏目导航

推荐阅读

热门阅读