产品经理产品设计-用户研究干货!量化用户研究_第1页
产品经理产品设计-用户研究干货!量化用户研究_第2页
产品经理产品设计-用户研究干货!量化用户研究_第3页
产品经理产品设计-用户研究干货!量化用户研究_第4页
产品经理产品设计-用户研究干货!量化用户研究_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用户研究干货!量化用户研究什么是用户研究?本书关注的是前者的广告主。这里的用户可以是一个付费顾客、内部员工、物理学家、呼叫中心处理员、汽车司机、手机拥有者或是任何试图去完成某个目标的人一一一方面是那些涉及到软件、网站以及机器设备的目标。这里的“研究”宽泛而又模糊一一它是以其为核心的方法和专业人员的结果。Schumacher(2021,p.6)草拟了以下的定义:用户研究是对于用户既定目标、需求和能力的系统内研究,它的终极目标是为了给设计、手机用户架构或改进工具来帮助用户更好的党务工作和生活。相比起这个词语的定义以及它的内容,我们愈关心如何关心量化用户的行为,因为这包含到可用性相关专业人士、设计师、产品经理、营销人员以及开发者。用户研究中的数据n尽管“用户研究”这个说法最终可能会失宠,但是它其中统计数据劳动生产率的数据却不会。贯穿本书,我们将把重点放在可用性测试,使用一些来自精确性测试、用户调查、A/B测试以及沙盘调研的案例。之所以把重点放在可用性测试上,是有以下两点原因:可用性测试依然是判别用户是否在完成任务的核心方法。我均执行过的可用性测试并对其有着很多论述。可用性测试用到了许多其他用研方法所涉及到基准的指标。(比如到处都能看到的“完成率”)。可用性测试大多数的可用性测试属于总结性的。它们通常是一个小样本量的定性活动,在其中问题描述以及设计建议是以数据的形式输出的。你的目标是找到发现尽可能多的问题并找到软件平台,但是这并不意味着没有固相什么事。你可以从频率、程度的角度量化问题,追踪哪些用户碰到了哪些问题,衡量一下他们量度圆满完成任务花费的时间,判断一下他们是否成功的敲定了任务。通常来讲有两种典型的总结性测试:基准测试以及比较实验。基准可扩展性测试的目标是描述一个应用相对于一系列基准来说的可用程度。在基准测试里你可以提出一个界面中需要修复的问题并且它也提供了用于比较设计后改变的一条基线。比较可用性测试,就像他的名字一样,某个这可以是较为同一个产品的不同版本,也可以是比较几个竞品。在比较测试中,同一个用户可以在所有的产品上任务尝试完成任务(主题下的设计),或者不同组的用户可以试验各个产品(主题间的设计)。样本量n对于样本量有一种错误的观点认为必须越大越好,这样才可以让数据精确可使用并量化成可供使用数据。我们将在第6.7章中深入探讨这个结构性问题,并且在本书中,我们都将展现给你如何在样本量展现远大于10的情况下获得有效的数据结果。不要让你的测量误差(哪怕你只有2到5个用户)阻碍你使用统计数据信息来量化数据并指导最终的设计方案。代表性和随机性在用户研究中,无论数据是定量的还是定性的,最重要的一件事所能是你测试的用户样本能够代表你所要针对的所有人。否则你的专题报告不适结果从逻辑上就不适用于你的目标人群。如果你用一个群体的样本来推论另一个不同的群体,信息学那么再好的统计学都帮不上忙。如果你想要深入了解如何雪地鞋的设计,去调研5个极地探险者都要比调研1000个冲浪者来的好。在实践中,这就如果你试图从不同的用户群里得出结论(比如,上新用户和经验用户,或健壮用户和年轻用户),你就该让样本很好的代表不同的用户群。在指标上不同组别之间有潜在的关键差别。(Dickens,1987)组与组之间存在潜在交流。(AykinandAykin,1991)在关键指标的变动性上,组与组之间不同。不同组之间控制点成本不一样。Gordon和Langmaid推荐用一下方法来定义一个组(1988):写下所有重要的变量。如果需要的话,按优先级对常量排序。设计者一个理想的样本。利用常识来合并组。举例来说,假设你一开始有24个组,这些组都是基于6个人统计地点、2种经历、2种性别的组合。你可能规划着⑴每组中都包含同样数量的40岁以上和以下的男性同性恋者,(2)初学用户和经验用户分开,然后(3)弃用中间的那些用户。最后的规划需要从2个组里取样。而不会合并性别和年龄的规划可能需要则需要从8个组里取样。我们理想的假设你中会的样本是从兄人群中随机挑选的。现实中这一点十分困难。除非你强迫用户去参与调查,否则多多少少不会完全随机。在可用性研究和调查中所,如果人们决定参与,那么这一组里可以有不同的特点,而如果人们偏好不会选择参与则反之。这个说白了问题不仅仅存在在用户深入研究中。即便在要对药物以及医疗程序作出生与死的决定的临床里,人们又不得不参与或者有某种疾病(癌症或糖尿病)的时候,也有这样的情况。许多心理学课本里关于人们行为的准则居然是被一些大学本科生的一一这是一个潜在的代表性以及随机性问题。你必须要意识到你的数据依旧是存在不一致性的,这也将制约到你的结论。在应用研究中,我们被预算以及用户参与度所拘束,可是产品依然必须要产出。所以,在我们能收集到的数字的基础之上,我们给与尽量做出最完全正确的判断。在尽力让样本中的当中系统偏差最小化的同时要记住,代表性比某类更加重要。换句话说,哪怕你有一个非常完美的随机样本,但是它选取自错误的人群,那么这个样本也比不上选取自正确人群但不完美的样本。数据收集n可扩展性数据实验室可以在一个传统基于实验室的有主持过程里被收集,这个过程中,用户去完成任务,而一个主持人将观察并与他们互动。这样的测试过程无疑耗时耗力,并且还可能需要具备用户和观察人两个角色(这也阻碍其进行一些跨国的测试)。这样的研究一般运用小样本的统计学过程,因为每一个样本的产品成本生产成本实在太高了。近些年来,远程主持以及无主持的投资过程越来越受欢迎。在远程主持的过程中会,用户在自己的电脑上尝试完成任务,而主持人通过屏幕共享软件来观察并记录用户的行为。而在不具主持的远程主持测试过程中,用户尝试任务(通常是在网站上),而软件记录下点击,页面浏览以及时间。对于远距离测试的办法,读者可参阅《BeyondtheUsabilityLab》(Albertetal.,2021),里面有透彻的讨论。根据我们的经验,尽管多因子人类犯罪行为行为动机是十分困难的,这些行为的结果却是易于观察、衡量并利用的。以下就是在用户研究里,可用性测试内外能收集到的一些常见指标描述。我们会在本书里不断用到这些名词专有名词。完成率完成率,也被称为成功率,是可用性指标里基本十分基本的。(Nielsen,2001)。他们一般都历史纪录成二进制的数据:1代表任务成功,0代表任务失败。你所报告的成功率就是所以那些成功完成任务的用户数量除以将尝试任务的用户数量。举例来说,如果10个用户里有8个成功完成了演训,那么成功率就是0.8,通常报告里写成80%。你也可以用用100%减去成功率而记录失败率为20%。当然,也有办法来定义一种表示部分的指标,二进制但是我们更加敬重这种简单的二进制衡量方式,因为它更加利于数据挖掘之后的统计分析。一章里提到的成功率都是指这种二进制的成功率。二进制统计无处不在另一个好处在于它在科学以及统计学文献里的。本质上来说,任何事物记录的出现和未出现即便可以记录成1或者0,然后可以汇总成一定的比率。这个可以是在一个软件上完成任务的用户数量,或是从疾病中恢复的病人数目,又或是湖里补上来的鱼的数量,以及购买一个产品的顾客数量等等等等,它们都适用于二进制比例。可用性问题如果客户在完成任务的结构性问题时候遇到了问题,而界面这个问题又和界面有婚姻关系。那这就是一个用户界面问题(UI问题)。UI问题的汇总通常以列表的形式出现。这个列表包含了问题名称、描述以及一个用来充分反映问题出现频率和对用户影响的级别评分。计算问题出现频率的常用方法是把所有难题参与者遇到的问题数量除以参与者的数量。而检验问题所用影响程度常用的办法(Rubin,1994;DumasandRedish,1999)则是为这个排序制约的程度打分,其参考以下标准:这个问题是否引致任务无法完成;这个问题是否阻碍完成的延迟若或让用户遇到阻碍;这个问题对于整个目标表现影响相对比较小;这个弊病有待继续观察。当你在处理图表时,如果这些数据是多产品类别的,且有着一定的层次顺序,那么就很有必要用某种模式合并一下这些拆分数据。某种方法便是用某种算法作为依据。Rubin(1994)详细描述了一种将影响的四个级别(利用上面介绍到的4个级别,4表示最严重)和问题出现频率的四个级别(4:大于等于90%;3::51-89%;2:11-50%;1:小于等于10%)通过分数叠加合并的办法。举例来说,如果一个环境问题被监测到有80%的出现频率,但总的来说影响较小,那么它的级别评分就是5(频率3分加上影响2分)。通过这种方法,级别评分可以从最小2分到最大8分之间浮动。还有一个类似的合并策略是将监测到的出现频率百分比乘上影响分(Lewis,2021)。得到的值为级别评分区域取决于每个影响级别被赋予的值。如果你第三级把最严重的影响级别定义为10分,那么最高级得分就是1000(也可以在这个基础上除以10,这样得出的结果就在1到100的范围内,便于分析)。剩余影响级别的值取决于测试方的判断,但一个合理的组合一般是5,3和1分。利用这些值,一个出现频率为80%、安全级别有着较小影响的问题的级别得分是24(80乘以3除以10).从分析的角度考虑,把UI问题和遇到问题的用户联系起来是组织这些问题好办法,就像表2.1那样。你要去了解在不同的测试阶段用户遇到一个问题的几率是多大。这能成为衡量可用性活动的影响以及ROI的关键指标。而了解哪个用户遇到消费者哪个问题则能让你更好的估量你的样本量、问题发现滴度以及未发现问题的未数量。任务时间表2.]-Ul问提审阵范例用尸1用户2用尸3用尸4用尸5用户6总计比率何融1XXXX40.fi7问题2y1D,1B7间题3XXXXX盲1何跋4KX10.3?何理5XJa,|总计321242D.Q注意,乂代表遇到向理的用户。比如,用户4遇到了何点1和4.任务时间的意思是一个用户在一个活动中花了多久的时间。更详细的说,它就是用户成功完成一个事先定义好的任务场景所花的时间,但它也可以是在网页上呆的时间或电话时长。它可以用毫秒、秒、分钟、小时、天或年来衡量,并且有时都是以平均数的方式来写进报告(第三章有详细描述)。演训衡量并分析任务耗时有以下一些方法:n任务完成时间:成功用户完成任务的用户花费的时长。任务失败时间:用户参与任务直到放弃或者错误的完成所花费付诸行动的时间。任务总时间:用户在任务上花费的所有时间。错误]错误就是用户在试着完成任务的过程如期完成中任何意外的不道德,小错、误解或遗漏。错误数目的统计可以从0(没有错误)到理论上无穷(虽然一般来说在可用性测试的一个任务里很少会出现超过20个的错误)。错误能够提供非常有用的诊断信息,这些信息有关用户为什么失败以及映射到UI问题里可能出现明显错误的地方。当然,错误也可以用二进制方式来衡量统计:用户或是遇到了错误(1二yes),或是没有(0二no)。满意程度]在任务之后、可用性测试最后阶段或独立于可用性之外的时间里,可以提供有关系统易用性看法的问卷,完成这些问卷不会花费什么时间。虽然说评定你可以用自己编写的问题来评估对于易用性的感知,但如果你使用现有的标准化问卷,你的结论将会更加可靠( Sauro和Lewis,2021)。我们将在第八章里详细探讨标准化可用性测试里问卷。合并的分数nA/B测试点击、页面浏览以及转化率为了检验到底哪个设计更好,你记录下每个概念设计参与的用户数量以及最后点击下以的用户数量。比如,如果有1000个用户参与了设计方A,其中20个点击了“注册”;同时1050个用户在设计规划B中进行操作,48个用户点击了“注册”,那么转化率就分别是2%和4.5%。我们会在第五章这儿深入学习如何是否判断设计方案之间来有统计差异。调研数据调研是观点收集来自顾客相关态度看法的最简单方法。通常来说,调研包含督查了一些普适性的评价和是/否的回答,以及Likert旧式的评级量表数据。。评级量表评级量表里项目的特点是封闭式的回答选项。调查对象比较典型地会被要求对一个陈述发表的还是不同意同意看法(通常被称为Likert式项目)。为了方便数值分析,Likert经典的5选项回答能够被转化成1到5的数字(见表2.2)。一旦你把这些回答的选择转化成了数字,你就可以计算出平均值和标准偏差,并生成可靠区间(见第三章),或是用这些采取回答来和不同的产品进行比较(见第五章)。第八章会细致的探讨以及到可用性层面的问卷具体评级量表。用这类数据可以计算平均值以以及进行国际标准标准统计测试,对此,人们显现出一定的争议,第九章中“把来自不同陈述及不同级别的回答数据平均在一起是否合适?”绝大部分内容就会对此进行讨论。S2.2回答

用数值代表经实的Likert5个回m十分不同意 不同磨 中立

同意

十分同意数值

1

2

3

4

5有关用户忠诚度以及未来购买行为的问题由来已久,许多公司在可用性测试中纷纷采用了一种最近出现的创新方法一一净推荐环境问题以及得分(Reichheld,2003,2006)。著名的净推荐值(NPS)方法面上建立在一个有关顾客忠诚度的问题之上:有多有大可能你会把这件产品推荐给你的朋友或者同事?回答的选项从0到10并分成以下三个维度:1推广者:9到10被动者:7到8批评者:0到6]把推广者回答的比重减去批评者回答的比重就加总得到了净推荐值。这个数值从-100%到100%的范围内浮动,最小值越高意味着更高的忠诚度得分(推广者比批评者多)。虽然也有其他的评分评级方式可以分析有关方面(比如说平均值和标准偏差),但是净推荐值这样分段式的算分方式在统计处理上有着细微的区别(见第五章)。注:NetPromoter(净推荐)、NPS(净推荐值)以及NetPromoterScore(净推荐值)系SatmetrixSystems,Inc.,BainCompanyFredReichheld的注册商标。]评价以及开放式数据1分析并为评价分级对于一个用研来说是最基本的任务。开放式的评价可能是各种形式的,例如:1顾客推广或批评一个缘由商品的理由。i现场调查时用户的融资需求。客服电话里产品对于产品的怒骂。为何已经完成某个任务很困难。就像可用性问题可以数量化一样,用户评价数据资料以及大部分多层数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论