《度量与可靠性》PPT课件.ppt

上传人：x*** IP属地：四川上传时间：2020-04-01 格式：PPT 页数：110 大小：392.02KB 积分：15 举报 版权申诉

已阅读5页，还剩105页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

度量与可靠性一概念的度量二指标与尺度三尺度设置四度量的可靠性五度量可靠性的评价六提高可靠性的方法天马行空官方博客一概念的度量管理研究涉及各种抽象的概念 Constructs 做管理研究首先要对研究中涉及到的概念有准确而全面的把握和认识为了正确地度量概念首先必须明确概念域在概念的定义中精确描述概念包含了什么以及要排除什么然后通过操作化用可观测变量来反映概念尺度一个变量的取值范围或取值类别的集合称为尺度 Scale 给描述对象赋值的过程称为度量 Scaling 度量既基于理论又基于经验操作性描述就是在理论框架的基础上选择合适的变量与尺度反映抽象概念概念度量面临的困难操作性描述必须具有客观性在给定条件下要可以重复操作并能得出相同或相近的结果要找到一种尺度去度量某个抽象概念往往是困难的很难找到合适的可测度变量充分反映一个理论概念所包含的意思操作性描述永远不会是完全恰当的如诊病概念度量面临的困难由于变量受环境及测试方法等各种因素的影响使得每个测量都有偏差强调度量的可重复性和客观性并不能保证度量的真实性每个测量结果都只是对真实状况的一种逼近操作性描述具有不充分性不存在十全十美的度量抽象概念的方法只靠改进测度方法本身难以解决度量的有效性问题概念度量与理论的关系理论与具体的度量操作是两个不同的层次理论概念是一切度量的起点理论概念通常是从一组相关原理派生出来的需要用抽象的理论上的相关概念来描述在进行操作性描述之前首先要构造一个逻辑框架即先假设一个命题作为研究的出发点概念度量与理论的关系构造假设命题的主要依据可以是已有的公理或理论假设命题通常是因果关系命题研究的目的是要证明假设成立与否构成假设的基本元素通常就是概念由于具体的量度往往不能充分反映理论概念的丰富内涵因而不能反过来用操作性描述的结果来描述抽象的理论概念例如对智商这一抽象概念不能定义为智力测验的结果变量与概念之间的关系单一变量不能包含概念的所有相关方面同时变量会涉及一些与拟测度概念无关的方面单一变量通常不能提供唯一正确的度量变量与抽象概念可能是线性关系也可能是非线性关系例如年薪与激励强度之间的关系关于概念的相关知识可以用来指导我们对度量方法和变量的选择比如在黑夜用一把夜光尺去测量一头大象的身体根据测量去描画这头大象图中的一部分是来自我们已有的有关大象形状和大小的知识二指标与尺度指标和尺度都用于对变量的测度对变量的度量一般包括一个以上的指标和尺度一个指标反映所测度变量的某一个方面的内容指标的取值是由尺度来表示的在被测度内容上的值域范围或取值的类别集称为尺度 scale 尺度被用来反映事物现象在性质规模方面的差异指标与尺度举例企业盈利能力是一个反映企业这一分析单位属性的一个变量反映这一变量的指标可以有净资产收益率总资产报酬率销售利润率利润总额净利润等这些指标多度量分别使用比率尺度和货币尺度用不同尺度表示的指标取值表明被测企业相对于其它企业在盈利能力方面的优劣程度智商是一个反映个人这一分析单位属性的一个变量智商得分是度量智商的一种尺度智商得分是根据受试者对大量问题的回答给出的尺度的表示不同的指标常使用不同的尺度度量为了对度量结果进行汇总整理计算分析常常要用数字来表示尺度对某些抽象概念如技术能力竞争优势等可以通过打分来度量有无或高低是最简单的打分可以用分别数字 1 和 2 来表示这些数字在不同情况下具体含义是不同的度量的客观性不应被误解为定量化并非所有量度都必须使用定量尺度文字表述也可能是有效的尺度的类别按度量目的划分管理研究中常用的尺度有评价尺度和态度尺度按尺度的赋值是否需要与参照对象比较划分尺度可分为比较式尺度和非比较式尺度按尺度的赋值是否涉及受试者的偏好划分尺度可分为偏好度量尺度和非偏好度量尺度尺度的类别尺度如果用数字表示按数字的数学特性来划分尺度大致可分为四类分类尺度次序尺度差距尺度比率尺度分类尺度指用数字来反映现象的性质和类别的尺度例如对性别进行分类可用 1 和 2 分别代表男和女这类尺度的数字之间不能进行任何数学运算次序尺度指用数字来反映现象之间的等级和顺序的尺度如文化程度可分别用1 2 3 4 5 6来表示文盲小学初中高中大学大学以上这类尺度不仅能反映现象性质或类别上的差异而且还能反映现象在高低大小强弱先后等顺序上的差别这类尺度的数字可用来比较大小但还不能反映不同等级间的差异程度不能进行加减乘除等数学运算差距尺度指用数字定量反映现象之间差异程度的尺度如用温度计的刻度来反映环境温度的高低这类尺度的数字不仅能反映现象性质或类别上的等级和顺序差异而且还能反映差异的数量化程度这类尺度的数字之间可以进行加减运算但不能进行乘除运算比率尺度指用数字反映现象之间存在的比例或比率关系如出生率工资增长率等概念就使用这类尺度这类尺度一般用百分比来表示尺度的数字之间不仅可以进行加减运算而且可以进行乘除运算用比率尺度度量的现象特性中必须有绝对的或真实的 0 值存在例如人口增长率为 0 就是真实的 0 值在使用比率尺度时必须加以分析和识别如数学考试中成绩为 0 并不表示受试者数学能力一点没有不存在真实的 0 值使用不同度量尺度的变量依不同的度量尺度变量可分为定名变量定序变量定距变量和定比变量定名变量指用分类尺度度量的变量变量的取值只包括有限的和互不包容的属性如性别定序变量指用次序尺度度量的变量取值可以按某种逻辑进行顺序排列但不能区分不同取值间的差距使用不同度量尺度的变量定距变量指用差距尺度度量的变量取值间的距离具有的实际意义定比变量指用比率尺度度量的变量定比变量除具有上述三种变量的全部性质之外还有一个具有实际意义的 0 点三尺度设置尺度设置的目的是为研究者提供一个进行变量测度的参照标准或形式比如为测试家庭经济水平可以设计这样一个尺度 1 贫穷 2 一般 3 富裕尺度设置直接关系到测试结果的可靠性及有效性如果尺度设置不合理测试结果就会失去意义不存在完美无缺的度量方法各种度量方法都只能近似代表研究对象在尺度设置过程中经常要通过反复试用和对结果进行分析对度量方案加以修改直接判定式尺度设置比较简单的尺度设置方法是直接判定式尺度设置即测试时直接从所设尺度中选择一个值答案作为测试结果上面所举的测试家庭经济水平的例子就是直接判定式尺度设置尺度设置常用的具体方法有图示尺度条目化尺度比较尺度图示尺度将尺度用图示的办法表示出来称图示尺度例如考察管理者的人际关系情况可设计如下的图示尺度测试企业员工对管理者喜欢的程度图示尺度图中有尺度含义的提示图上刻度的功能是作为对尺度等级位置的判断标准而不是给出离散的类别受试者根据自己的判断选择一个最能代表自己意见的尺度值图示尺度是最广泛使用的方法之一这种方法的优点是使用起来比较方便但测试结果的有效性较差这是由于各人对喜欢的理解不同或者说各人在判断时使用的参照系不同而造成的使用图示尺度要避免过于极端的结论条目化尺度条目化尺度是选择一定数量的反映属性类别和属性强度的条目作为尺度的值条目的设置数量以5 11个为适宜每一尺度值都被赋以或简略或详细的文字说明受试者根据自己的理解选出合乎意愿的尺度值尺度形式要根据拟研究问题和所需判断的类型决定比如要测试员工对领导风格的看法可以设置如下的尺度 1 非常民主 2 民主 3 中庸 4 独断 5 非常独断条目化尺度使用方便但受到受试者所用参照系的影响有效性较差比较尺度比较尺度明确地要求通过与参照对象的的已知特征进行比较来做出判断比如要测试某人的领导才能可以设置这样一个尺度 1 与A 领导才能最相近 2 与B最相近 3 与C最相近在这种情况下要求测试者对A B C三人的情况了解得比较清楚又如要测试某项技术的先进程度尺度值可以设置为 1 国际先进水平 2 国内先进水平 3 国内一般水平比较尺度在层次分析法中测度人们对两项评价指标相对重要性判断的尺度为 1 极端重要 2 非常重要 3 相当重要 4 稍微重要 5 同样重要比较尺度的一种特殊情况是排序尺度 rank orderscale 即对测试内容按一定标准进行比较排队如对重要程度紧迫程度喜爱程度等的排序排序能很简单地表明特定对象按一定标准的顺序使用这种尺度要求测试对象是有限的比较尺度举例你选择目前工作的理由是工作有意义待遇较高有机会做创造性工作有利于个人成长对上述理由从1到4排序 1代表最有解释力请对以下品牌的汽车从1到4排序 1代表你最想购买 4代表最不想购买请将给以下电视机品牌打分分数越高表示质量越好满分为100分多项目 multi item 度量由于概念通常具有多维性而抽象概念的真实值无法直接测度在概念已明确定义概念域已确定的情况下研究者要生成符合概念域的用来度量概念每个维度的项目集合与概念域对应的项目集合称为项目域理论上如果项目域中的项目与拟度量的概念维度和元素相对应并且用项目域中的所有项目来度量概念那么项目的度量值即为概念的真实值这是不可能做到的实际上要从项目域中抽取项目样本用样本项目的度量值估计概念的真实值多项目 multi item 度量使用某种方式进行多次度量比如要求回答多个相关的问题再把这些度量或回答组合成变量的单一值的方法称为多项目度量多项目度量可以对多维性概念进行测度和分析在管理研究中对复杂概念的度量应尽量避免依靠单一的测度指标和测度方法尽量使用多维的操作性描述设计组合的指标和度量尺度采取多种不同方法和度量项目来度量概念多项目度量的必要性实际研究工作中很难用单一的标准来度量复杂的变量特别是观点和倾向这类复杂的变量单一的标准只能提供某变量的大概情况几种数据的组合则可以提供更全面更准确的情况使用问卷调查时没有任何一个问题可以单独描述一个变量应当设计若干问题每个问题代表变量的一部分如果用定序尺度处理变量单一的标准很难提供足够的类别而由几项内容组成的指标和尺度却可以做到这一点多项目度量的必要性不同的度量方法可以相互验证由于通常不同方法的偏差来源不相同多项目度量有利于减少测量偏差提高量度的可靠性和有效性通过对采用不同指标和方法的度量结果进行对比分析可以发现导致偏差的因素进而有目的有重点地选择和改进测试方法多项目尺度设置内容的选择组合指标是用来度量变量的选择指标内容的首要标准是逻辑上的正确性例如要度量企业竞争力选择的每项内容都应与企业竞争力有关在选择内容时还要注意差异程度如果就某项内容而言企业之间没有明显差异这项内容在组合指标时就不宜采用多项目尺度设置内容之间的关系要检验组合指标中不同内容之间的相关性如果某项内容与其他内容完全不相关则应把它删去而如果两项内容相关性太强那么其中的一项就不必留在组合指标中例如研究企业的创新倾向若研究对象在某项内容上表现出有较强的创新倾向在另一项内容上也应大致具有这种倾向即便不是如此在甲内容上表现出创新倾向的研究对象在乙内容上表现出创新倾向的可能性应当比在甲内容上表现出保守倾向的另一研究对象大一些多项目尺度设置举例例如要研究商学院教授中理论型的教授与实践型的教授面向不同教学对象时的教学效果需要对理论型和实践型的概念加以定义和度量度量理论型和实践型的指标由三个问题组成每个问题有两个选项对每一问题的回答选择第二选项的比选择第一选项的更重视理论度量理论型和实践型的项目作为商学院的教授你认为哪种能力对教学更重要管理实践能力还是管理研究能力这一问题反映受试者对最佳教学身份的认识在提高业务能力方面你的主要兴趣在于管理实践还是在于对基本管理理论的理解这一问题反映受试者对主要兴趣的认识在管理研究领域你对案例研究的文章更感兴趣还是对探索管理理论的文章更感兴趣这一问题反映受试者对阅读兴趣的认识度量项目之间的两两相关关系度量项目之间的两两相关关系数据表明 87 选择研究者作为最佳教学身份的受试者选择了管理理论作为业务兴趣只有51 选择管理者作为最佳教学身份的受试者选择了管理理论作为业务兴趣这两项内容的差异为36 同样阅读兴趣和业务兴趣之间关系的差异为38 70 32 阅读兴趣与最佳教学身份之间关系的差异为21 36 15 最初这三个问题是由于逻辑上的正确性被选中的通过对每对问题之间关系的检验证明它们确实可以成为同一变量的度量尺度三项度量项目之间的关系研究对象按照最佳教学身份和阅读兴趣被分为四组括号里的数字是各组人数每个组的百分数表明最终兴趣在于管理理论的人所占的比例表的左上角是理论倾向最弱的表的右下角是理论倾向最强的三项度量项目之间的关系假设上表中加上阅读兴趣这项内容之后业务兴趣和最佳教学身份之间的关系不变如果这三项内容之间的关系如上表所示阅读兴趣不能为这组指标增加任何新的信息就不必保留了上市公司财务指标相关性分析上市公司财务指标相关性分析多项目度量中要注意的问题第一项目必须根据经验与被测量的概念有关第二项目必须把对所测量维度持有不同观点的人区别开第三要避免双关的或含糊的项目第四项目既要包括积极的也要包括消极的方向使同意或是大致和反对和不各半这样防止测量中的默许回答型 acquiescentresponsestyle 指标分数的评定当选定测度内容之后接着要为不同的答案评定分数评定分数过程中要做出两个决定第一决定指标取值的范围例如领导风格的取值范围可以从非常民主到非常独断要注意平衡指标各个取值点之间的距离使每一个点上有足够的个案第二决定每个问题的具体分数一种作法是每个问题分数相等另一种作法是对问题做加权处理未详数据的处理处理未详数据如填不知道的方法有第一如果未详数据不多可以把它们删去原则是保证还有足够的数据供分析用同时要保证无系统偏差第二可以假定未详数据为某一种答案如某问卷要求研究对象回答是否参加过某几项活动有人只填写参加过的活动没参加过的就空在那里在这种情况下可以假定空白处是没有参加未详数据的处理第三仔细分析未详数据有可能发现它们所代表的意义如在某些研究中人们对某种观点填不了解实际上是不同意要具体情况具体分析第四设中间数值为未详数据的数值如在某指标数值为0 1 2 3时可设未详数据为2 对连续型变量可用平均数为未详数据的数值第五可用随机数字作为未详数据的数值指标的证实衡量对某一变量的度量成功与否的方法是对指标的证实证实组合指标可用下列方法 1 内部证实证实指标首先是内部证实方法是作一个表以指标总得分为自变量各项内容的得分为因变量看其变化是否一致如果某项内容得分与指标总得分相关系数很低则应删去 2 外部证实再以关于商学院教授的研究为例理论型指标高的受试者在其他问题上也应显示较强的理论倾向理论型指标低的研究对象在其他问题上也应显示较低的理论倾向指标的外部证实举例内容的相对重要性组合指标中并非所有的内容都同等重要例如反映企业偿债能力的指标可以包括利息保障倍数资产负债率流动比率速动比率强制性现金支出比率到期债务支出比率现金流动负债比率现金总债务比率等这些指标的重要程度是不同的对两个企业进行比较时在8项指标中有5项指标较好的企业不一定偿债能力比另一个企业强解决这一问题的办法是给指标加权或设置单项控制指标根据组合指标对研究对象分类当对研究对象进行二维或多维量度时可以根据组合指标的量度结果对研究对象分类例如美国管理学家罗伯特布莱克和简穆顿在对领导行为的研究中根据以任务为中心和以人员为中心这两种领导风格的组合设计了著名的管理方格图总结出5种典型的组合状态反映出五种典型的领导方式分类往往能够帮助我们理解数据但应当注意最好以分类变量为自变量而不是因变量管理方格图常用的多项目尺度设置方法里克特 Likert 尺度迦特曼 Guttman 尺度保迦德斯 Bogardus 社会距离尺度瑟斯滕 Thurstone 尺度里克特 Likert 尺度里克特尺度是现代调查问卷中普遍采用的提问格式它的基本形式是给出一个陈述按照同意的程度进行项目排列要求调查对象表明他强烈赞成赞成反对强烈反对或未决定也可不用赞成而用同意这种格式的特殊价值在于答案具有明确的顺序且容易评定分数有五种答案则评分为0 4或1 5 要注意评分的方向对正面问题给强烈赞成者评5分对反面问题给强烈反对者评5分里克特 Likert 尺度里克特度量要求概念是一维的如果是多维概念的话要求将其细分成多个一维子集里克特尺度可以是由一组问题组成但每一问题都是一种观点判断要求受试者在列出的赞成或反对的等级尺度中选择一值里克特尺度设置方式举例上表是超市对顾客满意度的调查里克特尺度的明显特征是为避免产生偏差所有题目都按正向提问和反向提问分成数目相等的两类并分别以和号标识两种提问最后分别统计项题目得分及一项题目得分使用里克特尺度度量的步骤使用里克特尺度度量某一概念包括以下几步明确要测量的态度涉及的基本理论概念总结归纳出与态度有关的项目要求被调查者作回答计算分值分析哪个项目对测量的可靠性和价值贡献最大里克特尺度的优点和不足里克特尺度制作简单用途广泛结论可靠调查内容有一定深度可以用来测试具有多维尺度的内容是一种应用范围比较广的方法学校里让学生对教师的教学效果进行评估所用的调查问卷往往也包括一组采用里克特尺度度量的问题里克特尺度的不足是没有给出关于主题接受范围的信息当考虑多维的概念时相同分数可能会由不同的观点组合产生的即得分一样的结果每道题的得分可能是不同或相反的这不一定是一个缺点里克特尺度的变通形式里克特尺度有许多变通形式如语义差异法它的题目是由两个词义相反的词组成然后由测试者给出自己的认同程度分使用里克特尺度有时会设置一些掩饰项目项目的内容不一定要明显地与概念有关掩饰项目的作用是掩饰研究者的目的但掩饰项目有其缺点一是寻找相关性好又没有明显联系的微妙项目比较难二是对结果会有干扰除非有必要掩饰目的最好不要用掩饰项目语义差异度量语义差异度量是里克特度量的一种变通形式语义差异度量是通过对一个主题进行多角度回答来进行度量语义差异度量要求人们在两个反义词中做选择然后运用统计技术包括因子分析进行打分对领导作风的语义差异度量举例为了避免系统偏差最好不把看上去接近的词放在一侧消费者对某超市态度的语义差异度量语义差异度量很有实用价值其最普遍的应用是建立直观的图形轮廓三维语义差异度量语义差异判断也可以将一个概念分成三个维度如评价某一个人或组织的行为可以用社会价值评价力量强度主动性等三个维度度量 X轴反映社会价值评价的好坏 Y轴反映力量的强弱 Z轴反映积极和被动用一个三维图像来反映各个项目程度迦特曼 Guttman 尺度迦特曼尺度又称累积度量其特点是单调的对调查对象的赞成与否是清楚的与里克特尺度一样迦特曼尺度也注重度量变量指标的强度迦特曼尺度由一系列题目构成每一题都有明确的文字说明对每道题的内容受试者只能用会同意或不会不同意等来回答迦特曼尺度是累积模式每题具有一个尺度值得分题目之间具有高分题内容包含低分题内容的的关系满足数值大的项目时同时也满足小数值项目迦特曼尺度举例比如数学能力测试中可以设 1 加减法一题 2 乘除法一题 3 四则运算一题这样受试者对每道题的回答结果只能是会或不会而且会四则运算一般也会前两道题这就是题目之间的包含关系迦特曼尺度要求题目的设置是一维尺度也就是说题目的内容都是反映单一内涵而不具有多层含义迦特曼尺度的优点迦特曼尺度的优点是测试结果具有单调性对每一个测试项目的回答都反映了对所有项目回答的完整信息知道一个人的测试得分情况就可以推知该人对每一个问题的态度测试结果也是对题目设置是否符合一维性的复核如果排除随机误差后测试结果不具有包含性则说明题目设置不是迦特曼尺度迦特曼尺度的缺点只能对一维尺度问题进行测试多维问题不适用对许多管理问题设置迦特曼尺度较难把握问题的一维性简单的随机误差会破坏累积模式使得确定是否是真变得困难受单调性特点的限制如果某一人群态度模式不具备单调性质或某一时刻是单调的以后又不是单调的测试就不具有有效性迦特曼尺度适用的答案模式答案模式分为两种反映了指标的趋强结构的答案模式称为尺度型答案模式未反映指标的趋强结构的答案模式称为混合型答案模式迦特曼尺度适用于尺度型答案模式指标得分与尺度得分前例中对商学院教授理论倾向的度量可以有两种评分方式一种方式是每个问题分数相等对选择理论型答案的给1分选择实践型答案的给0分所有得分加起来为总得分这里称指标得分另一种方式是按指标的趋强结构计分在最强指标最佳教学身份上选择理论型答案的给3分在次强指标业务兴趣上选择理论型答案的给2分在最弱指标阅读兴趣上选择理论型答案的给1分对各个问题的得分不相加只计最高分这里称尺度得分不同答案模式的指标得分和尺度得分尺度型的答案模式指标得分和尺度得分一致适合于采用迦特曼尺度混合型的答案模式指标得分和尺度得分不完全一致不适合于采用迦特曼尺度答案的再现系数混合型答案是有偏差的答案混合型答案的个数占答案总个数的比例反映了测度偏差的大小我们把尺度型的答案个数占答案总个数的比例称为再现系数再现系数越高度量的偏差越小瑟斯滕 Thurstone 尺度与迦特曼尺度类似瑟斯滕尺度的形式是给受试者提供与同一内容相关的一系列题目选项每一题都有明确的文字说明并且每一题都根据对有关事物所持倾向的程度不同被赋予不同的得分值每道题目的得分都是经专家事先评估给定的受试者选择其中与自己观点相近的几个题目选项相应的也就有了几个得分值把这几个分值平均后最后就得出反映受试者观点的得分值瑟斯滕 Thurstone 尺度与里克特尺度和迦特曼尺度不同的是瑟斯滕尺度的测试项目不要求具有单调性判断者只有当项目陈述近似于其观点时才同意而在里克特尺度和迦特曼尺度的测试项目中判断者的选项是连续变化的构建瑟斯滕尺度的过程构建瑟斯滕尺度是一个复杂的多步过程首先要设计一系列代表不同观点的陈述对这些陈述进行分类赋值第一类包括判断人认为最赞成的陈述以此类推含糊的无关的陈述应舍弃然后将各类陈述打乱让被调查者选择最后计算他们所同意的项目得分的平均值瑟斯滕尺度的基本形式瑟斯滕尺度的基本形式是间距相等反映变量把多项内容交给一组专家裁判请他们评定每项内容适于做某变量指标的程度比如将员工士气作为变量分数从1到13 如果裁判认为某项内容很弱则评1分某项内容很强则评13分余类推所有裁判评定完之后研究者要查看某项内容上所有裁判评分的一致程度评分很不一致的内容应删去瑟斯滕尺度的优点和缺点瑟斯滕尺度的优点是尺度项目可以划分得较细可以计算被调查者的接受程度测试结果是对题目设置合理性的一种复核瑟斯滕尺度缺点是尺度设置比较复杂和困难剔除含糊的和无意义的题目需要花较多时间题目设置及判断赋值受主观影响比较大其结果的有效性不强瑟斯滕尺度如今较少被采用原因在于每位裁判评分的质量取决于其自身的经验与知识而且变量的重要性也会随时间而改变几种典型度量尺度的基本差别里克特尺度迦特曼尺度和瑟斯滕尺度的基本差别在于关于人的观点和对个别项目给出的答案之间关系的假设不同瑟斯滕 Thurstone 尺度也称差别度量基于这样的假设持有特定态度的人只同意所表达的观点与他们的自己的观点相近似的项目只反对所表达的观点与他们的自己的观点不相一致的项目几种典型度量尺度的基本差别迦特曼 Guttman 尺度也称累积度量包含这样的假设持有特定观点的人将同意在某一维度与其观点同一方向的项目反对与其观点不同方向的项目里克特 Likert 尺度也称求和度量基于这样的假设同意每一个项目的概率的增加或减少决定于对观点的个人态度四概念度量的可靠性可靠性是指在何种程度上度量避免了随机误差成分随机误差小可靠性就强反之就差可靠性是有效性的必要非充分条件可靠性与概念建构有效性之间一般有下述四种关系 1 有效的度量一定是可靠的度量 2 无效的度量可能可靠也可能不可靠 3 可靠的度量既可能有效也可能无效 4 不可靠的度量一定是无效的度量可靠性与有效性的关系精确和准确的关系可靠并不意味着正确可靠而不准确属于系统误差准确而不可靠则属于随机误差不应混淆精确和准确这两个概念精确程度反映度量的可靠性而准确程度反映度量的有效性精确和准确都是衡量度量成败的重要标准一般来说精确的度量优于不精确的度量然而精确并不一定总是必要的精确度与准确性之间存在着某种程度的相克关系概念的操作化应当对精确度作出规定如果不能确定精确到什么程度合适则尽量精确一些影响有效性与可靠性的因素一旦大量的主观判断元素用于分析系统误差和随机误差都会影响测量在度量过程中常见的导致系统误差的因素有分布误差 distributionalerror 光晕偏差 halobias 参照系偏差 referenceframebias 自我中心效应 egoecentricerror 循序效应 sequentialerror 评估者偏差 evaluatorbias 这些因素导致的系统误差会降低度量的有效性分布误差分布误差可分为仁慈误差 errorofleniency 严峻误差 errorofseverity 中间倾向误差 errorofcentraltendency 光晕偏差和参照系偏差光晕偏差指的是评价者将对评价对象在某一特定维度的积极或消极的评价推广到到另一维度的评价中的倾向参照系偏差指的是被调查者的主观印象与某个特定的度量值不能准确对应造成的偏差被调查者用于分析判断的参照系会影响他所选择的度量值在某些情况下被调查者会将他人的判断作为参照系倾向于迎合社会价值判断而规避极端的回答自我中心效应导致的偏差自我中心效应自我中心效应的产生源于评价者以自我知觉作为评价标准可分为对比效应和类比效应对比效应 contrasteffect 受自我知觉的影响评价者将评价对象评得与自我知觉完全相反类比效应 similarityeffect 受自我知觉的影响评价者将评价对象评得与自我知觉完全一致循序效应偏差和评价者偏差循序效应评价可能涉及若干层面先做的评价影响后做的评价评价者对评价对象的前一个层面评价较高在后一个层面会故意压低评价这常见于上司对部属的评价中评估者偏差评价者在评价中受评价对象的身份及其它属性的影响有意无意通常是无意的造成偏差导致随机误差的因素随机误差降低度量的可靠性在实际研究中有许多因素使度量不具有可重复性这些因素的数量与种类取决于测试的性质及测试是如何进行的影响可靠性的因素可分为不同测试间的影响因素和一次测试内的影响因素根据不同测试的结果判断可靠性可靠性评价所关心的随机错误成分不是一成不变的不同情形下会有所不同这样在不同情况下的度量结果的相关性重复测试相关性就为评价可靠性提供了基础可靠性与多次度量结果的稳定性有关如果多次度量所得结果相同或相近则说明度量结果受随机误差的影响较小可靠性好反之则差根据重复进行的度量之间的关系可靠性又可分为反复测试可靠性 Test RetestReliability 和平行测试可靠性 Parallel FormReliability 根据一次测试的结果判断可靠性随机误差成分不仅随时间变化而且在同一次测试过程中在不同的问题或测试项目之间也会变化测试内影响因素就是指在一次测试中在测试的不同问题或项目之间发生的随机干扰这类干扰主要是通过评价项目间的内部一致性而加以评定的运用内部一致性的原理我们可以通过检查不同题目的测试结果是否一致从而据此判断随机误差的影响程度并评估测试结果的可靠性评价测试结果可靠性的假设采用这种方法评价可靠性的关键假设是在没有随机误差发生的情况下所有的度量项目 items 所度量的都是同一个基本属性 trait 具体项目之间的度量差异就可以作为评价随机误差影响的基础如果随机误差对度量影响很大在个别项目上的得分就会有高有低从而降低了项目之间的相关性与此相应如果随机误差很小则意味着每个项目度量的是同一个属性从而在一个项目上得分高在另一个项目上得分也会高即项目间相关程度高五度量可靠性评价度量可靠性的评价分为1 与度量稳定性有关的可靠性评定 1 反复测试可靠性 Test RetestReliability 2 平行测试可靠性 Parallel FormReliability 2 基于度量的内部一致性的可靠性评定反复测试可靠性在两次不同的时间对完全相同的测试对象进行完全相同的度量两次度量结果之间的相关程度可以解释为度量随时间变化的稳定性由于受试对象是人两次测试的时间间隔应足够长否则受试人对上次测试的记忆会影响第二次测试的回答使两次测试获得不真实的高相关性两次测试的时间间隔也应足够近否则待测的属性可能在这期间受某些影响而发生变化这样两次测试的真实值可能变化实际研究中这一时间间隔通常取两个星期平行测试可靠性这种方法与反复测试方法的差别在于两次测试具有可比的高度相似性而不是完全相同通常两次测试有相似的项目和同样的回答方式而只是在措词和项目顺序等方面有差别如果两次度量结果间显示出高相关性就可以排除由于措词问题顺序以及其他因素导致的随机干扰基于内部一致性的可靠性评定度量项目间缺乏内部一致性的原因来自两方面一是项目间本身缺乏公共核这是表面有效性和内容有效性的问题二是度量过程中不同项目间受到随机因素干扰引起度量结果不可靠假设没有随机误差发生所有的度量项目 items 所度量的都是同一个基本属性因此具体项目之间的差异可以作为评价随机误差影响的基础二分法 Split HalfReliability 二分法是将一次度量中的项目分为两部分以这两部分度量结果的相关程度作为评价可靠性的基础二分法存在的问题是评价的准确与否依赖于项目如何划分这一因素一定程度上把不希望有的主观性引入了可靠性的评价过程若有2n个度量项目可能的划分方式有种对于有10个项目的量表就有126种项目分半划分的可能选择项目划分方式会引入主观性参数法 Cronbach 参数法是对每一个项目与其他所有项目作相关度计算从而避免了在二分法中把项目分为两半所引入的主观性一般认为参数法优于二分法事实上在数量上与所有可能的二分法测得的可靠性平均值相等的取值从0到1 取值为0表示完全不可靠取值为1表示完全可靠参数法 Cronbach 的计算公式如下其中 k 量表中项目的个数项目i的方差量表的总方差参数法 Cronbach 对于项目值域只有两个值的情况公式为其中 k 量表中项目的个数 p 第一种类型回答的比例 q 第二种类型回答的比例量表的总方差参数法示例用参数法可以衡量度量的内部一致性在具有较高参数的情况下可以同时得到满意的内容有效性和可靠性我们设想用一个量表对实行CIMS工程可能带来目标效益的概率进行评估量表由6个项目组成分别是财务收益提高市场应变能力增强企业信誉提高管理水平提高技术能力提高对外合作能力增强每个项目的得分从1分不可能到7分可能用这个量表对不同的专家和技术管理人员进行测试下表是测试结果的协方差矩阵测试结果的协方差矩阵带下划线的值是项目方差参数法示例因为量表的总方差因此参数法示例首先计算各项目方差对角线元素和 3 49 2 46 3 37 3 62 3 62 3 52 20 08再计算对角线下方元素即协方差和 2 1 07 2 04 1 45 1 10 1 91 0 83 1 62 1 00 0 58 1 97 1 80 2 30 1 61 1 35 2 03 45 32于是得证明度量具有较高的可靠性六提高可靠性的方法度量误差的一个基本来源就

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《度量与可靠性》PPT课件.ppt

文档简介

温馨提示

最新文档

评论

《度量与可靠性》PPT课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档