测量与量表详解.doc_第1页
测量与量表详解.doc_第2页
测量与量表详解.doc_第3页
测量与量表详解.doc_第4页
测量与量表详解.doc_第5页
免费预览已结束,剩余25页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目 录壹、测量一、测量的本质 二、测量尺度 三、测量误差的来源 四、评估测量工具的 贰、量表的设计一、量表的特质 二、受测者的反应方式 三、建立量表的技术 叁、参考文献 肆、关键词 伍、问题讨论 陆、补充资料 柒、附录 2 7壹、测量一、测量的本质(一) 测量的特性1.测量(MEASUREMENT)的意义: 测量是根据某一准则,分派数字于物体或事物之上2.测量的对象:事务或特质的指针3.测量有三种程序,参考附录(图表1)l 选取可观察事件l 利用数字或符号代表事件的特性l 运用分派法则给观察值一个符号或数字(二)测量的内涵1.研究使用的概念可分为事物(objects)或特质(properties)研究人员并非测量事物或特质,而是测量特质的指标,也就是测量事物特质的大小程度2.测量一项构念(construct)本身是一种挑战,而研究的质量也有赖于测量的选择与构念,以及测量与研究环境配合的情形(三)测量的定义1951年史蒂文斯(Stevens,S.S)给测量下了一个定义“从广义而言,测量是根据法则给事物分派数字。”从中概括出测量包括三个要素:“第一,事物的属性;第二,数字;第三,规则”。二、测量尺度(Measurement Scale)测量尺度具有三个特性:l 数字具有次序。l 数字的差距具有次序。l 数字序列具有唯一原点,以代表。综合以上特性,可得四种类型的测量尺度:尺度类型尺度特性基本实证操作范例名目尺度分类、无次序、距离或原点相等的判定性别(男、女)顺序尺度具有次序但无距离或单一原点较大或较小的判定肉的煮熟度区间尺度具有次序与距离,但无单一原点区间或差距相等的判定温度比率尺度具有次序、距离与单一原点比率相等的判定年龄(一)名目尺度(nominal scale):在社会科学与企业研究中,名目尺度比其它尺度更常使用。名目尺度将一个集合分割成互斥且能完全分派的种类,例如:性别可分为男性与女性两类。使用名目尺度时,计算每一组群成员的个数是唯一可能的数学运算。若对每一种类赋予数字,这些数字只能代表标记而没有数量的意义。只要组群彼此互斥而且符合完全分派,名目的分类可由任何数目的组群构成。名目尺度是四种类型中测量能力最低的一种,没有次序或距离关系,也没有数学原点。当待测的特质具有不同程度的差异时,名目尺度即未能充分测量不同数量程度的信息。但,名目测量在探索性研究中特别有价值,因其目的在探索变量关系而非获得精确测量。调查研究与其它事后回溯研究常将资料依据次群体分类,因此也常使用名目尺度进行测量。(二)顺序尺度(ordinal scale):又称等级尺度,包含所有名目尺度的特性外加一个次序指标。若递移性公理成立,顺序尺度即可能成立。递移性公理指:若大于,且大于,则大于。顺序尺度度意味大于或小于,但并不说明程度上的大或小,即等级与等级的差距可能大于或小于等级与等级的差距。顺序尺度常见的是对意见与偏好分别等级,而配对比较法则是最常使用的测量程序。数字本身只有等级意义,故较适合的集中趋势(central tendency)量数是中位数;而以百分位数(percentile)或四分位数代表离散趋势(dispersion tendency)。顺序尺度的数据不能采用相关分析(correlation analysis), 只能使用无母数统计法进行统计检定。(三)区间尺度(interval scale):区间尺度具有名目尺度和顺序的特征,外加一个距离相等的概念。一般态度量表,智力商数或其它多点量表也都视为区间尺度。可利用算术平均数作为集中趋势量数,以标准差作为离散趋势量数。(四)比率尺度(ratio scale):比率尺度具有前述三种尺度的特微,外加一个具有实质意义的绝对零点或原点。比率尺度代表变量的实际数量,或物理属性的量数,例如:重量、高度、距离、空间都是比率尺度的例子。所有统计方法都可用于比率尺度。比率尺度可进行乘法与除法运算,其它尺度则不行。几何平均数与调和平均数也可作为集中趋势量数,而以标准差作为离散趋势量数。三、测量误差的来源:一个理想的研究必须设计并控制每一变量测量尺度,以达成变量测量的精准与明确,但是这个理想目标并不易达成。因为必须认知潜在的误差来源,并努力的降低误差使其中立,大部分的误差来源来自于系统性的误差,其余误差来随机性的,其误差来源可能干扰研究的结果,包括受测者的误差、情境因素、测量者误差、工具误差这四种。(一)受测者误差受测者本身的特质因素可能影响测量结果,例如员工地位、不同组群成员、社会阶级和地位等。这些属于明确性的可能误差,可以在研究设计中加以处理,但是一些比较不明确的因素未被考虑。例如受测者可能不愿表示强烈的负面意见或问题认知有限却不愿承认,或者在回答问卷时心理状况有关,如疲劳、厌倦、饥饿,都有可能影响回答者正确与充分的回答能力。(二)情境因素情境因素所引起的潜在问题相当广泛,访谈中的任何外力因素都可能严重影响受访者与受测者的关系,若受测者感觉隐私未受到保障,可能拒绝表达特地感受,而街头访谈即可能较家庭访谈更容易受到情境因素干扰,因为比较没有保障与安全感。(三)测量者误差测量者误差的原因很多,例如,访谈者重述、释义或重牌问题的先后顺序都可能影响或扭曲访谈结果。粗率的数据处理也将扭曲研究结果;在数据分析阶段错误的编码与错误的统计计算也都会导致进一步的误差。(四)测量工具误差测量工具的误差主要有两种情形:第一、测量内容不能过于混淆与模糊,用字与语法逾越受测者理解能力,因为意义模糊、填答空间不足、选项不足或印刷不良都会导致工具误差。第二、测量项目不足。少有测量工具能涵盖所有潜在问题的重要论点,当测量项目的选择未能充分涵盖所预测良的特质会产生工具误差之情形。四、 评估测量工具的准则(一) 效度: 指测量工具能正确测出其所欲测量的特质之程度。l 外部效度: 研究成果概化的能力。l 内部效度: 测量工具的设计能得出其所欲测量的特质。1.内容效度:测量工具内容的适切性。2.效标关联效度: 指则量工具的内容具有预测或估计的能,而其有效程 度则依据测量洁果与效标的关联程度而定。l 依时间发生时间的顺序分: (1)预测效度: 指用于预测研究 (2)同时效度: 指用于估计研究l 选择效标的四种方法:(1)攸关性: 指效标能正确的测量所要衡量的项目(2)公平性: 指效标能给予每个销售人员以平评分的机会(3)可靠性: 指效标稳定且重复测试亦能产生近似的结果(4)可获得性: 指无论使用何种测量工具,效标的内容必须是能在合理成本下取得。3.构念效度:最为复杂与抽象。构念效度指测量工具的内容,能推论或量一些抽象的概念或特质的能力。 效度测量汇整表类型测量内容评估方法内容效度测量内容能够代表所有攸关项目的程度主观到断或小组评估其内容效度比值效标关联效度测量工具掌握效标攸关要素的程度相关分析同时效度现况的描述: 效标数据是当前可得数据预测效度未来的预测: 使用未来的效标构念效度测量的变异为何?企图确认所欲测量构念并判定测量值与之相符程度主观判断相关分析区别技术因素分析多元特质多重益法矩阵(二) 信度:指测量结果是否具有一致性或稳定性的程度常用的信度衡量的三种类型。 1.稳定性:用同一种测量工具,对同一群受测者重复施测的结果,若 具有一致性,则称这个测量工具具有稳定性。 2.等值性:是考虑有多少误差来自不容的受测者或不同版本的测试。 3.内部一致性:指拧讨测量项目之间的内部一致性或同构型。 4.改进信度的方法:指确保稳定性的原则是尽量使数据来源的变异程度 减到最低,并尽量使测量时的外部环境维持不变。(三)实用性:研究计划在科学上的要求是测量过程必须具有信度与效度, 而执行上的要求是必须有实用性,包括有以下三种定义: 1.经济性:资料的搜集方法会受经济因素的影响。2.便利性:指执行时是否易于说明与了解。3.可解释性:指测量的结果必须有适当的表达与解释。若要提高问卷的解释能力须留意下列几项关键因素:(1)本测验的功能与测验的程序说明(2)对行政人员及监考人员的工作说明(3)计分要点与计分说明(4)选择适当受测群体的准则(5)有关信度的验证(6)各子项目相互影响的验证(7)本测验结果与其它测验结果的比较(8)本测验的结果使用指南 信度估计法汇总表类型系数测量内容方法重复测试稳定性同一测量工具不同时点,对同一受测者测量结果一致的程度相关分析不同版测试等值性一套测量的两个版本,对同一受测者测量结果一致的程度相关分析折半法内容一致性相似的测量项目是否反应出相同构念特殊相关分析贰量表的设计一量表的性质 许多企业研究的概念与构念不仅复杂且抽象程度高,在研究上不容易测量。所以如何将一些抽象的概念与构念转成正确的测量分数,是研究上的重要课题。(一)量表化的定义 量表化只的是一种程序,此程序将要测量的对象,或是想要衡量的特性,分派某些数值,以便赋予这些特性具有数字的特点,以便研究者来分析研究,研究出来的结果也比较客观、准确。(二)量表的选择 量表的选择必须考虑下列六大因素: 1.研究的目的 一般来说,量表可能是为了(1)测量受测者本身的特质,(2)测量受测者对一件事物或刺激的看法。2.量表填答的类型量表可以区分为类别量表与比较量表。3.偏好的程度量表的设计也会牵扯到偏好程度的测量,包含偏好测量与非偏好测量。4.数据尺度的特性在量表的编制中,必须考虑数据尺度的使用,看是属于名目、顺序、区间、或比率尺度。5.层面的多寡量表可以是单一层面或多维层面。6.量表的建构:(1)主观决断方式,根据某概念现有的想法为基础来编制量表。(2)共识量表,是由一组专家根据主题的关联性决定是否将某个项目列入问卷中。(3)项目分析,个别的项目在经过预试之后,计算个项目的总分,以评估哪些项目能够很明显的将受测者区分为高分组或低分组。(4)累计量表,根据项目的鉴别能力,加以排序而成,用以决定选择的项目。(5)因素量表,则是以项目之间的相互关联性来加以建构,以共同因素描述其关系。统计上,可透过因素分析或群集分析来进行。二、受测者的反应方式第一、将受测者反应的特质区分为若干个层面,并要求受测者对各个层面加以评断。第二、研究者能将填答方式加以结构化,而非以开放填答的方式。为了将受测者反应的特质转为若干个层面,我们必须探讨评等与排序量表的观念。(一)评等量表1.量表点的数量:对于量表点的数量,研究者可能使用三点、五点或七点的评等量表,仍无一致的结论。然而,基本上从三点量表到七点量表都有人使用,且没有太大的差异。2.选择量表:(1) 单一分类量表(simple category scale),亦被称为二分化量表,提供了两个互相排斥的反应选择。对于评等者来说有多种选择,但却只可寻求一个答案,使用多重选择之单一反应量表(single-response scale)是合适的。稍些变化,多重选择之多重反应量表(multiple-response scale),亦称为检查列表,允许评等人选择一个或多个决定。(2) 李克特量表(Likert scale)是最常使用,为加总顺序量表(summated rating scale)的变化。加总量表含有对于感兴趣的标的物表达了不是喜欢就是不喜欢的态度。(3) 言意差异量表(semantic differential scale)是衡量标的物特性在心理上的重要程度。(4) 数字化量表(numerical scales)是一种在数在线的每个数字(量表点)都会有一段相等的区间,最常使用的是5个量表点。(5) 图形式平等量表(graphic rating scale)是一种简单又普遍使用的尺度,受测者依据对问题的反应,在一条直线上选定一个点。(6) 项目氏量表(itemized scale),是由一系列的描述句组成的,而受测者则选择最能反应他们情况的论述。3.使用评等量表所遇到的问题:以评等量表做为一种测量的工具,其实是建立在受测者有能力且愿意去做出恰当判断的假定上。然而,实际上受测者在做评定上,却常可能发生三种错误,分别是:(1) 极端效果或同情效应(leniency),两极偏误会发生好好先生及刁难先生两种评估者。此种偏误的处理方式可以在量表设计时预估控制。(2) 趋中效应(central tendency),评估者通常都不想给极端的分数,尤其在评估者不认识此人时,此种现象称为趋中效应。解决的方式包括:j调整描 述的强度k在图形式量表中,加大词语间的距离l使两端的语意差别比中间来的小m使用较多点的量表(3) 月晕效应(halo effect),是指人们对一般性的印象所造成的误差。此解决的方法可以让所有受测者每此仅对一项属性或特质进行评估。(二)排序量表(ranking scale)通常要求受测者直接比较挑选,一般是要求选出最好的,或是比较喜爱的。1.配对比较量表 (paired-comparison scale)反应者必须在两个标的物中表达清楚的态度,受测者被要求对一系列对象两两进行比较,根据某个标准在两个被比较的对象中做出选择。这是一种很普遍的态度测量方法,实际上是一种特殊的等级量表,不过要求排序的是两个对象,而不是多个。 配对比较方法克服了等级排序量表存在的缺点,首先,对受测者来说,两个一对来选择一个肯定比一大组对象选出一个更容易;其次,配对比较也可以避免等级量表的顺序误差。但是,一般要对所有的配对进行比较,判断的次数将是N= n (n-1) / 2次配对比较,其中,N为判断总次数,n为要比较的事件或项目总数,此作法要考虑到的,过多的配对数目可能会超出受测者的负荷,产生厌烦而影响应答。 结果出来的次序数据,要将他转换成间距量表的形式,可以用配对比较法则,方式是将偏好次数转换成标准常态机率值( Mp ),在依据常态分配的机率密度转换成Z分数的矩阵。2.集中排列量表 ( forced ranking scale) 此表要求受测者直接将所有的选项排列次序来,强迫做出次序选择, 此方法比配对比较法来得快速且简单,而且也没有数据转换的问题。不过,此方式有一个缺点,若是排列的选项过多时,受测者可能不能做出明确的判断。3.比较量表 (comparative scale) 提供一个偏好的标竿或评点,用以评估研究中对于目标物、事件、或情况的态度,假使反应者是熟悉标准,直接比较对于比较量表来说是很方便的。4.连续区间法 (successive intervals )若是面对更多项目,可利用卡片,每一项目各一张,让受测者以卡片对项目进行排序动作;归类后的顺序及代表此项目的分数,由此可建立区间尺度的数据。三、建立量表的技术: 若要衡量受测者某一种态度,而必须以一连串的题目加以测量,此时可以利用主观式量表、或是共识量表以选择适当的题目。(一)主观式量表: 研究者可能依据本身对主题的了解,设计出一些可以测量此项概念的题目,而形成主观式量表。如附录(图表)是四个关于对公司印象的要素。基本上,主观式量表的建立花费不太大,且容易实施,所提供的讯息亦是有用且洽当的。只是他仍然会产生几个缺点,他是比较主观的,而且结果的好坏端赖于编制者的逻辑是否正确,同时也须仰赖研究者的判断能力,才能挑出足以代表完整概念的项目。但是,却无法证明受测者对此项概念的参照架构是否与研究者一致。(二)共识量表:共识量表是由一组专家依据底下三项原则,挑选出题目而组成的。他的原则为1.与主题范畴的关连性。2.题意模糊的可能性。3.题目所表达的态度层级。比较有名的共识量表,是Thurstone Differential Scale (差异量表)。差异量表是以等距表现法来编制一个测量态度的量表。此法先由研究者列出许多题目,然后由许多专家(一般在50人以上)对这些项目进行评估,已决定哪些项目是可以成为最佳的问卷组合。例如,依据专家对每一题目的同意程度分等,然后计算每一题目的四分位差(Q3-Q1)及中位数。选择其四分位差较小的题目,如果四分位差太大,表示此题目太过模糊不清,不适合放入最后的量表,中位数类似的题目可增加问卷的信度,因而可以重复选用。 差异量表是具有信度和效度的量表,因本法利用大量的专家对量表的项目做评估,不是仅依赖研究者本身的判断。不过,本法通常是在学术研究上使用,而较少在企业中使用,因为成本高,耗时长,且需要太多的人力。(三)项目分析: 项目分析主要是评估某个题目是否能够区别出得高分与得低分的群体。而最常使用此种分析的是加总性量表。 加总出每个人的总分,并进一步区分出高分组(前25%),与低分组(后 25%)。如此,两组分别代表赞同与不赞同的两端。依据这两组可进一步比较总分的高低与个别项目之间的相关情形,称为项目分析并分析如下。 首先:设计量表中每一个题项在高分组及低分组的平均值,然后在检 定每一题项,在高分组与低分组之间是否存在显著差异。若达到显著差异,代表此题项具有一定的鉴别力,因此,将其保留在量表内,若没有达到显著差异则将他剔除。 以我的工作非常不愉快为例,分为非常同意到非常不同意等五种反应。进行项目分析时,首先计算高总分组与低总飞组在本题的平均值,然后再利用T检定,若T检定的结果显著,故此题目可被放入量表内。依过去的经验法则,在计算每一题项的T职之后,可将这些T值一大小排列,然后只取直T值大于1.85的题目,不过,必须注意的是,在计算T值时,每组必须大于25人以上。另外,为了避免反应偏误,应该设计正向与负向的问题各半。l 实例分析:见附录(图表)步骤:1. 对我认为我的工作是令人兴奋的之叙述,我们选择底端25%的分配(低总分群)及顶端25%的分配(高总分群),每一群人中有73人。在中间分布的50%对分析是相对不重要的。对每一个反应类别,量表值(X)是借着频率或反应选择数字价值而被扩大。这个价值的产出是产品(fX),这个数字是倍X扩大(fX2),举例,有三个反应者在低分群,分数选5(非常同意此叙述) :(fX)=5*3=15;(fX2)=15*5=75。2. 频率、产品及平方要加总3. 对每群计算平均分数4. 变异数计算及公式要求的平方总和5. 数据用修正后t分配测试,并为项目比较高分群及低分群。注意,平均数是公式的分母6. 计算值是和标准值(1.75)比较。假使计算值(在本案例中是8.92)是相等或超过这标准值,这是依个好的叙述足以用来衡量态度的辨别(若是少于这个标准,我们认为他是个缺乏辨别目标态度的叙述,并应该从衡量工具中删除),我们是选择下一个目标并重复这些步骤。(四)累计量表 1.意义:最有名的是古德曼良表谱(Guttman Scalogram)。它可以推 估个人的回答在某个问题上是反应正向或负向。2.目的:决定一个题目是否为单一维度量表,尝试建立一个同属性的 量表。3.运用:社会差距、组织层级、演变阶段4.设计流程:第一步:界定测量内容范围,具体提出题项第二步:进行预试第三步:受测者的总分由高至低排列,并将题项受认同的程度由左 至右排列第四步:以t检定把无法区别认同程度的题项去除第五步:可以求得一个复制系数且必须在0.90以上,才可称为单一 维度量表5.举例:参考附录(图表)(五)因素量表 1. 概论: (1)处理问题方向 (a) 多维度问题 (b) 发掘潜在或隐性维度 (2)设计方式:以具体相关题项,发掘各题项之间的相互依赖程度2. 语意差别法:(semantic differential,SD): (1)意义:假设事务的涵义可能有多层面关系,这些层面的空间称之。 (2)目的:了解受测者对事物的认知程度。 (3)方式:由一组题目组成,每个题目皆由两极化的反应所组成。 (4)运用:品牌形象评估、企业形象评估、政治议题、人格测量、 组织研究 (5) 分成三因素:(a) 评价性(evaluation)(b)力量性(power) (c) 活动性(activity) (6)设计流程: 第一步:选定想要研究的概念 第二步:选定互斥的配对语词 第三步:加总后平均,与最接近理想条件的为选择 (7)举例:参考附录(图表)3. 个别设计的语意差异量表(Tailoade Scale):(1)运用:可建立各种商店的剖面图,并加以比较 (2)优点:(a)提供类似区间尺度的数据(b) 可对大样本进行态度的测量(c) 可测量正向负向的态度及强度(d) 可了解一群人或一个人对某事务的全貌(e) 可避免受测者在评估上所产生的偏误(3)举例:参考附录(图表) 4. 多层次量表化(Multidimensional scaling,MDS) (1)处理实质空间比语意差异法好 (2)量表目标、人或两者提供一个可见的变量关系 (3)优点:个产品能被定位,使用相似层级也能让一个人 (4)举例:参考附录(图表)叁、参考文献 Earl Babbie着;邱泯科、陈佳颖、蔡繁智、姜馨彦合译,研究方法:基础理论与技巧,台北市,双叶书廊有限公司。 王渊海,统计学(上),台北市,王冠出版社。 投影片下载标准化测量工具的发展与评估,.tw/nutr2027/Powerpoint/Ch3.ppt#5 信度 真分数理论的假设,.tw/ecp/news/9310071.ppt#13肆、关键词测量(measurement) P118古得曼量表谱(Guttman scalogram)p.142特质(properties) P118语意差别法(semantic differential, SD)p.143名目尺度(nominal scale) P119月晕效应(halo effect)p.136顺序(等级)尺度(ordinal scale) P120连续区间法(successive intervals)p.138区间尺度(interval scale) P121项目分析(item analysis)p.140比率尺度(ratio scale) P122单一层面(unidimensional)p.133效度(validity) P123项目式量表(itemized scale)p.136内容(content) P124效标关联(criterion-related) P124构念(construct) P125等值性(equivalence) P126内部一致性(internal consistency) P126稳定性(stability) P126信度(reliability) P126主观式量表(arbitrary scale)p.138同情效应(leniency)p.136类别量表(categorical scale)p.132李克特量表(加总性量表)(Likert/summated scale)p.135,140趋中效应(central tendency)p.136比较量表(comparative scale)p.138配对比较量表(paired-comparison scale)p.137共识量表(consensus scaling)p.138,139排序量表(ranking scale)p.137因素量表(factor scale)p133,143图形式评等量表(graphic rating scale)p.136量表化(scaling)p.132伍、问题与讨论(测量)1. 测量下列三项构念时,应包括哪些内容?请尽可能明确说明。a.工厂产量。b.工作满足。c.成就动机。Ans:a.选取测量产品、 利用数字或符号代表产品特性、 运用分派法则给予产品一个数字或符号来分辨良品和不良品、 测量单位时间、 计算产量的单位、 总产量应扣除不良品的数目。 b. 选取测量工作、 利用数字或符号代表工作特性、 运用分派法则给予工作数字或符号来分辨满足程度、 测量单位时间、 使用测量指标的结果再加以推论。c. 所谓成就动机乃是一个人认为很有意义或很有价值的工作,不但愿意去作,并且愿意花费许多精神和力气去追求,以达成功或完美的心理历程。选取测量工作、 利用数字或符号代表工作特性、 运用分派法则给予工作数字或符号来分辨成就动机、 测量单位时间、 使用测量指标的结果再加以推论。2.名目、顺序、区间、比率四种测量尺度之间: a.主要差异为何? b.这些差异如何影响统计方法的使用?各有哪些统计方法?Ans:a.主要差异为何?尺度类型尺度特性基本实证操作范例名目尺度分类、无次序、距离或原点相等的判定性别(男、女)顺序尺度具有次序但无距离或单一原点较大或较小的判定肉的煮熟度区间尺度具有次序与距离,但无单一原点区间或差距相等的判定温度比率尺度具有次序、距离与单一原点比率相等的判定年龄b.这些差异如何影响统计方法的使用?各有哪些统计方法?名目尺度(nominal scale):在社会科学与企业研究中,名目尺度比其它尺度更常使用。名目尺度将一个集合分割成互斥且能完全分派的种类,例如:性别可分为男性与女性两类。使用名目尺度时,计算每一组群成员的个数是唯一可能的数学运算。若对每一种类赋予数字,这些数字只能代表标记而没有数量的意义。只要组群彼此互斥而且符合完全分派,名目的分类可由任何数目的组群构成。当待测的特质具有不同程度的差异时,名目尺度即未能充分测量不同数量程度的信息。但,名目测量在探索性研究中特别有价值,因其目的在探索变量关系而非获得精确测量。调查研究与其它事后回溯研究常将资料依据次群体分类,因此也常使用名目尺度进行测量。顺序尺度(ordinal scale):又称等级尺度,包含所有名目尺度的特性外加一个次序指标。若递移性公理成立,顺序尺度即可能成立。递顺序尺度度意味大于或小于,但并不说明程度上的大或小,即等级与等级的差距可能大于或小于等级与等级的差距。顺序尺度常见的是对意见与偏好分别等级,而配对比较法则是最常使用的测量程序。数字本身只有等级意义,故较适合的集中趋势(central tendency)量数是中位数;而以百分位数(percentile)或四分位数代表离散趋势(dispersion tendency)。区间尺度(interval scale):区间尺度具有名目尺度和顺序的特征,外加一个距离相等的概念。一般态度量表,智力商数或其它多点量表也都视为区间尺度。可利用算术平均数作为集中趋势量数,以标准差作为离散趋势量数。比率尺度(ratio scale):比率尺度具有前述三种尺度的特微,外加一个具有实质意义的绝对零点或原点。比率尺度代表变量的实际数量,或物理属性的量数,例如:重量、高度、距离、空间都是比率尺度的例子。所有统计方法都可用于比率尺度。比率尺度可进行乘法与除法运算,其它尺度则不行。几何平均数与调和平均数也可作为集中趋势量数,而以标准差作为离散趋势量数。3.测量误差的四个主要来源为何?以一个面对面访谈的情况为例,请说明各项误差来源如何影响结果? Ans:第一个是受测者误差,受测者本身的特质因素可能影响测量结果,例如员工地位、不同组群成员、社会阶级和地位等,例如问的类似政治问题,如果受测者本身是挺某个政党,其回答的答案不能中立,使访谈的结果产生偏差。第二个是情境因素,访谈期间受测者的情绪都会影响答案,测量者尽量避免让受测者的情绪波动太大,和避免比较隐私的问题,例如月薪或经济能力等等。第三个是测量者误差,在访谈中,访谈者重述、释义或重牌问题的先后顺序都可能影响或扭曲访谈结果。例如一开始就先问受测者的月薪、岁数、经济能力等等,使受测者感觉不安全感觉很像在身家调查的样子,致使受测者的情绪影响而兴致缺缺的不想回答你所问的问题,或者测量者误解了答案上所传递的讯息而使数据分析造成差异。第四个是测量工具误差,一开始所要问的问题要易懂,让测量者可以把问题有效的传达给受访者了解其意义,使其答案的精确性和明确性可以得到一定的程度,而不是想问的问题,连测量者都不知其问的重点在哪,使其访谈结果有一定性的偏差。4.您同不同意以下说法?请说明。a. 测量的效度比信度重要。b. 内容效度是最难评估的效度类型。c. 有效度的测量一定有信度,但有信度的测量不一定有效度。d. 稳定性与等值性基本上是相同的东西。 Ans:a.不同意。应该要效度与信度兼顾,虽然有信度不一定有效度,但是信度过低,也会导致没有效度,所以两者都非常的重要。 b.不同意。内容效度是极为主观的判定,指测量内容是否能代表所攸关项目的程度,较容易评估。构念效度最为复杂及抽象,指测量工具的内容,能推论或衡量一些抽象的概念或特质的能力,评估起来较困难。c.同意。效度:指测验结果的正确性,一个有效的测量就是是否能测量出所要测量的东西。信度:指测验结果的可靠性、一致性。因此,具有效度的测量,其结果必然有可靠性,但是一个测量虽然具有信度,但却不一定能测量出所要测量的东西,所以,并不一定有效度。 d.不同意。稳定性:是用同一种测量工具,对同一群受测者重复施测同一批样本的结果。等值性:是考虑有多少误差来自不同的受测者或不同版本的测试。5. 有人请你为该校开发一个测量学生风气指标的测量工具:l a. 您将用到哪些概念或构念 b. 选择几个主要概念并说明其构面 c. 举出您将用于测量这些构面的可观察指标 d. 您如何将这些不同构面组成单一指标 e. 您如何判定这项测量的信度与效度Ans:a. 多元特质多重方法矩阵,因为它是抽样调查中最有用,也是最常用分析构念效度的方法b. 1-决定研究问题测量学生风气指标2-决定研究构念3-选择指标4-形成指标c. 1-学生对学校风气的看法2-学生对社会风气的看法d. 根据上述的两种看法,分别测量这两种态度,每一种态度即为一项研究构念可归纳为测量学生风气指标e. 信度指测量结果的一致性。信度与效度有一定的关系,一个测量工具可能有信度而无效度,但不可能没有信度而效度,亦即信度为必要但非充份条件。而信度有三种类型,分别是稳定性、等值性与内部一致性。可藉由这些条件来判断该项测量的信度与效度。(量表的设计)比较底下的优缺点:a.评等量表与排序尺度b.李克特量表与差异量表c.单一维度量表与多维度量表Ans:a.评等量表与排序尺度Ans:使用评等量表,受测者不考虑与其它事物关系加以量表化,所得数据可分较多级次,亦可分工较细。较能突显数据的症结,并屏除相关探讨事物的影响。排序尺度,则是考虑相对关系加以排序,可以很清楚的评鉴出各排序次目后的优劣。b.李克特量表与差异量表Ans:李克特量表的优点是容易且能迅是编制,而且每一个题目都能实际验证他的鉴别力,比差异量表更有信度,且受测者为主题或以刺激为主题的研究上,都可使用,也就是李克特量表能比较不同受测者的异同,及比较不同刺激间的差异,而且能以区间尺度的数据进行分析。相对的差异量表依赖受测者本身判断,以专业族群的信度量表,虚耗时费力,较多用于学术上使用。c.单一维度量表与多维度量表 Ans:顾名思义单一维度是指对受测者对单一种态度测量,可用一个项目或若干个项目来测量次态度,而事后亦可用加权方式取得综合指标;多维层面比单维层面更能充分的描述所需测量的事物,虽然繁复些,,但能以各层面探讨所的数据,较能具体化事物。此章谈到五种建构量表的方法,请说明各种方法为何?讨论他们的差异并说明差异的重要性。 方法 目 的 差异重要性 主观式量表衡量受测者某种态度,较主观可对个别项目分析,或就不同公司比较,或不同公司自个别项目上的比较 共识量表衡量受测者某种态度利用大量的专家对量表做分析,多用在学术上 项目分析评估某个题目是否能区别出高分与低分的群体比较不同受测者为主题异同或以表较不同刺激的研究上 累计量表决定一个题目是否为单一维度量表,尝试建立一个同属性的量表。 研究有关社会差距、组织层级、演变阶段 因素量表研究多维度问题,发掘潜在或隐性维度,发掘各题项之间的相互依赖程度品牌形象评估、企业形象评估、政治议题、人格测量、 组织研究古典的语意差异量表与特别编制的语意差异量表有哪些主要的差异?并说明两者的优、缺点。 Ans:古典的语意差异量表之缺点: (1)人类的思考与行为本来充满着模糊过程,传统的问卷常被过度的解释。 (2)为迎合数字的精确要求,实验数据常有被过度使用之嫌。 (3)为简化或降低数学模式的复杂性,却将实际状况间之相关与动态特质忽略。特别编制的语意差异量表之优缺点: 优点: (1)语意差异为取得兴趣或态度方面的数据,提供了有效、弹性与简单的方法。 (2)语意差异提供受试者第一印象,可减少受到先入为主价值反应的影响。 (3)语意差异提供的反应,可为填答者提供较多的选择自由,避免刻板的回答。缺点:(1) 结果有集中倾向。 在图表8-1或8-2使用反应策略,哪一个是适当的并且加入洞察力来了解学生对于他们所进入的学校计划之需求不同指标 ?Ans: 建议可以使用图表8-1里的语意差异量表,此表适合用来衡量标的物 特性在心理上的重要程度。透过语意差异量表所衡量出的结果,可以知道 学生心理需求上与计划上的感观,进而可以加以分析哪些因素是重要的决 定因子。陆、补充资料评量的基本概念整理 测量尺度 名目尺度(nominal scale) 或类别尺度(categorical scale)。 主要功用是在区分类别,给每一个类别适当名称,藉以辨识。譬如:人之性别可区分为男性与女性;婚姻状况可区分为已婚与未婚;家长职业可区分分为专业、半专业、以及非专业三类;而休闲嗜好可区分为户外休闲与室内休闲,或区分为益智性活动、运动性活动、以及娱乐性活动三类等 顺序尺度(ordinal scale) 将事物依其特征或属性的大小、或多少的程度,排成顺序或等级。 譬如,将十个参加演讲比赛的学生依其成绩高低自1排至10,这就是顺序尺度的应用。 换个方式来看,如果以顺序尺度测量四年乙班五十名学生的成绩,请问小明的成绩如何?答案可能是小明是第五名,而不是小明的成绩是80分。 在等级或顺序的排列中,可以比较个体之间的地位,可说明大于或小于的关系和差异,但个体之间的差异并无相同的单位。故全班第一名的成绩与第二名成绩的差异,未必等于第二名成绩与第三名成绩的差异。这个特征要特别留意。 等距尺度(interval scale)或区间尺度 等距尺度是一组具有连续性、单位又相等的数值。如果应用等距尺度来测量变项,乃是依其特征或属性之不同赋予不同的数值。使这些数值不仅显示大小的顺序,而且数值之间具有相等的距离。 等距尺度的主要特征在于:(1)分数、(2)连续性、与(3)等距;而其主要功用则在于采用连续且等距的分数说明变项特征或属性的差异情形。 试想学生的国语科测验成绩,范围是0分至100分。假如大中的成绩是0分,这并不表示大中的国语科能力是空白。分数上的0是人为的零点,是研究者决定的一个点。因此,大中考了0分,只能解释说,大中在这次测验中,全部题目都答错了,而不能说大中的国语能力是0。 国语科测验小明考了90分,小华只有45分,那并不意味着小明的国语能力是小华的两倍。这一个解释上的限制要特别予以留意。 比例尺度(ratio scale) 比例尺度具有等距尺度的全部特征,而且有真正零点。因此比例尺度的数值之间有相等的比例(ratio),不仅可以加减,也可以作乘除的运算。 如人的身高,可以采用比例尺度来测量,以0代表没有高度,0以上的不同数值代表实际高度,而身高200公分即为身高100公分的两倍。实例:所得调查 名目尺度 你有所得吗? 无 有 顺序尺度 你的所得水平是 低所得 中所得 高所得 等距尺度 你每月的所得是 9,999元以下 10,00029,999元 30,00049,999元 50,00069,999元 70,000元以上 比例尺度 你每月的所得是_元统计基本概念:集中趋势:各项数据的中心位置,最大功能在于以一个简单的数来代表全部个数的数值。使用平均的概念,有助于把庞大的原始资料化约而加以掌握。集中趋势虽可反映整体状况,但无法将分布特性完整呈现。离散趋势:所谓的离散系指所有观察个案围绕某一中间数值(例如平均数)的分布状况。算术平均数(Sample Mean, Average):代表集中趋势,也就是可由样本平均数看出母体的集中状况。算术平均数就是将所有的数值总和除以个案数。调和平均数:其样本值须不要为0。几何平均数:基样本值须要为正值,在比例型之资料较佳。标准差(Standard Error):代表每一个数与样本平均数之平均距离,可以由此看出母体之平均距离的情形。中位数:Md = 中位数所在组的下限+(n/2-小于中位数各组次数之总和)*组距/中位数在之组的次数 ,n:样本个数。百分位数:将数据排序分100个等级,每等级为1%。四分位数:将数据排序分四个等级,每等级为25%。内容效度:1. 抽样效度:量表所包含的项目是否能代表母体构念的项目。内容效度的高低,端赖项目取样代表性之大小而定。2. 表面效度:是指量表项目和形式上,给人的主观印象,如果该量表从外表来看,似乎确实可适切地测量其预测的特质或行为,便称它具有表面效度。影响效度的因素:1. 样本性质:样本多样性、代表性愈高,测量工具效度就愈高。2. 测量信度:若信度太低,则效度亦低。3. 干扰变数:指存在于测验所欲测特质及其效标之外,但却与两者间具有某种相关程度的变量。例如:年龄层、性别、环境背景 信度过低,则没有效度。 效度过低,则信度没有意义。 有效度一定有信度。 但有信度不一定有效度。信度的类型:1. 再测信度:指同一种测量工具,对同一群受测者,前后测验两次的相关系数,又称稳定系数。2. 复本信度:同一群受测者接受两种复本测验的得分之相关系数。3. 折半信度:测验题目依题目的单双数或其它方法分成两半,计算受测者在两半测验上的分数的相关系数。4. 内部一致性系数:反应测量工具内部同构型、一致性或稳定度。同构型愈高,代表量表试题是在测量相同的特质。5. 评分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论