王建心理测量学知识.ppt

上传人：g*** IP属地：河南上传时间：2020-03-15 格式：PPT 页数：123 大小：235.50KB 积分：15 举报 版权申诉

已阅读5页，还剩118页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

心理测量学心理学的重要研究方法之一第一节概述一测量的基本概念一测量的定义测量依据一定的法则使用量具对事物的特征进行定量描述的过程一定的法则事物的特征量具定量描述二测量的基本要素 1 参照点绝对参照点绝对零点相对参照点2 单位好的单位须符合两个条件意义明确同一单位对所有人来说意义相同等价第一单位与第二单位之间的距离第二单位与第三单位之间的距离三测量的量表量表 scale 使事物的特征数量化的数字的连续体 Stevens 将量表从低到高分为4个等级 1 命名量表 NominalScale 2 顺序量表 OrderScale 3 等距量表 IntervalScale 4 比率量表 RatioScale 1 命名量表 NominalScale 用数字来代表事物或对事物进行分类代号类别数字只是一种名称的替代物不同的个体用不同的数字标志如球员的号码各种分类标志男或女正常或异常等 2 顺序量表 OrderScale 给个体赋值使数值的大小次序与个体在所测量的心理特性上的多少大小高低等的次序相符合顺序量表在心理和教育中十分常见如竞赛成绩排名等 3 等距量表 IntervalScale 给个体赋值使数值间的差不仅能够反映出对应个体在所测量心理特性上的排序而且能够反映出对应个体在该特性上的差异程度如温度计偏爱程度等但建构间距量表不是容易的事常常只能做到顺序量表 4 比率量表 RatioScale 给个体赋值使数值间的比率能够反映对应个体在测量心理特性上比率如身高体重速度等但在心理学中是极少见的心理测量通常都是顺序量表为方便比较通常把顺序量表转换为等距量表二心理测验的基本概念一定义心理测验依据心理学理论使用一定的操作程序通过观察人的少数有代表性的行为对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段 1 心理心理测验测量的是人的行为2 行为样本从总体行为中抽取出来的能够反映个人特定心理特质的一组行为作为直接的测量对象 3 测验条件对所有被试必须是相同的 4 原始分数的解释只有与其他人的分数或常模比较才有意义二心理测量的性质 1心理测验的间接性通过测量外显行为来推断内隐的心理特质2心理测验的相对性没有绝对的标准3心理测验的客观性测验的客观性实际上就是测验的标准化问题三心理测验的种类一心理测验的种类一按测验的功能分类1 能力测验智力测验特殊能力测验能力倾向测验2 学绩测验已获得的学业成就3 人格测验兴趣态度动机气质性格二按测验的方式分类1 个别测验优点获得的信息多容易建立融洽的合作关系特殊被试幼儿盲人缺点费时复杂对主试要求高 2 团体测验优点缺点三按测验材料性质分类1 文字纸笔测验2 非文字操作测验文化公平测验四按测验材料的严谨程度分类1 构造性测验2 投射性测验五按测验的要求分类1 最高行为测验2 典型行为测验四对心理测验的科学态度一错误观念1 万能论2 无用论3 心理测验就是智力测验心理测验智力测验智商遗传决定论二对待测验的正确态度1 心理测验是研究心理学的重要方法之一是决策的辅助工具 2 心理测验作为研究方法和测量工具尚不完善 3 防止乱编和滥用心理测验第二节测验的常模一常模团体一常模团体的性质由具有共同特征的人所组成的一组群体或是该群体的一个样本任何一个测验都有许多可能的常模团体在制定常模时首先要确定常模团体在对常模参照分数做解释时也必须首先考虑常模团体的组成二确定常模团体的注意事项常模团体的四个条件 1 群体构成的界限必须明确对每个常模团体的性质和特征的简短且明确的描述 2 常模团体必须是所测群体的代表性样本克服取样偏差采用正确的取样方法随机取样系统抽样分层取样 3 样本大小要适当从统计学原理上说样本是越大越好但考虑到经济实用样本数量也不能无限扩大样本大小可以根据以下几方面来确定常模总体的数目总体数目小则样本数目也小总体数目大样本数目也应大一般来说样本最好应有30 100人如果是全国性常模一般应有2000 3000人为宜总体性质总体性质越复杂样本容量就越大测验结果的精确度精确度要求越高样本量就越大 4 常模团体必须是近时的三取样的方法取样从目标人群中选择有代表性的样本上统计学分类随机抽样非随机抽样随机原则从总体中取样时每个个案被抽取的机会是均等的 1 简单随机抽样按随机表顺序抽样每个人或抽样单位有相同的机会成为常模中的一部分 2 系统抽样是介于随机抽样和和非随机抽样之间的一种抽样方法其第一种样本可以依立意抽样法抽取亦可用随机方式抽取具体抽样流程为抽样前须将母体的每一个单位编号先计算样本区间即N n N表示母体的数目 n表示样本的大小如果样本区间为分数可四舍五入化为整数然后从1到N n号中随机抽出一个号码作为第一个样本单位将第一个样本单位的号码加下样本区间即得第二个样本单位依此类推直到样本数抽够为止 3 分组抽样先将总体依照一种或几种特征分为几个子总体类群每一个子总体称为一层然后从每一层中随机抽取一个子样本将它们合在一起即为总体的样本称为分层样本比如某中学有1000名学生装其中男600人女有400人欲采用分层抽样从中抽取100人的一个样本则其中男应有60人女应有40人样本的精确度还与分层数目及样本大小密切相关分层越细样本越大则样本的代表性越好 4 分层抽样是将总体按照某种标准年龄文化程度划分为一些子群体每一个子群为一个抽样单位用随机的方法从中抽若干子群将抽出的子群中所有个体合起来作为总体的样本四常模分数与常模 1 常模分数对常模样本施测后将被试的原始分数按一定规则转换出来的导出分数 2 常模常模分数构成的分布是它是解释心理测验分数的基础种类一般常模特殊常模常模分数和常模均会随时间的变化而改变因此常模必须经常修订五常模的类型类型 1 发展量表2 商数3 百分位4 标准分数一发展量表 1 心理年龄 mentalage 智力年龄指被试智力发展水平的年龄单位是年或岁和12个等距的月年龄量表最基本的假设是随年龄的增长所测量的特质有系统的改变因此不适用于成人年龄量表的基本要素 1 题目可区分不同年龄组 2 常模团体由各个年龄被试组成的有代表性样本 3 常模表 2 年级当量 gradeequivalents 即年级常模用年级代替年龄指把学生的测验成绩与各年级学生的平均成绩比较看他相当于几年级的水平年级常模的单位通常为10个月间隔如5年级的分布为5 0到5 9 年级当量只适用于一般课程不适合只学1 2年的课程年级当量只适用于解释本学年的水平不适用于跨学年的如一个五年级学生的年级当量为8 并不能说他已经掌握了8年级的课程 3 发展顺序量表 ordinalscales 格塞尔发展顺序量表格塞尔认为婴幼儿的行为系统的建立是一个有次序的过程反映了神经系统的不断成长和功能的分化因而可以把每个成熟阶段的行为模式作为智能诊断的依据皮亚杰量表用特定的任务来揭示儿童发展处于哪个阶段 5岁质量守恒6岁重量守恒7岁容量守恒二商数 quotient 1 比率智商IQ 100 MA CA 缺点实龄是等距的而智龄不等距智力发展不是直线的计算成人智商时以多大实龄作为除数智力生长何时达到顶点不同年龄组比率智商分数具有不同的标准差因而相同的比率智商对于不同年龄具有不同的意义 2 离差智商 IQ 100 15Z 三百分位 1 百分等级 percentilerank 概念某个分数的百分等级就是得分低于这个分数的人数的百分比百分等级指示个体在常模团体中的相对位置百分等级越低个体所处的地位越低 2百分点相对于某一百分等级的分数点叫百分点或百分位数 3十分位百分点将分数分布分成100个等份十分位是将分数分成10个等份十分位提供一个10级的等级量表每一级包括10 的分数百分位的评价优点 1 容易计算容易解释 2 对于各种被试和各种测验普遍适用缺点 1 缺少相等单位属于顺序量表不能做加减乘除运算 2 分布与分数分布不一致四标准分数 standardscore 1Z分数 X XZ S不仅具有可比性还具有可加性 Z 0SZ 1 3 3 约占总体的99 73 除了Z分数外还可以把Z分数转换成T分数标准九离差智商等转换方法线性转换从正态到正态非线性转换从偏态到正态通过百分等级 2T分数非线性转换常态化纪念Terman和Thorndike T 10 Z 50平均数为50 标准差为10 3标准九 stanine 标准化九级分制标准九 5 2Z 即平均数为5 标准差为2 4离差智商 deviationIQ IQ 100 15Z 六常模分数的表示方法一转化表转化表的3个基本要素原始分导出分常模团体的特征描述 1 简单转化表2 复杂转化表二剖析图第三节测验的信度测量误差及其来源一测量误差的含义测量值与实际值的差异二测量误差的种类系统误差测量工具本身引起的误差稳定随机误差由不稳定因素引起的误差不稳定真分数及其有关的假设真分数 TrueScore 一个测量工具在没有测量误差时所得到的纯正值操作定义无数次测量结果的平均值观察分数 ObservedScore 测验分数真分数的数学模型及其假设X T EX 测验分数T 真分数E 误差测量误差的假设 X T或 E 0 SX2 ST2 SE2实得分数的变异数真分数的变异数误差变异数随机误差 ST2 SV2 SI2真变异数与测量目的有关的变异数与测量目的无关的稳定的变异数系统误差 SX2 SV2 SI2 SE2 SX2 ST2 一信度概述一什么是信度信度 reliability 是指测量结果的稳定性程度也叫测量的可靠性操作定义一组测量分数的真变异数与总变异数实得变异数的比率 rxx ST2 Sx2rxx 信度系数注意 1 信度指的是一组测验分数或一系列测量的特性而不是个人分数的特性 2 真分数的变异数是不能直接测量的因此信度是一个理论上构想的概念只能根据一组实得分数作出估计二信度的作用1 评价测验信度是测量过程中所存在的随机误差大小的反映2 解释个人测验分数的意义SE SX 1 RxxSE 标准误Sx 所得分数的标准差rxx 测验的信度真分数的置信区间 95 X 1 96SE3 不同测验分数的比较二信度的估计方法一重测信度1 含义和计算重测信度 test retestreliability 用同一量表对同一组被试施测两次所得结果的一致性程度 rxx X1X2 N X1X2 S1S2 2 使用的前提条件所测量的心理特质必须是稳定的练习和遗忘的效果基本上相互抵消在两次施测的间隔时期内被试在所要测查的心理特质方面没有获得更多的学习和训练二复本信度 1 含义和计算复本信度 Alternate formreliability 是指两个平行等值的测验测量同一批被试所得结果的一致性程度计算方法与重测法相同施测的安排等值性系数两个复本测验是同时连续施测的稳定等值系数重测复本信度两个复本测验是相距一段时间分两次施测的 2 使用的前提条件两测验真正平行项目的内容形式数量难易时限指导语等被试要有条件接受两个测验注意时间间隔要适当 3 局限只能减少而不能排除练习和记忆的影响许多测验建立复本相当困难三分半信度 1 含义和计算分半信度 split halfreliability 是指将一个测验分成对等的两半后所有被试在这两半上所得分数的一致性程度假设两半测验等值常见的分半方法是按测题序号奇偶分半 l测验题目按某种顺序如难度排列 l如果是随机排列的题目则必须是所有题目是平等的要么难度相等要么性质一致是测同一个心理特质的 l如果测验有多个分量表应在分量表内部排好顺序再把各分量表的两半组合起来求相关奇偶分半法作用注意事项如果有相互有牵连的项目或一组解决同一问题的项目时这些项目要放在同一半中如果试卷中存在任选题或试卷为速度测验时不宜使用分办信度分半法是按正常的程序实施测验然后将全部项目分成相等的两半根据各人在这两半测验的分数计算其相关然后进行修正校正公式斯皮尔曼布郎公式rxx 2rhh 1 rhh rhh是两半测验分数之间的相关系数当假定两半测验等值具有相同的平均数和标准差不成立时用弗朗那根公式或卢仑公式来估计信度弗朗那根公式 rxx 2 1 Sa2 Sb2 Sx2 Sa2 Sb2是两半测验分数的变异数 Sx2是测验总分的变异数卢仑公式 rxx 1 Sd2 Sx2Sd2 两半测验分数之差的变异数Sx2 测验总分的变异数四同质性信度1 含义同质性信度 homogeneityreliability 也叫内部一致性系数是指测验内部所有题目间的一致性程度可弥补分半法的不足 2 计算及适用范围基本公式 rkk Krij 1 K 1 rij K为测验项目数rij是项目间相关系数的平均数库德理查逊公式KR20公式 rxx K K 1 1 piqi Sx2 pi为答对第i题的人数的比例 qi为答错第i题的人数的比例 K为题目数 Sx2为测验总分的变异适用于已知各项目的难度五评分者信度1 含义和计算评分者信度 scorerreliability 是指多个评分者给同一批人的答卷进行评分的一致性程度 2人时相关系数积差相关 90多人时肯德尔和谐系数W 12 Ri2 Ri 2 N K2 N3 N K 3 20 N 3 7时查W表检验 RI为第i个被试被评的水平等级之和七影响测量信度的主要因素一被试方面被试团体同质性越高个体差异越小所得相关系数信度就越低被试团体异质性越高个体差异越大所得相关系数信度就越高二主试方面指导语态度期望等三施测情境四测量工具测验长度测验越长信度越高测验难度过难或过易都会使个体间得分差异减小降低信度测验内容试题取样不当内部一致性低题意模糊信度则低五两次施测的间隔时间间隔时间越短信度越高间隔时间越长信度越低第四节测验的效度一效度的概念1 什么是效度效度 validity 是指一个测验或量表实际能测出其所要测的心理特质的程度 1 效度是一个相对的概念每个测量工具都有自己的目的内隐特质是通过外显行为间接测得的 2 效度是测量的随机误差和系统误差的综合反映 3 判断一个测量是否有效要从多方面收集证据操作定义效度 SV2 SX2 rXY2 SX2 ST2 实得分数的变异数真分数的变异数误差变异数随机误差真变异数与测量目的有关的变异数与测量目的无关的稳定的变异数系统误差 2 效度与信度的关系 1 信度高是效度高的必要而非充分条件一个测验效度高其信度也必然高但一个测验信度高其效度不一定高 2 测验的效度受它的信度制约rXY rXX一个测验的信度必然比效度高至少相等二效度的估计 1 内容效度内容效度 contentvalidity 是指测验题目对有关内容或行为取样的适当程度即一个测验实际测到的内容与所要测量的内容之间的吻合程度一个测验要有内容效度必须具备两个条件 1 要有定义完好的内容范围 2 测验题目应是所界定的内容范围的代表性取样应用范围主要应用于成就测验也适合于某些用于选拔和分类的职业测验不适用于能力倾向测验和人格测验表面效度 surfacevalidity 外行人对某个测验从表面上看好像是测某种心理特质的程度并不是一种真正的效度人格测验要求表面效度不宜过高 2 内容效度的确定方法 1 逻辑分析法专家根据自己的知识经验对量表的有效性逻辑性作出判断也称逻辑效度为使内容效度的判断过程更客观一般采用下列步骤确定测验内容的总体范围编制双向细目表编制评定量表从测验内容所测的技能题目对所定义的范围的覆盖率各种题目数量和分数的比例以及题目形式的适当性等方面对测验作出总的评价 2 统计方法用两个测验复本来测同一批被试若相关高则内容效度可能高但若相关低则说明必有一个测验缺乏内容效度 3 经验推测法通过实践来检验效度 2 结构效度 structurevalidity是指一个测验实际测到所要测量的理论结构或特质的程度或者说测验分数能够说明心理学理论的某种结构或特质的程度特点 1 具有不同理论构思的测验其结构效度无法进行比较 2 结构效度有时很难获得 3 结构效度没有单一的指标是由各方面的证据累积起来进行评价的结构效度的确定方法结构效度确立的一般步骤 1 提出理论框架 2 依据理论框架推演出有关测验成绩的假设 3 用逻辑或实证的方法来证明假设结构效度的确定方法结构效度确立的一般步骤 1 提出理论框架 2 依据理论框架推演出有关测验成绩的假设 3 用逻辑或实证的方法来证明假设具体方法 1 测验内部寻找证据法分析测验的内容效度若内容效度高说明其结构效度也高分析被试对题目反应的特点有无社会称许性的题目如当事情不顺我意时我时常动怒对该题的回答也许反映不了要测的性格计算测验的同质性信度分半信度系数 KR20 KR21 2 测验之间寻找证据法相容效度新老测验之间的相关两测验测的是同一心理特质若相关高则说明新测验可能有较高的效度区分效度新老测验之间的相关两测验测的不是同一心理特质若相关低则说明新测验可能有较高的效度因素分析法得出的因素符合理论的构思说明效度高 3 考察测验的实证效度法根据效标把被试分组考察其得分差异根据测验得分差异把被试分组考察其所测特质行为表现的差异 4 实验法和观察法证实实验前训练实验后 3 实证效度含义种类及作用实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性效标 criterion 被估计的行为是检验测验效度的标准衡量一个测验是否有效的外在标准实证效度又称效标关联效度 criterion relatedvalidity 常用的效标学业成就临床诊断实际工作表现特殊训练成绩不同团体的总体表现先前有效的测验等级评定效标测量的条件 a 有效性效标测量能真正反映观念效标 b 可靠性有较高的信度c 客观性效标测量必须能真正反映观念效标防止效标污染效标污染 criterioncontamination 是指评定者知道被试的测验分数因而影响到对效标的客观评定 d 实用性经济实用实证效度的确定方法 1 相关法测验分数与效标测量之间的相关系数优点数量化可用回归方程进行个人效标预测缺点要求预测源与效标呈线性关系无法提供关于取舍正确性的指标 2 区分法检验测验分数能否有效地区分由效标所定义的团体 T检验重叠量计算 3 命中率法应用范围预测源和效标都是二分的强调社会公平时使用总命中率 B C A B C D 当测验用于提高工作或学习效率时使用正命中率 B A B 四影响测量效度的因素 A 测验的构成项目的质量题型区分度难易顺序项目数量测验长度与效度的关系 r nx y nrxy n 1 rxx nrxx n测验增长倍数 B 测验的实施过程C 接受测验的被试常模团体的同质性影响到对被试测验得分的解释进而影响到测验的效度测验偏倚 testbias 是指用不适用于被试的标准来解释被试的测验得分因而造成解释的偏差 D 效标测量行为与所选效标的相似性越高效度越高测验分数与效标行为之间是否是线性关系如果不是线性关系求皮尔逊相关就会低估效度效标本身的测量越可靠效度就可能越高 E 测量的信度第五节项目分析项目分析对项目进行筛选和修订可以提高测验的信度和效度定性分析内容效度题目编写的恰当性和有效性等的分析定量分析主要是指题目难度和区分度的分析一测验的难度一难度 difficulty 的含义难度指项目的难易程度在最高作为测验中称为难度而在典型作为测验中则指通俗性两者都是指在总体中能够正确或确切回答某项目的人数二难度的计算 1 二分法记分项目是非题选择题的难度用通过率来表示通过率易度 P R NR 通过人数 N全体被试人数P越大难度越小用极端分组法上下27 被试较多时测验总分从高到低排列分别计算高分组和低分组在某一项目上的通过率合并 P PH PL 2选择题难度的校正 CP KP 1 K 1 CP 校正后通过率 P 实得通过率 K 备选答案数目 2 论述题等非二分法记分项目的难度P X XmaxX 所有被试在该项目上的平均得分 Xmax 该项目的满分三测验难度水平的确定项目难度取决于测验的目的性质和项目形式 1 测验目的效标参照测验掌握测验不考虑难度选拔测验难度录取率2 项目形式选择题的难度一般应大于猜测概率 3 测验性质一般都应防止被试得满分满分的意义是不明确的大体而言难度为0 50时最理想此时项目具有最大的鉴别力在实际操作中让所有项目难度都到达0 50困难很大而且也不必要一般只需使项目的平均难度接近0 50 而各个项目的难度在0 50 0 20之间变化测验难度 1 测验难度影响测验分数的分布形态难度大正偏态难度低负偏态 2 测验难度影响测验分数的离散程度测验过难或过易分数全距缩小信度降低 P 0 50时最佳二测验的区分度一区分度的含义区分度 discrimination 指测验项目对被试心理品质水平差异的区分能力或鉴别能力项目的区分度是测验是否有效的指示器高区分度项目能将不同水平的被试区分开来二区分度的计算1 鉴别指数法鉴别指数 indexofdiscrimination D 的计算比较测验总分高和总分低的两组被试在项目通过率上的差别 D PH PLD值越大区分度越高项目越有效伊贝尔鉴别指数评价标准 2相关法相关法项目总分相关以某一项目分数与效标分数或测验总分的相关作为该项目区分度的指标相关越高区分度相关的计算方法 1 二列相关适用于两个连续变量其中一个变量被人为分成两类如一个测验的题目分数是连续的而效标分数或测验总分被分成及格不及格效标分数或测验总分是连续的而项目分数被分成通过不通过 2 点双列相关适用于双变量数据例如有一列数据是连续变量数据如体重身高以及许多测验与考试的分数另一列数据是二分类的称名变量数据如性别分男与女态度分赞成和不赞成学习经历分有与无考试结果分合格与不合格题目解答分答对与答错等数据三区分度与难度的关系第六节测验编制的一般程序一测验的目标分析对象用途目标二测题的编写三测验的编排和组织一测验的目标分析一明确测量对象年龄性别职业受教育程度经济状况民族文化背景等二明确测量用途用于显示或用于预测三明确测量目标工作分析心理变量或行为特征能力人格学业成就对特定概念下定义操作定义具体确定测验具体内容双向细目表二测题的编写一收集测验资料

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

王建心理测量学知识.ppt

文档简介

温馨提示

最新文档

评论

王建心理测量学知识.ppt

文档简介

温馨提示

最新文档

评论

相关文档