心理测量学基本概念和常考公式及其计算_第1页
心理测量学基本概念和常考公式及其计算_第2页
心理测量学基本概念和常考公式及其计算_第3页
心理测量学基本概念和常考公式及其计算_第4页
心理测量学基本概念和常考公式及其计算_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理测量学基本概念和常考公式及其计算 一 重点公式及计算 1 一个包括 40 个题目的测验信度为 0 80 欲将信度提高到 0 90 通过斯皮尔曼一布朗 公式的导出公式计算出至少应增加 个题数 A 60 B 100 C 50 D 40 此题可见基础教材第 355 页 须注意 教材中这个地方已被勘误过 正确的是 K 2 25 测 验长度应为原来的 2 25 倍 90 个题目 即需要增加的题目数为 90 40 50 个题目 正确答 案 C 50 2 下面是某求助者的 WA I S RC 的测验结果 言语测验 VIQ 量表分 知识 12 领悟 10 算术 7 相似性 1l 数字广度 6 词 汇 13 操作测验 PIQ 量表分 数字符号 9 图画填充 8 木块图 6 图片排列 7 物体拼凑 10 VIQ 96 PIQ 87 全量表的平均分为 9 问题 求助者词汇测验得分的百分等级是 选项 A 16 B 50 C 84 D 98 正确答案 C 遇到这种问题 只要记住 10 为平均数 标准差是 3 的情况下 得分为 13 的话正好高出一 个标准差 高出一个标准差对应的百分等级就是 84 注 本题是韦氏智力测验 它 以 10 为平均数 3 为标准差 遇到此类问题要记住 处于平均数的位置它的百分等级是 50 高于一个标准差百分等级是 84 高于 2 个标准差百分等级是 98 低于一个标准差百分 等级是 16 低于 2 个标准差百分等级是 2 3 智龄的计算 假如某儿童 4 5 6 岁组的题目全部通过 7 岁通过 4 题 8 岁通过 3 题 9 岁通过 2 题 其智龄为 以其全部通过的最高年龄为起点 6 4 2 3 2 2 2 6 岁 18 月 7 岁 6 个月 4 百分等级公式 PR 100 100R 50 N 小东在 30 名同学中语文成绩是 80 分 排列第五名 那么他的百分等级是 PR 100 100 5 50 30 85 5 如果要挑得分高的 20 的被试 须求出相当于 百分等级的测验分数 80 6 离差智商的计算公式 1 JPG 2 16 KB 2008 8 22 10 38 7 测量标准误的估计公式中 SX 代表 所得分数的标准差 8 测验的效度是 0 80 说明测验的总方差中有 的方差是测验分数的方差 64 二 重要的概念 1 高尔顿是第一个倡导心理测验的人 是使用评定量表和问卷法的先驱 并且他发展了分 析个体差异资料的统计方法 不仅扩充了古特列特的百分位法 而且创造了粗浅的相关计 算法 2 美国心理学家卡特尔 1980 年发表 心理测验与测量 一文于 心理 杂志上 这是在 心理学文献中首次出现 心理测验 一词 3 1904 年比内为了鉴别弱智儿童 他与西蒙合作编制成了世界上第一个科学的智力测验 比内 西蒙量表 1905 年 他在 心理学年报 上发表了文章 诊断异常儿童的新方法 介绍了该量表 历史上称为 1905 量表 从此 比内 西蒙量表宣告诞生 4 最有名的是 1916 年出版的美国斯坦福大学的推孟教授修订的 斯坦福 比内量表 这一 量表首次使用了 智力商数 的概念 简称为 IQ 是心理年龄和实际年龄的比值 5 比较有名的几个测验 智力测验 推孟的研究生欧提斯编制的团体智力测验 2 后在次基础上发展出美国陆军用 甲 乙两种测验 有基于因素分析理论编制的测量多项能力的韦克斯勒的儿童智力量表 还有桑代克编制的标准化教育测验 人格测验 1917 年武德沃斯设计的 个人资料调查表 1912 年问世的罗夏克墨迹图测验 RIT 和于 1943 年首次出版 由哈撒韦和麦金利编制的目前影响最大的 MMPI 明尼苏达 多相人格调查表 6 测量是 就是根据一定的法则用数字对事物加以确定 7 测量的要素是 参照点和单位 8 1 命名量表 只是用数字来代表事物或对事物进行分类 命名量表中的数字没有任何 数值意义 不能作量化分析 无大小意义 只表明类别 无参照点和单位 无法比较大小 或进行任何数学方法运算 2 顺序量表 表明类别的大小或某种属性的多少 主要用于分等论级和分类 数字仅 表示等级并不表示某种属性的真正量或绝对值 无参照点 没有绝对零度 和单位 无法 进行数学方法运算 3 等距量表 存在大小关系 无绝对零度 但存在相对零点 可以进行数学运算 有 相等单位 4 等比量表 是最精确的测量 大多是物理量表 而心理量表只能达到等距量表水平 可以知道事物之间的某种特点上相差多少及它们之间的倍数关系 有相等单位和绝对零点 可以进行数学运算 9 心理测量是 就是通过观察人的少数有代表性的行为 对反映在人的行为活动中的心 理特征 依确定的原则进行推论和量化分析的一种科学手段 这一定义包含有至少三个基 本要素 行为样本 客观测量和标准化 10 关于心理测量中的标准化 心理测量要做到客观必须在测验编制 实施 评分 解释 过程中减少主试和被试的随意性程度 标准化的测量是测量客观性的根本保证 11 心理测验的性质 间接性 相对性 客观性 12 心理测验的种类 1 按测验的内容分 能力测验 智力测验 反应能力测验 学绩测验 如成套的成就 测验 人格测验如 EPQ MMPI 等 2 按测验的对象特点分 个别测验和团体测验 3 按测验表现形式分 文字测验 纸笔测验 和非文字测验 4 按测验的目的分 描述性测验 诊断性测验 预测性测验 5 按测验的时间分 速度测验和难度测验 6 按测验要求分 有最高作为测验和典型行为测验 13 正确的测验观 1 测验是重要的心理学研究方法之一 是决策的辅助工具 2 心理测验作为研究方法和测量工具尚不完善 心理测验的最大问题是理论基础不够 坚实 3 科学地看待测验 防止乱编滥用 14 错误的测验观 测验万能论 测验无用论 15 常模团体 常模团体是由具有某些共同特征的人所组成的一个群体 或者是该群体的 一个样本 16 常模样本 找一个有代表性的样本来代表目标总体 也代表常模总体 这个用来代表 常模总体的样本 就是常模样本 常模样本必须具备常模总体的基本特征 17 常模样本的容量 总体的数目 一般情况 最小样本为 30 100 个 要是全国性的常 模 一般地要求有 2000 3000 人为宜 18 取样就是 从目标总体中选择有代表性的样本 一般地有两类取样方法 随机抽样和 非随机抽样 具体说有 简单随机抽样 系统抽样 分组抽样 分层抽样 19 常模分数 就是施测常模样本被试后 将被试的原始分数按一定规则转换出来的导出 分数 20 常模分数构成的分布是 通常所说的常模 它是解释心理测验分数的基础 人们常常会忽略常模的时间性 常模分数和常模均会随时间的变化而改变 因此常模必须 经常修订 21 常模的表示方法 表格法和图示法 1 表格法就是转换表法 这种表示常模分数分布的方法是最常见的 它有三个要素 原始分数 导出分数 常模样本的特征描述 2 图示法就是剖面图法 22 参照常模的解释分数是 将被试的分数直接或间接地以常模样本中的相对等级或相对 位置来表示 另一种常见法是以常模性质分 可分为 发展常模 反映心理发展程 百分 位常模和标准分常模 23 发展常模 按发展常模来解释测验分数 某一测验分数就表示个人在以正常途径发展 的心理特征方面处于一个什么样的发展水平 这些平均表现构成的量表就是发展常模 象 智力年龄 年级当量 发展顺序量表等均为发展常模 1 发展顺序量表 是直观的发展常模 因为它告诉人们多大的儿童具备什么能力或行 为就表明其发育正常 2 智力年龄 在比内 西蒙智力量表中首先使用了智力年龄的概念 智力年龄实际上是 一种年龄量表 也是用年龄来表示测验分数 以智力年龄为典型代表的年龄常模在做解释时确实非常简捷明了 但是智力年龄并不是单 位恒定相等的 而是随年龄的增长而增大 另外 智力年龄的概念显然不适用于成人 成 人到一定阶段后智力发展相对稳定 表现不出一年与一年之间的差别 3 年级当量 它实际上就是年级量表 测验结果说明属哪一年级的水平 在教育成就 测验中最常用 24 百分位常模是 把一个量表分成一百个位置 对不同的得分给予相应的等级评价 依 据不同的等级对结果作出解释 25 百分位常模可分两类 百分等级和百分点 1 百分等级 一个测验分数的百分等级式是指在常模样本中低于该分数人数的百分比 百分等级是应用最广的测验分数表示方法 2 百分点 又叫百分位数 百分点或百分位数于百分等级的计算方法正好相反 百分 等级是计算低于某测验分数的人数百分化 而百分位数是计算处于某一百分比例的人对应 的测验分数是多少 3 还有两种常见的变式 四分位数和十分位数 两者含义相似 26 标准分常模 标准分数最常见的是 z 分数 标准分数是等距量表 它可以做加 减 乘 除运算 常见的标准分常模 z 分数 Z 分数 T 分数 标准九分数 离差智商 IQ 等 标准分由原始分转换而来 这种转换又可分成 线性转换 非线性转换 27 线性转换的标准分 z 分数 最典型的线性转换的标准分 1 公式 z X X SD X 为原始分 X 为样本平均数 SD 为样本标准差 从公式看 z 的含义是 它表示某一分 数与平均数之差是标准差的几倍 3 z 的性质 1 平均数为 0 标准差为 1 2 z 分数有正 负 其绝对值表示原始分与平均数间的距离正值表示原始分大于平均数 负 值则相反 3 z 分数的分布形态与原始分分布一致 28 非线性转换的标准分 1 T 分数是 平均数为 50 标准差为 10 的分数 即 这一词最早由麦柯尔于 1939 年提出 是为了纪念推孟和桑代克对智力测验 尤其是提出智 商这一概念所作出的巨大贡献 2 标准九 是标准化九分制的简称 它是以 5 为平均数 以 2 为标准差的一个分数量 表 最早时被广泛应用于美国空军的心理测验中 标准九分数也是一种标准分 它将原始分划分为 9 部分 最高是 9 分 最低 1 分 除 1 和 9 的范围略大以外 其余均是以 5 为中心向两边各包含 0 5 个标准差的分数段 29 标准分常模小结 1 标准分常模分数均是等距分数 虽然不同类型的常模其平均数和标准差不同 但均 可用离均值来表示 2 标准分常模的局限性 标准化常模表示的是存在状态之间的横向比较 离开原常模样 本 不同常模样本之间的比较就没有意义 名称 z 分数和 z 分数 T 分数 标准九 标准十 标准二十 平均数 0 50 5 5 10 标准差 1 10 2 1 5 3 30 离差智商及其意义 传统比率智商的缺点 1 心理年龄与生理年龄呈线性关系 用传统的比率智商 不同年龄组的标准差不相等 从 10 20 都有 因此智龄与年龄的发展并不是呈线性关系 2 智力增长到何时达终点仍在争论 1 离差智商 通过与同 2 年龄的代表性样本的平均数相比较来确定智商的高低 离差智商是一种常态化标准分数 因而其计算方法与其他标准分数一样 公式为 IQ 100 15z 由于离差智商的提出 过去使用比率智商的测验都改用离差智商 其公式为 IQ 100 16z 两者唯一的区别是标准差 一个是 15 一个是 16 31 信度是指 测量结果的可靠性和一致性 32 信度的操作化定义 1 误差理论认为 一个人的测验分数 X 是由真实分数 T 和误差 E 两部分构成的 公式是 X T E 2 因此信度就被定义为 一组测量分数的真实方差与实得方差的比 或者是指真实方 差占总方差的百分比 公式为 rxx 1 SE 2 SX 2 3 根据统计学理论 真实方差与实得方差的比是一个相关系数的平方 所以我们把这 种相关系数的平方叫做信度系数 4 计算公式为 rxx ST2 SX2 33 由于误差的来源信度的可分为 这种分类是基于信度的传统定义 真分数理论 1 重测信度 考虑的误差来源是时间取样 2 复本信度 考虑的误差来源是内容取样 3 分半信度 它考虑的误差来源也是内容取样 它与复本信度的差别是 分半信度考 查一个测验内容的两半题目测量的是否是同一个心理特点行为 4 同质性信度 内部一致性系数 考虑的是测验内容是否异质 5 评分者信度 考虑的误差来源是评分者间的差别 34 信度的表示方法 1 信度系数和信度指数 1 信度系数 rxx rx2T S2T S2 2 信度指数 rXT ST SX 2 测量标准误 SE SX 1 rxx 35 信度的意义 1 信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差 也就是测 验的总变异中真分数造成的变异占百分之几 它直接告诉我们测量的误差有多大 2 测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内 并且可以预 测实得分数再测时可能的变化情况 36 信度的作用 1 解释预测个人分数的意义 2 解释真实分数与实得分数间的关系 明确告诉我们测验误差大小 3 新编的测验信度应高于原有的同类测验或相似测验 4 下结论说某测验比较可靠 必须是依据情境的 经多次证实的 5 它是确定测验好坏的一个指标 一般的原则是 1 当 rxx 0 70 时 测验不能用于对个人作出评价或预测 而且不能做团体间比较 2 当 0 70 rxx 0 85 时 可用于团体比较 3 当 rxx 0 85 时 才可以用来鉴别或预测个人成绩或作用 37 重测信度 有时也叫稳定性 主要针对时间变量 1 重测信度采集数据得方法是 对同一组被试间隔一定的时间重复测试一次 4 重测信度的计算方法是积差相关法 因而 rxx 就是皮尔逊的积差相关系数 7 重测信度的时间间隔选择依测验性质和目的而定 如果测验是用于长期预测 则测 量间隔长一些 对儿童的智力测验一般是两周到四周为宜 对成年人 间隔可到半年 很 少超过 6 个月 13 使用重测信度应注意 不是所有测验都可以计算重测信度 并且重测信度只是反映 了随机误差的影响 而不是反映被试心理特点的长期变化 38 复本信度 又叫等值性系数 1 数据采集方法是 给被试施测两个内容等值但题目不同的测验 求两组数值的相关 计算方法常见的也是积差相关法 2 复本信度的高低反映了两个互为复本的测验等价的程度 而不是反映一个测验本身 受随机误差影响的大小 复本信度的高低关键取决于复本测验的选择 因而施题目取样问 题 或者说是测验的内容取样问题 3 复本信度优于重测信度的地方是 避免了重测带来的记忆效应和练习效应 可用于长 期追踪研究前后测量 减少了作弊的可能性 4 复本信度的缺点 有些测验的复本很难找到 有些测验因正迁移效应使测验性质改变 如测量的内容很容易受练习的影响 复本信度也无法清除这种练习效应 5 重测复本信度 即再不同的时间里施测两个等值的测验 复本 得到的相关就是重 测复本信度 也叫稳定等值系数 它比单一的重测信度或复本信度都要严格 全面一些 39 斯皮尔曼 布朗公式 rnn nrtt 1 n 13 1 rtt 14 rnn 是校正以后的相关系 数 15 rtt 是实得的相关系数 16 n 为 rnn 对应的测验长度与 rtt 对应的测验长度之比 分半时 17 n N N 2 2 N 为测验全长 18 所以分半法信度的校正公式是 rxx 2 rnn 1 rhh 其中 rhh 为两半测验的相关系数 1 卢伦公式 rxx 1 Sd2 Sx2 其中 Sd2 是两半测验分数之差的方差 Sx2 为总方差 2 从理论上分析 分半信度反映的实际上是两半测验能够测量相同内容或心理特点的 程度 了解一下 40 内部一致性信度 同质性信度 同质性是指测验的所有题目间性质的一致性 即测 的是同一种心理特质或行为 同质性是测量单一特质的必要条件 这里讲的同质性是指测 验题目得分反映的心理特质一致 同质性的判别标准是 题目间呈高正相关 如果相关很 低或是呈负相关 则题目为异质 1 库德和里查德森提出的 K R20 公式只适合预测题目是二分法计分的 克伦巴赫 系数适合于非二分法计分的测验的内部一致性信度估计法 2 从同质性信度的含义我们不难看出 分半信度是求测验两半之间的一致性或同质性 而同质性是求所有题目间的一致性 因此分半信度实际上是同质性信度的一种 可以作为 测验同质性评价的粗略估计指标 因为可以根据测验得分来推论或验证某种概念或理论构 思 因此同质性信度也是一种构思效度 或叫结构效度 它实际上介于信度与效度之间 41 评分者信度 有些心理测验的得分不是根据客观的计分系统计分的 是由评分者来给 被试打分 因此 这样的测验的可靠性如何取决于评分者评分的一致性和稳定性如何 评分者信度因评

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论