新课件-心理测量学.ppt_第1页
新课件-心理测量学.ppt_第2页
新课件-心理测量学.ppt_第3页
新课件-心理测量学.ppt_第4页
新课件-心理测量学.ppt_第5页
已阅读5页,还剩256页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理咨询师考试心理测量学知识 张春雨 sprain 西南大学心理学院 主要内容 第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用 第一节概述 第一单元测量与测量量表第二单元心理测验的基本概念第三单元心理测验的分类第四单元纠正错误的测验观第五单元心理测验在心理咨询中的应用第六单元心理测验的发展史 一 什么是测量测量就是依据一定的法则用数字对事物加以确定 三个主要的元素 1 事物 2 数字 3 法则 第一单元测量与测量量表 所谓 事物 指的是我们要测量的对象 更准确地说 就是引起我们兴趣的事物的属性或特征 所谓 数字 是代表某一事物或事物某一属性的量 区分性 1与2序列性 等级性 3 2 1等距性 3 2 1 2 1 1可加性所谓 法则 代表的是测量所依据的规则和方法 二 测量要素 一 参照点参照点有两种 绝对零点人定的参照点 即相对零点 二 单位好的单位必须具备两个条件 确定的意义相同的价值 三 测量量表 测量的本质是根据某一法则将事物数量化 即在一个定有单位和参照点的连续体上把事物的属性表现出来 这个连续体称为量表 由于制定量表的单位和参照点不同 量表的种类也不同 1 命名量表只是用数字来代表事物或对事物进行分类 量表中的数字没有任何数值意义 不能作量化分析 无大小意义 只表明类别 无参照点和单位 无法比较大小或进行任何数学方法运算 测量水平最低的一种形式 如代号 类别 四类量表 2 顺序量表表明类别的大小或某种属性的多少 主要用于分等论级和分类 数字仅表示等级并不表示某种属性的真正量或绝对值 无参照点 没有绝对零度 和单位 无法进行数学方法运算 3 等距量表存在大小关系 无绝对零度 但存在相对零点 有相等单位 可以进行加减数学运算 但不能做乘除运算 4 等比量表是最精确的测量 具有相等单位又有绝对零点 大多是物理量表 可以进行各种数学运算 可以知道事物之间的某种特点上相差多少及它们之间的倍数关系 心理测验本质属于顺序量表 第二单元心理测量的基本概念 一 心理测量的定义二 心理测量的性质 一 心理测量的定义 所谓心理测量 就是依据心理学理论 使用一定的操作程序 通过观察人的少数有代表性的行为 对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段 二 心理测量的性质 一 间接性 二 相对性 三 客观性 心理测量的间接性 研究者无法直接测量人的心理 只能测量人的外显行为 也就是说 只能通过一个人对测验题目的反应来推论他的心理特质 特质是构成人格的最小单位 是激发与指导个体的各种反应的恒常的心理结构 心理测量的相对性 在对人的行为做比较时 没有绝对的标准 也就是没有绝对的零点 有的只是一个连续的行为序列 所谓测验就是看每个人处在这个序列的什么位置上 心理测量的客观性 测验的客观性实际上就是测验的标准化问题 对一切测量的共同要求是测验工具的标准化 测验用的项目或作业 施测说明 施测者的言语态度及施测时的环境等 要求标准化 测验评分记分的原则和手续也要经过标准化 使反应的量化是客观的 最后 分数转换和解释标准化 对结果的推论应该是客观的 第三单元心理测验的分类 按测验的功能分类按测验材料的性质分类按测验材料的严谨程度分类按测验的方式分类按测验的要求分类 一 按测验的功能分类 一 智力测验 二 特殊能力测验 三 人格测验EPQ16PFMMPI 二 按测验的性质分类 一 文字测验 二 操作测验也称非文字测验 三 按测验材科的严谨程度分类 一 客观测验 二 投射测验 四 按测验的方式分类 一 个别测验 二 团体测验 五 按测验的要求分类 一 最高行为测验 智力测验 成就测验 二 典型行为测验 人格测验 第四单元纠正错误的测验观 错误的测验观正确的测验观 一 错误的测验观 一 测验万能论 二 测验无用论 三 心理测验即智力测验 二 正确的测验观 一 心理测验是重要的心理学研究方法之一 是决策的辅助工具 二 心理测验作为研究方法和测量工具尚不完善 第五单元心理测验在心理咨询中的应用 智力测验人格测验心理评定量表 这几个方面是我国目前心理门诊中运用较多的 第六单元心理测验的发展史 科学心理测验的产生和发展现代心理测验在我国的发展 一 科学心理测验的产生与发展 高尔顿 F Galton 提出人的不同气质特点和智能是按身体特点的不同而遗传的 为了研究差异的遗传性 便设计了测量差异的方法 为心理测验奠定了统计学基础 他第一个提出了相关的概念 卡特尔 卡特尔是对心理测验发展做出巨大贡献美国心理学家 1890年 卡特尔在 心理 杂志上发表 心理测验与测量 一文 这是心理测验第一次出现于心理学文献中 在此文中 卡特尔写到 心理学若不立足于实验与测量上 决不能够有自然科学之准确性 又说 心理测验如果有一个普遍的标准 则其科学的与实用的价值都可以增加 他当时就极力主张测验手续和考试方法应有统一规定 并要有常模以便比较 所有这些都是测量学上的重要概念 比内 A Binet 世界上第一个正式的心理测验 20世纪以后 心理测验主要有以下几个方面的发展 1 操作测验的发展2 团体智力测验的发展3 能力倾向测验的发展4 人格测验的发展 二 现代心理测验在我国的发展 近些年来我国的心理学家正在致力于测验本土化 近代中国的心理测验 1914年 Creighton比较中美儿童智力差异 广州 500人 1916年 樊炳清首先介绍了比 西智力量表1918年 Walcott用S B施测 清华 1918年 俞子夷编制 小学生毛笔书法量表 1920南京高等师范学校 廖世承 陈鹤琴开设心理测量课 1921年 廖世承 陈鹤琴出版书 心理测量法 1921年 费培杰将比内智力测验翻成中文1922年 张耀翔在北京将心理测验列为入学考试科目1922年夏 中华教育改进社聘请美国麦柯尔1924年 陆志韦发表 订正比内西蒙智力测验说明书 36年代与吴天敏做修订 80年代吴天敏3修 1931年6月由艾伟 陆志韦 陈鹤琴 萧孝嵘等倡议 组织并成立了中国测验学会 南京1932年 测验 创刊1935年 沈有乾用 朋洛德人格问卷 测量中国学生1937年 周先庚使用 塞斯顿情绪稳定性测验 此时智力测验和人格测验约20种 教育测验50种 1943年 林传鼎试用 普莱西X O测验 丁瓒等于46 47 52年分别将TAT 主题统觉测验 与韦克斯勒 布勒维测验用于临床 1948 51年间 刘范使用过RIT 罗夏克墨迹图测验 至1949年 出版的测验方面的书籍共计20余种 1979年 林传鼎 吴天敏 张厚粲在武汉举办全国测验培训班1979年 龚耀先主持修订 韦克斯勒成人智力量表 1979年 林传鼎 张厚粲编制 少年儿童学习能力测验 1980年 林传鼎 张厚粲主持修订 韦克斯勒儿童智力量表 1980年 北师大开设心理测验课 1980年 张厚粲开始对高考试卷做系统分析1981年 刘绍衣修订 卡特尔16种人格因素问卷 1982年 吴天敏第三次修订中国比内测验1982年 宋维真修订 明尼苏达多相人格调查表 1983年 龚耀先 陈仲庚修订 艾森克问卷 1984年 中国心理学会成立心理测量专业委员会1984年 我国正式加入 国际教育成就评价协会 1985年 张厚粲主持修订 瑞文标准推理测验 1986年 龚耀先主持修订 韦克斯勒幼儿智力量表 1987年 张明园修订 生活事件量表 1989年 李丹修订 瑞文测验 联合型 1990年 中国加入国际测验委员会 ITC 吴文源修订 症状自评量表 SCL 90 1992年 戴忠恒修订 一般能力倾向测验 1992年 宋维真编制 心理健康调查表 1992年 沙毓 yu 英等编制 学生性格量表 1993年 宋维真等编制 中国人个性测量表 CPAI 1980年代 编制超常 弱智儿童筛查量表 0 3 6 岁儿童发育 发展量表 CPM领导行为评价量表 真题练习 200705 103 正确的测验观包括 A 心理测验是重要的心理学研究方法之一 是决策的辅助工具 B 做心理测验时态度要正确 C 心理测验作为研究方法和测量工具不完善 D 一考定终身 说明心理测验非常重要200705 104 人格测验包括 A EPQ B MMPI C 16PF D CRT200711 50 关于测量 正确的说法是 A 测量就是心理测量 B 就是依据一定的法则用数字对事物加以确定 C 就是用数字描述事物的法则 D 就是用一些题目或数字来描述事物的属性 AC ABC B 真题练习 200806 105 心理测验具有 A 外显性 B 间接性 C 相对性 D 客观性200806 106 按测验的功能 可将测验分为 A 智力测验 B 特殊能力测验 C 人格测验 D 投射测验200806 109 错误的测验观包括 A 心理测验即人格测验 B 心理测验尚不完善 C 心理测验即智力测验 D 测验万能论200811 106 按测验的方式分类 可将测验分为 A 操作测验 B 文字测 C 个别测验 D 团体测验 BCD ABC ACD CD 真题练习 200811 107 心理测验具有 A 外显性 B 间接性 C 相对性 D 客观性200811 108 测量的主要元素包括 A 事物 B 数字 C 法则 D 描述200905 91 测量所用数字具有自然数的特点 即具有 A 区分性 B 等级性 C 等距性 D 可加性200905 118 等距量表中的数值可以进行 运算 A 加 B 减 C 乘 D 除 BCD ABC ABCD AB 真题练习 200911 34 人格测验不包括 A EPQ B 16PF C CRT D MMPI 2200911 55 在顺序量表中 变量具有 A 相等单位 B 绝对零点 C 等级 D 可以做四则运算200911 75 编制世界上第一个正式的心理测验的学者是 A 高尔登 B 比内 C 卡特尔 D 奥蒂斯200911 91 按测验的功能 可将测验分为 A 智力测验 B 特殊能力测验 C 人格测验 D 投射测验200911 118 按测验材料的性质 可将测验分为 A 文字测验 B 主题统觉测验 C 智力测验 D 操作测验 C C B ABC AD 真题练习 201011 107 按测验材料的性质 可将测验分为 A 文字测验 B 智力测验 C 主题统觉测验 D 操作测验201105 53 在顺序量表中 变量具有 A 相等单位 B 等级 C 绝对零点 D 可以做四则运算 AD 小结 第一节概述 第一单元测量与测量量表第二单元心理测验的基本概念第三单元心理测验的分类第四单元纠正错误的测验观第五单元心理测验在心理咨询中的应用第六单元心理测验的发展史 心理测量学 第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用 第二节测验的常模 第一单元常模团体第二单元常模的类型第三单元常模分数的表示方法 第一单元常模团体 一 常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体 或者是该群体的一个样本 用一个标准的 规范的分数表示出来 以提供比较的基础 任何一个测验都有许多可能的常模团体 第一单元常模团体 一 常模团体的性质常模的选择主要是基于对测验将要施测的总体的认识 常模团体必须能够代表该总体 常模的选择包括 确定一般总体 确定目标总体 确定样本 使用测验需要特别注意常模团体 二 常模团体的条件 一 群体的构成必须明确界定 二 常模团体必须是所测群体的代表性样本 三 样本的大小要适当在实际工作中 应从经济的或实用的可能性和减少误差这两个方面来综合考虑样本的大小 一般最低不小于30或100个 全国性常模 一般应有2000 3000人为宜 样本大小适当的关键是样本要有代表性 四 标准化样组是一定时空的产物在选择合适常模时 要注意选择较为新近的常模 三 取样的方法 取样即从目标人群中选择有代表性的样本 抽样方法有下列几种 一 简单随机抽样按照随机表顺序选择被试构成样本 二 系统抽样系统抽样要求目标总体无序可排 也无等级结构存在 三 分组抽样先将群体进行分组 再在组内进行随机取样 四 分层抽样先将目标总体按某种变量分成若干层次 再从各层次中随即抽取若干被试 最后把各层的被试组合成常模样本 四 常模分数与常模 一 常模分数常模分数就是施测常模样本被试后 将被试者的原始分数按一定规则转换出来的导出分数 由原始分数构成的分布转换而来的分数 叫导出分数导出分数具有一定的参照点和单位 它实际是一个有意义的测验量表 它与原始分数等值 有意义 等单位 带参照点 二 常模 常模分数构成的分布 就是通常所说的常模 norm 它是解释心理测验分数的基础 常模有一般常模与特殊常模之分 第二单元常模的类型 发展常模百分位常模标准分常模智商及其意义 一 发展常模 个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平 一 发展顺序量表 二 智力年龄 三 年级当量 一 发展顺序量表 最早的一个范例是格塞尔发展程序表皮亚杰最著名的工作就是对守恒概念的研究 格塞尔婴幼儿发展量表GesellDevelopmentalSchedules由美国耶鲁大学的A 格塞尔及其同事制定的婴幼儿发展测量工具 最初发表于1925年 后对它作了几次修订 先后发表于1937 1940 1947和1974年 1974年修订版的测试对象为从出生至5岁 重点是3岁以下的幼儿 测试时间约30分钟 格塞尔早期用电影记录并分析了幼儿的日常行为反应 发现了幼儿发展程序的规律 他认为 幼儿的生长发展是有次序地逐步成熟和由简易分化到精细分化 幼儿的行为在抵达某一阶段时会显示出特殊的飞跃式进展 幼儿的新行为在成熟程序上具有代表性 并反映其在生长发育上已抵达新的阶段 格塞尔称这些年龄阶段为枢纽年龄 并把测定枢纽年龄列为量表的重点检查项目和诊断标准 格塞尔量表确定 1岁内以每4周为一个阶段 而以4周 16周 28周 40周 52周作为枢纽年龄 1 3岁间则以3 6月为一个阶段 以18月 24月 36月为枢纽年龄 格塞尔婴幼儿发展量表GesellDevelopmentalSchedules其检查内容分 应人能 测试幼儿对周围人的应答能力和料理自己生活的能力 应物能 测试幼儿看物 摘物和绘画等能力 言语能 测试幼儿听 理解和言语能力 动作能 测试幼儿坐 步行和跳跃的能力 结果以发展商数评价幼儿的发展水平 格塞尔认为 所观察到的发展现象反映了中枢神经系统的成熟程序 这一理论受到各方面的肯定 格塞尔量表具有临床诊断的价值 它不仅适用于测量幼儿的发展水平 而且比其他量表更适用于伤残儿 被认为是婴幼儿智能测试的经典方法 20世纪60年代初 中国开始在临床上试用格塞尔量表 一 发展顺序量表 皮亚杰对守恒概念的研究 儿童不是时期出现不同的守恒概念5岁能理解质量守恒概念6岁掌握重量守恒概念7岁掌握容量守恒概念 二 智力年龄比内 西蒙量表中首先使用智力年龄的概念 一个儿童在年龄量表上所得的分数 就是最能代表他的智力水平的年龄 这种分数叫做智力年龄 简称智龄 直接的计算年龄常模转换 三 年级当量年级当量实际上就是年级量表 测验结果说明属哪一年级的水平 在教育成就测验中最常用 二 百分位常模 百分位常模包括百分等级和百分点 四分位数和十分位数 一 百分等级 一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比 二 百分点 百分位数 在分数量表上 相对于某一百分等级的分数点就叫百分点或百分位数 三 四分位数和十分位数 四分位数是将量表分成四等份 相当于百分等级的25 50 和75 对应的三个点分成的四段 十分位数是将一组数据由小到大 或由大到小 排序后 用9个点将全部数据分为10等份 与9个分割点上相对应的数据称为十分位数 三 标准分常模 常见的标准分数有 z分数 Z分数 T分数 标准九分数 离差智商 IQ 等 标准分数可以通过线性转换 也可以通过非线性转换得到 一 线性转换的标准分数 公式5 2 其中X为任一原始分数 为样本平均数 SD为样本标准差 Z A Bz 公式5 3 加上一个常数 A 是为了去掉负值 乘以一个常数 B 是为了使单位变小从而去掉小数点 一 线性转换的标准分数 当以50为平均数 即加上一个常数50 以10为标准差 乘以一个常数10 来表示时 通常叫做T分数 即 T 50 10 公式5 4 最早使用T分数者是麦柯尔 标准九分 十分 二十分 标准九分 量表是个9级的分数量表 它是以5为平均数 以2为标准差的一个分数量表 标准十分 平均数为5 标准差为1 5 标准二十分 平均数为10 标准差为3 使用最广 影响最大的一种常态化标准分数则是离差智商 二 非线性转换的标准分数 当原始分数不是常态分布时 也可以使之常态化 这一转换过程就是非线性的 常态化过程主要是将原始分数转化为百分等级 再将百分等级转化为常态分布上相应的离均值 并可以表示为任何平均数和标准差 计算步骤如下 1 对每个原始分数值计算累积百分比 2 在常态曲线面积表中 求出对应于该百分比的z分数 所得的z分数可将分布分成几部分 称z 分数 以区别由线性转换所求得的z分数 四 智商及其意义 若心理年龄高于其生理年龄 则智力较一般儿童高 若心理年龄低于其生理年龄 则智力较一般儿童低 但在使用中发现 单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性 一 比率智商 比率智商 IQ 被定义为心理年龄 MA 与实足年龄 CA 之比 公式5 5 由于个体心理年龄与实足年龄并不同步增长 所以比率智商并不适合于年龄较大的被试 二 离差智商 是一种以年龄组为样本计算而得的标准分数 它表示的是个体智力在年龄组中所处的位置 因而是表示智力高低的一种理想的指标 韦克斯勒将离差智商的平均数定为100 标准差定为15 公式5 6 16 50 第三单元常模分数的表示方法 一 转换表法二 剖析图将测验分数的转换关系用图形表示出来 真题练习 200705 50 常模样本量一般不小于 A 100或500 B 800或1000 C 20或25 D 30或100200705 51 维克斯勒将离差智商的平均数定位100 标准差定为 A 17 B 15 C 11 D 13200711 51 系统抽样的关键是计算 A 样本量 B 总体 C 随机数 D 组距200711 52 百分等级的55的分数表示在常模样本中有55 的人比这个分数 A 低 B 相等 C 高 D 以上都不正确200711 53 可以将测验分数的转换关系用图形表示出来 便于直观的看出被试者在各个分测验上的表现及相对位置 A 条形图 B 直方图 C 剖面图 D 饼状图 D B D A C 200806 53 是由具有某种共同特征的人所组成的一个群体 或者是该群体的一个样本 A 团体 B 常模团体 C 样本 D 受测人群200806 54 常模分数构成的分布 就是通常所说的 它是解释心理测验分数的基础 A 常模分数 B 常模 C 导出分数 D 分数200806 55 式中SD为 A 样本平均数B 任一原始分数C 样本标准差D 标准分数200806 56 韦克斯勒将离差智商的平均数定为100 标准差定为 A 16 B 15 C 14 D 13200806 57 最简单而且最基本的表示常模的方法就是 A 转换表 B 分布表 C 对照表 D 指数表 B B C C B A 200811 55 取样是指从 中选择有代表性的样本 A 总体 B 群体 C 目标人群 D 样本 200811 56 常模分数又叫 A 导出分数 B 粗分数 C 原始分数 D 总体分数200811 57 标准二十分的标准差为 A 5 B 4 C 3 D 2200811 58 韦克斯勒将离差智商的平均数定为100 标准差定为 A 16 B 15 C 14 D 13200811 105 发展顺序量表可以告诉人们某儿童的发育与其年龄相比 A 超前 B 滞后 C 正常 D 以上都不是200905 34 以50为平均数 以10为标准差表示的标准分数叫 A 标准九分数 B T分数 C 离差智商 D Z分数200905 56 随机号码表法是 A 简单随机抽样 B 系统抽样 C 分组抽样 D 分层抽样200905 76 比率智商 IQ 是 与实足年龄之比 A 生理年龄 B 真实年龄 C 心理年龄 D 智力年龄200905 105 标准分数可以通过 得到 A 线性转换 B 非线性转换 C 分析 D 变化 C A C B ABC B A C AB 200911 56 首先使用智力年龄概念的是 量表 A 比内 西蒙 B 韦克斯勒 C 斯坦福 比内 D 瑞文200911 105 属于标准分数常模的是 A 百分等级 B T分数 C 比率智商 D 离差智商20105 34 发展常模就是 A 团体的分数B 百分位数C 个人的分数D 年龄量表20105 35 在心理测验中 对于非典型群体需要制定 A 普通常模B 特殊常模C 一般常模D 发展常模20105 56 具有某种共同特征的人所组成的一个群体或者是该群体的一个样本 叫做 A 团体B 常模团体C 样本D 受测人人群20105 57 以50为平均数 以10为标准差来表示的分数 通常叫A Z分数B 标准九分数C T分数D 离差智商20105 76 解释心理测验分数的比较基础是 A 常模分数B 常模C 导出分数D 分数 A BD B B C B 20105 92 抽样的方法一般包括 A 分层抽样B 系统抽样C 分组抽样D 简单随机抽样20105 121 常模的构成要素包括 A抽样分数B原始分数C导出分数D对常模团体的具体描述201011 56 常模样本量的大小 一般最低不小于 P337 A 100或500 B 800或1000 C 20或25 D 30或100201011 57 某分数的百分等级为55 表示在常模样本中有55 的人的分数比该分数 A P340 A 低 B 相等 C 高 D 全不是201011 58 以50为平均数 以10为标准差来表示的分数通常叫 P342 A Z分数 B T分数 C 标准九分数 D 离差分数201011 59 表示的是个体智力分数在同年龄组分数分布中所处的位置 P343 A 离差智商B 比率智商C 百分等级D 标准九分数 ABCD BCD D A B A 201011 60 是将测验分数的转换关系用图形表示出来 从而可以很直观地看出披试者在各个分测验分数分布中的相对位置 P346 A 条形图 B 直方图 C 剖面图 D 散点图201011 106 标准分数可以通过 得到 P341 A 线性转换 B 非线性转换 C 求积 D 求和201105 54 由具有某种共同特征的人所组成的一个群体 或者是该群体的一个样本 称为 A 团体 B 常模团体 C 样本 D 受测人群 C AB B 小结 第二节测验的常模 第一单元常模团体第二单元常模的类型第三单元常模分数的表示方法 心理测量学 第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用 第三节测验的信度 第一单元信度的概念第二单元信度评估的方法第三单元信度与测验分数的解释第四单元影响信度的因素 补充内容 经典测验理论的基本假设 一 误差的含义和种类 一 含义测量误差指的是在测量过程中与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应 二 种类系统误差随机误差 二 误差的来源 一 测验本身引起的误差取样缺乏代表性 词语模棱两可 二 施测过程引起的误差1 主试者方面 年龄 性别 外表 动作等2 环境因素3 时间安排4 意外干扰5 记分 二 误差的来源 三 受测者本身引起的误差应试动机测验焦虑学习和训练测验经验生理状态反应定势 三 真分数 一 含义测量没有误差时所得到的真值操作性 无数次测量结果得到的平均值 二 实得分数 真分数与测量误差 三 性质一组测验分数的变异性是由测量目的有关的变异数 稳定的但出自无关来源的变异数和随机误差变异数所决定的 三 真分数 四 真分数的数学模型 五 三个假设公理若某种心理特质可以用平行测验反复测量足够多次 观察分数就会接近真分数E X T E E 0真分数与误差分数之间的相关为零 T E 0各平行测验上的误差分数之间的相关为零 E1 E2 0 三 真分数 六 平行测验如果两个题目不同的测验测的是同一种特质 并且题目的形式 数量 难度 区分度以及测查等值团体后所得分数的分布都是一致的 则这两个测验被称为平行测验 第一单元信度的概念 一 信度的定义信度是指同一被试者在不同时间内用同一测验 或用另一套相等的测验 重复测量 所得结果的一致程度 信度只受随机误差的影响 如果我们讨论一组测验分数的特性时 可用方差代表具体分数 得到与公式5 7类似的公式 式中 是测验实得分数的方差 是测验真分数的方差 是测验误差的方差 在测量理论中 信度被定义为 一组测量分数的真分数方差与总方差 实得分数的方差 的比率 即 公式5 9 由于真实分数的方差是无法统计的 因此公式5 9还可以转化为 因此 信度也可以看作在总的方差中非测量误差的方差所占的比例 二 信度的指标 一 信度系数与信度指数 公式5 11 信度指数的平方就是信度系数 二 测量标准误 误差的标准差 信度越高 标准误越小 信度越低 标准误越大 第二单元信度评估的方法 重测信度复本信度内部一致性信度评分者信度 一 重测信度 又称稳定性系数 使用同一测验 在同样条件下对同一组被试者前后施测两次测验 求两次得分间的相关系数 一般是两周到四周较宜 间隔时间最好不超过六个月 二 复本信度 以两个等值但题目不同的测验 复本 来测量同一群体 然后求得被试者在两个测验上得分的相关系数复本信度反映的是测验在内容上的等值性 故又称等值性系数 复本测验要求题目内容 数量 形式 难度 区分度 指导语 时限 例题等相同或相似 三 内部一致性信度 一 分半信度 split halfreliability 这个相关系数就代表了两半测验内容取样的一致程度 公式5 14 式中为一半分数的相关系数 为测验在原长度时的信度估计值 Howtodividethetest Random 随机法 odd even 奇偶法 1sthalfofitems lasthalfofitems 顺序法 二 同质性信度 homogeneityreliability 代表测验内部所有题目间的一致性 1 指所有题目都测的是同一种心理特质 2 指所有题目得分之间都具有较高的正相关 同质性信度就是一个测验所测内容或特质的相同程度 克伦巴赫 系数 四 评分者信度 随机抽取若干份测验卷 由两位评分者按评分标准分别给分 然后再根据每份测验卷的两个分数计算相关 即得评分者信度 一般要求在成对的受过训练的评分者之间平均一致性达0 90以上 才认为评分是客观的 斯皮尔曼等级相关 评分者信度 肯德尔和谐系数 被评者 评定者 公式中K 3 评定者数 N 6 被评者数 W 0 86 第三单元信度与测验分数的解释 解释真实分数与实得分数的相关确定信度可以接受的水平解释个人分数的意义比较不同测验分数的差异 一 解释真分数与实得分数的相关 信度系数可以解释为测验的总变异中 真分数造成的变异占百分之几 在极端的情况下 如有rxx 1 00 则表示完全没有测量误差 所有的变异均来自真实分数 若有rxx 0 则所有的变异和差别都反映的是测量误差 二 确定信度可以接受的水平 一般原则是 当rxx 0 70时 测验不能用于对个人做出评价或预测 而且不能作团体比较 当0 70 rxx 0 85时 可用于团体比较 当rxx 0 85时 才能用来鉴别或预测个人成绩或作为 三 解释个人分数的意义 两个作用其一是估计真实分数的范围 其二是了解实得分数再测时可能的变化情形 人们一般采用95 的或然率 概率 水平 其置信区间为 公式5 16 四 比较不同测验分数的差异 测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要 这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别 差异分数的标准误公式为 公式5 17 第四单元影响信度的因素 一 样本特征二 测验长度三 测验难度四 时间间隔 一 样本特征 信度常用信度系数来表示 信度系数就是相关系数 相关系数受样本是否异质及样本团体平均能力水平的影响 一 样本团体异质性的影响 二 样本团体平均能力水平的影响 样本团体异质性的影响 任何相关系数都要受到团体中分数分布的范围所影响 而分数范围与样本团体的异质程度有关 若获得信度的取样团体较为异质的话 往往会高估测验的信度 相反则会低估测验的信度 样本团体平均能力水平的影响 测验的信度还受取样不同团体间平均能力水平的不同而不同 这是因为 对于不同水平的团体 题目具有不同的难度 每个题目在难度上的微小差异累计起来便会影响信度 显而易见 每个信度系数都要求有对建立信度系数的团体的描述 在编制测验时 应把常模团体按年龄 性别 文化程度 职业等分为更同质的亚团体 并分别报告每个亚团体的信度系数 这样测验才能适用于各种团体 二 测验长度 测验长度 亦即测验的数量 也是影响信度系数的一个因素 一般来说 在一个测验中增加同质的题目 可以使信度提高 第一 测验越长 测验的测题取样或内容取样就越有代表性 第二 测验越长 被试的猜测因素影响就越小 长有时反而会引起被试的疲劳和反感而降低可靠性 K rkk 1 rxx rxx 1 rkk K为改变后的长度与原长度之比rxx为原测验的信度rkk为测验长度是原来的k倍时的信度估计 三 测验难度 难度对信度的影响 只存在于某些测验中 如智力测验 成就测验 能力倾向测验等 对于人格测验 兴趣测验 态度量表等不存在难度问题 因为这些测验的题目没有正确或错误答案之分 三 测验难度 在实际情况下 如果某个测验适用范围很广 其难度水平通常适合于中等能力水平的被试 而对较高水平和较低水平的被试可能较易或较难 使得分数分布范围缩小 信度水平降低 因此一个标准化的测验 应根据不同能力水平报告测验的难度 以作为选择测验的参考 四 时间间隔 时间间隔只对重测信度和不同时测量时的复本信度 重测复本信度 有影响 对其余的信度来说不存在时间间隔问题 真题练习 200705 52 一般要求在成对的受过训练的评分者之间平均一致性达到 以上 才认为评分是客观的 A 0 70 B 0 80 C 0 90 D 1 00200705 53 以再测法或复本法求信度 两次测验相隔时间越短 其信度系数 A 越大 B 越低 C 越小 D 不变200705 55 信度只受 的影响 A 系统误差B 随机误差C 恒定效应D 概化作用200711 54 同质性信度主要代表测验内部 间的一致性 A 两半测验B 题目与分测验 C 所有题目 D 分测验200811 59 信度只受 的影响 A 系统误差 B 随机误差 C 恒定效应 D 概化理论 C A B C B 200905 35 以再测法或复本法秋信度 两次测验相隔时间越短 其信度系数越 A 大 B 低 C 小 D 不确定200905 77 重测信度即 A 等位性系数B 稳定性系数 C 相关系数D X系数200905 92 关于心理测验 下列说法正确的是 A 测验越长 测验的测题取样或内容取样越有代表性 B 测验越长 被试者受猜测因素的影响就越小 C 测验越长 月遵循报酬递增率原则 D 测验太长 有时会引起被试者的疲劳和反感而降低可靠性200911 76 在不同时间内用同一测验重复测量同一被试者 所得结果的一致程度称为 A 信度 B 效度 C 难度 D 区分度 A B ABD A 20105 77 同质性信度主要反映测验内部 间的一致性 A两半测验B题目与分测验C所有题目D分测验与分测验201011 61 信度只受 的影响 P348A系统误差B随机误差C恒定效应D实验误差 C B 小结 第三节测验的信度 第一单元信度的概念第二单元信度评估的方法第三单元信度与测验分数的解释第四单元影响信度的因素 心理测量学 第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用 第四节测验的效度 第一单元效度的概念第二单元效度评估的方法第三单元效度的功能第四单元影响效度的因素 一 效度的定义 效度是指所测量的与所要测量的心理特点之间符合的程度 或者简单地说是指一个心理测验的准确性 在测验理论中 效度被定义为在一组测量中 与测量目标有关的方差 或称有效方差 与总方差的比率 即 公式5 21 二 效度的性质 一 效度具有相对性在评鉴测验的效度时 必须考虑其目的与功能 二 效度的性质 二 效度具有连续性测验效度通常用相关系数表示 它只有程度上的不同 而没有 全有 或 全无 的区别 因此 我们评价一个测验时 不应该说 有效 或 无效 而应该用效度较高或较低来评价 另外 效度是针对测验结果的 即测验效度是 测验结果 的有效性程度 信度和效度的关系 一 信度是效度的必要而非充分条件二 效度是受信度制约的 第二单元效度评估的方法 美国心理学会在1974年所发行的 教育与心理测量之标准 一书中将效度分为三大类 即内容效度 构想效度和效标效度 一 内容效度 一 什么是内容效度内容效度指的是测验题目对有关内容或行为取样的适用性 从而确定测验是否是所欲测量的行为领域的代表性取样 想要编制一个具有较高内容效度的测验需要对所测心理特征有明确的概念测验题目应是所界定的内容范围的代表性取样 二 内容效度的评估方法 1 专家判断法2 统计分析法3 经验推测法 1 专家判断法 请有关专家对测验题目与原定内容的符合性做出判断 看测验的题目是否代表规定的内容 又称 逻辑效度 logicalvalidity 为了使内容效度的确定过程更为客观 弥补不同专家对同一测验的判断可能不一致 可采用如下几个步骤 定义好测验内容的总体范围 描述有关的知识与技能及所用材料的来源 编制双向细目表 确定内容和技能各自所占的比例 并由测验编制者确定各题所测的是何种内容与技能 制定评定量表来测量测验的整个效度 如测验包括的内容 技能 材料的重要程度 题目对内容的适用性等 简约式命题细目表 说明 1 全卷满分100分 表中分值即为百分比 2 M为选择题 H为填空题 N为解答题 E为综合题 3 试题难度分为容易题 0 7以上 适中 0 4 0 7 难 0 4以下 三级 三种试题试题的分值比例约为5 4 1 4 考试时间120分钟 其中第I卷50分钟 第II卷70分钟 全息式命题细目表 2 统计分析法 重测信度 学习前后测验 在学习某一知识前后各做一次测验 进行比较评分者一致性信度复本信度 来自同一范围的复本测同一批被试 看其相关 3 经验推测法 即通过实践来检验效度 不同的被试团体在测验上的得分和对每题的反应有较大差异 一般总分和各题通过率随年级上升如儿童发展量表是否有效 经过对不同年龄阶段的儿童进行调查 然后分析其结果 三 内容效度的特性 内容效度与所有效度的性质一样 不是普遍适用的 而是根据具体情况分析得来 如果测验分析者和测验使用者定义的内容范围相同 则编制者报告的内容效度对使用者而言是有意义的 否则就没有意义 内容效度与表面效度 表面效度是由外行对测验作表面上的检查确定的 它不反映测验实际测量的东西 只是指测验表面上看来好像是测量所要测的东西 内容效度是由够资格的判断者 专家 详尽地 系统地对测验作评价而建立的 不过 在编制测验时 表面效度是一个必须考虑的特性 例如 最高行为的测验要求有较高的表面效度 二 构想效度 一 什么是构想效度构思效度 还有人叫结构效度 一个测验实际测到所要测量的理论结构和特质的程度 或者说分数能够说明心理学理论的某种结构或特质的程度 基本特征结构效度的大小取决于事先假定的心理结构理论 无法证实时 有可能理论有问题 二 构想效度 二 构想效度的估计方法1 对测验本身的分析 内容效度 内部一致性信度 被试对题目的反应特点 2 测验间的相互比较 相容效度 区分效度 因素分析法 3 效标效度的研究证明4 实验法和观察法证实 三 效标效度 一 什么是效标效度反映的是测验预测个体在某种情境下行为表现的有效程度 被预测的行为是检验效度的标准 简称效标 效标就是衡量一个测验是否有效的外在标准 它是独立于测验并可以从实践中直接获得的我们感兴趣的行为 根据效标资料是否与测验分数同时获得 又可分为同时效度和预测效度两类 常用效标 学业成就 等级评定 临床诊断 特殊训练成绩 实际工作表现等好的效标测量的条件 1 真实反映观念效标的重要侧面 2 效标测量必须稳定 可靠 客观 3 在有效性的前提下 效标测量要尽可能简单 省时 省力 二 效标效度的评估方法 1 相关法2 区分法3 命中率法 1 相关法 相关法是评估效标效度最常用的方法 它是求测验分数与效标资料间的相关 这一相关系数称为效度系数 2 区分法 区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法 某政府机关通过测验录用了一批公务员 经半年试用期后 根据他们的实际工作成绩 将这批公务员区分为称职和不称职两组 然后回过头来检查这两组人在测验上的分数是否有显著差异 如果差异显著 说明这个测验在录用公务员的选拔性测验中是有效的 由于统计上的显著性受到团体大小的影响 当团体较大时 平均数之间小的差异在统计上也显著 因而变得有意义了 但实际上测验很难将这两个团体的人区分开 为避免这个缺点 还要看这两个团体分布的重迭量 这里有两个指标 一个是其中一组内被试得分超过另一组平均数的人数与另一组中被试超过其平均数的人数比率 如果比率小 说明两组差异大 测验是有效的 另一个指标是看两组分数分布共同区域的百分比例 如果百分比例不大 说明两组差异显著比较可信 测验是有效的 3 命中率法 命中率法是当测验用来做取舍的依据时 用其正确决定的比例作为效度指标的一种方法 使用命中率法 可将测验分数和效标资料分为两类 在测验分数方面是确定一个临界分数 即分数线 高于临界分数者预测其成功 低于临界分数者预测其失败 第三单元效度的功能 一 预测误差效度系数常常以决定性系数来表示 意旨相关系数的平方 它表示测验正确预测或解释的效标的方差占总方差的比例 第三单元效度的功能 二 预测效标分数 公式5 26 byx rxy sy sxa byxX三 预测效度指数E值大小表明使用测验比盲目猜测能减少多少误差E 100 1 K k 第四单元影响效度的因素 一 测验本身的因素二 测验实施中的干扰因表三 样本团体的性质四 效标的性质 一 测验本身的因素 1 测验材料必须对整个内容具有代表性 2 测题设计时应尽量避免容易引起误差的题型 如是非题 3 测题难度要适中 具有较高的区分度 4 测验长度要恰当 即要有一定的测题量 5 测题的排列按先易后难顺序 二 测验实施中的干扰因表 一 主试的影响因素标准化预测效度的时间间隔测验情境 二 被试的影响因素 三 样本团体的性质 一 样本团体的异质性如果其他条件相同 样本团体越同质 分数分布范围越小 测验效度就越低 二 干涉变量年龄 性别 教育水平 智力 动机 兴趣 职业和任何有关的特征不同 同一测验的效度也会有很大不同 四 效标的性质 效标与测验分数之间的关系是否线形皮尔逊积差相关系数的前题是假设两个变量的关系是线性的分布 效标测量的可靠性即效标测量的信度 真题练习 200705 105 内容效度的评估方法有 A专家判断法B双向细目表法C统计分析法D经验推测法200711 102 效度具有相对性 因此在评鉴测验的效度时 必须考虑测验的 A 信度 B 目的 C 功能 D 长度200711 103 同200705 105200711 104 测验实施中的干扰因素包括 A 主试者的影响因素 B 测验情景 C 被试者的影响因素 D 其他干扰因素200711 105 构想效度的估计方法包括 A 对测验本身的分析 B 测验间的相互比较 C 效标效度的研究证明 D 实验法和观察法证实200806 58 效标与测验分数之间的相关 用皮尔逊积差相关系数的前提是假设两个变量的关系是 的分布 A 非线性 B 线性 C 抛物线 D 正态曲线 ACD BC ABCD ABCD B 200806 107 信度与效度的关系可表述为 A 信度是效度的必要而充分条件B 信度是效度的充分条件C 信度是效度的必要而非充分条件D 效度是受信度制约的200806 108 根据效标资料是否与测验分数同时获得 可将效标效度分为 A 相容效度 B 区分效度 C 同时效度 D 预测效度200811 60 在心理测验中 效度是指一个心理测验的 A 稳定性 B 准确性 C 可信度 D 区分性200905 57 检验测验分数能否有效地划分由校标所定义的团体的一种方法是 A 相关法 B 区分法 D 命中率法 D 失误法200905 119 同200705 105200911 35 测验题目对有关行为取样的适用性是 A 内容效度 B 构想效度 C 效标效度 D 区分效度201005 107 同200711 102201011 104 效标效度可分为 P363 A 相容效度 B 区分效度 C 同时效度 D 预测效度105 同200711 102 CD CD CD B B A CD 201105 57 在心理测验中 效度是指所测量的与所要测量的心理特点之间符合的程度 或者简单地说是指一个心理测验的 小结 第四节测验的效度 第一单元效度的概念第二单元效度评估的方法第三单元效度的功能第四单元影响效度的因素 心理测量学 第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用 第五节项目分析 项目分析就是对组成测验的每个测题进行分析 项目分析包括定性分析和定量分析 定性分析 内容效度 题目编写的恰当性和有效性 定量分析 题目的难度和区分度 项目分析的应用对项目进行编制 筛选和修订 可以提高测验的信度和效度试题库 计算机自适应考试 第一单元项目的难度 一 定义 难度 difficulty 顾名思义 是指项目的难易程度 难度的指标通常以通过率表示 即以答对或通过该题的人数百分比来表示 公式5 31 通过人数越多 即P值越大 难度越低 二 计算方法 一 二分法记分的项目 公式5 32 二 非二分记分的项目 公式5 34 三 难度水平的确定 一 项目的难度选择题目时 最好使试题的平均难度接近0 50 而各题难度在0 50士0 20之间 选拔测验一般难度接近录取率速度测验 难度测验 一般都应防止被试得满分 因为满分的意义是不明确的选择题的难度应大于概率水平是非题0 75最为合适 四选一的0 63最为合适 三 难度水平的确定 二 测验的难度如果被试样本具有代表性 对于中等难度的测验 其测验总分应该接近常态分配 第二单元项目的区分度 一 定义 项目区分度 itemdiscrimination 也叫鉴别力 是指测验项目对被试的心理特性的区分能力 具有良好区分度的项目 能将不同水平的被试区分开来 区分度 D 的范围在 1 00至1 00之间 有积极区分 消极区分和无区分作用三种类型 二 计算方法 一 鉴别指数 二 相关法 一 鉴别指数 根据测验总分取两端的人作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论