已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 1 页 共 16 页 心理测量学知识复习概要心理测量学知识复习概要 第一节第一节 概概 述述 324 第一单元第一单元 测量与测量量测量与测量量 表表 324 一 什么是测量一 什么是测量 对测量的描述正确的是 测量就是依据一定的法则法则用数字数字对事物事物加以确定 测量的元素元素包括 法则 数字 事物 测量所用数字具有自然数的特点 即具有 区分性 等级性 等距性 可加性 二 测量要素二 测量要素 任何测量都应该具备的要素是 参照点 单位 一 参照点 一 参照点 参照点就是确定事物的量时 计算的起点起点 参照点有两种 即 绝对零点 相对零 点 参照绝对零点可加减乘除 参照相对零点只能加减 心理测量参照相对零点 二 单位 二 单位 好的单位必须具备两个条件 确定的意义 相同的价值 心理现象既没有确定的意义 也没有相同的价值 心理测验的结果是有误差的 要用区间来解释 而不是用点来解释 三 测量量表三 测量量表 定义 在一个定有单位和参照点的连续体上把事物的属性表现出来 这个连续体称为量表量表 斯蒂文斯 S S Stevens 将测量从低级到高级分成 4 种水平 命名量表 顺序量表 等距量表 等比量表 一 命名量表 一 命名量表 是测量水平最低的量表形式 只是用数字来代表事物或把事务归类 用 1 代表男 用 2 代表女等等 这样的量表通常叫命名命名量表 二 顺序量表 二 顺序量表 比命名量表水平高 数字不仅指明类别 同时指明类别的大小或属性程度 我们通常 将学生的考试结果按名次排队 这些名次属于顺序顺序变量 在顺序量表中 变量具有等级等级 三 等距量表 三 等距量表 比顺序量表进一步 有相等的单位 其数值可以相互做加减加减运算 但没有绝对零点 因此不能做乘除运算 0 并不意味着没有温度 这种说法对对 四 等比量表 四 等比量表 最高水平量表 有相等单位又有绝对零点 所得的数字可以做加减乘除运算 其数值 可以进行加 减 乘 除运算的量表是等比变量等比变量 一般说来 心理测量是在顺序量表顺序量表上进行的 主要用于分等级和排序 斯蒂文斯的斯蒂文斯的 4 4 种量表 水平从低到高 种量表 水平从低到高 属属 性性 水平水平量表量表 大小关系大小关系相等单位相等单位绝对零点绝对零点 可进行可进行 1命名量表无无无标记和分类 2顺序量表有无无分等级和排序 3等距量表有有无加减运算 4等比量表有有有加减乘除运算 第二单元第二单元 心理测验的基本概心理测验的基本概 念念 327 一 心理测验的定义一 心理测验的定义 正确的说法是 心理测验 就是依据心理学理论 使用一定的操作程序 通过观察人的少数有心理测验 就是依据心理学理论 使用一定的操作程序 通过观察人的少数有 代表性的行为 对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手代表性的行为 对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手 段段 二 心理测验的性质二 心理测验的性质 心理测验具有独特的性质 即具有 间接性 相对性 客观性 相对性相对性属于心理测验的重要性质 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 2 页 共 16 页 影响心理测量客观性的要素是 测验刺激的客观性 对反应的量化的客观性 对测验结果的推论的 客观性 测验的客观性不包括绝对的标准绝对的标准的客观性 第三单元第三单元 心理测验的分心理测验的分 类类 328 一 按测验的功能分类一 按测验的功能分类 按测验的功能进行分类 可将测验分为 智力测验 特殊能力测验 人格测验 二 按测验材料的性质分类二 按测验材料的性质分类 按测验材料的性质分类 可将测验分为 文字测验 操作测验 三 按测验材料的严谨程度分类三 按测验材料的严谨程度分类 按测验材料的严谨程度分类 可将测验分为 客观测验 投射测验 刺激没有明确意义 对被试反应没有明确规定的心理测验 称之为投射测验投射测验 投射测验的主要特点是刺激 材料的意义是不明确的 四 按测验的方式分类四 按测验的方式分类 按测验的方式分类 可将测验分为 个别测验 团体测验 团体测验始于第一次世界大战 陆军甲种和乙种智力测验是第一个团体测验 五 按测验的要求分类五 按测验的要求分类 按测验的要求分类 可将测验分为 最高作为测验 典型行为测验 心理测验的分类心理测验的分类 分类原则分类原则测验种类测验种类测验实例测验实例 按功能分类按功能分类 智力测验智力测验 特殊能力测验特殊能力测验 人格测验人格测验 比内一西蒙智力测验 斯坦福一比内智力量表 韦氏儿 童成人智力量表 升学 职业指导 特殊工种人员筛选 临床较少 MMPI 16PF EPQ 罗夏 主题统觉 TAT 0308 3 191 按材料性质分类按材料性质分类 文字测验文字测验 操作测验操作测验 MMPI EPQ 16PF 韦氏智力量表中的言语量表 罗夏 TAT 瑞文测验 韦氏智力量表中的操作量表 按材料严谨程度分类按材料严谨程度分类 客观测验客观测验 投射测验投射测验 绝大多数心理测验均属此类 罗夏 主题统觉 自由联想 句子完成 按方式分类按方式分类个别测验个别测验比内一西蒙智力量表 韦氏智力量表 不能用于团体 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 3 页 共 16 页 团体测验团体测验陆军甲种乙种测验 教育成就测验 团体测验可个别实 施 如 MMPI EPQ 16PF 等 按要求分类按要求分类 最高作为测验最高作为测验 典型行为测验典型行为测验 智力测验 成就测验均属最高作为测验 各种人格测验均属典型行为测验 第四单元第四单元 纠正错误的测验纠正错误的测验 观观 330 一 错误的测验观一 错误的测验观 错误的测验观包括 测验万能论 测验无用论 心理测验即智力测验 错误的测验观不包括 以上一个也不是以上一个也不是 二 正确的测验观二 正确的测验观 正确的测验观包括 习题 习题 137 心理测验是重要的心理学研究方法之一 是决策的辅助工具 心理 测验作为研究方法和测量工具尚不完善 第五单元第五单元 心理测验在心理咨询中的应心理测验在心理咨询中的应 用用 331 我国目前心理门诊中运用较多的心理测验有 智力测验 人格测验 心理评定量表 一 智力测验一 智力测验 我国修订后的韦氏智力量表包括 WAIS RC C WISC C WYCS1 二 人格测验二 人格测验 三 心理评定量表三 心理评定量表 第六单元第六单元 心理测验的发展心理测验的发展 史史 332 一 科学心理测验的产生与发展一 科学心理测验的产生与发展 英国生物学家和心理学家高尔登高尔登 F Galton 的主要贡献有 提出人的不同气质特点和智能是按身体特 点的不同而遗传的 为了研究差异的遗传性 设计了测量差异的方法 为心理测验奠定了统计学基础 第 一个提出了相关的概念 美国心理学家卡特尔卡特尔 J M Cattell 对促进心理测验发展做出的巨大贡献是 使心理测验首次出现于 心理学文献中 认为心理学应立足于实验和测验 认为心理测验应有统一的标准 比内比内 A Binet 编制了世界上第一个正式的心理测验 20 世纪以后 心理测验在如下几方面取得了长足发展 操作测验 团体智力测验 能力倾向测验 人格测验 20 世纪在智力测验方面的新发展是研发了 罗夏测验 团体测验 操作测验 投射测验 P335 有关心理测验的发展史 正确的描述是中国的科举制度是世界上较早的心理测验的实践 二 现代心理测验在我国的发展二 现代心理测验在我国的发展 近些年来 我国心理学家正在致力于心理测验的本土化研本土化研究 第二节第二节 测验的常测验的常 模模 335 第一单元第一单元 常模团常模团 体体 335 一 常模团体的性质一 常模团体的性质 常模团体常模团体是由具有某种共同特征的人所组成的一个群体 或者是该群体的一个样本 常模团体的选择一般包括 确定一般总体 确定目标总体 确定样本 二 常模团体的条件二 常模团体的条件 常模团体的条件包括 群体构成的明确界定 对群体具有代表性 样本量大小要适当 具有新近 性 标准化样组是一定时空的产物 抽样方法抽样方法不是常模团体的条件 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 4 页 共 16 页 一 群体的构成必须明确界定 一 群体的构成必须明确界定 二 常模团体必须是所测群体的代表性样本 二 常模团体必须是所测群体的代表性样本 三 样本大小要适当 三 样本大小要适当 实际工作中 样本量大小适当须从如下几方面考虑 经济 实用 减少误差 常模样本量的大小 一般最低不小于 30 或或 100 全国性常模 样本量一般要在 2000 3000 之间 样本 大小适当的关键是样本要有代表性代表性 四 标准化样组是一定时空的产物 四 标准化样组是一定时空的产物 三 取样的方法三 取样的方法 抽样的方法一般有 简单随机抽样 系统抽样 分组抽样 分层抽样 取样是指从目标人群目标人群中选择有代表性的样本 随机号码表法是简单随机抽样简单随机抽样 系统抽样要求 目标总体无序可排 无等级结构存在 系统抽样法的关键是计算组距组距 先将群体分组 再在组内进行随机取样的方法是分组抽样分组抽样 四 常模分数与常模四 常模分数与常模 一 常模分数 一 常模分数 定义 常模分数就是施测常模样本被试后 将被试者的原始分数按一定规则转换出来的导出分数导出分数 常模分数又叫导出分数导出分数 导出分数的特性 与原始分数等值 具有意义 等单位 具有参照点 二 常模 二 常模 常模分数构成的分布 就是通常所说的常模常模 它是解释心理测验分数的基础 对于某些特殊的群体来说 情况很具体而特殊 我们就需要制定特殊常模特殊常模 常模表示一种最简单 最基本的且常用的呈现常模资料的方法 它的构成要素为 原始分数 导出分 数 对常模团体的有关具体描述 第二单元第二单元 常模的类常模的类 型型 339 一 发展常模一 发展常模 发展常模就是年龄量表年龄量表 在年龄年龄量表中 个人的分数指出了他的行为在按正常途径发展方面处于什么样的 发展水平 一 发展顺序量表 一 发展顺序量表 发展顺序量表可以告诉人们某儿童的发育与其年龄相比 超前 滞后 正常 最早的一个发展顺序量表的范例是葛塞尔葛塞尔发展程序表 葛塞尔发展程序表 其中按月份显示儿童在如下几方面的大致发展水平 运动水平 适应性 语言 社会性 按照葛塞尔研究的婴儿行为变化的顺序 16 周的婴儿能使头保持平衡 皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展 尤其注重某些特殊概念的形成 其中最著名的 工作就是对守恒守恒概念的研究 皮亚杰发现 儿童在不同时期出现不同的守恒概念 通常儿童到 5 岁时才会理解质量守恒 6 岁时才会掌 握重量守恒 7 岁时才具有容量守恒概念 发展量表中的年龄量表最基本的假设是所测量的特质随年龄有系统地改变 所以 它的基本要素是 一 组可以区分不同年龄组的题目 一个常模团体 常模表 最直观的发展常摸是发展顺序量表发展顺序量表 二 智力年龄 二 智力年龄 比内一西蒙比内一西蒙量表中首先使用智力年龄的概念 一个儿童在年龄量表上所得的分数 就是最能代表他的智力水平的年龄 这种分数叫智力年龄智力年龄 简称智龄智龄 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 5 页 共 16 页 在吴天敏修订的比内一西蒙量表中 某儿童通过了 4 岁组的全部题目 5 岁组通过 3 题 6 岁组通过 2 题 7 岁组通过 1 题 其智龄为 5 岁岁 用陆志韦修订的比内 西蒙量表做测验 某儿童 6 岁组题目全部通过 7 岁 组通过 4 题 8 岁组通过 3 题 9 岁组通过 2 题 其智龄为 7 岁岁 6 个月个月 三 年级当量 三 年级当量 常模样本中 6 年级的算术平均分为 35 某儿童在算术测验中得 35 分 那就是说 该儿童的算术年级当量 是 6 年级水平年级水平 二 百分位常模二 百分位常模 百分位常模包括 百分等级 百分点 四分位数 十分位数 一 百分等级 一 百分等级 一个测验分数的百分等级是指在常模样本中低于低于这个分数的人数百分比 55 的百分等级表示在常模样本中有 55 的人比这个分数低低 王红在 30 名同学中物理成绩是 80 分 排列第五名 则其百分等级为 85 二 百分点 二 百分点 在分数量表上 相对于某一百分等级的分数点就叫百分点百分点或百分位数百分位数 高考的最高分为 650 其百分等级为 100 最低分为 105 分 百分等级为 1 要录取 20 的学生进入大学 百分等级为 80 的百分位数 540 三 四分位数和十分位数 三 四分位数和十分位数 四分位数是将量表分成四等份 相当于百分等级的 25 50 和 75 对应的三个百分数分成的四段 十分位数 1 10 为第一段 三 标准分常模三 标准分常模 标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表 因为它的基本单位是标准差 所以叫标准分数 常见的标准分数有 Z 分数和 Z 分数 T 分数 标准九分数 离差智商 标准分数可以通过线性转换线性转换和非线性转换非线性转换得到 一 线性转换的标准分数 一 线性转换的标准分数 Z X SD 式中 SD 为样本标准差样本标准差 X 为任一原始分数 为样本平均数 XX Z A BZ 式中 Z 为转换后的标准分数 A B 为根据需要指定的常数 加上一个常数是为了去掉负值负值 乘 以一个常数是为了使单位变小从而去掉小数点 二 非线性转换的标准分数 二 非线性转换的标准分数 当原始分数不是常态分布时 也可以使之常态化 这一转换过程是非线性的非线性的 常态化常态化过程主要是将原始分数转化为百分等级 再将百分等级转化为常态分布上相应的离均值 并可以表 示为任何平均数和标准差 当以 50 为平均数 以 10 为标准差来表示时 通常叫 T 分数分数 最早使用 T 分数者是麦柯尔麦柯尔 注 未见教材中描述 标准九分是一种标准分数系统 其量表是个 9 级的分数量表 它是以 5 为平均数 以 2 为标准差的一个 量表 标准十分 平均数为 5 标准差为 1 5 标准二十分 平均数为 10 标准差为 3 常用标准分数常用标准分数 标准分数标准分数平均数平均数标准差标准差 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 6 页 共 16 页 分数 分数样本平均数样本平均数样本标准差样本标准差 SDSD 分数 分数5010 标准九分标准九分52 标准十分标准十分5 51 5 标准二十分标准二十分103 离差智商离差智商10015 韦氏 韦氏 四 智商及其意义四 智商及其意义 若儿童的心理年龄高于其生理年龄 则智力较一般儿童高 若心理年龄低于其生理年龄 则智力较一般儿 童低 但在实践中发现 单纯用心理年龄来表示智力高低的方法缺乏不同年龄年龄儿童间的可比性 一 比率智商 一 比率智商 比率智商 IQ 被定义为心理年龄心理年龄与实足年龄之比 比率智商的计算公式是 IQ MA CA 100 不符合比率智商含义的说法是 心理年龄除以实足年龄所得的商数 实足年龄除以心理年龄所得的商 数 被试成绩与平均数之差除以标准差所得的商数 被试成绩除以标准差所得的商数 由于个体智力增长是一个由快到慢再到停止的过程 即心理年龄与实足年龄不同步不同步增长 所以比率智商并 不适合于年龄较大的被试者 二 离差智商 二 离差智商 韦克斯勒将离差智商的平均数定为 100 标准差定为 15 离差智商的优点是 建立在统计学的基础之上 表示的是个体智力在年龄组中所处的位置 表示的 是智力高低的一种理想的指标 离差智商离差智商表示的是个体智力在年龄组中所处的位置 IQ 100 十 15Z 100 十 15 X SD 是离差智商离差智商的计算公式 X 从不同测验获得的离差智商只有当标准差标准差相同或接近时才可以比较 两种智商及其计算公式两种智商及其计算公式 智智 商商计算公式计算公式 比 率 智 商IQ MA CA 100 离差智商 韦氏 IQ 100 十十 15 X SDX 第三单元第三单元 常模分数的表示方常模分数的表示方 法法 345 一 转换表法一 转换表法 最简单而且最基本的表示常模的方法就是转换表转换表 有时也叫常模表 测验的使用者利用转换表转换表可将原始分数转换为与其对应的导出分数 从而对测验的分数做出有意义的解释 二 剖面图法二 剖面图法 剖面图剖面图是将测验分数的转换关系用图形表示出来 从而可以很直观地看出被试者在各个分测验上的表现及 其相对的位置 第三节第三节 测验的信测验的信 度度 348 第一单元第一单元 信度的概信度的概 念念 348 一 信度的定义一 信度的定义 信度信度是指在不同时间内用同一测验 或用另一套相等的测验 重复测量同一被试者 所得结果的一致程度 信度只受随机误差随机误差的影响 在测量理论中 信度被定义为 一组测量分数的真分数方差与总方差 实得分数的方差 的比率 即 rxx ST2 Sx2 二 信度的指标二 信度的指标 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 7 页 共 16 页 一 信度系数与信度指数 一 信度系数与信度指数 公式rxx rxT2 ST2 Sx2和公式rxT Sr Sx 表明信度指数的平方平方就是信度系数 二 测量标准误 二 测量标准误 SE Sx公式中 SE 为测量的标准误 Sx 是所得分数的标准差 rxx为测验的信度系数 从公式中可xxr 1 以看出 测量的标准误与信度之间的关系是 信度越低 标准误越大 信度越高 标准误越小 第二单元第二单元 信度评估的方信度评估的方 法法 349 估计信度的方法一般有 重测信度 复本信度 内部一致性信度 评分者信度 一 重测信度一 重测信度 使用同一测验 在同样条件下对同一组被试者前后施测两次测验 求两次得分间的相关系数 叫重测信度重测信度 又称稳定性系数稳定性系数 用重测法估计信度 最适宜的时距随测验的目的 性质和被试者的特点而异 一般是 2 4 周较宜 间隔 时间最好不超过 6 个月 二 复本信度二 复本信度 复本信度又称等值性系数 它是以两个等值但题目不同的测验 复本 来测量同一群体 然后求得被试者 在两个测验上得分的相关系数 复本信度反映的是测验在内容内容上的等值性 如果复本信度考虑到两个复本实施的时间间隔 并且两个复本的施测相隔一段时间 则称 重测复本信 度 稳定与等值系数 复本信度的缺点有 如果测量的行为易受练习的影响 则复本信度只能减少而不能完全消除这种影响 由于第二个测验只改变了题目的内容 已经掌握的解题原则可以很容易地迁移到同类问题 对于许多测验 来说 建立复本是十分困难的 三 内部一致性信度三 内部一致性信度 一 分半信度 一 分半信度 分半信度通常是在测验实施后将测验按奇 偶数分为等值的两半 并分别计算每位被试者在两半测验上的 得分 求出这两半分数的相关系数 这个相关系数就代表了两半测验两半测验内容取样的一致程度 斯皮尔曼一布朗公式rxx 2rhh 1 rhh 式中rhh为一半分数一半分数的相关系数 rxx为测验在原长度时的信 度估计值 二 同质性信度 二 同质性信度 同质性信度主要代表测验内部所有题目所有题目间的一致性 K R20公式 K R21公式有别于克伦巴赫 a 系数的是 它们只能用于是非题是非题 四 评分者信度四 评分者信度 一般要求在成对的受过训练的评分者之间平均一致性达到 0 90 以上 才认为评分是客观的 正确的描述是 随机抽取若干份测验卷 由两位评分者按评分标准分别给分 然后再根据每份测验卷的 两个分数计算相关 即得评分者信度 所有题目看起来好像测量同一特质 但相关很低或为负相关时 则测 验为异质的 人的多数心理特征如智力 性格 兴趣等 具有相对的稳定性 间隔一段时间 不会有很大变 化 不同的信度反映测验误差的不同来源 第三单元第三单元 信度与测验分数的解信度与测验分数的解 释释 352 一 解释真实分数与实得分数的相关一 解释真实分数与实得分数的相关 rxx 为信度系数 下列情况属于极端情况 rxx 0 rxx 1 00 二 确定信度可以接受的水平二 确定信度可以接受的水平 确定可以接受的信度水平的一般原则是 当rxx 0 70 时 测验不能用于对个人做出评价或预测 而且 不能作团体比较 0 70 rxx 0 85 时 可用于团体比较 rxx 0 85 可用于个人和团体 三 解释个人分数的意义三 解释个人分数的意义 信度系数在解释个人分数的意义时的作用是 估计真实分数的范围 了解实得分数再测时可能的变化 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 8 页 共 16 页 情形 大约有 95 的可能性真分数落在所得分数 1 96SE 的范围内 或有 5 的可能性落在范围之外 的描 述 其置信区间为 X 1 96SE XT T X 1 96SE 四 比较不同测验分数的差异四 比较不同测验分数的差异 甲被试在韦氏成人智力测验中言语智商为 102 操作智商为 110 已知两个分数都是以 100 为平均数 15 为标准差的标准分数 假设言语测验和操作测验的分半信度分别为 0 87 和 0 88 那么甲被试的操作智商不显不显 著高著高于言语智商 第四单元第四单元 影响信度的因影响信度的因 素素 354 一 样本特征一 样本特征 一般而言 若获得信度的取样团体较为异质的话 往往会高估高估测验的信度 二 测验长度二 测验长度 一般来说 在一个测验中增加同质的题目 可以使信度提高 下列描述中正确的是 测验越长 测验的 测题取样或内容取样就越有代表性 测验越长 被试者受猜测因素的影响就越小 测验太长 有时反而会 引起被试者的疲劳和反感而降低可靠性 一个包括 40 个题目的测验信度为 0 80 欲将信度提高到 0 90 通过斯皮尔曼一布朗公式的导出公式计 算出至少应增加 50 个题数 教材 教材 P355P355 和习题 和习题 7474 均错 均错 K 0 9 1 0 8 0 8 1 0 9 2 25 即要取得 0 9 的信度 测验长度应为原来的 2 25 倍 而不是 2 5 倍 即需增加 40 2 25 40 50 习题 74 的正确选 择应为 姜长青 三 测验难度三 测验难度 对于不同平均能力水平的团体 题目的难度难度会影响信度系数 洛德 Lord 提出在学绩测验中 为了保证其可靠性 各类选择题的理想平均难度为 五择一测题 0 70 四择一测题 0 74 三择一测题 0 77 二择一题 0 85 四 时间间隔四 时间间隔 以再测法或复本法求信度 两次测验相隔时间越短 其信度系数越大大 第四节第四节 测验的效测验的效 度度 357 第一单元第一单元 效度的概效度的概 念念 357 一 效度的定义一 效度的定义 在心理测验中 效度是指所测量的与所要测量的心理特点之间符合的程度 或者简单地说是指一个心理测 验的准确性准确性 在测验理论中 效度被定义为在一组测量中 与测量目标有关的真实方差 或称有效方差 与总总方差的比 率 二 效度的性质二 效度的性质 效度具有两个性质 相对性 连续性 效度具有相对性 因此 在评鉴测验的效度时 必须考虑测验的目的目的与功能功能 专栏专栏 5 4 信度和效度的关系信度和效度的关系 信度与效度的关系可表述为 信度是效度的必要而非充分条件 效度是受信度制约的 第二单元第二单元 效度评估的方效度评估的方 法法 359 美国心理学会在 1974 年发行的 教育与心理测量之标准 一书中将效度分为几个大类 即 内容效度 构想效度 效标效度 一 内容效度一 内容效度 一 什么是内容效度 一 什么是内容效度 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 9 页 共 16 页 内容效度内容效度指的是测验题目对有关内容或行为取样的适用性 从而确定测验是否是所欲测量的行为领域的代 表性取样 二 内容效度的评估方法 二 内容效度的评估方法 内容效度的评估方法有 专家判断法 统计分析法 经验推测法 1 专家判断法 专家判断法 专家判断法 就是请有关专家对测验题目与原定内容的符合性做出判断 看测验的题目是否代表规定的内 容 如果专家认为测验题目恰当地代表了所测内容 则测验具有内容效度 因此 内容效度有时又称逻辑效度逻辑效度 为了使内容效度的确定过程更为客观 弥补不同专家对同一测验的判断可能不一致 可采用的步骤是 定义好测验内容的总体范围 编制双向细目表 制定评定量表来测量测验的整个效度 2 统计分析法 统计分析法 除了描述性语言外 内容效度的确定也可采用一些统计分析方法 如 计算两个评分者一致性 复本 相关 再测法 3 经验推测法 经验推测法 三 内容效度的特性 三 内容效度的特性 在编制测验时 效度是重要的要考虑的特性 如果是编制最高行为测验 除了内容效度 也要求有较高的较高的 表面效度表面效度 相反 典型行为测验却要求较低的表面效度 二 构想效度二 构想效度 一 什么是构想效度 一 什么是构想效度 构想效度是 构思效度 结构效度 主要涉及的是心理学的理论概念问题 指测验能够测量到理 论上的构想或特质的程度 测验的结果是否能证实或解释某一理论的假设 术语或构想 解释的程度如何 二 构想效度的估计方法 二 构想效度的估计方法 构想效度的估计方法包括 对测验本身的分析 测验间的相互比较 效标效度的研究证明 实验 法和观察法证实 1 对测验本身的分析 对测验本身的分析 可以作为构思效度证据的有 测验的内容效度 测验的内部一致性指标 分析被试者对题目的反应 特点 2 测验间的相互比较 测验间的相互比较 可以作为构思效度的测验间比较的有 相容效度 区分效度 因素分析法 计算两种测验之间得分的相关 其中一种测验是待研究效度的 另一种是已有效度证据的成熟的测验 但 两者测量的是同一种心理特质 假如相关高 说明新测验所测量的特质确实是老测验所反映的特质或行为 这 种方法叫相容效度相容效度 3 效标效度的研究证明 效标效度的研究证明 4 实验法和观察法证实 实验法和观察法证实 三 效标效度三 效标效度 一 什么是效标效度 一 什么是效标效度 又称实证效度 效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度 它可分为 同时 效度 预测效度 在检验一个测验的效标效度时 难点在于找到合适的效标 因此效标的选择至关重要 一个好的效标必须 具备如下条件 效标必须能最有效地反映测验的目标 即效标测量本身必须有效 效标必须具有较高的信 度 稳定可靠 不随时间等因素而变化 效标可以客观地加以测量 可用数据或等级来表示 效标测量的 方法简单 省时省力 经济实用 二 效标效度的评估方法 二 效标效度的评估方法 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 10 页 共 16 页 效标效度的主要评估方法有 命中率法 区分法 相关法 1 相关法 相关法 相关法是求测验分数与效标资料间的相关 这一相关系数称为效度系数 根据变量的不同 可选用的计算 方法有 积差相关法 点二列相关公式 二列相关公式 贾斯朋 Juspen 多系列相关公式 2 区分法 区分法 区分法区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法 3 命中率法 命中率法 命中率法是当测验用来做取舍的依据时 用其正确决定的比例作为效度指标的一种方法 命中的情况是指 预测成功而且实际也成功 预测失败且实际上也失败 第三单元第三单元 效度的功效度的功 能能 365 一 预测误差一 预测误差 效度系数的实际意义常常以决定系数来表示 如测验的效度是 0 80 则测验的总方差中有 64 的方差是 测验分数的方差 如果某测验的效度是 0 70 则在测验中无法作出正确预测的比例是 0 51 Sest Sy中 rxy2代表效度系数的平方 即决定系数决定系数 Sy为效标成绩的标准差 1 2 xyr 二 预测效标分散二 预测效标分散 Y a bxy 式中 Y 是预测的效标分数预测的效标分数 三 预测效标指数三 预测效标指数 预测效率指数 E 值的大小表明使用测验比盲目猜测能减少多少误差 如一个测验的效度系数为 0 80 E 40 这表明由于该测验的使用 使得我们在估计被试者的效标分数时减少了 40 的误差 第四单元第四单元 影响效度的因影响效度的因 素素 366 一 测验本身的因素一 测验本身的因素 要保证测验具有较高效度 测验本身的因素要做到 测验材料必须对整个内容具有代表性 测题设计 时应尽量避免容易引起误差的题型 如是非题 测题难度要适中 具有较高的区分度 测验长度要恰当 测题的排列应先易后难 二 测验实施中的干扰因素二 测验实施中的干扰因素 测验实施中的干扰因素包括 主试者的影响因素 测验情境 其他干扰因素 被试者的影响因素 三 样本团体的性质三 样本团体的性质 一 样本团体的异质性 一 样本团体的异质性 如果其他条件相同 样本团体越同质 分数分布范围越小 测验效度就越低低 二 干涉变量 二 干涉变量 样本团体的性质包括年龄 性别 教育水平 智力 动机 兴趣 职业和任何有关的特征 由于这些特征 的影响 使得测验对于不同的团体具有不同的预测能力 故测量学上称这些特征为干涉变量干涉变量 美国心理学家吉赛利 E E Ghiselli 提出了如何找出干涉变量的一套方法 它们是 用回归方程求得每个人的预测效标分数 将该分数与实际效标分数相比较 获得差异分数 D 如果 D 的绝对值很大 说明测验中可能存在干涉变量 根据样本团体的组成分析 找出对照组 分别计算效度 从而找出干涉变量 对于欲测团体 根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体 对于预测性 高的团体 获得的测验效度会有所提高 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 11 页 共 16 页 四 效标的性质四 效标的性质 效标与测验分数之间的相关 用皮尔逊积差相关系数的前提是假设两个变量的关系是线性线性的分布 效标测量本身的可靠性如何亦是值得考虑的一个问题 效标测量的可靠性即效标测量的信度信度 第五节第五节 项目分项目分 析析 368 一般来说 测验的项目分析包括定性定性分析和定量定量分析 项目的定性分析包括考虑项目的内容效度 题目编写的恰当性恰当性和有效性有效性等 第一单元第一单元 项目的难项目的难 度度 368 一 定义一 定义 难度是指项目的难易程度 用 P 代表 P 值越大大 难度越低 在能力测验中通常反映难度水平的指标 在非能力测验 如人格测验 中 类似的指标称通俗性通俗性 在 200 个学生中 答对某项目的人数为 120 人 则该项目的难度为 0 6 二 计算方法二 计算方法 一 二分法记分的项目 一 二分法记分的项目 计算项目难度的公式如下 P R N 100 P PH PL 2 P X Xmax 100 在 370 名被试者中 选为高分组和低分组的被试者各有 100 人 其中高分组有 70 人答对第 1 题 低分组 有 40 人答对第 1 题 则第 1 题的难度为 0 55 吉尔福特为了平衡机遇对难度的影响 提出的难度校正公式是 Cp KP 1 K 1 二 非二分记分的项目 二 非二分记分的项目 数学测验的第 7 题满分为 15 分 该题考生的平均得分为 9 6 分 则该题的难度为 0 64 三 难度水平的确定三 难度水平的确定 一 项目的难度 一 项目的难度 难度 P 值越接近于 0 或接近于 1 越无法区分被试者之间能力的差异 相反 P 值越接近于 0 50 区别力 越高 为了使测验具有更大的区别力 应选择难度在 0 50 左右的试题比较合适 各题难度应在 0 50 0 20 之 间 二 测验的难度 二 测验的难度 第二单元第二单元 项目的区分项目的区分 度度 370 一 定义一 定义 项目区分度区分度也叫鉴别力 是指测验项目对被试者的心理特性的区分能力 二 计算方法二 计算方法 一 鉴别指数 一 鉴别指数 鉴别指数的计算步骤为 2 1 3 4 1 确定高分组与低分组 每一组取答卷总数的 27 2 按测 验总分高低排列答卷 3 分别计算高分组与低分组在该项目上的通过率或得分率 4 按下列公式估计出 项目的鉴别指数 D PH PL 1965 年 美国测验专家伊贝尔 L Ebel 根据长期的经验提出用鉴别指数评价项目性能的标准 鉴别指 数 D 为 0 19 以下以下 说明该项目差 必须淘汰 二 相关法 二 相关法 计算区分度最常用的方法是相关法 常用的相关法有 点二列相关 二列相关 相关 积差 相关 1 点二列相关 点二列相关 点二列相关点二列相关适用于一类变量为二分称名变量 另一类变量为连续变量的成对变量的相关 计算 2 二列相关 二列相关 二列相关二列相关适用于两个连续变量 但其中一个变量被人为分成两类的相关计算 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 12 页 共 16 页 3 相关法 相关法 相关相关适用于两个变量均为二分称名变量的相关计算 三 区分度与难度的关系三 区分度与难度的关系 难度与区分度的关系 一般来说 较难的项目对高水平的被试者区分度高高 中等难度的项目对中等水平的 被试者区分度高 项目难度的分布一般以常态常态分布为好 这样不仅能保证多数项目具有较高的区分度 而且可以保证整个测 验对被试者具有较高的区分能力 第六节第六节 测验编制的一般程测验编制的一般程 序序 373 第一单元第一单元 测验的目标分测验的目标分 析析 373 一 测验的对象一 测验的对象 在编制测验前首先要明确测量的对象 也就是该测验编成后要用于哪些团体 只有对受测者的如下几方面 心中有数 编制测验时才能有的放矢 年龄 受教育程度 社会经济水平 阅读水平 二 测验的用途二 测验的用途 测验用途不同 编制测验时的取材范围以及试题难度等也不尽相同 在测验编制前就应明确所编出的测验 是要对被试者做 描述 诊断 选拔 预测 一 显示性测验 一 显示性测验 显示性测验是指测验题目和所要测量的心理特征相似的测验 古德纳夫曾经将其分为样本测验样本测验和标记测验标记测验 二 预测性测验 二 预测性测验 三 测验的目标三 测验的目标 心理测验的目标心理测验的目标是指编制的测验是测什么的 即用来测量什么样的心理变量或行为特征 心理测验的目标分析以测验不同而异 一般可分为 工作分析 对特定概念下定义 确定测验的具 体内容 对于选拔和预测功用的预测性测验 它的主要任务就是要对所预测的行为活动作具体分析 我们称之为任 务分析或工作分析 job analysis 这种分析包括如下步骤 确定哪些心理特征和行为可以使要预测的活 动达到成功 建立衡量被试者是否成功的标准 这个标准我们称之为效标 第二单元第二单元 测题的编测题的编 写写 375 一 搜集资料一 搜集资料 心理测验题目的来源应该排除直接翻译国外测验的题目直接翻译国外测验的题目 题目来源分为三方面 已出版的标准测验 理论和专家的经验 临床观察和记录 二 命题的一般原则二 命题的一般原则 心理测验命题的一般原则可以从几方面来考虑 内容 文字 理解 社会敏感性 一 内容方面 一 内容方面 心理测验命题在内容方面的主要要求是 内容符合测验的目的 避免贪多而乱出题 内容取样要有 代表性 题目间内容相互独立 二 文字方面 二 文字方面 心理测验命题在文字方面的主要要求是 使用准确的当代语言 语句简明扼要 排除与答案无关的 因素 最好是一句话说明一个概念 三 理解方面 三 理解方面 心理测验命题在理解方面的主要要求是 有确切的答案 除创造力测验和人格测验外不应具有引起争 议的可能 内容不要超出受测团体的知识水平和理解能力 格式要不被人误解 四 社会敏感性方面 四 社会敏感性方面 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 13 页 共 16 页 有些测验必须涉及一些社会敏感性问题 菲力普 Phillips D L 列举了值得参考的几个策略 命题 时假定被试者具有某种行为 命题时假定规范不一致 指出该行为是常见的 虽然是违规的 三 测题的编制要领三 测题的编制要领 一 选择题 一 选择题 选择题要编好题干 也要编好选项 必须注意 题干问题明确 避免与选项用词一致 选项简明扼要 长度相等 每题只给一个正确答案 选项最好用同一形式 二 是非题 二 是非题 编制是非题应注意 内容以有意义的概念 事实或基本原则为基础 每道题只能包舍一个概念 尽 量避兔否定的叙述 尤其是双重否定 是 非 题的数目应基本相等 随机排列 三 简答题 三 简答题 编制简答题的原则包括 宜用问句形式 填充形式的空格不宜太多 每题应只有一个正确答案 编制简答题的原则不包括将其操作化将其操作化 四 操作题 四 操作题 编制操作测验的原则有 明确所要测量的目标 并将其操作化 尽量选择真实性程度较高的项目 指导语要简明扼要 制订评分标准 确定计分方法 第三单元第三单元 测验的编排和组测验的编排和组 织织 378 一 合成测验一 合成测验 一 选择与审定试题 一 选择与审定试题 1 选择试题的形式 选择试题的形式 在选择题目形式时 需要考虑 测验的目的 材料的性质 接受测验的团体的特点 各种实际因 素 2 审定题目 审定题目 审定试题要注意题目的 范围应与测验计划的双向细目表相一致 数量要比最后所需的数目多一倍至 几倍 难度必须符合测验目的的需要 说明必须清楚明白 二 测题的编排 二 测题的编排 测验编排的一般原则应排除答案混合排列答案混合排列 测验编排的一般原则包括 难度逐步上升 先易后难 将 同类型的测题组合在一起 依各种类型测题本身的特点编排题目与选项 测题常见的排列方式有 并列直进式 混合螺旋式 二 预测与项目分析二 预测与项目分析 预测应注意 对象应取自将来正式测验准备应用的群体 实施过程与情境应力求与将来正式测验时的 情况相近似 时限可稍宽一些 最好使每个被试者都能将题目做完 预测过程中 随时记录被试者的反应 情形 三 信度和效度考察三 信度和效度考察 四 常模制订四 常模制订 五 编写指导手册五 编写指导手册 测验指导手册的内容有 测验的目的和功用 编制的理论背景 选材的原则 方法 实施测验的说 明 测验的标准答案和记分标准 测验的心理计量学特征 常模资料 第七节第七节 心理测验的使心理测验的使 用用 382 第一单元第一单元 主试的资主试的资 格格 382 一 知识结构一 知识结构 主试者的知识结构是指开展心理测验工作所必须具备的 心理学基础知识 心理学专业理论知识 本行业的专业知识 心理测验专业技能 国家职业资格培训教程 心理咨询师 基础 第五章心理测量学知识复习概要 第 14 页 共 16 页 二 专业理论知识和专业技能二 专业理论知识和专业技能 一 专业理论知识 一 专业理论知识 主试者的心理测验专业理论知识 具体言之 包括 对心理测验的特点 性质和作用的认识 对心理 测验局限性的认识 了解测验的基本特征 熟悉保证心理测验标准化的必要性 二 专业技能 二 专业技能 主试者必须具有实际操作心理测验的专业技能和经验 接受严格 系统的心理测验专业训练 熟悉有关测 验的如下方面 内容 适用范围 测验程序 记分方法 三 职业道德三 职业道德 主试者的职业道德包括 测验的保密 测验的控制使用 测验中个人隐私的保护 心理测验的保密涉及到 测验内容 测验结果 个人隐私 第二单元第二单元 测验的选测验的选 择择 383 选择测验必须注意 所选测验必须 适合测量的目的 符合心理测量学的要求 一 所选测验必须适合测量的目的一 所选测验必须适合测量的目的 二 所选测验必须符合心理测量学的要求二 所选测验必须符合心理测量学的要求 第三单元第三单元 测验前的准备及注意事测验前的准备及注意事 顶顶 384 一 测验的准备工作一 测验的准备工作 测验前的准备工作主要包括 预告测验 准备测验材料 熟悉测验指导语 熟悉测验的具体程序 二 测验中主试的职责二 测验中主试的职责 测验中主试者的职责是指 应按照指导语的要求实施测验 测验前不讲太多无关的话 主试者不应 对被试者的反应做出任何暗示性反应 对特殊问题要有心理准备 三 建立协调关系三 建立协调关系 在心理测验实施中 主试者和被试者之间建立了一种友好的 合作的 能促使被试者最大限度地做好测验 的关系 叫协调协调关系 第四单元第四单元 测验实施的程序及要测验实施的程序及要 素素 385 一 指导语一 指导语 测验指导语一般组成为 如何选择
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医疗资源下沉与基层医疗需求响应策略
- 鹅口疮中药外治:冰硼散使用规范
- 2026届安徽省定远县民族私立中学化学高一上期中综合测试试题含解析
- 六年级下册期末数学模拟试题A卷解析
- 人教版七年级数学下册期末解答题压轴题卷及答案
- 绞窄性疝术后并发症早期识别护理
- 面积超的太多合同
- 备案总分包合同
- 重庆市渝北区小学三年级上学期数学期中考试试卷
- 定点更换机油合同
- 【MOOC】《大学生科技创新课程之中美青年创客大赛》(西南交通大学)章节期末慕课答案
- 西昌古诗文品读智慧树知到期末考试答案2024年
- 【超星尔雅学习通】经济学原理(下):全球视角(复旦大学)网课章节答案
- HR知识学习基础篇(一)
- 《典型军事武器简介》
- 加油加气站可行性研究报告
- GB/T 29473-2012移动实验室分类、代号及标记
- GB/T 2423.29-1999电工电子产品环境试验第2部分:试验方法试验U:引出端及整体安装件强度
- GB/T 20666-2006统一螺纹公差
- 需配备的物业办公物资表
- 洲际酒店员工培训l课件
评论
0/150
提交评论