




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
心理与教育测量 09 级复习题目汇总 孙宁 2011 12 24 1 1 测量的基本要素 测量的基本要素 1 参照点 采用相对参照点为测量起点的测量结果只能进行加减运算 而不能进行乘除运算 比如 智商 2 单位 2 量表 量表 能够使事物的特征数量化的具有特定单位和参照点的数字的连续体就是量表 1 命名量表 命名变量只说明某一事物与其他事物在名称 类别或属性上的不同 并不 说明事物与事物之间差异的大小 顺序的先后及质的优劣 应用例子 牌照号码 人名 地名 足球运动员的号码 局限性 不能说明类别的数量差别 2 顺序量表 顺序量表 是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量 具有等级性和 次序性的特点 应用例子 军衔 比赛中的名次排列 局限性 不考虑差异的绝对量 只 考虑相对差别 3 等距量表 等距量表除能表明量的相对大小外 还具有相等的单位 应用例子 温度 局限性 比率是无意义的 零点是任意规定的 4 比率量表 比率量 表除了具有量的大小 相等单位外 还有绝对零点 应用例子 距离 重量 3 卡特尔卡特尔 1890 年发表 心理测验与测量 一文于 心理 杂志上 这是在心理学文献中 首次出现 心理测验 一词 4 比内比内 1905 年 B S 量表 第一个正式智力量表 比内首先提出了智龄智龄的概念 然后在 此基础上产生了比率智商概念 比率智商比率智商的计算公式 智商 智龄 实龄 100 5 人格测验人格测验 艾森克人格问卷 EPQ 卡特尔 16 项人格因素问卷 16PF 明尼苏达多项 人格调查表 MMPI 心理评定量表心理评定量表 精神病评定量表 躁狂状态评定量表 抑郁量表 焦虑量表 恐怖量表 6 斯皮尔曼斯皮尔曼首次运用因素分析研究智力结构 提出智力结构的二因素论 为编制新的智力 测验奠定了理论基础 7 桑代克桑代克编制第一个标准化的教育成就测验 被公推为教育测量的鼻祖 8 最早进行人格测量的是 克雷培林克雷培林 最早采用自由联想法诊断病人 9 自陈人格问卷 1917 年武德沃斯武德沃斯设计的 个人资料调查表 由哈撒韦和麦金利编制的 目前影响最大的 MMPI 明尼苏达多相人格调查表 10 1917 陆军甲 乙种测验应用 最早的能力倾向测验能力倾向测验 一战时在 Yerkes 领导下编制 1 陆军甲种 测验 2 陆军乙种 测验 11 系统误差误差只影响测量的准确性 不影响稳定性 而随机误差既影响稳定性又影响准确 性 12 测量误差的来源 误差的来源 1 来自测量工具 心理测量量表是否稳定 是否测到了我们所 要测得东西是测量工具造成误差的主要原因 2 来自测量对象 受测者真正水平是否得 到真正发挥 3 来自施测过程 物理环境 主试者方面 评分计分环节 13 经典测验理论假定 观察分数 X 与真分数 T 之间是一种线形关系 并只相差一个随机 误差 E 即 X T E 根据这一模型 我们可以引申出 3 个相关联的假设公理 1 若一 个人的某种心理特质可以用平行测验反复测量足够多次 则其观察分数的平均值会接近于 真分数 即 X T 或 E 0 2 真分数和误差分数之间的相关为零 即 T E 0 3 各平行测验上的误差分数之间相关为零 即 E1 E2 0 14 信度的意义 信度的意义 信度指实测值和真值相差的程度 指统计量与参数之间的接近程度 指 一种测验对相同的应试者再次测验时引起同样反应的程度 15 三种等价的信度定义 三种等价的信度定义 1 信度乃是一个被测团体真分数的变异数与实得分数的变异 数之比 rXX ST2 SX2 2 信度乃是一个被测团体真分数与实得分数的相关系数的平方 rXX P2TX 3 信度乃是一个测验 X 与它的任意一个平行测验 X 的相关系数 rXX PXX 心理与教育测量 09 级复习题目汇总 孙宁 2011 12 24 2 鉴别指数题目评价 0 40以上很好 0 30 0 39良好 修改会更好 0 20 0 29尚可 仍需修改 0 19以下差 必须淘汰 鉴别指数题目评价 0 40以上很好 0 30 0 39良好 修改会更好 0 20 0 29尚可 仍需修改 0 19以下差 必须淘汰 鉴别指数鉴别指数题目评价题目评价 0 40以上0 40以上很好很好 0 30 0 390 30 0 39良好 修改会更好良好 修改会更好 0 20 0 290 20 0 29尚可 仍需修改尚可 仍需修改 0 19以下0 19以下差 必须淘汰差 必须淘汰 16 影响测量信度的主要因素 影响测量信度的主要因素 1 被试方面 就单个被试而言 被试的身心健康状况 应试动机 注意力 耐心 求胜心 作答态度等会影响测量误差 就被试团体而言 整个 团体内部水平的离散程度以及团体的平均水平都会影响测验的信度 2 主试者方面 就 施测者而言 手册规定实施 或故意紧张氛围 给考生暗示 协助 信度 就阅卷评分者 而言 若评分标准掌握不一 或者前松后紧 甚至是随心所欲 3 施测情景方面 在实 施测验时 考场是否安静 光线和通风状况是否良好 所需设备是否齐全 桌面是否符合 要求 空间阔窄是否恰当等 4 测量工具方面 一般的 试题的取样 试题之间的同质 性程度 试题的难度等是影响 5 两次施测得间隔时间 在计算重测信度和稳定性与等 值性系数时 两次测验相隔时间越短 越大 越长 其他因素带来影响的机会就越多 因 而可能越小 17 提高测量信度提高测量信度的常用方法 1 适当增加测验的长度 2 使测验中所有试题的难度接 近正态分布 并控制在中等水平 3 努力提高测验试题的区分度 4 选取恰当的被试团 体 提高测验在各同质性较强的亚团体上的信度 5 减少无关因素的影响 18 效度效度 S2V r2xy 19 信度与效度的关系 信度与效度的关系 1 信度高是效度高的必要而非充分条件 信度高 不一定效度 高 但一个测验想要效度高 真分数的变异数必须占较大的比重 即测验的信度必须高 2 测验的效度受它的信度制约 20 内容效度内容效度 方法 逻辑分析法逻辑分析法 21 效度的特点效度的特点 1 效度是一个相对的概念 2 效度是测量的随机误差和系统误差的综 合反应 3 判断一个测量是否有效要从多方面搜集证据 22 影响测量效度的因素影响测量效度的因素 1 测验的构成 2 测验的实施过程 3 接受测验的被试 4 所选效标的性质 5 测量的信度 23 提高测量效度提高测量效度的方法 1 精心编制测验量表 避免出现较大的系统误差 2 妥善组 织测验 控制随机误差 3 创设标准的应试情境 让每个被试都能发挥正常水平 4 选 好正确的效标 定好恰当的效标测量 正确地使用有关公式 24 实证效度实证效度的确定方法 1 相关法 最常用来建立实证效度的方法是求测验分数与效 标测量间的相关 积差相关法 等级相关法 二列相关法 四分相关法 2 区分法 3 命中率命中率 4 功利率 25 难度对测验的影响难度对测验的影响 1 测验难度影响测验分数的分布形态 难度大 正偏态 难度低 负偏态 2 测验难度影响测验分数的离散程度 测验过难或过易 分数全距缩小 信度降低 P 0 50 时最佳 26 题目鉴别指数与评价价标 题目鉴别指数与评价价标 27 Sternberg 智力的认知成分理论智力的认知成分理论 1 成分智力 思维和问题解决等所依赖的心理 过程 包括 元成分 操作成分 知识获得成分 2 情境智力 反映在对日常事物的处理上 包括 适应环境 塑造环境 选择新环境 3 经验智力 人们在两种极端情况下处理问题的能力 新异的或常规的问题 包括 处 理新任务 自动化加工 28 传统智力测验中的若干问题 传统智力测验中的若干问题 1 传统智力测验的结构效度 不同智力测验有着不同的理论基础 其结构也不同 解释也 不同 因此 应针对不同情况选择不同量表 也不能笼统地说一个人的智力如何 2 传统智力测验的功能 1 将人群分类的功能 2 作为预测源测验行使预测的功能 缺点 还不够精细 无法精确诊断 心理与教育测量 09 级复习题目汇总 孙宁 2011 12 24 3 3 传统智力测验的公平性 1 性别差异 传统智力测验中有利于男性和女性的项目的 不平衡 2 职业差异 经历对智力的影响 3 文化和教育差异 城乡差别 种族差别 4 年龄 时代 差异 人是不是越来越聪明 4 传统智力测验的预测效度 智力的稳定性与可变性 可变性 1 智力随年龄成熟而发展 智力在童年期急速增长 在青少年期增长缓慢 在成年期达 最大值 保持一段时间后开始有所下降 2 智力随环境而变化 智力中的遗传与环境的 关系 3 智力随个性特质的不同而产生不同变化 人格 动机 情绪对智力发展的影响 而传统智力测验没有考虑这些因素的影响 积极的人格 进取心 面对挫折的态度 能促 进智力的成长 29 1905 年 比内和西蒙联名发表了 诊断异常儿童智力的新方法 这就是第一个比西比西 B S 量表 世界上第一个智力量表 30 斯比量表斯比量表 1916 年量表最早对施测和记分提供了详细的指导语 认识到这方面的变化能 产生广泛的分数差异 引入了智力商数的概念 比率智商 开始以 IQ 作为个体智力水 平的标志 适用年龄 3 13 岁 31 1955 年 韦克斯勒成人智力量表韦克斯勒成人智力量表 WAIS 第一个成人智力测验 1981 年 韦克斯勒成 人智力量表修订版 WAIS R 背数 背数 分顺背和倒背两部分 2 位到 9 位数 主要测查注 意力和短时记忆能力 对智力低者 测其智力 对智力高者 测其注意力 理解 理解 该分测 验能反映被试对于社会价值取向 风俗 伦理道德是否理解和适应 在临床上可以鉴别脑 器质性障碍的病人 类同类同 测查个体的逻辑思维 抽象思维 分析和概括能力 是普通智 力的一个很好的测量指标 积木图案 积木图案 与操作量表总分相关很高 被认为是最好的操作测 验 在临床上帮助诊断知觉障碍 分心 老年衰退等症状 译码译码或数字符号 主要测查注 意力 简单感觉运动的持久力 建立新联系的能力和速度 背数和数字符号分测验计算复 本信度 其余部分计算分半信度 为 0 88 0 98 32 瑞文推理测验瑞文推理测验的理论假设源于斯皮尔曼的智力一般因素理论 测的是卡特尔所说的流 体智力 33 能力倾向测验的特点 能力倾向测验的特点 1 测验的目的 能力倾向测验预测失败比预测成功更准确 2 测验的编制 每个分测验针对一种能力 应该是相互独立的 重视特殊团体常模的建 立 3 测验结果的解释 注意被试与常模性质之间的差异 34 吉尔福特吉尔福特将发散思维的特性视为人的创造性活动的特性 并将创造力定义为发散思维 的 能力 即对规定的刺激产生大量的 变化多端而又独特的反应的能力 他认为发散思维发散思维在 行为上主要表现出 3 种特性 1 流畅性 面对智力任务能在短时间内做出迅速而众多的 反应 2 变通性 思维灵活多变 触类旁通 不受传统思维或思维定势的影响 能多方 位的思考与解决问题 3 独特性 对事物能表现出不同寻常的独特见解 35 第一个人格问卷 武德沃斯武德沃斯 Woodworth 1919 年编制的 个性资料调查 1920 年 罗夏克墨迹测验问世 投射测验由此诞生 36 自陈量表自陈量表的基本假设是只有受测者最了解自己的人格特征 故让被试自己提供关于自己 人格特征的报告 自陈量表的编制方法编制方法 1 逻辑法 直觉法 确定要测量的特质 编写 题目 编制问卷 爱德华个人偏好量表 EPPS 詹金斯活动调查表 显性焦虑量表 缺点 表面效度不能保证测验的真正效度 测验题目与所测特质联系过于明显 容易作假 2 同质法 因素分析法 施测大量题目 相关题目构成因素 即人格特质 16PF EPQ3 3 经验法 实证法 第一步 分组 选取具有某一特征的效标组 对照组 第二步 确定根据什么特点来区分效标组和一般人 第三步 能把两组分开的题目构成测 心理与教育测量 09 级复习题目汇总 孙宁 2011 12 24 4 验 MMPI 缺点 1 分数的解释受原始效标组的影响 2 量表缺乏理论意 义 4 综合法 逻辑分析法 因素分析法 经验法 杰克逊人格问卷 JPI 37 艾森克人格问卷 EPQ E 内外倾性 量表和 N 神经质 情绪性 量表均为双极量表 P 精神质 又称倔强 讲求实际 为单级量表 L 说谎量表 为效度量表 外向 情绪不稳定 胆汁质 外向 情绪稳 多血质 内向 情绪稳定 粘液质 内向 情绪不稳定 抑郁质 38 投射测验的理论基础 投射测验的理论基础 基本假设 人们对于外界刺激的反应都是有其原因且可以预测 的 人们对外部刺激的反应虽然决定于所呈现的刺激的特征 但反应者过去形成 的人格特征 他当时的心理状态以及他对未来的期望等心理因素也会渗透在他对刺激的反 应过程及其结果之中 通过向受测者提供一些意义模糊的刺激情境 让受测者对这种情境 做出自己的解释 然后通过分析他解释的内容 就有可能获得对受测者自身的人格特征的 认识 39 罗夏克墨迹墨迹测验 反应方式 自由联想 40 投射测验的发展史 投射测验的发展史 1 从 泼墨 游戏到罗夏墨迹测验 2 以罗夏墨迹测验为代表 的投射技术在 20 世纪 40 60 年代盛极一时 达到鼎盛时期 3 20 世纪 70 年代 是投射 技术的危机期 4 20 世纪 70 年代以后 投射技术进入 退隐期 但仍有复兴希望 爱 克斯纳为代表的改革派给投射技术注入了新的血液 41 态度测量方法 态度测量方法 1 等距量表法 2 利克特量表法 3 哥特曼量表法 42 心理测验四个基本条件心理测验四个基本条件 1 行为样本 从人的大量行为中抽取与测量的心理特质直接 有关的一组行为进行测量 并依据对这一组行为的测量结果推断其心理特质和教育成就 2 标准化 指测验的编制 实施 记分以及测量分数解释的程序的一致性 3 难度或 应答率 项目的难度是通过被试答对某一项目的人数的比例来确定的 4 信度和效度 信度指的是一个测验的可靠性 即用同一测验多次测量同一团体所得结果之间的一致性程 度 效度指的是一个测验的有效性 即一个测验在多大程度上能够测到它所要测量的心理 特质 43 信度三个作用信度三个作用 1 信度是测量过程中所存在的随机误差大小的反应 随 只对测量 结果产生恒定的影响 而不会使测量结果上下波动 2 信度可以用来解释个人测验分数 的意义 我们可以用一个团体 人数足够多 两次施测的结果来代替对一个人反复施测 以评估测量误差的变异数 3 信度可以帮助进行不同测验分数的比较 通常 来自不同 的测验的原始分数是不能直接进行比较的 而必须转化成标准分数在进行比较 44 信度的估计方法信度的估计方法 1 重测信度 同一量表 同一被试群体 在不同时间 两次施测 求其相关 2 复本信度 因为任何测验只是所有可能题目中的一份取样 行为样本 所 以可编制许多平行的等值测验 叫做复本 3 分半信度 在测验没有复本且只能实施一 次的情况下 可将测验项目分成对等的两半 根据被试在这两半测验中所得的分数计算相 关系数 即得分半信度 4 同质性信度 同质性指测验的所有题目测量的是同一种心理 特质 表现为各个题目得分之间有较高的相关 相关越高则同质性越强 5 评分者信度 评分者信度是指不同评分者之间在测验结果计分上的一致性 45 分半信度的校正公式分半信度的校正公式 P50 46 重测信度 复本信度的使用条件 重测信度 复本信度的使用条件 1 所测量的心理特性必须是稳定的 遗忘和联系的 效果基本上互相抵消 在两次施测的间隔期内 被试在所要测查的心理特质方面没有获得 更多的学习和训练 2 各份测验测量的是同一种心理特性 各份测验具有相同的内容和 形式 各份测验的题目不应重复 各份测验题目数量相等 难度和区分度大体相同 各 份测验的分数分布 平均数和标准差 大致相等 复本编好后 应再测一次 以确保各份 心理与教育测量 09 级复习题目汇总 孙宁 2011 12 24 5 测验的等值 47 效标效标是衡量一个测验是否有效的外在标准 它是独立于测验并可以从实践中直接获得我 们所感兴趣的行为 不过 我们所感兴趣的行为往往是一个观念上的东西 观念效标观念效标 它 必须用一个数字或等级来进行表达 效标测量效标测量 例如 大学生入学考试的观念效标是 大 学学习成功 它的一种常用的效标测量便是大学头两年或一年相关学科的平均成绩 48 多种特质 多种方法矩阵法 作为结构效度的确定方法 其实质是相容效度和区分效度相容效度和区分效度 的综合运用 49 非二分法难度计算非二分法难度计算 P74 50 区分度计算 之鉴别指数法 鉴别指数鉴别指数的计算 当效标成绩是连续变量时 可以从分数 分布的两端各选择 27 的被试 分别计算出每道题目上各自的通过率 两者之差就是鉴别 指数 D 即 式中 与 分别为高分组与低分组在该项目上的通过率 51 公式 6 10 6 12 86 52 确定常模团体时的注意事项确定常模团体时的注意事项 1 群体构成的界限必须明确 在确定常模团体时 必须 清楚地说明所要测量的群体的性质与特征 2 常 必须是所测群体的一个代表性样本 为了克服取样偏差 保证具有代表性 一般在抽样时应遵循随机化原则 采用统计学的方 法抽取样本 3 取样的过程必须明确且有详尽的描述 这主要是为了使测验的使用者不 至于误用测验和错误的解释测验结果 4 样本大小要适当 根据统计学原理 取样误差 与样本大小成反比 所以 在其他条件相同时 在考虑到人力 物力因素的前提下 样本 越大越好 5 常 必须是近时的 过时的常模是不能作为参照标准的 一个常模不能一 劳永逸的使用 6 注意一般常模与特殊常模的结合 将特殊常模与一般常模结合起来 可使被试与最接近的群体进行比较 解释分数也会更加准确 53 制定常模的过程制定常模的过程 1 确定测验将用于哪一个群体 根据测验群体 选定最基本的统计 量 决定抽样误差的允许界限 在此基础上设计具体的抽样方法 并对该群体进行抽样 得到常模团体 2 对常模团体进行施测 并获得团体成员的测验分数及分数分布 3 确定常模分数类型 制作常模分数转换表 即常模量表 同时给出抽取常模团体的书面说 明 以及常模分数的解释指南等 54 比较几种导出分数的优缺点导出分数的优缺点 按某种规则将原始分数转化为导出分数的过程称为分数的 转化 常用的导出分数有百分等级 标准分数 T 分数等 1 百分等级百分等级优点为它是一种 相对位置量数 它不受原始分数分布状态的影响 具有可比性 且具有易计算 解释方便 等优点 其缺点是单位不等 尤其在分配的两个极端 只具有顺序性 而无法用它来说明 不同被试之间分数差异的数量 解释时不能离开特定的团体 2 标准分数标准分数优点为它是一 个抽象值 不受原始测量单位的影响 并可接受进一步的统计处理 缺点是只能在两个原 始分数分布形态相同或相近是才能运用 Z 分数进行比较 否则 仍然无法做准确比较 3 T 分数分数 标准分数变式标准分数变式 优点 具有等单位的特点 便于进一步进行系统分析工作 正态分布下 可以利用正态分布表将各种导出分数与百分等级分数做换算 正态分布下 运用某种变式分数可以将几个测验上的分数做直接的比较 即使是非正态分布 也可以运 用由正态分布的 Z 分数转换而得来的变式分数进行直接比较分析 缺陷 分数过于抽象 不易理解 在非正态分布下 分布形态不同的变式分数 仍然不可以相互比较 也不能相 加求和 55 两个个例题 百分位等值 P142 线性等值 P144 心理与教育测量 09 级复习题目汇总 孙宁 2011 12 24 6 56 比较目标参照测验与常模参照测验 比较目标参照测验与常模参照测验 简答简答 常模参照测验的目的在于度量和比较个体 之间的差异 并以被试在团体中的相对位置来评价和解释测量结果 目标参照测验的主要 目的则在于了解个体在所规定的测量内容上的行为水平 其出发点是个体本身的绝对水平 而不再是个体间的水平差异 由于测验性质的不同和受测人群可能存在的差异
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电子行业5G技术应用前景研究报告
- 2025年智能农业技术在农产品运营管理中的应用前景研究报告
- 2025年养老行业智能养老服务市场前景研究报告
- 2025年区块链技术在智能合约行业的应用与发展前景研究报告
- 2025年金属行业新材料应用前景研究报告
- 2025年电子竞技行业电子竞技市场规模与发展前景分析研究报告
- 安定区2025年甘肃定西市安定区融媒体中心选调工作人员笔试历年参考题库附带答案详解
- 宁夏2025年宁夏回族自治区生态环境厅事业单位自主公开招聘急需紧缺高层次人才公笔试历年参考题库附带答案详解
- 商洛市2025陕西商洛学院工程训练中心人员招聘考试2人笔试历年参考题库附带答案详解
- 华池县2025年甘肃庆阳华池县事业单位引进急需紧缺人才11人(第一批第三次)笔试历年参考题库附带答案详解
- 小学信息科技《数据与编码-探索生活中的“编码”》教学设计
- GB/T 28619-2024再制造术语
- 《传感器与检测技术》教学教案集
- 焊工工艺及技能训练教案
- DL∕T 5372-2017 水电水利工程金属结构与机电设备安装安全技术规程
- 农业生产玉米病虫害田间识别、抗性评价与防治技术
- DZ/T 0462.3-2023 矿产资源“三率”指标要求 第3部分:铁、锰、铬、钒、钛(正式版)
- DZ∕T 0338.2-2020 固体矿产资源量估算规程 第2部分 几何法(正式版)
- 农村特岗教师聘用合同书
- GB/T 232-2024金属材料弯曲试验方法
- 社区获得性肺炎教学课件
评论
0/150
提交评论