心理测量3-常模_第1页
心理测量3-常模_第2页
心理测量3-常模_第3页
心理测量3-常模_第4页
心理测量3-常模_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

测验常规、1、2、内容摘录、各种常用导出分数及其关系各种测试分数的合成方法常规制作和常用常规、引言、过时测试和过期的常规心理学家进行了高中咨询,这所高中为高智商学生设置了特殊的教育项目,只有智商达到130以上的学生才能申请该项目。 但是,学校管理者在1980s初期满足智商要求的学生激增,这些申请人通过了学校智能测试的检查,结果发现成绩是真实的。 根据这个咨询专家的调查,学校用的测验是1955年版的WAIS,1981年发表了修订版WAIS-R。 WAIS比WAIS-R更简单,考试得分高8分,所以“高智商”的学生肯定翻倍了。3、4、第一节的分数合成,一、分数合成的意义,(一)分数合成的种类的分数组合可以在不同的水平上进行,一般有几种方法:项目组合:不同的项目可以组合在尺度和分数的测试中,所有的项目都可以合成一个测试的总分评分或量表的组合:将几个可评分量表的分数组合起来得到一个合成分数。 韦克斯勒成人智能测试的语言部分包括六个测试。 测验或预测来源的组合:同时使用多个测验或预测来源。 大学新生会考虑各考试分数的成绩。 5,6,(2)分数合成中的问题,用什么方法合成分数是最合适的分数组合,多少测试分数作为最合适的组合分数是必要的,2,组合变量的方法,(1)临床判断根据经验主观地组合各种要素来得出结论和预测的方法称为临床判断。 MMPI之类的优点:整体上可以综合地考虑各要素,是对特定的个人进行单独的判断,可以考虑单独的情况。 缺点:主观加权受判断者偏见的影响,没有准确数量指标的判断者可能不客观,需要经过训练,有丰富的经验,7,8,(2)加权加法合成,不考虑各变量的经验关系,根据某一事先理想的程序进行推理加权。 单位权重:将各变量直接相加得到一个合成得分。 公式7.9等量加权:将所有得分转换为标准得分,然后将它们组合起来。 式7.10考虑权重系数:标准点乘以权重的组合。 (7.11,9、9、9和(3)多元回归同时使用若干预测源预测一个效果指标,并且在那些预测源变量之间具有补偿性的情况下,采用多元回归。 考虑式7.12变化的线性关系的前提下测得的特质有一定的补偿性,如各科高考成绩、10、(4)多重区分、前提:假设预测源之间没有互补性。 如果飞行员飞行的话,任何项目都不能合格。 多个划分:因为每个属性都有一个标准,所以把人分为达到(接受)最低标准和不达到(拒绝)最低标准两种,在这两组人内部不做进一步的划分。 连续栅栏按一定顺序依次实施测试和预测源。 只有通过第一项后,才能执行以下操作。 把最有效的预测源放在开头。 (11 )合成得分的特殊方法,完全得分把各变量视为一个整体,不是孤立地看最初的反应结果,而是看整体的反应模式。 例如,50名健康者和50名精神疾病患者,2人回答没有问题。 健康者和精神患者都是一半正确,一半正确的话,就不能看到总分。 但是,健康者的模式是TT或FF,而精神疾病患者的模式是TF或FT。 轮廓分析并不是把各个变量变成单纯的线性组合,而是考虑通过各测试和尺度得到的分数的轮廓。 12、第二节分数解释,13、例如心理测量学考试83分,高还是低? 第二节分数的解释、分数的解释包括两方面的问题如何使分数有意义在内如何向当事人传达有意义的信息。必须使原始点数有意义,同时,为了能比较不同的原始点数,必须转换为具有一定的参照点和单位的测试尺度上的数值。 根据统计方法从原始点数变化到尺度的点数称为导出点数。 常模参照点数,和具有某个特征的人构成的相关团体进行比较,根据其在组内的相对位置报告成绩。 作为比较的参考团体被称为常模团体,常模团体的分数分布被称为常模。 14、15、一、常模参照分数的解释,制定常模的步骤:确定相关的比较团体将该团体成员获得测试分数的原始分数作为尺度,可以将个人分数显示在该团体内的相对位置。 16、(1)常模的团体和常模本、1、常模团体:由具有某个共同特征的人组成的组,或该组的样本。 如果集团大,常模集团就应该是集团的代表性样品,被称为标准化样品。 17、2、常模的决定和使用应注意的问题,对作者来说,常模的选择主要基于对实施试验整体的认识,常模团体必须代表这整体。 这项工作包括整体一般的决定、整体目标的决定、样品的决定。 样品的选择必须通过整体性质表示整体目标,表示整体一般。 在满足条件后,可以称为普通的样子,真的是有代表性的。 测验用户:应该考虑的问题是,现有的定型团体中的哪一个最合适。18、3、常模集团的条件、集团构成要明确定义:制定常模时,要明确说明要测定的集团的性质和特征。 常模集团必须是所测集团的代表性样品:收集常模资料时,通常采用随机抽样或分层抽样的方法,有时可以组合使用两种策略。 样品的大小必须合适:总体数量少,几十人,需要100%的样品。如果达到了总体数量,对应的样品也大,一般最低也在30个或100个以上,全国通用,一般最好是2000-3000人。 标准化样品群是一定时空的产物:注意在选择适当的常规模式时,选择比较最近的常规模式。 19、4、采样方法、采样:从对象中选出有代表性的样品。 采样的方法有随机采样和非随机采样两种. 随机原则是,从整体采样时,提取个别个体的机会均等。 简单随机抽样系统抽样分组的抽样层次抽样:层次比例抽样和层次非比例抽样。 20、(二)常模点数和常模,一、常模点数常模点数是在试验常模本后,将被试验者的原始点数按一定规则转换而得到的导出点数。 常模得分构成的分布通常被称为常模,是说明心理测试得分的基础。 在常模中一般常模和特殊常模的分试验手册中记载的常模是通常常模,不一定适合使用者的具体情况,特殊常模是为非典型的团体制作的,一般是在比小的团体窄的范围内制作的。 优点:可以将被实验者的结果与最近的人进行比较的缺点:不允许在大范围内解释得分。 测试用户可以把特殊常规模式和通常常规模式结合起来。21、22、2、常模的类型和解释、发展常模的人的许多心理特性,如智力、技能等都是随着时间有规律地发展的,所以可以把个人的成绩与各种发展水平的人的平均表现进行比较。 根据这样的平均表现作成的尺度是发展常规,也称为年龄尺度。23、发展顺序尺度:最直观的发展常规是发展顺序尺度,它告诉人们多少孩子有什么样的能力和行为,说明其发育正常,相应的能力和行为出现得比某个年龄早,发育在发展中,否则发育落后。 第一个例子是盖尔开发计划表。 24、心理年龄(知识年龄):比内西蒙尺度首先使用知识年龄的概念。 智龄是用年龄尺度测量智力的单位。求智龄分的方法很简单,将儿童测试中的分数与各组普通儿童进行比较,可以给出年龄分数。 例如,吴天敏修订的比内西蒙尺度中,每个年龄有6个问题,正确答案是每个问题智龄2个月。 如果某儿童的6岁组主题全部通过的话,7岁组有4题,8岁组有3题,9岁组有2题,智力年龄的计算为6 (岁) 42 (月) 32 (月) 22 (月)=6岁18月=7岁6个月。25、学年当量:实际上是学年尺度,考试结果显示被实验者属于哪个年级水平,在教育成绩考试中最常用。 年龄表单位通常每学年有两个月的假期,所以每隔10个月。 例第109页。 发展尺度的优点:能够与容易理解的伙伴团体直接比较,为个人内的比较和纵向研究提供了基础的缺点:仅适用于儿童,不合格者只对在典型环境中成长的儿童不能进行代数计算的智力年龄单位不一定,3和4的差异大于15和16的差异。 因为智力发展快而慢。26、27、百分位常模、百分位常模包含百分位和百分位、四分位和十分位。 百分比级别:应用最广泛的表示测试分数的方法。 一个测试分数的百分比是指在普通的榜样中低于这个分数的人的比例。 百分位表示个体在常模集团中的位置,百分位越低,个体所在的位置就越低。 其计算(参照94页):用于对未分组数据的百分位计算数据进行分组的百分位法。 28、2222222222222200000000基本单位是标准偏差。 常见的标准得分是z得分、t得分、标准得分、分布式IQ(IQ )线性变换的标准得分: z得分是最典型的线性变换的标准得分。 非线性变换的标准点数:原始点数不是正态分布的情况下也能标准化,该变换过程是非线性的。 参见第98页。 31、t分数: T=50 10Z最初由麦克在1939年提出的标准9分9级分数标准是以5为平均值,2为标准偏差的分数标准。 100页,32页,智商,比率IQ :心理年龄(MA )和实足年龄(CA )的比,商数乘以100,智商IQ=ma/ca和100斯坦福大学的推孟教授于1916年修改了比内西蒙尺度,作为斯坦福比内尺度,提出比率IQ的概念也就是说,因为心理年龄和实足年龄不同步成长,比率IQ不适合年龄大的被试验者,另外,因为年龄组不同,孩子的比率IQ分布不同,所以相同的比率IQ分数根据年龄有不同的意义。33、方差IQ :以年龄组为样本计算的标准分数,为了与传统比率IQ大致一致,韦克斯勒规定方差IQ的平均值为100,标准偏差为15。 方差IQ基于统计学,表示个体智力在年龄组中所处的位置,所以是表示智力高低的理想指标。 通过分散PS的提案,过去很多使用比率PS的测试,后来都使用了分散PS。 初期斯坦福一比纳智能尺度,3岁儿童测试内容的例子(代表每个问题2个月的智龄)1.穿珠子:要求一起穿48个珠子。 2 .看图说物体名:有18张照片(马、木、衣服、球、飞机、轮船等),要求说10张。 3 .用积木架桥。 4 .想起动物的照片。 5、画圆形。 6 .画直线。 7 .顺背3位。 注:完成6题就行了,有一题替代问题。 34、35、百分位数和标准分数的共同点:将被试分数在小组内横向进行比较,发展尺度与不同发展水平的人纵向进行比较。 常模分数的表示方法:变换表(P111114 )和解析图。36、分析图用图形表示一系列测试中的几个分数。 从解析图一目了然地知道个体在各种测试中的表现及其相对位置。 参见第115页。37、二、标准参考分数、常模参考中,一个人的分数可以通过与其他人的分数进行比较来解释,表示某个团体内的相对等级。 在标准参照测试中,一个人的测试成绩不是与别人进行比较,而是与某个特定的标准进行比较。 标准参照测试的优点是,像通常的参照测试一样,以能力强者为荣,能力差者长期受挫,效果参照测试巧妙地避免了得分、名次的过度纠缠,每个人都有自己的奋斗目标和希望。 常规参照考试不能反映被试验者的真正能力和水平,甚至不知道被试验者能做什么,不能做什么。 效力标准考试可以发现个人特有的优点,找到问题的核心。 从38、39、常模参照测试的得分不能得到外部有效坐标的测试表现,有效坐标参照测试可以直接说明,有时测试结果本身可能是有效坐标。 效果标准考试与教师教育过程中自我编辑考试的关系更密切,因此效果标准考试的理论概念更容易被教师接受和应用。 在效果标准考试中,一个标准是考试所包含的材料的熟练度或掌握度,主要与考试的内容有关,因此把这个分数称为内容标准分数。 另一个比较标准是外在效果指标,用预期效果的成绩来说明测试的分数,但由于与后面的结果有关,所以把这个分数称为结果参照分数。 41、(1)内容参照,内容参照:也称为范围参照,主要根据某特定的材料内容和技能的掌握度和熟练度显示并说明试验结果。 1 .制作内容参照测试时,和说明这种测试的分数时,要制定一个标准,确定测试所包含的知识和技能范围有两个步骤,可以报告测试的成绩。 2、一些主要内容参照量表,掌握分数。 设定判别被实验者合格还是掌握了的最低分数,即最低掌握水平,该分数以上表示被实验者掌握了还是达到了熟练水平。 此分数以下表示没有达到这个水平,需要进一步的学习和其他纠正措施。 采用全部得分或无得分。 正确率(更一般):报告的内容是参照分数的另一个指标,表示被实验者通过测验正确答案的问题的比例,所以比起掌握分数的二分法得分,掌握和熟练度更合适。 正解率=正解主题数/合计主题数为100、42、43%,内容标准点数是将内容标准点数和常规点数组合使用。 在制定内容标准尺度时,不仅要明确定义内容、范围,还必须详细说明各级“典型”人物正确和不正确的问题类型。 把一个人的考试分数和这个尺度进行对比,就能显示出他正确反应的比例,以及他的成绩达到了什么人的水平,能解决什么问题。 等级评价尺度在某种情况下,我们感兴趣的不是人们是否掌握了某种知识,而是完成一个人的过程或生产某种产品的技能。 对于各种技能,无法通过回答问题来确定其掌握和熟练水平。 通常,需要使用等级评价尺度来报告活动的熟练水平和产品质量。 为了尽可能客观地进行评价,有必要在各种等级上制定标准。 例如,要评价学生书法,需要从正确性、明性、美观性等方面区分不同的水平,为各水平规定标准样品,详细说明。 比较各学生的书法和标准样品,可以得到最接近哪个级别的样品,以及哪个级别。 44、3、内容参考分数的特征,用个人掌握的知识和水平来记述行为,指出人知道什么能做什么。 在很多情况下,这比知道人在团体内的相对位置更有价值。特别适合利用计算机辅助教育和程序教材的自我学习。 内容参照分数主要用于达成测试和确定可接受的最低标准的资格测试。一般不使用内容参照分数,因为大部分能力倾向和人格测试很难确定测试范围。 (45 )结果参照分数,实际上是有效的分数,在有效的行为水平上表示测试结果,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论