心理测量学笔记2_第1页
心理测量学笔记2_第2页
心理测量学笔记2_第3页
心理测量学笔记2_第4页
心理测量学笔记2_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.1.1 什么是内容效度1、内容效度:测验内容对测验目的的适合程度。2、基本前提:测验试题应为所欲测内容或行为范围之代表性样本。3、主要用于建构或评价成就测验或职业测验。4、内容效度需要考虑的基本方面:(1)测验内容范围:应能涵盖所界定对象的全部范围。(2)测验题目的代表性:每个试题应与所界定内容或行为范围有适度相关;试题分配应能反映范围内各种变项或成分所应占的比重。5、还需要保证:(1)保证测验本身结构以及要求受测者对试题做出反应的方式(2)保证有一定的题量2.1.2 内容效度的估计方法1、专家判断法:由专家对测验项目所涉及的内容范围进行符合性判断,是一种定性分析的方法。基本过程:(1)详

2、细描述内容范围 课程内容、教育目标以及各类题目所占比例 (2)明确每一个测验项目,即每一道题所测的内容范围(3)在内容范围和结构方面对测验项目与全测验作比较例:10以内加减法运算测验内容范围:10以内加减法运算 内容分类:A.运算类型 B.运算范围(1)加法(2)减法 运算结果10 各类的相对重要性<10    =10    >10加法40%   10%    0减法50%     0

3、        02、分析每一测验题的内容、结构。思考:专家评判法的问题?(1)缺乏数量化的指标!(2)所以,讨论内容效度时,应给出各方面的详细信息:教材和大纲的版本、出版时间、专家人数、专业水平、不同专家判断的一致性。2. 复本法:计算取自同一内容范围的两个测验复本得分的相关。3. 再测法:前测学习再测如果成绩显著提高,说明测验对教学具有较高内容效度。4. 经验法如:不同年级在测验上的得分应岁年级而增高2.1.3 内容效度的适用范围1、适用: 教育成就测验 职业选拔测验 标准参照测验2、不适用:能力倾向(apti

4、tude)与人格Why?2.1.4 内容效度与表面效度1、表面效度(Face validity): 表面看起来测验内容与测验目的的一致性程度。(非专业人士对测验是否有效所作的直观判断)-市井或通俗测验大多有高的表面效度,但它不能保证测量的正确性。2、表面效度的作用:提高表面效度可以起到“包装”作用3、对表面效度的要求:-最高水平测验:高;典型行为测验:低4、内容效度的主要问题:缺乏数量化指标2.2 效标关联效度1、效标关联效度:又称实证效度,指一个测验对处于特定情境中的个体的行为预测的准确性。 即:测验结果与效标的关联程度(求相关)。2、 效标关联效度是基于数据的( data based) (

5、1)选拔测验与工作绩效的相关 (2)大学入学成绩与GPA的相关 (3)MBA考试成绩与工作后成就的相关3、效标(Criterion):希望做出推断的行为或被预测的行为,是检验测验有效性的标准。 测验=预测源 想预测的行为=效标2.2.1 常见的效标1、学业成就:学科成绩,学历,获奖2、实际的工作表现:产量、考勤、违规次数3、特殊训练成绩:培训4、临床诊断5、对团体的区分(人口统计学变量):年龄,种族,疾病类型6、其他现成的测验2.2.2 效标的选择有效符合测验目的可靠高信度、误差小可行可以收集到客观避免“效标污染”效标污染:1、效标污染(criterion contamination ) :一

6、般指由于评定者知道其预测源分数而使效标“纯度”降低的情况(Anastasi, 1988)2、好的效标应是适当的、可信的和无偏见的(Thorndike, 1949)2.2.3 两种效标关联效度1、预测效度(predictive validity):-预测未来-他将来会患焦虑症吗?2、同时效度(concurrent validity):-诊断现状-他患有焦虑症吗?3、二者的重要差别:进行测验(即预测源)与进行效标测量之间的时间。-不同时间=预测效度-同一时间=同时效度预测效度与同时效度的比较1、理想的策略:预测效度(1)做法:让学生参加高考,把所有的人都录取,一段时间以后,将他们的平均学业成绩与高

7、考分数求相关。这个相关称为效度系数。(2)预测效度的困境?实践上,伦理上2、实践中的选择:同时效度做法:让已经上了大学的学生参加高考,同时收集他们的平均学业成绩,计算高考分数与学业成绩的相关。优势:可行性、易行性3、二者的差别表面上:时间长短实质上:对样本代表性的要求2.2.4 效标关联效度的估计方法1、相关法: 计算测验分数与效标的相关系数。 统计的显著性: 样本量对相关系数显著性的影响相关显著性与样本量之间的关系(p < .05 水平)相关系数r样本量n.9973.7078.51415.32537.195102.0984022、区分法:根据效标上的成绩将被试分为好、坏两组,那么,这些

8、组在预测分数上应该有显著差异。如果存在显著差异,说明测验的预测效度高。3、命中率:当使用测验进行决策时,决策的正命中率和总命中率可以作为效度的指标。总命中率命中人数/总人数正命中率=被录取的成功者/录取人数2.3.1 结构(构想)效度的概念1、结构(构想):假设性的概念或特质2、结构(构想)效度(Construct validation ):一个测验对理论上的构想或特质的测量程度。3、例如:一个测验在多大程度上测量了“幸福感”(责任感、自主性等等)?这个面试(interview)测量了人际技能了吗?假设验证与累积证据2.3.2 结构效度的验证步骤1、第一步:对结构或特质进行界定(建立理论框架)

9、,说明该结构的心理学意义、它与其他结构或特质间的关系2、第二步:根据理论定义,推论出一些可能的假设,并用实验或统计的方法验证假设。3、例:焦虑测验的结构效度验证当人面临危险时,焦虑度会升高;服用某种特殊药物,可以减轻焦虑;患有某种精神病的人,他们的焦虑程度会比普通人高。2.3.3 结构效度的估计方法1、测验内方法:主要通过测验内部构造来分析测验的结构效度 (1)内容效度:可以作为结构效度的证据 (2)被试解答时的反应过程:看是否测到要测的结构 (3)考察测验的同质性:内部一致性方法(看测验是测单一特 质还是多种特质,从而确定测验的构想效度)内部一致性方法1、人格测验常用-题目分数与总分相关-分

10、测验与总分相关注:这种考察方法一般只能根据结果推论出测验是测单一特质还是多种特质的,对于测验效度的贡献比较有限,只是结构效度高的必要条件非充分,需要作进一步的研究才能确定测验所测构想。 2、测验间方法:通过测验间的相互关联(1)相容效度(congruent validity):新编测验与某个已知的能有效测量相同特质的旧测验之间的相关。例:新编智力测验与韦氏智力量表的相关如果高,则新测验的相容效度高。(2)会聚(辐合)效度(convergent validation):也叫求同效度。基本思想:如果两个测验是测量同一特质的,那么即使用不同的方法进行测量,他们之间的相关也应该是高的。例:一个纸笔形式的智力测验与一个操作形式的智力测验应该具有高相关(3)区分效度(discriminant validation) :也叫求异效度。基本思想:如果两个测验是测量不同特质的,那么即使用相同的方法进行测量,他们之间的相关也应该是低的。例:一个纸笔形式的智力测验和一个纸笔形式的人格测验,相关应该比较低(4)因素分析(factor analysis):一种多变量统计法。目的是降维,即用更少量的因素概括解释许多相互关联的变量。基本思想:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论