心理测量学复习资料.doc_第1页
心理测量学复习资料.doc_第2页
心理测量学复习资料.doc_第3页
心理测量学复习资料.doc_第4页
心理测量学复习资料.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理测量学复习资料1、 心理测量定义:依据一定的心理学理论,使用测验对人的心理品质进行定量描述的活动。2、 测量量表的两个要素:参照点和测量单位。3、 品质优良的测量单位应该具备两条性质:一、有统一的意义;二、有恒定的价值。4、 观察分数X是一个包括三种分数的混合体,其中包括既包括欲测量心理品质的实际值,又包括测量的随机误差和系统误差两种误差值。欲测心理品质实际值称为目标真分数(V),随机误差值称为随机误差分数(E),系统误差值称为非目标真分数(I),目标真分数与非目标真分数合称为真分数(T)。T=V+I 、 X=T+E=V+I+E5、 标准化测验的四个标准化要求:测验编制过程标准化,测验实施标准化,测验评分标准化,测验分数解释标准化。6、 非标准化测验通常也称为自编测验,学校课堂使用的大部分是教师自编测验。自编测验编制目的明确、测试对象熟悉、内容设计针对性强、方法灵活多变。7、 最佳行为测验的定义:指被试作答时必须尽自己的能力找到最佳答案的测验。一般能力测验都是最佳行为测验,8、 典型行为测验的定义:指被试作答时要根据自己平时怎么想、怎么做如实作答,就是要提供自己“典型”行为的测验。自陈式人格测验都是典型行为测验。9、 首先倡导测验运动的是英国的优生学创始人费兰西斯.高尔顿。比内和西蒙合作完成世界上第一个智力测验量表比内西蒙量表,史称“1905量表”。10、 信度的定义:指的是相同被试在不同时间或不同场合下重复用同一测量工具或等价工具测量所得结果的一致性程度。信度反映了测量结果中由于随机误差因素所带来的方差变异大小。测量的信度(rxx)是一个从0.00到1.00的非负值。11、 重测信度的定义:指的是同一个测量工具在两个相同时间对同一组被试施测所得结果的一致性程度。12、 重测信度的使用条件:(1)测量工具所测量的个体心理特质在时间上应该是相对稳定的。(2)测量工具所测量的个体心理特质应该不存在明显的练习效应和遗忘效应。(3)在两次施测间隔期间不应该进行专门的训练和培训,以保证重测信度反映的随机因素的影响效应。另外两次施测时间间隔的长短会影响重测信度估计值的大小,因此,在报告重测信度时应该报告间隔的时间长度。13、 复本信度的定义:指的是两个平行的测验(复本测验)测量同一批被试所得结果的一致性程度。复本信度的估计过程就是计算同一批被试在两个平行的复本测验上所得分数的相关系数,也叫等价系数。14、 平行测验或副本测验的定义:指的是两个在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式等方面都相同或相似的测验,也就是用不同的题目测量同样的内容而且测验结果的平均值和标准差都相同的两个测验。15、 内部一致性信度的估计方法包括:分半信度评估法、库德理查森信度评估法、克龙巴赫Alpha系数评估法。16、 库德理查森信度的使用条件:只能针对1、0计分题型,对于其他题型需要使用更加一般化的估计方法。17、 克龙巴赫Alpha系数的使用条件:各种记分方式的测验内部一致性信度,是更一般化的测验内部一致性信度估计方法。18、 所有的测验内部一致性信度估计方法:包括分半信度估计法、库德理查森信度估计法、克龙巴赫Alpha系数估计方法,总会高估速度测验的信度,因此在估计测验的内部一致性系数时,需要对测试和估计过程进行适当的修正。一般可以这样设计,把一个速度测验分成两半,在不同的时间、相同的时限内进行测试,计算着两半测验分数的相关系数。19、 测验标准误公式: (Se是测量标准误,Sx是测验分数的标准差,Rxx是信度)20、 效度的定义:指的是测量工具测出它所希望测量的心理特质或行为特征的效果和程度。效度研究的就是测量结果的准确性问题。21、 人格测验需要表面效度低,能力(成就)测验需要表面效度高19、基于效标关联性的效度验证过程涉及的是,被试在该测量工具上的表现与另外一个独立存在的、可观察的相关行为特征表现之间的关联性程度。这个独立存在的、可观察的相关行为特征表现称为效标。基于效标关联性的效度证据采集可以有预测性设计与同时性设计。20、基于效标关联性的效度验证方法的影响因素:1、群体的一致性或同质性程度:越同质(全距越窄)的样本群体,也就是测量得分全距越窄的样本,得到的效度系数越低。由于相关系数是两个变量之间的关系,因此,无论是预测变量还是效标变量,其得分全距越窄,效度系数也就倾向于越低,应该尽量扩大被试群体的异质性,避免低估测验的真实效度。2、测验长度:正如信度系数一样,效度系数也会直接受到测验长度的影响。测验长度越长,结果越稳定,效度系数越高。3、效标污染:对于这种效标评价收到被评价测验结果信息干扰的现象,我们称为效标污染。效标会因为获取效标分数的方法和过程而受到污染,从而降低效标的有效性。21、难度是指题目的难易程度。计算方法:(1)得分率法难度P计算公式: ( 为所有被试在第i题上的平均得分;Ti为第i题的满分)(2) 极端分组法: (Phi为高分组在第i题上的得分率、Pli为低分组在第i题上的得分率)Pi的取值范围为0,1。22、在常模参照测验中,对所有被试而言,合理项目难度为0.5左右,分布范围应控制在0.30.7之间。23、区分度的计算方法:鉴别指数法 。Di指第i题的鉴别指数即区分度。PHi:高分组在第i题上的得分率、PLi:低分组在第i题上的得分率),区分度取值范围是-1,1.24、影响题目区分度的因素:(1)题目难度。题目过难或题目过易,都会导致被试在题目上的得分差异很小甚至没有,即区分度低。(2)被试群体的同质性。被试越同质(即被试的水平相接近),则被试在题目上的得分越接近,被试间的差异越难区分,表现出题目无区分能力,即区分力低。(3)测验各题所测心理品质的一致性。若题目所测量的心理品质各不相同,则以测验总得分作为能力高低的假设不成立,这时计算出的区分度显然会低。(4)题目本身的文字表述和内容质量也会影响题目的区分度。如果题目的表述存在歧义,或题意不清,或答案有误等,均会导致题目的低区分度。25、题目功能差异的定义:是指不同群体在统一题目上的答对概率不同,即不同群体在同一题目上的得分存在差异。造成题目功能差异的原因可能是群体间本身水平存在差异,也可能是群体间本身水平不存在差异而由于其他原因所致。由前者导致的称为良性题目功能差异,后者则称为不良题目功能差异,即存在测量偏差。关注较多的群体差异主要有性别差异、地区差异、种族差异、跨文化差异等。26、一致性题目功能差异的定义:是指被试的能力水平与其所在的组别之间不存在交互作用,即在所有的能力水平上,一组被试回答某一项的正确率都大于另外一组被试。27、常模参照测验的定义:是通过测试将被试个体的心理发展水平与某一特定群体(测试对象总体)的心理发展水平进行比较,从而确定被试个体心理发展水平在这一特定群体中的相对地位的测验。足够大的有代表性的样本叫标准化样本。常模就是指根据标准化样本在测验上的测试结果,在经过一定的统计技术处理止呕,建立起来的具有参照点和单位的测验结果评价参照系统。28、分数转换方式有两种:一、纵向转换,发展性常模,二、横向转换,群体内常模。29、心理年龄常模的定义:就是以年龄为评价指标,通过年龄和心理发展水平的对应关系建立起来的分数参照标准。30、发展顺序量表常模是通过年龄和典型行为特征的对应关系建立起来的评价参照标准,主要用于评价个体特别是儿童的行为发展特点和水平。30、群体内常模:百分等级分数常模、标准分数常模。Z分数T分数CEEB分数离差智商平均数(X)050500100标准差(SD)1101001531、 标准参照测验的定义:是根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验中所得结果,也是根据某一明确界定的行为标准直接进行解释的。标准参照测验的标准指的是编制测验和解释测验分数时所依据的知识和技能范围,而不是指划界分数。32、 测验项目的难度分析:如果项目对要考察的内容范围有良好的代表性,即使通过率很高或者很低,应该保留下来。标准参照测验区分度分析方法有:前测后测法,控制组法。33、 标准参照测验的信度:分类一致性信度、荷伊特信度。34、 测验等值的定义:就是通过对考核同一种心理品质的多种测验形式作为测量分数系统的转换,进而使得这些来自不同测验形式的测验分数之间具有可比性。35、 测量等值的条件:(1)测验所测心理结构或品质的同一性。被等值的不同测验形式所测的必须是同一种心理品质,测验的内容与范围也应该基本相同。(2)等信度。被等值的不同测验形式必须又相等的测验信度,不能指望一个低信度的测验通过与一个高信度的测验等值而提高自身的可靠性。(3)测验等值转换关系的公平性。(4)测验等值转换关系的可递推性。(5)测验等值转换关系的对称性。(6)测验等值转换关系对总体的唯一性或样本不变性。36、 等值数据采集设计有三种:单组设计、随机等组设计、锚测验非等组设计。37、 单组设计:把拟进行等值的两个 或多个测验同时向同一被试组施测,然后借助于同一被试组把拟进行等值的测验联系起来。两组测验分数的差异主要是由于两个测验的难度不同而引起的。这种等值设计既简单又无抽样误差。38、 随机等组设计:从统一总体中随机抽取两组被试,这两组被试被认为在能力分布上是相同的或很接近。这两组被试分别接受测验X或者被试Y,然后估计两测验形式间的等值关系。39、锚测验非等组设计:锚测验非等组设计住测验编制时另外编制一组测验题,这些题目称为共同题,也称为锚题。锚测验题既对第一组被试施测,也对第二组被试施测。由于施用了一组共同题,两个被试之间能力的差异就可以被定量描写,进而可以排除被试组间的能力的差异而将拟进行等值的测验形式之间的等值关系估计出来。39、 教育成就测验的定义:又称教育测验、学绩测验,它是在个体经过一个阶段的学习或训练之后,对其知识、学识和技能的发展水平所进行的测定,是一种专门为教育情境而设计的测验。40、 测验的信度不能低于0.8甚至0.9,测验的预测效度不能低于0.4,并存效度不能低于0.6。41、 智力测验的结果通常有三种表达方法:智力年龄、比率智商和离差智商。42、 戴斯智力PASS模型理论:四种认知成分:计划、注意、同时性加工、继时性加工。43、 斯滕伯格智力三个亚理论:智力情境亚理论、智力经验亚理论、智力成分亚理论。44、 斯坦福比内量表第一次修订在1916年,量表包括10个分量表,分量表分数都是以10为平均数,3为标准差。45、 韦克斯勒智力量表分为三种:韦克斯勒幼儿智力量表(WPPSI)、韦克斯勒儿童智力量表(WISC)、韦克斯勒成人智力量表(WAIS)。46、 WISCIV由14个分量表组成,以因素分析法分析。每一个分量表上的原始分要转换为平均数为10、标准差为3的标准分数,最后得到平均数为100标准差为15的全量表智商。47、 常用的团体智力测验:瑞文推理测验。瑞文测验包括:渐进矩阵标准型(SPM)、渐进矩阵彩色型(CPM)、瑞文测验联合型(CRT)。48、 能力倾向指接受必要的培训和实践后获得成功的可能性,是一种潜在的、特殊的能力。49、 GAYB(一般能力倾向成套测验)由15种测验项目构成,其中11种是纸笔测验,4种是器具操作测验,可以测定9种能力倾向。平均数为100、标准差是20。50、 军事职业能力倾向成套测验(ASVAB)包含10个分测验,可以产生7个独立的合成分数。51、 学业评估测验(SAT):测验分数在一个平均数为500标准差为100的标准分数量表上报告。52、 人格测验的种类:(1)自陈量表(2)评定量表(3)投射测验53、 人格自陈量表的编制方法的编制策略分为演绎式编制策略和实证式编制策略。演绎式编制策略包括逻辑分析法和理论推导法;实证式编制策略包括效标团体法和因素分析法。54、 MMPI采用经验效标法编制而成,其主体是10个临床量表和4个效度量表。效度量表是MMPI最先提出的。最后转化为T分数,即平均数为50,标准差为10。55、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论