测量心理学第三章试题.doc_第1页
测量心理学第三章试题.doc_第2页
测量心理学第三章试题.doc_第3页
测量心理学第三章试题.doc_第4页
测量心理学第三章试题.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

座位号000机密启用前 2018年7月教育科学学院期末考试 心理测量与测验期末自测试卷(A)(课程代码 00000)本试卷共6页,满分101分,考试时间150分钟。总 分题 号一二三四五六核分人题 分251015103010复查人得 分得 分评卷人复查人一、单项选择题(本大题共12小题,每小题1分,共12分)在每小题列出的四个备选项中只有一个是最符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。1.下列说法中那项正确 【3.1.35.B.2.C】A.当测试题目比较困难时,测试成绩都比较差,是随机误差。 B.当测试题目比较困难时,且教师评卷时的评分标准不同,是系统误差。 C.当测试题目比较困难时,大多数人做不来的题都猜测,是随机误差。 D.测试的标准答案是错误的,导致答对的同学的成绩都降低几分,是随机误差。2.下列中不是误差的来源的是 【3.2.36.A.1.A】A.测量原理 B.测量工具 C.测量对象 D.测量过程3.下列说法正确的是 【3.2.36.B.2.D】A.测量工具所造成的误差的主要来源来自于测验的编制过程,其中信度与效度的影响最大。 B.如果测验的题目模棱两可,那么该测验的结果一定是错误的。 C.通过大量的研究证明,大多数的能力测验与测验成绩呈线性相关。 D.测验经验指由于不同受测者对测验的程序和技能熟悉程度不同,所引起误差的方式。4.不是测量中的三种理论模型中是 【3.3.41.A.1.C】A.CTT B.IRT C.ICC D.GT5.真分数理论的提出者是 【3.3.41.A.1.D】A.洛德 B.诺维克 C.皮尔逊 D.斯皮尔曼6.下列说法中正确的是 【3.3.41.B.2.B】A.CTT所采用的项目特征具有不变性。B.真分数与观察分数呈线性的关系。C.潜在特质理论采用了线性概率模型。D.IRT的样本取样是用的随机取样,有一定的样本依赖。7.下列说法不正确的是 【3.2.37.B.2.B】A.测验焦虑指被试在测试前和测试中所出现的一种紧张的、不愉快的情绪体验。 B. 在选拔测验中,受测者为了给人留下好的印象,在回答时可能会考虑施测者期望或社会道德等因素,而不按自己的真实情况作答,从而给测验带来的误差是受测者的反应倾向影响的。 C.应试动机是指受测者接受测验而的动机不同,会影响其作答态度、注意力、持久性、反应速度等,从而影响测验的成绩。 D.反应倾向指受测者由于某些个人偏好,而在测验过程中对不确定的问题根据自己的偏好选择。8.下列说法中有关信度的正确的是 【3.5.50.B.2.C】A.信度越大,SI2 B.信度越大,SV2 C.信度越大,SE2 D.信度越大,ST2 9.下列说法中有关效度度的正确的是 【3.5.50.B.2.A】A.校度越大,SI2 B.校度越大,SV2 C.校度越大,SE2 D.校度越大,ST2 10. 小明称体重,一会儿显示50kg,一会儿又显示75kg。下面那种说法正确? 【3.5.50.B.2.C】A.信度高,效度也高。 B.信度高,效度低。C.信度低,效度高。 D.信度低,效度也低。11. 11.小明称体重,本来只有50kg,却显示75kg。下面那种说法正确? 【3.5.50.B.2.D】A.信度高,效度也高。 B.信度高,效度低。C.信度低,效度高。 D.信度低,效度也低。12.下列说法正确的是 【3.4.43.B.2.A】A.CTT理论是依据弱势假设而来的。 B.ICC理论是依据弱势假设而来的。 C.IRT理论是依据弱势假设而来的。 D.ICC是线性概率模型。13.下列说法正确的是 【3.4.47.B.2.B】A.多数CTT模型都是假设完全潜在空间的。 B.多数IRT模型都是假设完全潜在空间的。 C.IRT又称“知道-正确假设”。 D.CCT又称“知道-正确假设”。14.IRT的主要模型不包括的有 【3.4.48.A.1.D】A.连续型IRT模型 B.多级评分IRT模型 C.二级评分IRT模型 D.一级评分IRT模型15.下列公式中正确的是 【3.3.41.B.2.B】A.T=X+E B.X=T+E C.ST2=SV2+SE2 D.ST2=SV2+SE2 +SI2得 分评卷人复查人二、不定项选择题(本大题共5小题,每小题2分,共10分)在每小题列出的五个备选项中至少有两个是符合题目要求 的,请将其代码填写在题后的括号内。错选、多选、少选或未选均无分。16.下列选项中属于IRT的特点的是 【3.4.44.A.2.ABD】A.能力参数估计的不变性 B.能力估计的精确性 C.能力估计的可靠性 D.项目参数估计的不变性 E.测验编制的便利性17.术语ICC是由谁提出的 【3.4.47.A.1.B】A.洛德 B.塔克 C.斯皮尔曼 D.诺维克 E.皮尔逊18.CTT的不足有哪些方面的表现 【3.4.43.B.2.ABCDE】A.统计量的样本依赖性,抽样变动大。B.能力与难度量表的不一致,测量误差大。C.信度估计的不精确性,复本施测难。D.测验结果拓宽的有限性,预测力缺乏。E.测量分数的测验依赖性,分数难比较。19.IRT的基本假设主要有 【3.4.46.B.1.CF】A.潜在特质空间的双维性假设 B.潜在特质空间的多维性假设 C.局部独立性假设 D.局部整体性假设 E.速度限制假设 F.非速度限制假设20.IRT的主要模型有 【3.4.48.A.1.ACE】A.连续型IRT模型 B.断续型IRT模型 C.二级评分IRT模型 D.一级评分IRT模型的 E.多级评分IRT模型 得 分评卷人复查人三、名词解释题(本大题共10小题,每小题2分,共20分)21.系统误差 【3.1.35.A.1】指由与测量目的无关的因素引起的一种恒定而有规律的效应。22.测验焦虑 【3.2.37.A.1】 是指被试在测试前和测试中所出现的一种紧张的、不愉快的情绪体验。 23.classical test theory 【3.3.41.B.2】真分数理论又称为经典测验理论,其操作定义是无数次测量结果的平均值。24.应试动机 【3.2.37.B.2】 受测者接受测验而的动机不同,会影响其作答态度、注意力、持久性、反应速度等,从而影响测验的成绩。25.IRT 【3.4.43.B.2】项目反应理论或题目反应理论或潜在特质理论,是针对经典测验理论的不足提出的。 26.测量误差 【3.1.34.A.1】指的是在测量过程中,那些与测量目的无关的因素所导致的测量结果不准确或者不一致的效果。27. 反应倾向 【3.2.38.B.1】指受测者由于某些个人偏好,而在测验过程中对不确定的问题根据自己的偏好选择。28. 潜在特质 【3.4.43.B.2】在IRT中,潜在特质指在观察分析测验反应基础上提出的一种统计构念。在测验中,潜在特质一般指潜在的能力,并经常用测验总分作为这种潜力的估算。29. 项目特征曲线假设 【3.4.47.B.2】又称为“知道正确假设”,即被试知道某一项目的正确答案,他一定答对,换句话说,若答错某一项目,则他必然不知道答案。30.单维性假设 【3.4.46.B.2】是指假定同一测验都在测单一向度,即测验中的每一个项目都测量到同一种共同的潜在特质。得 分评卷人复查人四、判断改错题(本大题共小题,每小题3分,共15分)判断下列各题正误,正确的在题后括号内打“”,错误的打“”,并将错误的地方改正过来。31.测量误差指的是在测量过程中,那些与测量目的无关的因素所导致的测量结果不准确的效果。 【3.1.34.B.2】()(1分)测量误差指的是在测量过程中,那些与测量目的无关的因素所导致的测量结果不准确或者不一致的效果。 (2分)32.在CTT中,基本假设主要有潜在特质空间的多维性假设,局部独立性假设,项目特征曲线假设,非速度限制假设。 【3.4.46.B.2】()(1分) 在IRT中,基本假设主要有潜在特质空间的单维性假设,局部独立性假设,项目特征曲线假设,非速度限制假设。(2分)33.在选拔测验中,受测者为了给人留下好的印象,在回答时可能会考虑施测者期望或社会道德等因素,而不按自己的真实情况作答,从而给测验带来的误差是受测者的反应倾向影响的。 【3.2.37.B.2】()(1分)在选拔测验中,受测者为了给人留下好的印象,在回答时可能会考虑施测者期望或社会道德等因素,而不按自己的真实情况作答,从而给测验带来的误差是受测者的应试动机影响的。(2分)34. 真分数模型和潜在特质理论的核心部分都是数学模型,其共同之处是把可观察到的被试的反应和无法观察的被试的潜在特质联系起来了,且采用了线性概率模型。【3.3.45.B.2】()(1分)真分数模型和潜在特质理论的核心部分都是数学模型,其共同之处是把可观察到的被试的反应和无法观察的被试的潜在特质联系起来了,但CTT采用了线性确定性模型,而潜在特质理论采用了非线性概率模型。(2分)35.行为样本测查的部分心理特质与特定的行为,而非全部。这于质检、水检不一样,行为样本涉及了抽样问题。 【3.5.50.B.2】()(1分)行为样本测查的部分心理特质与特定的行为,而非全部。这于质检、水检一样,涉及了抽样问题。(2分)得 分评卷人复查人五、简答题(本大题共3小题,31题6分,32、33题10分,共26分)36.请简述误差的来源。 【3.2.36.B.2】答:来源于测量工具。项目取样;表达的清晰与准确;及其可操作性;信度与效度的问题。(答对2项即可)(2分)来源于测量对象。被试的情绪、技能与技巧、学习、发展与教育、练习疲劳、反应倾向等。(答对2项即可)(2分)来源于测量过程。测试环境、主试因素、意外干扰、评分计分等。答对2项即可)(2分)37.请简述IRT比CTT的优越性。 【3.4.45.B.2】IRT在估计被试能力或潜力特质时,同时考虑被试的反应组型,因此对于原始得分相同但反应组型不同的个体,往往能够提供不同的能力估计值。(2分)IRT可以针对每一个被试提出其能力估计值的测量误差指标,而不是以一个笼统的标准误来代表测量误差,能够比较精确地断定每一个被试能力估计值的误差范围。(2分)IRT所采用的项目参数,不依赖于被试样本,也不依赖于项目库。(2分)IRT可以由同质性比较高的分测验中计算出被试的能力估计值,主试在时间、精力有限的情境下,可以较快而又不失精确地获得所需要的信息。(2分)IRT提出的项目信息函数和测验信息函数的概念,可以作为评定个别项目或整份测验的测量误差的指标,完全可以取代传统的“信度”概念。(2分)38.随着计算机技术的发展,CTT逐渐被淘汰,请简述CTT的缺点与不足并详细说明。【3.4.43.B.2】统计量的样本依赖性,抽样变动大。CTT所采用的统计量,诸如难度、区分度和信度等,都是一种样本依赖的指标,即指标会随着样本的特性而改变。(2分)能力与难度量表的不一致,测量误差大。在CTT中,被试能力量表时测验的卷面总分,其参照系是全部项目,项目难度量表是被试群体的得分率,其参照系是被试群体。(2分)信度估计的不精确性,复本施测难。CTT中对信度的估计很不精确,估计值具有笼统性,每个测验都只有一个信度值。(2分)测验结果拓宽的有限性,预测力缺乏。CTT主要应用于标准化技术和随机化技术来控制变量误差,但是在这种技术下获得的结果只能在相同条件下成立,却不能将其推广到非标准化情境中去,使得测验的应用范围受到限制。(2分)测量分数的测验依赖性,分数难比较。用CTT来解释测验分数时,必须依赖原测验来做解释,故难以比较不同的测验。(2分)得 分评卷人复查人六、论述题(本大题共1小题,每小题15分,共15分)39.请论述误差控制的方法并举例。 【3.2.40.C.2】 答:测量内容的标准化,测量内容是对所有受测者施测相同的或等值的题目。(1分)列如,测数学补习是否有限,小明考数学,小红考英语,即测量内容不一致。(2分)测量编制的标准化,即在测验编制时,要注意搜集材料的丰富性和普遍性。(1分)列如,测试中小学生的恋爱观,却用测验成人婚恋观的题来给中小学生做。(2分)施测条件的标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论