




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
教育测量与评估期末复习简短的回答1.简要描述教育测量的基本要素,四个层次是什么?答:(1)教育测量的基本要素包括:参考点和单位。参考点:计算事物数量的起点,也叫零点。绝对参考点:绝对零点,如长度、重量。相对参考点:相对零点,如海拔和温度。单位:衡量事物的标准量的名称。理想的装置必须满足两个条件:同一个单位有相同的意思,即确定的意思。两个相邻单位之间的差异相等。(2)教育测量的四个层次四、教育水平的测量(第2章第25页未找到确切答案)从使用的参考点来看,教育和心理测量的参考点都是相对的参考点。就使用的单位而言,教育和心理测量中使用的单位的含义不明确,而且单位往往不等同。本质上,教育和心理量表属于等级量表。无论是测量智力、能力倾向还是个性,它都只具有量表的特点。由于大多数心理特征都具有正态分布的特征,并且没有绝对的零,所以我们也可以将测量后直接得到的原始分数转换成正态分布下的标准分数,并将这些分数作为等距的分数。2.教育测试开发的基本程序是什么?回答:首先,确定准备测试的目标二、专题计划的制定三、设计测试项目四.预测和项目分析V.综合测试六.测试的标准化七、收集信度和效度数据八、试验手册的编制3.简述实施教育考试应注意的问题。答案:第3部分,测试实施(第4章第92页未找到准确答案)(a)试验开始前的准备工作在主要审判中:首先,主测试应该在测试前熟悉测试的结构、内容和用法。其次,测试实施者应该精通测试说明,并且能够清晰流利地说话。有时,测试人员必须在必要时接受培训。培训包括:1、熟悉测试内容;2.掌握测量步骤;3、掌握评分方法;4.掌握乐谱的翻译技巧。测试:主试验应在试验前准备好试验材料,以免因短缺而暂时找不到。(2)测试过程中的注意事项1.指导2.测试场景3.应用和测试顺序4.测验焦虑(3)校长与学生之间良好的合作关系主要测试确保测试结果绝对保密。积极鼓励受试者4.简要描述歧视的相对性,包括哪些方面?回答:1.不同的计算方法有不同的判别值。两个相关值的比较。2.样本大小影响相关方法分割值的大小3.分组标准影响歧视指数。4.样本样本的同质性影响分割值的大小。5.简要描述几种可靠性评估方法?答:可靠性类型和评估方法(第6章,第6页,估计同质可靠性的唯一方法)重测信度复制品可靠性对半可靠性同质可靠性记分员可靠性同质可靠性的估计方法库尔德-理查森方法K-R20公式(仅适用于得分为1或0的情况)公式:在公式K-R20中:K是构成测试的问题数;P i是通过问题I的人数比例;齐是未能通过问题一的人的比例;Sx是总测试分数的标准偏差。K-r21公式(适用于1分或0分,每个问题难度相似)公式:在公式K-R21中:x条是测试的平均分数。其他符号同上。阿尔法系数或基伦巴赫公式它适用于所有非0、1评分和连续评分(即多重评分)公式:其中:K K是要测试的问题的数量;S i是问题I中分数的标准偏差;Sx是总测试分数的标准偏差。6.提高可靠性的方法有哪些?回答:(1)适当增加测试长度(2)使所有题目的难度接近正态分布(3)努力提高试题的辨别力(4)选择适当的主题任何测试的有效性都是为了某个目标,或者测试只在与测试目标一致的目的和场合下有效。N(2)效度是针对测试结果的,即测试结果的效度。(3)有效性具有连续性n检验的有效性通常用相关系数来表示,只是程度不同,没有“全有或全无”之分。也就是说,当我们评价一个测试时,我们不应该说“有效”或“无效”,而应该用更高或更低的效度来评价它。8.影响标准有效性的因素有哪些?回答:(1)测试长度(2)效果目标的选择N (3)预测值和基准测量值的可靠性被试样本的特征N (5)基本利率N (6)录取率二。讨论9.讨论教育考试的分类。答:(1)根据测试功能能力测验成就测试人格测验能力测验包括:实际能力测试和潜在能力测试(能力倾向测试);一般能力测试(智力)和特殊能力测试。实践能力:指个人当前的“能力”,它代表个人现有的知识、经验和技能,是正式和非正式学习或培训的结果。潜在能力:指的是一个人未来的“潜在的人”,指的是当给某个学习机会时,某个行为可能达到的水平。成就测试:它主要用来衡量个人(或群体)在接受一些正规教育或培训后掌握知识和技能的程度。人格测验:主要用于测量人格、气质、兴趣、态度、品德、情感、信念、价值观等方面的人格和心理特征。(2)按试验方法分类纸笔测试使用书写或图形材料,便于实施。小组测试大多是以这种方式进行的。操作测试:操作测试项目主要属于图片、物体、工具和模型的识别和操作。没有必要用语言来回答问题,所以它不受文化因素的限制。(2)按试验方法分类口试:测试项目是口头材料。受试者口头回答了问题。计算机测试:测试项目可以是文本或图形,显示在计算机上,受试者按键回答。(三)根据受试者人数个人测试:一次只接受一个受试者,通常是一个受试者和一个受试者面对面。团体测试:大多数人同时接受一项主要测试。个别测验优势:获取更多信息;易于建立和谐的合作关系;特殊科目(儿童、盲人)缺点:耗时、复杂,对主测试要求高。团体测验优点:节省时间,在短时间内收集大量数据缺点:受试者的行为不易有效控制,容易产生测量误差。(4)按应用领域:学术测试职业测试临床试验(五)根据测试点的性质:建设性测试投影试验(6)根据试验要求分类:最高为测试:这种测试要求受试者给出尽可能好的答案,这主要与认知过程有关,并有正确的答案。(能力测试、成就测试)典型的测试:这种测试要求受试者以通常的方式回答,没有正确的答案。(个性测试)(七)根据测试目的分类:描述性测试:测试的目的是描述个人或群体的能力、性格、兴趣和知识水平。诊断测试:目的是诊断个人或群体的一些行为问题。预测测试:目的是通过测试分数来预测一个人未来的表现和成就水平。(八)根据测试说明常模参照测试:这个测试比较一个人和其他人的分数,看他们在一个小组中的位置。标准参考测验:这种测验是将受试者的分数与某一标准进行比较来解释。(9)按测试难度分类速度测试:这种测试相对容易,但数量多,时间短。几乎每个科目都无法完成所有的问题。测量的是反应速度。难度测试:它包含从简单到困难的各种难题。其中有些极其困难,几乎所有的科目都无法解决。然而,还有很多时间。衡量的是解决难题的最高能力。10.讨论教育调查员的素质要求和道德标准。答:(1)教育测量师的素质要求专业理论知识专业技能对心理测试的科学态度错误的想法:普适理论论无用心理测试是智力测试。(心理测试=智力测试=智商=遗传决定论)正确的测试态度:心理测试是研究心理学的重要方法之一,也是决策的辅助工具。心理测试作为研究方法和测量工具并不完美。防止随机编制和滥用心理测试。(2)心理测量工作者的道德原则(1)测试的保密性和受控使用测试信息和样本问题的发布它有助于消除公众对心理测试的神秘和误解。测试的技术程序、可靠性、有效性和其他测试属性应该向所有人公开。让考生熟悉考试,消除焦虑,保证考试结果的准确性。对测试结果的反馈(2)考试中的个人隐私保护11.讨论如何正确解释考试分数的含义。(哪一个是正确答案,一个还是两个)首先,你如何看待考试成绩的重要性1.应根据教育和心理测量的特点进行分析。考试分数应该被视为一个范围,而不是一个明确的点。2.分数不应该是绝对的,也不应该根据测试结果做出最终结论。应参考其他相关信息。其他相关信息包括:测试前的个人经历测试情况也是需要考虑的一个因素。3.为了准确地解释考试成绩,不仅仅有常模数据是不够的,还有考试的信度和效度数据。4.不同考试的分数不能直接比较。为了使不同考试的分数具有可比性,两者必须放在一个统一的尺度上。第二,如何向受试者报告考试成绩的正确解释1.考试成绩不应直接告知受试者本人或其父母、校长及其他相关人员,而应予以解释和建议。2.避免使用专业术语,使用双方都能理解的语言。3.确保双方知道测试测量或预测了什么。4.如果测试是基于标准的,客户应该知道他在和哪个组比较。5.让聚会知道如何使用他的分数。6.考虑考试成绩对双方的影响。7.当事人应积极参与考试成绩的解释。12.讨论影响测量可靠性的主要因素。回答:(1)样本特征1.样本组异质性的影响一般来说,如果获得可靠性的抽样组是异质的,他们将倾向于高估测试的可靠性,而低估测试的可靠性。2.样本组平均能力水平的影响测试的可靠性将根据不同群体的平均能力水平而有所不同。因为项目对于不同级别的组有不同的难度,每个项目难度的累积变化会影响可靠性。(2)测试长度1.测试时间越长,测试样本或内容样本越有代表性。2.测试时间越长,参与者猜测因素的影响就越小。(三)测试难度难度对可靠性的影响只存在于某些测试中。如智力测验、成绩测验、能力倾向测验等。人格测验、兴趣测验、态度量表等没有困难。因为这些测试中的问题没有正确或不正确的答案。难度和可靠性之间没有简单的对应关系。理论上,只有当平均难度水平为50%时,获得的可靠性才是最高的。事实上,0.50的难度只适用于简答题。对于选择题,难度值应根据猜测因素增加。洛德提出,为了保证性能测试的可靠性,各种选择题的理想平均难度是:五个测试题中的一个:0.70四个选项和一个测试题:0.74三个选择和一个测试:0.77真或假:(4)时间间隔当在不同时间测量时,时间间隔只影响重测信度和重复信度。两次测试间隔越短,可靠性系数越大。间隔越长,可靠性系数越低。13.探讨中国古代的教育测量思想和实践。答:(1)中国古代的教育测量思想心理特征差异的思考孔子的教育测量思想“性是相似的,学习是遥远的”孔子说:人(或生命)与生俱来的纯粹本性是相互联系的。最近,在很长一段时间内养成的习惯彼此大不相同。大的“超过中国人会说英语,但少于中国人不会说英语还有”孔子说:“中等以上的人可以告诉他更高的知识或真理;然而,中等学历或低于道德水平的人不能告诉他高等教育或真理。心理特征差异的可测量性思想孟子:“对,然后知道重量;度(du),然后知道长度;一切都一样,什么是心?(孟子):说“只有用秤称,才能知道轻重;用尺子量一量可以知道长度。一切都是这样的,人类的心脏更需要它。(2)中国古代的教育测量实践教育测量的实践活动(人才评价与选拔)1.科举制度欧洲公务员考试制度在商周时期,表演了六种艺术:仪式、音乐、射箭、御术、书法和数学。汉代:五经:法律、军事、农业、税收和地理隋唐:儒家经典(各种形式:佛经、墨迹意义、口含意义、政策理论等。)2.民间智力游戏从:年到现在,婴幼儿的运动测量测量智力水平的古代仪器外国名人河内塔问题六门艺术九连环坞的精美设计可以与现代魔方和魔棒练习相媲美。性玩具是可比的,也可以被视为与现代认知心理学相比学校的汉诺塔任务更复杂,也更具可操作性服务。著名心理学家伍德沃斯称之为“中国迷宫”。著名心理学家伍德沃斯称七巧板为“唐突”。也就是“中国画板”的意思。拼图式的拼图任务现在几乎是当代大多数人的智慧。力量测试和创造力测试被使用并发展成标准化纸笔测试。3.三国时期,邵 人物志检查验证方法、“八种观点和五种观点”(观察)被美国人翻译后,命名为人类能力之研究4.韩非:用一只手画圆圈,用另一只手画正方形。到目前为止,它已经被用来衡量注意力。中国古代测量思想的特点;描述的分类类型注重整体评价,并将其与人的道德素质联系起来。可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师招聘之《小学教师招聘》通关考试题库附完整答案详解【典优】
- 教师招聘之《小学教师招聘》考试综合练习【满分必刷】附答案详解
- 个性化保健食品定制创新创业项目商业计划书
- 功能性乳品创新创业项目商业计划书
- 水产品深加工技术专利布局与保护创新创业项目商业计划书
- 教师招聘之《小学教师招聘》练习题库含完整答案详解【考点梳理】
- 2025年教师招聘之《小学教师招聘》题库试题附答案详解(达标题)
- 2025年教师招聘之《幼儿教师招聘》模拟考试试卷及参考答案详解【模拟题】
- 2025年教师招聘之《小学教师招聘》题库高频难、易错点100题模拟试题含答案详解(轻巧夺冠)
- 2025年教师招聘之《小学教师招聘》综合提升练习题及参考答案详解【b卷】
- CNAS-GL025:2023 校准和测量能力(CMC)表述指南
- 船用齿轮箱基础知识培训讲义
- 古建筑屋面瓦拆除与修复方案
- DB22T 2091-2014 国境空港口岸检验检疫设施建设规范
- 2024数据要素典型案例集
- 医院科室副主任竞聘
- 无人机项目建设规划投资计划书
- 机动车驾驶员培训理论科目一考核题库500题(含答案)
- 人教版(2019)高中生物必修1《分子与细胞》期末复习知识点考点提纲
- 初一开学第一课初一新同学我想对你说课件
- 《无线电失效程序》课件
评论
0/150
提交评论