




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、从量化角度浅析质量控制 主讲:王鼎.感念只需涉及到人的事都是复杂的,包括教育质量控制,我们的目的只是希望将复杂问题简单化,但不一定处理一切问题.这是一块必需用心去领会的领域,在这里我们似乎在了解他人,但问题处理的结果往往仅仅进一步了解了本人。当我们经常以为回答了某个问题的时候,我们却经常被更多的问题所困。相关技术只需经过实际才干表达其价值,否那么与渣滓无异。我思故我在,每个学校,每个地域都有其开展的特殊性,必需结合相应开展规律,作到个性与共性的有效结合,平衡好“破与“立的关系。.内容构造当前面临的问题量化手段及相关技术目的量化数据结果为诊断提供必要根据在教学管理中,有待进一步思索的问题.当前面
2、临的问题:宏观层面问责学生学习的改善.当前面临的问题:微观层面如何获取、利用相关学生信息,有效为诊断、决策所用? 涉及相关检验的合理运用如何保证学科教研组长所提供的信息具有较大的可靠性及有效性? 涉及数据的可靠性及评价的有效性如何保证教育目的实施的衔接性及稳定性 涉及控制与反响技术的运用.量化手段及技术目的量化相关内容:丈量、评价、检验、考试的区别与联络评价的普通常识丈量模型运用命题的技术控制技术目的:信度、效度、区分度、难度留意不同考试类别,所用公式不同.教育丈量与评价的根本问题丈量的根本含义 丈量的过程是赋值的过程 丈量往往包含在某评价或评定中,更多的被看成一种根本的研讨手段 人的心智的复
3、杂性,决议了丈量对象相关要素之间是不明确的,大量的概率模型被广泛的运用评价的根本含义 评价是价值分析、衡量和判别的过程 丈量不能替代评价,丈量是一个量化过程,评价是一个定性过程 在数学教育中,评价目的往往是:数学现实,包括定义、定义、公式,某些特殊的证明等获得数学结果的规范方法与技艺规范的运用,即典型的非数学情境,经过明确的数学手段完美处置.教育评价相关概念分析教育丈量与教育评价 教育评价是教育丈量的一种延续检验与考试 检验是对行为样本的客观的和规范化的丈量 考试普通指在比较正式场所下的检验,目的性比较强.评价丈量检验.教育评价的过程的四个步骤:确定教育目的;设计评价情境,这必需根据预先规定的
4、教育目的中期望学生变化的那种行为来设计的;选择和编制评价的工具,要求这些工具能引发教育目的所期望的那种行为;分析评价结果,即根据既定的教育目的来分析评价学生所到达的程度 .教育评价的开展趋势教育丈量的重心发生变化 现代认知实际的开展,更加关注学生在认知过程中的内部信息处置机制。 不仅仅局限于对学生未来胜利与否的预测,更关注对学习目前学习情况及学科才干的诊断。教育丈量的实际有进一步开展 不仅仅满足与在试题层次上对学生的反响进展量化,同时对学生在信息加工成分层次、加工过程步骤层次上,将心思实际、统计模型、认知模型整合了起来计算机技术的开展提高了检验的效率 提升的丈量与评价的数据采集精度,提升了评价
5、的可监控性和有效性教育丈量、评价的社会化功能逐渐加强 如何保证公平公正不仅仅是相关教育丈量学界关怀的问题,同时社会更加关注,特别是对于高风险的评价。.评价的参照系:回答运用什么参照来解释所得相关信息常模参照:确定学生在群体中的相对位置 类似高考、初三、高三模拟考试规范参照:阐明学生在多大程度上到达了所要求的学科规范 学校内部阶段性考试增长参照:解释并确认学习的作用以及学习的增长也促进情况 教师和家长很看中学生在学习中的提高,但很少将其作为评分的根底,一些专家以为其可以作为常模参照和规范参照的解释的补充.经典丈量实际与工程反响实际浅析经典实际浅析工程反响实际IRT浅析 留意:1、两套实际及模型的
6、运用假设 2、各自的优点和缺乏 3、关注多维工程反响实际在丈量上的广泛运用和开发研讨.经典丈量实际的假设.经典丈量模型的特点与优点实际假设是要求不高,是弱假设。从阅历的判别,有较强的可接受性。这套实际经过近六十多年的开展和实际,构成里较为完善的检验实际及对试题和试卷进展统计分析方法,方法简单,直观,易掌握。在我国教育任务者运用中有一定的普遍性。 .经典丈量实际的局限性抽样变动大才干难比较复本难实施缺乏预测力.IRT的特点根本思想:潜在特质根本思绪 确定被试的心思特质值和他们对于工程的反响之间的关系,这种关系的数学方式就是“工程反响模型。IRT的中心就是数学模型的建立以及对模型中各个参数的估计。
7、.IRT的根本假设潜在特质空间的单维性假设 大多数工程反响模型都假设完全潜在空间是单维的。部分独立性假设 被试对一个检验工程的反响不受他们对其他检验工程反响情况的影响。工程特征曲线假设ICC 反映了被试对某一检验工程的正确反响概率与该工程所对应的才干或特质程度之间的函数关系。.工程反响模型二级评分IRT模型 例:逻辑斯蒂模型 单参数模型拉希模型;双参数模型和三参数模型。多级评分IRT模型延续型IRT模型.工程反响实际的优点及运用才干参数估计的不变性。 即个体独立于检验工程参数估计的不变性。 即检验独立于个体提供被试才干估计值的准确度目的被试才干和工程难度在同一量表上,为检验编制、测题分数的报告
8、和解释提供了便利。.工程反响实际的缺陷由于是概率模型,所以数学模型与实测数据的拟合要求高;标题反响实际是一维性假设,即在模型性运用中,要求试题只测试单个心思特质。这个假设要求非常高,目前没有很好的方法可以去验证。但目前世界上不断地就多维情况开发相应的实际模型,曾经进入实践运用中。.命题技术控制攻克难点:建立阶段性测试的评价目的明确两个关系:课程规范与考试规范的关系 运用对象不同 性质与功能不同 可测程度不同 稳定程度不同教材与考试规范的关系命题要点:命题的目的、原那么及指点思想 留意: 1、对于高利害性的考试,命题必需守住如下底线: 科学性 公平性 难度 2、考试规范与课程规范的一致性考试蓝图
9、.命题的目的、原那么及指点思想命题的目的和指点思想命题的原那么 科学性 导向性 适切性 稳定性 .考试蓝图便于命题人员的编题操作,保证整卷的质量控制。既保证了在考试规范中所规定的试卷构造能得到确实地实现,在大大减少命题人员编制试题的盲目性和个人的随意性的同时,即保证全卷调查知识覆盖面,又有利于试题发扬其积极的调查功能,突出调查重点,确保考试目的的实现;便于审题人员的审核。审题人员根据上述所呈现的考试蓝图,根据考试规范,逐条对照,对发现的问题,有的放矢的提出修正甚至改换意见,促进试卷与考试规范的一致性,有利于提高试卷的质量。便于对试后结果的效度进展评价。没有这考试蓝图,评价就短少了参照物,有了这
10、个考试蓝图,就可以对考试成果进展更为细致、深化的统计分析,搜集、归纳考生的案例进展质性分析,对命题技术和试卷质量进展评价。 .考试蓝图.技术目的:难度.区分度试题的区分度以0.2以上为宜.试卷的信度:试卷能否可靠?信度的概念:反映丈量工具可靠性的工具信度的计算:其中 表示每道试题成果的方差, 表示整卷成果的方差公式表达出了丈量工具随机性误差的大小,信度值越大,随机性误差越小,丈量工具丈量的稳定性越强,反之,稳定性越小.效度效度:试卷的有效性简称效度,指试卷在多大程度上测到了所要测的对象,如知识、技艺、才干等。效度分类: 内容效度:知识、技艺的覆盖面、代表性及要求程度 构造效度:才干构造的表达
11、效标效度:检验分数与效标的相关程度 如用中考的成果与模拟中考的成果的相关程度来检验模拟中考的有效性,中考就成了模拟中考的效标 .试卷质量的中心问题:效度、信度 信度=效度.案例举例:总体情况:.总体情况 某学科试卷考试成绩总体情况表年份总分考生人数平均分整卷难度预计整卷平均分均方差及格比例(72)优秀比例(135)满分人数200512011.7万100.010.83397224.9691.5%(*)51.8%(*)4707200615011.6万119.670.798120231.7690.22%42.27%3569200715010.1万117.410.783119226.3293.03%2
12、0.64%186200815010.2万124.80.832123224.3895.57%43.03%1034注:由于2005年试卷满分为120分,(*)表示分数不低于60分的人数所占比例,(*)表示分数不低于109的人数所占比例.难度 近四年中考某学科试卷考试成绩总体情况表年份总分考生人数平均分整卷难度预计整卷平均分均方差及格比例(72)优秀比例(135)满分人数200512011.7万100.010.83397224.9691.5%(*)51.8%(*)4707200615011.6万119.670.798120231.7690.22%42.27%3569200715010.1万117.4
13、10.783119226.3293.03%20.64%186200815010.2万124.80.832123224.3895.57%43.03%1034注:由于2005年试卷满分为120分,(*)表示分数不低于60分的人数所占比例,(*)表示分数不低于109的人数所占比例.难度分布:分类设计分值实际分值容易题121分121分中档题17分13分较难题12分16分.客观题识别度指数.效度内容年份总分数与式的运算方程与不等式函数统计初步三角形和四边形相似形和锐角三角比圆2005120122824925166200615018322910322092007150133830102819122008(
14、二期含概率初步)30(含向量初步)316.构造设计分布:根底知识和根本技艺:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、19、20、2112、22123、231(2)、241、2;运算才干:8、9、10、19、20、212、241、2512;逻辑思想才干:14、18、2312、242、253;空间观念:6(一期教材)、15、17、18、212、2312、242、25123;分析、处理问题的才干:14、2112、2212。.量化数据为诊断提供根据量化不能为诊断提供全部的根据教师(特别学科教研组长)在学科素养(对学科、课程规范、教材运用的认识,对学生认知过程的把握程度)上的高低对判别的作用注重对群体性、典型性案例,作为量化手段的必要补充在诊断中的重要作用.在教学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 苗木移植方案
- 超前小导管施工工艺流程图
- Brand KPIs for neobanking C24 Bank in Germany-英文培训课件2025.4
- 敦煌吐鲁番文献所见回鹘古代历法
- 培训学校楼梯管理制度
- 介绍家人活动方案
- 物理中考一轮复习教案 第十八讲《液体压强、大气压强》
- 仓储公司年会策划方案
- 仓库安全宣传月活动方案
- 仓鼠活动策划方案
- 管材、管件供货方案
- 全国伤害监测培训课件
- 金属废料加工的废料分类与分拣技术
- 《院感培训护士》课件
- 幼儿园公开课:大班语言《相反国》课件(优化版)
- 医院污泥处置管理制度
- 护坡混凝土施工方案
- 订购单模板(订货单模板)
- 施工组织设计施工方案报审表
- 3D扫描与模型重建
- 县政府工作调动文件范本
评论
0/150
提交评论