



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
用主成分分析模型构造中学考试综合评价指数 摘要 在中学考试的综合评价中,使用较多的指标进行描述使分析复杂化,难以对众多指标的影响作出正确的判断,需要少量几个“综合评价指标”。通过简单加权的合成方法,难以得到科学的结果。主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少量几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关,较好地解决了这一课题。关键词 考试评价;主成分分析;数学模型;计算步骤,指数构造方法一、问题的提出在中学考试评价中,通常使用各学科的“平均分”、“优秀率”、“及格率”和“低分率”等指标。考虑到成绩的分布状况(“优秀率”与“及格率”之间的差距偏大,可能失去部分信息量),某些地区还使用了“良好率”指标。这样,k个学科的考试评价的p项指标将多达kp个。在对考试进行综合的评价时,使用较多的指标进行描述不仅会增加评价的工作量,而且会因评价指标间的相关性造成评价信息重叠,相互干扰,其结果使分析复杂化,难以对众多指标的影响作出正确的判断。因此,需要少数几个甚至一个“综合评价指标”来代替众多的且相互之间具有相关关系的指标,同时又需要不失去原有指标具有的信息量,这是考试评价中具有现实意义的课题。某些地区采用一种“降维”的方法,较成功地把kp维指标降为p维指标,即在使用“总分平均分”的同时,用“科平均率”取代各科的“率”(计算方法见备注1)。如何把p维指标再合成为一个“综合评价指标”?采用一些简单加权的合成方法时,由于对各指标的影响不容易作出正确的定量化的判断,及权数产生的科学性等问题,往往难以得到令人信服的科学的结果。主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少数几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关。较好地解决了这一课题。二、主成分分析的数学模型= (X1,X2,Xp) (式11)设有n个样品,每个样品观测p个指标(变量):X1,X2,Xp, 得到原始数据矩阵:(i = 1,2,p)其中用数据矩阵X的p个列向量(即p个指标向量)作线形组合(即综合指标向量)为:(i = 1,2,p)上述方程组要求:且系数ij由下列原则决定:、Fi与Fj(ij,i,j=1,p)不相关;、F1是X1,X2,Xp的一切线性组合(系数满足上述方程组)中方差最大的,F2是与F1不相关的X1,X2,Xp的一切线性组合中方差最大的,Fp是是与F1,F2,Fp-1都不相关的X1,X2,Xp的一切线性组合中方差最大的。这样决定的综合变量F1,F2,Fp分别称为原变量的第一,第二,第p主成分,其中F1的方差在总方差中占的比例最大,其余主成分F2,F3,Fp的方差依次递减。在实际工作中挑选前几个甚至一个最大主成分F1,就能够基本包括全部指标所具有的信息,达到了将众多指标简化浓缩为少数几个甚至一个综合评价指标的目的。三、主成分分析的计算步骤及实例求解满足上述要求的方程组系数ij的运算,在数学上可以变为求方程组中的系数向量,即矩阵的特征值及其相应的单位特征向量的问题。建立模型时,首先将原始数据写成矩阵,如(式11)。注意:原始数据矩阵X的p个指标需要有一定的联系,而且为正相关(如果为负相关,需要进行相应的转化)。1、将原始数据标准化。2、建立变量的相关系数矩阵:R =(rij)pp 不妨设R=XX3、求R的特征值12p 0 及其相应的单位特征向量:4、写出主成分: Fi = a1iX1 + a2iX2 + + aPiXP i = 1, ,p5、计算第j个主成分(特征值)的方差贡献率及前几个主成分的累计方差贡献率。选取累计贡献率大于某值(如定为90%、95%、99%等)的前几个主成分。6、对选取的主成分进行解释或分析。主成分分析计算过程举例:对青岛市中考的5项指标作主成分分析,原始数据如附表1:由于“低分率”指标与其他指标之间呈显著的“负相关”,直接代入必然产生严重的干扰,故实际写入矩阵时该指标以“100% - 低分率”的形式出现。第一步、将原始数据标准化。第二步、建立变量的相关系数矩阵R如下:X1X2X3X4X5X11.0000.8850.9420.9790.989X20.8851.0000.9660.9330.818X30.9420.9661.0000.9830.889X40.9790.9330.9831.0000.949X50.9890.8180.8890.9491.000表1、相关系数矩阵R第三步、求特征值、特征向量和方差贡献率主成分特征根方差贡献率累计贡献率14.735094.7094.7020.22984.6099.3030.02870.5799.8740.00510.1099.9750.00130.03100.00表2、特征根和方差贡献率从表2看,前2个特征值累计贡献率已达99.30%,说明前2个主成分包括了全部指标具有的99.30%的信息,我们取前2个特征值,并计算出相应的特征向量。第一特征向量第二特征向量0.4530120.3363460.434557-0.6421300.451546-0.3209310.4576400.0089460.4388760.609478表3、单位特征向量第四步、写出主成分:第一主成分 F1 = 0.453012X1 + 0.434557X2 + 0.451546X3 +0.457640X4 + 0.438876X5第二主成分 F2 = 0.336346X1 - 0.642130X2 - 0.320931X3 + 0.008946X4 + 0.609478X5 第五步、分析。从第一主成分F1的各项指标的系数大小基本相当可见:这5个指标对F1的作用也基本相当。“良好率”指标的系数(0.451546)甚至略大于“优秀率”指标的系数(0.434557)。从第二主成分F2的各项指标的系数分析可见:“低分率”指标(0.609478)对F2的作用最大。本例说明把“良好率”和“低分率”纳入指标考核的体系是有必要的(某些地区未采用这2个指标)。四、构造综合评价指数的方法 方法一:利用主成分F1, ,Fm作线性组合,并以每个主成分Fi的方差贡献率i作为权数构造一个综合评价函数: y = a1F1 + amFm y也称为评估指数,可以依据对每个样品计算出的y值大小进行排序或分类划级。在上述例子中,青岛市中考指标主成分分析的综合评价函数可以表述为: y = 4.7350 F1 + 0.2298 F2方法二:只用第一主成分F1作综合评价指数。在本例中,第1个特征值累计贡献率已达94.70%,说明第一主成分已经基本包括了主要指标具有的信息。当主成分特征向量的各分量符号不一致时(如本例第二主成分F2),只用F1作综合评价指数是适宜的。青岛市中考指标主成分分析的结果见附表1。该表中分别列出了“第一主成分F1指数”和“综合评估指数”的数值、标准分值Z及其排序名次。用一个权数阵而得出去乘当原来的指标X1,XP 的重要程度存在较大差异时,可以对原来指标辅以加权“加权主成分分析”,相当于:其中 m = m1 + + mp =1,然后对y值作主成分分析。五、用计算机软件自动实现主成分分析的过程掌握主成分分析的数学模型需要一定的高等代数如矩阵运算的基础知识;进行实际计算的工作量十分繁杂;以通用的Excel软件不可能实现其计算过程;等等,都限制了该方法在基层教研部门的普及应用,甚至在国内中心城市教研室中的应用也尚不普遍。曾见有关文献介绍“陕西省高中会考综合评价的主成分分析模型及应用”的经验。用计算机软件实现主成分分析综合评价的过程,并在基层教研部门甚至重点中学进行普及应用具有重要的意义。笔者设计的大中型城市教研室成绩汇总、统计分析系统GSAS 软件设有“主成分分析综合评价”模块,可完成数据采集、负相关转化、标准化、计算分析、构造评价指数和排序的全部过程,主要功能有:1、选择评估对象。可选择“全部地区”(以市、县、区为单位评估),也可选择“全部学校”或“某地区学校”(以学校为单位评估),也可以在软件的“学校版” 内运行,即在校内以班级为单位评估等。2、选择评估科目。可选择“汇总指标”,对考试进行评估,也可选择“单科指标”,对某个科目评估。3、加权主成分分析。模块具有“权数”设置的条件。例如某次考试为了强调“及格率”在整体评价目标中的作用,可加大该指标的权数,而相应减小其他指标的权数。如果想把“考试评价”扩展为更广义的“教学评价”,在评价指标体系中加入“巩固率”(实际考试人数/在册学生人数)、“科平差生转化率”、等指标,也是完全可以实现的。参考文献、于秀林 任雪松编著多元统计分析中国统计出版社2003年4月、刘新平 刘存侠编著教育统计与测评导论科学出版社 2003年6月、王汉澜主编 教育评价学 河南大学出版社 1995年版 附表1、青岛市中考指标主成分分析统计表学校总分平均分科平优秀率科平良好率科平及格率科平低分率第1主成分指数第1主成分指数Z第1主成分指数名次综合评价指数综合评价指数Z综合评价指数名次育才444.9440.6268.4384.444.393.8561.77213.6091.7511超银439.7439.7267.4884.384.123.7421.72023.5041.7002育文436.934.7668.6685.474.273.5311.63233.3221.612326中425.4738.3163.1378.618.443.0991.42442.8921.4034求真425.1732.9459.5179.824.752.8521.31152.6881.3055育贤422.5629.8561.5380.515.722.7291.25462.5801.2526智荣422.1932.2259.878.436.822.6941.23872.5361.2317长泰421.9131.458.1578.386.282.6091.19982.4621.1958志成416.929.8257.3877.917.072.4221.11392.2891.111939中412.5930.7355.7274.499.12.2131.017102.0831.01110新兴404.8825.9851.971.989.251.6980.780111.6140.78311七中396.8326.9850.0468.9310.671.4860.683121.4060.68212滨海396.8623.8451.770.4511.421.4020.644131.3360.6481347中386.9224.1247.1966.8613.211.0210.469140.9710.4711459中380.5625.748.1364.7516.230.9240.425150.8650.4201549中302.929.5425.5739.3134.94-2.643-1.21452-2.491-1.2095227中283.676.5218.3932.7938.86-3.513-1.61553-3.312-1.6075364中273.758.6220.7232.7242.51-3.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天井老宅修缮方案范本
- 工程施工方案的发展趋势
- 路面摄像机施工方案范本
- 门窗质量鉴定方案范本
- 银行绩效测算方案范本
- 标识标牌纠错方案范本
- 2025解除房屋租赁合同范例
- 卡罗拉混动隔音施工方案
- 工厂防疫措施方案范本
- 角磨机铲除油漆施工方案
- 中国桑蚕养殖行业发展前景及发展策略与投资风险研究报告2025-2028版
- 中医高血压糖尿病课件
- 外带药输液协议书
- 微信小程序电商代运营及品牌授权合作合同
- 2025年天津市春季高考升学考试全真模拟试卷(二)中职英语(无答案)
- 初中数学问题解决策略 特殊化教案2024-2025学年北师大版(2024)七年级数学下册
- 古代汉语平仄试题及答案
- 钢卷储存及装卸安全管理办法
- 马工程《艺术学概论》-绪论省公开课一等奖全国示范课微课金奖课件
- 巡视巡察工作流程
- 中秋国庆教师廉洁教育
评论
0/150
提交评论