数理统计程序设计_第1页
数理统计程序设计_第2页
数理统计程序设计_第3页
数理统计程序设计_第4页
数理统计程序设计_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数理统计》课程设计题目 统计分析在学生成绩评估中的应用姓名杨秋燕学号 fT 11001010128成绩指导教师答辩评语:日期:2012-7-10统计分析在学生成绩评估中的应用【摘要】随着社会办学规模的不断扩大,教学质量的保证和提高的问题日益凸显,各种教学研究和教学实践层出不穷,但是学生学习状况的评价作为提高教学质量和激励学生努力学习的重要手段,却没有得到应有的重视,显然传统的评价方法忽略了学生基础条件的差异,并不能对学生的学习状况进行全面、客观、合理的评价,建立一种科学的评价方法势在必行。主要目的在于实践一种基于统计思想的新方法,用以改善现行教育体制在学生成绩评估中不足。以一个班级的期末成绩为案例,用基本统计的思想和方法提取出了对于学生有效的信息,并根据现行教育的宗旨,在每位同学的个人成绩信息表的制作上给出了建议。从统计思想出发提出的“学科突破概率”和“目标值上下限”两个新工具,将有助于学生目标的量化。【关键字】正态分布条件概率影响因子学科突破概率水平基准线0、引言2003年5月16日,教育部公布了“中国教育与人力资源问题报告”。报告中指出,我国人力资源基本现状:整体国民素质偏低,中高层次人才严重缺乏。2000年我国从业人员中受教育比例远不能满足现代经济对劳动者知识、技能的需要。如表1所示:表12000年我国从业人员中受教育水平教育水平所占比例小学及小学以下教育水平33%初中以下教育水平42%高中和中等职业技术教育12.7%高等教育4.7%基于我国目前人力资源的基本状况,专家们提出了今后教育发展的重要趋势:大力发展高等教育,培养大批高层级创新人才,教育发展的主攻方向应是高中阶段教育。随着这股高教育需求之风的来临,相应的,我国的本科、研究生等教育的招生规模在这几年内也出现了空前的发展。“凡事立则兴,不立则废”,目标在学习动力上的推进作用是不容忽视的。在学习中,能够充分了解自己的全局地位,以及获得老师对自己的学习建议,对于高中生而言是极其重要的一件事情。不仅有利于学生树立不同时期的个人短期、中长期的目标,而且有利于班主任获得更多的关于学生个人学习信息的资料,从而更好的安排任课教师的教学计划。如何能够在大型的考试后,通过一些技术处理得出一些充分反映学生总体的成绩水平的信息,以及针对每个学生的个性水平提出相应的建议对于现今的高中教育是很有意义的。另外,在高中阶段,一些老师偏爱优秀学生的情况屡见不鲜,这对于成绩中下学生的学习积极性产生了不小的负面影响,更甚者会产生对某些学科学习的抵触情绪。如何从学生现有的水平出发,发掘出他在薄弱学科上的潜能,为他打入“强心剂”,这也是很有意义的研究方向。下面将通过对于一组真实数据的案例分析,结合基本统计的思想和方法,对上述问题的解决进行一些尝试,最后给出理性的建议和思考。1、 原始数据选取重庆市第一中学2006级高二的理科某重点实验班56位学生的期末成绩作为原始数据.表2

理科综名次姓名语文数学外语合综合1赵健锋1061301182466002王世豪1151381212255993郝梵程1081301282335994宋娜1161381082365985周子奇1171321202245936周正杰1101251152295797王宇晨96133982515788吕盼1111211112305739李君杰11013312620157010谢子娣10812412720956811张丽达11213011121456712张凌菡10713910620956113龚浩1091428821855714周伊然10111712321655715郑襄南1041328823155516何嘉欢11411211620955117谢红阳1001249223354918胡家豪931179923754619张竹君11713310019554520任工少王王朱瑞琴113111113202539

21杨丹洁10811510321353922杜靖文11012212418153723陈俊猛1101169621253424中坤11513610217753025张俊1081169221352926孙自谦10311310320452327李爽1031259220352328海懿伦1039811120952129吴俊杰9111610420851930石建桥1031189719951731陈艳玲10910311419151732杨语涵10911112117151233白浩文921328519750634杨晨9512610218250535宋甜甜9811910318350336赵仁杰9412010518150037王晓璐1121239017449938张立旌991057422149939柳杨杰881199319649640谷志鹏971189618149241张博彬10110010218749042赵文凯1101158118348943刘娇琳939811617348044刘皓葳1061099017548045李艾明901399315547746吴逸飞7410810918647747杨舟10410210016847448李亚玲8711710916047349周坤901048319146850赵一凡931197517245951中凯凯961119115645452琚亚楠97999316345253李杰八、、971048616445154高昊918310017044455张咏秋101899815344156陈博文93961071414372、 数据的基本统计分析表3语文数学外语理科综合平均102.4464117.9464102.6429197.1607标准误差1.2286941.8078871.774173.49933中位数103118102198众数110130111209标准差9.19470113.5289913.2766826.18659方差84.54253183.0334176.2701685.7373峰度0.08608-0.31211-0.57233-0.77346偏度-0.52634-0.333090.0238960.003243区域435954110最小值748374141最大值117142128251求和57376605574811041观测数56565656最大(1)117142128251最小(1)748374141置信度2.4623573.6230863.5555177.012814(95.0%)样本方差从表中该项可以看出数学和理科综合的成绩相对于其它两门学科的成绩分散度显得更加厉害,这就表示:在考试的总得分中,这两科是最容易拉开距离的科目,得分容易,失分也很容易。因此,按拉开成绩距离的容易程度排序就是:理科综合>数学>外语>语文。偏斜度偏斜度表示的是分数段的分布对称情况。当偏斜度p>0时,表示左偏,也即高分人数较多,没能拉开距离,试卷的难度适中或偏低;相反而言p<0,就是右偏,高分人数较少,距离拉得较大,可能出现分数段的空挡,试卷的难度较大。从上面可以看出,该年的试卷对于该班全体同学来说,总体上偏难。3、相关系数现行的教育方针和社会都要求学生在学习阶段能够做到全面素质的提高,在考试中亦是如此。学习生活的每一个方面,都和周围的大千世界有着千丝万缕的联系,没有完全独立的物体存在。用统计分析中的相关系数来简单分析一下考试科目中的一些内在的联系:表4相关系数分析语文数学外语理科综合综合语文10.3758320.3358480.3748440.630782数学0.37583210.1285470.5072790.706356外语0.3358480.12854710.2271850.531349理科综0.3748440.5072790.22718510.872858合综合0.6307820.7063560.5313490.8728581从表中相关系数可以总结以下几点:(1) 、总分和高考的四个考试科目:语文、数学、外语和理科综合(理化生)的相关系数都很大,且相差不多。如此看来,要想在考试中取得好的成绩,任何一门的腐腿科目都最好不要有,这样才能有效的保证考试总分;(2) 、很多人认为语文和数学是两门完全没有联系的课程,就如同看待文理分班一样。现在从表中结果可以发现,这两门之间存在不小的联系的,毕竟理性思维和逻辑思维之间是互相补充,而学习的目的正是为了充分开发人的大脑的思考问题、解决问题的能力。每科虽然没有必然的外在联系,但是他们的内里却是千丝万缕的。4、学科影响因子用Y表示总分,X1表示语文成绩,X2表示数学成绩,X3表示外语成绩,X4表示综合科成绩,记X=(X1X2X3X4)',则有:Y=X1+X2+X3+X4=pX,其中。=(1 1 1 1)常规的想法会希望假定:X服从多元的正态分布,从而得到Y也是一元正态分布.这样延续下去的分析方法很容易陷入理论分析的误区,因为现实中的数据不是那么恰好服从正态分布;虽然给出了假定,但是实际操作人员会迟疑于最后得到的结果,因为结果的精确性和现实的某些不规则的随机性产生了极端的抵触,相信这也是为什么统计学在某些领域的应用发展方面受到阻碍的原因.在现实问题的分析中,将统计的思想有效的融合在实际问题中,在合理性的前提下采取统计的精确公式理论,这样才可能有效的利用统计这个分析工具.这和工业试验设计中采用的解决思路是一样的:理论来源于实践,在实际中检验理论,将理论结果更好的反馈到实践应用中.先采用简单的学科对总分的线性回归来观察它们之间的依赖关系.语文和综合方差分

析dfSSMSFSignificanceF回归分析144843.7444843.7435.684091.88E-07残差5467861.11256.687总计55112704.8语文LineFitPlot•综合•综合-预测综合综500- ■0 1 1 0 50 100 150方差分析dfSSMSFSignificanceF回归分析156232.8756232.8753.771371.19E-09残差5456471.971045.777总计55112704.8数学LineFitPlot1000r合综数学LineFitPlot1000r合综500-0-050 100 150+综合■预测综合数学方差分方差分析dfSignificanceSS MS FF回归分 ]析 1残差 54总计 5531820.1331820.1321.24365 2.51E-0580884.711497.865112704.81000合综500外语LineFitPlot1 1♦综合■预测综合00 50 100 150

理科综合和综合方差分析Significance回归分析185867.6785867.67172.77741.84E-18残差5426837.16回归分析185867.6785867.67172.77741.84E-18残差5426837.16496.9845总计55112704.8F理科综合LineFitPlot1000合综5000•综合■预测综合100 200理科综合300理科综合ResidualPlot50差0残-5050差0残-500 50 100 150•300-100理科综合图1个成绩和总成绩的回归分析每个回归方程在实际中表达的意义都要取决于实际问题的背景,而不是简单的将一些结果呈现给别人看,实际问题的理论结果要比较真实的反映到实践中去。这样才会使得学习的层面不是仅仅停留在理论意义上,而要把它深入到实际中去。在这里,容易陷入的误区是:将回归系数就看成学科的重要程度,或影响因子.这里称之为误区就是因为直接应用理论的结论,而没有结合实际。在实际中,总分的获得取决于4个学科的成绩的总和,简单的排除其中的3科而得到的回归系数并不能有效的解释学科的重要程度。5、学科突破概率通过上面的分析,已经得到全局意义下各个学科对于总分的影响因子。更进一步的分析要着眼于对于个人表现的分析,从而为每个同学确定其最优的突破口来提高成绩。假定某位同学的当前成绩是Xi=xi(i=1,…,4),那么他在当前的水平下优先考虑哪个科日对于他自己的成绩提高是最有帮助的?在概率论中有一个结论:“当X〜F(x)时,有F(X)〜U(0,1)”,这个结论很好的避开了分布假设问题。一个直观的认识来源于:如果某位同学一个学科当前成绩的累积分布Fj(x3i)很大时,那么在这个学科上提高成绩的难度应该比其他学科中累积分布Fj(x3j)较小的要大;也就是说如果总分提高1分的话,那么这1分出现在学科i中的概率小于出现在其它学科j中的概率.基于上面的考虑,用Pi(%)=1-Fi(七)=.Fi(xi)表示1分出现在

学科i中的概率,那么%(xi)=Fi(xi)就是1分不出现在学科i的概率(当前学科1的分数为xi)o从而得到的条件概率称为“学科突破概率”r(x*v*)—pqqq/rXA,x,x,x—1234i2’3’4 34(pqqq+qpqq+qqpq+qqqp)1234 1234 1234 1234r( )—"q&''rxx,X,X,X—1234"1234 ,'pqqq+qpqq+qqpq+qqqp■ 1234 1234 1234 1234r(x,x,x,x)=4J2P3。41 2 3 4 pqqq+qpqq+qqpq+qqqpr(Xr(X,X,X,X)—q1q2q34 12 3 4qqq+qpqq+qqpq+qqqp234 1234 1234 1234其中X=(X1 x2 x3 x4)为当前各科的成绩.对于周子奇同学当前成绩而言,他的学习重心应该放在综合科和英语上,这两门课程是使得他最容易提高分数的学科,尤其是综合科.上面结果表明:周同学在当前成绩水平下,总分提高1分有一半以上的可能性来自于综合科的提高.6、“基准线”分析法“腐腿科日”对于年轻人知识的积累是一个不好的现象,而且现在的学科发展越来越讲究多学科的交融,许多成果都来自于学科间碰撞的火花。不仅如此,在各个学科之间,还有着千丝万缕的联系,它们之间往往有着互补的作用,可以互相促进共同提高.那么一个自然而然的问题产生了:如果一个同学的当前成绩是Xi=xi(i=1,„,4),其中Xj是他的弱势科日,基于他个人现有的综合实力,为了达到学科的平衡,他的弱势科日成绩应该至少达到多少?以语文成绩的分析为例,将所有语文成绩的累积概率和总分的累积概率做P-P图分析:从图2可以发现,点几乎布满了整个区域,但还是可以看出有一个向上增长的趋势(这条趋势线一定是自左向右上升的)。在摒除了实际分数的尺度意义下,考虑语文和总分之间的水平因素是比较科学的,因为在实际生活中,这些定量分数的比较是在没有办法衡量相互之间的优劣关系时采用的折衷处理。用所有的点在平方损失下做回归,得到的这条直线被称为“平均水平基准线”。0 0.1 0.2 0.3 0.4 0.6 0.7 0.8 0.9将图中基准线以上的点,以点A(01176,01686)为例,向“基准线”做投影,得到在高水平对应的相应水

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论