考试成绩分布的数学模型_第1页
考试成绩分布的数学模型_第2页
考试成绩分布的数学模型_第3页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、考试成绩分布的数学模型吴潇辉摘要:一门课程考完之后我们在分析成绩的时候会发现,一个班的成绩根据我们的经验往往是分布在0, 100之间的任意一段可设以10分为一段,并且考得特别 低的很少,例如:0分、10分,考得特别高的也很少,例如:100分,但大多数人 考的不是特别高也不是特别低,例如:7090之间。现在,我们要建立一个数学模型来研究分数的分布情况。我们主要通过运用概率论中随机变量的概率分布规律的讨论,运用MATLA软件对题目中的数据进行拟合的 方法,并且把两种结果进行比拟,最终得出学生成绩的分布服从三大随机变量概率 分布中的正态分布。关键词:数据拟合概率分布函数概率密度函数MATLABMAT

2、HMATIC一、问题的提出:大学生学完一门课程,要进行考试,考试之后就有了成绩。通过这个成绩可 以说明学生的学习情况也可以说明老师出题的合理性。有人说一个班级的老师成 绩应付从正态分布可,那么,这种说法是否正确呢?例如下面的表格给出了某班 某门课的考试成绩:序号1234567891011成绩8185914662875173766271序号1213141516171819202122成绩9286848189857887818366序号2324252627282930313233成绩6987848267786455973474序号3435363738394041成绩4489827881817324

3、F面我们要解决的问题是:1、通过上面的表格分析这个班的成绩是否服从正态分布2、结合表格中的成绩给出成绩服从正态分布的判别方法和标准,以说明成绩分布的合理性。二、模型假设:1次门课程出题的难易程度相对于学生的学习程度来说适中,也就是说这次成绩具有合理性,可以把它当作衡量其他出题是否合理的标准。2、为了下面分析的方便我们姑且认为成绩的分布具有连续性。三. 符号说明y:在某一段分数上的人数;N :班级总人数;p:在某一段分数上的人数所占的比例;p(A):试验结果A的概率;F(x):概率分布函数;p(x):概率密度函数;,:常数。2四、模型建立与求解:从上面的表格中我们可以看出:成绩分布在7090分之

4、间的人数最多,在050分以及90100分的人数很少,5069分之间的人数也比拟少。因此我们可以近似认为学生成绩与分布在某一段成绩的人数之间关系可近似用下面的草图来表示:由于p - 工,也就是说对上面图中所有的纵坐标同除以41,因此应当不N 41改变图形的形状,所以每一段分数上分布概率与分数段之间的关系如以下图:分数为随机变量,右上图可以观察出,分布在 7089分断的概率最大,同时我们可以粗略的计算出:这个班这门课程的平均成绩大约为:74.4分,它也就在这段分数中。下面我们来说明成绩大致服从正态分布:1、 随机变量的概率分布有三大分布,即:二项分布、泊松分布和正态分布, 二项分布和泊松分布是用来

5、讨论离散型随机变量,而我们在假设的时候已经把分 数的分布近似的认为是连续型随机变量。2、二项分布和泊松分布是建立在n重贝努里实验的根底之上的,贝努里实验只3 有两个实验结果A及A,并且P(A) p,P(A) 1 p q其中0 p 1 :,而成绩 的出现不可能只出现两种结果,它不可能服从二项分布和泊松分布。3、理论说明,一个变量如果收到大量微小的、独立的随机因素的影响,那么 这个变量一般是正态随机变量。我们现在讨论的成绩正好满足这一点,影响成绩 的因素很多,例如:出题的难易、学生学习的程度、平时成绩的影响、学生的临 场发挥、老师改试卷时的误差等等。并且这些因素也是相互独立的,它们之间并 不从在特

6、殊关系。综合所述,成绩的分布应当服从正态分布。以下给出一个判别成绩服从正态分布的方法和标准:首先对给出的数据进行分析:把0 100每隔5分,分为20段,进行统计,统计出分数分布在每一段上的人数和 在每一段上的人数所占的比例。如下表:分数人数人数/总人数分数人数人数/总人数0-50051-5526-100056-600011-150061-65316-200066-70321-25171-75426-300076-80431-35181-851236-400086-90641-45191-95246-50196-1001对分析得出的数据做出如以下图:52O-05O.O+口-IJ203041150

7、数分&CI从图中可以看出这些点近似服从正态分布的图像,现在再利用matlab软件对这些数据进行拟合正态分布函数为F x1ye_dy,假设y而某一段分数分布的概率为Xix 5F X2F(xJ 0.5* e 2 e 2而每一段的概率可根据上面的表格得出,所以可用matlab软件来拟合一个正态分布概率密度函数,假设正态分布函数为x x 5y 0.5* e 2 e 2,可用表格中数据拟合可得出:80,79,见附录1:根据这两个值,我们就可得出正态分布概率密度函数1(x 80)2p(x) 1* e E,所以现在做出它的图像进行分析便可判定成绩是否服 7*79从正态分布。图像如下:为了便于分析成绩的分布情

8、况,我们可做出以下两个区间的图像,因为成绩虽然 只在0,100这个区间上,但概率密度函数区间太小看出成绩分布的整体趋势, 所以可对称的放在区间,但这不影响在 0,100这个区间上的分布情况plot2 *79* Exp2(x 80),x,160,2402*7921plot* ExpV2 *79(x 80)22*79,x,160,320从以上两个图也可以看出如果只取 0,100,不可能准确分析成绩分布图,所以 以上两种取法是合理的。从图中可得出成绩分布符合正态分布密度函数图像的一 般规律,概率密度图像是关于 x80对称的,且在这一点处概率密度取得最大值,这是正态分布的一大重要性质,由此可得出成绩分

9、布服从正态分布。6对这些数据进行分析并进行拟合,然后对密度函数图像分析,这就为分析成绩服 从正态分布找到了一种方法。而拟合出的密度函数图像与正态分布图像比照, 就 是说明成绩服从正态分布的最好凭证。也就是说正态分布图像就是一个判定成绩 服从正态分布的一个比拟好的标准。五. 模型说明分数本不是连续性的,但可以把它认为是连续性的,这为问题的分析提供了方便。先是对成绩分布从适用范围作了分析,它是服从正态分布。是对问题的一 个定性分析。接着又根据所给数据进行具体分析, 运用了拟合的方法,对成绩的 分布进行了定量的分析,对图的比照这是本模型的最大特点, 因此,这个成绩分 布图可以作为检验老师出题的水平和

10、学生学习的程度的一个标准。六. 模型推广本模型还可适用于其它方面,如对不同年龄人的腰围, 金属切削过程的产品 结果等一维正态分布,还可以推广到多维正态分布的验证, 这为各种工作的指导 起了很重要的作用。附录1:fun ctio n yhat二volum(beta,x);yhat=0.5*(2.7.A(beta(2)-x)./(2A0.5*beta(1)-2.7A(beta(2)-x-5)./(2A0.5*beta(1);x=0:5:95;y=0 0 0 0 0.0243902 0.0243902 0 0 0.0243902 0.0243902 0.0487805 0 0.0731707 0.0721707 0.0975beta0=0.1 81;beta,r,J=nli nfit(x,y,volum,beta0);betax=0:5:95;y=0 0 0 0 0.0243902 0 0.0243902

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论