浅谈正态分布的性质及其应用.doc_第1页
浅谈正态分布的性质及其应用.doc_第2页
浅谈正态分布的性质及其应用.doc_第3页
浅谈正态分布的性质及其应用.doc_第4页
浅谈正态分布的性质及其应用.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论与数理统计课程论文浅谈正态分布的性质及其应用姓名:林君泓班级:1008106学号:1100800130学院:机电工程学院摘要:正态分布是许多统计方法的理论基础,他是不以人们意志而转移的统计规律,且具有统一的函数表达式。正态分布在概率论与数理统计的理论研究和实际应用中都占有十分重要的地位。在自然界和社会现象中,大量的随机变量都服从或近似服从正态分布,如测量误差、产品的各类质量指标、生物学中同一群体的形态指标、经济学中的股票价格、农作物的收获量等等都涉及到正态分布。可以说,服从正态分布的随机变量应用之广是任何一种随机变量不能与之相比的。因此对于正态分布进行更深入更广泛的研究是值得的。本文将从其性质和填报高考志愿和胜率上的应用进行分析。关键词:正态分布 应用 胜率浅谈正态分布的性质及其应用正态分布是一个具有神秘色彩的分布。我们知道,对于某一件事或者某个要达到的目标,很多很多的个体发挥出来的水平大致上服从正态分布。也就是说,对于大量个体的发挥统计,常常能看到正态分布“冥冥之中”束缚着整体的状态。对于某个单独的单位,一般来说,对于“发挥出来的水平”这件事,也往往有波动的效果,不管是机器、工具还是我们人本身:有的时候,超水平发挥了;有的时候正常发挥;有的时候又会发挥失常。这种东西应该也可以抽象为围绕期望水平的正态分布。还有一个角度,如果有若干数据,包括发挥水平、排位情况,但是没有整体数据的时候,如果能推测是正态分布的情形,就可以近似计算出分布函数来,然后去估计其他的分布情况。这是反向推导的过程。一、正态分布的概念2、正态分布的密度函数 : f(x)为与x对应的正态曲线的纵坐标高度; 为总体均数; 为总体标准差; 为圆周率,即3.14159; e 为自然对数的底,即2.71828。1、正态分布(normal distribution) 又称Gauss分布或常态分布,是一种最重要的连续型分布。正态分布曲线是高峰位于中央,两侧逐渐下降,左右对称,永远不与横轴相交的曲线。二、正态分布的特征服从正态分布的变量的频数分布由、完全决定。1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。 2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。4、正态分布有两个参数,即均数和标准差,可记作N(,):均数决定正态曲线的中心位置;标准差决定正态曲线的陡峭或扁平程度。越小,曲线越陡峭;越大,曲线越扁平。5、u变换:为了便于描述和应用,常将正态变量作数据转换。是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于。6、描述正态分布资料数据分布的离散程度,越大,数据分布越分散,越小,数据分布越集中。 也称为是正态分布的形状参数,越大,曲线越扁平,反之,越小,曲线越瘦高。7、P(-X+)=68.3% P(-2X+2)=95.4% P(-3X+3)=99.7%三、正态分布的应用(一)高考填报志愿高考后,考生填报志愿时,下列两个问题就显得很重要:(1)高考后(或前)希望能准确估计自己的标准分和“百分位”(百人中所处的位置);(2)希望从考生手册中。往年高校第一志愿实际录取的最高、最低、平均分三个数据获取更多更准确的信息。不以人们意志而转移的统计规律正态分布理论,就可以帮助我们估计,实现这两个目的。一个学校在正常情况下,同类考生都有一、二百人以上规模,这已经算大样本容量了。只要教学和考试秩序正常,些成绩与全省同类考生的成绩就必然表现出正态分布的征。我们还知道影响本届考生成绩的敏感因素还有试卷难等,个别考生也许会发挥异常,但一个学校一、二百个以上生成绩在全省众多同类考生中因考试(统计学称为试条件相同引起的异常波动却是很小的,就是说,一个学校、二百个以上考生成绩在全省里面有较高相对稳定性。所,只有把每一个考生考后所估比较真实的成绩放在整个学,以大样本来分析才能保证用总体正态的特征来判断考生绩所处位置的科学性。这里以1998年西安电子科大在福建实录第一志愿40名考生为例,当时最低、最高、平均分分别是634、714、660分,现计算分析如下:(1) 把634,714隔10分分为8个段把分点换算为实际标准分;X0=(634500)100=134Xl=144x8=2.14(2) 查标准正态分布表算出大“曲边梯形”面积:S=(0.24)-(1.23)=0.07394(3) 查标准正态分布表算出8个小“曲边梯形”面积:S=(1.44)一(1.34)=0.01519S1=0.01315,S2=0.00128S3=0.00957,S4=0.00805, S6=0.00669 S7=0.010551,S8=0.00450(4)算出落在8十分数段的(理论)录取人数40SiS。要注意的是,根据标准正态分布的特征8个数据40SiS。均应采用去尾法所得整数作为所估实录人数,但考虑到最高分数段录取人数往往手步一人所以如果最高分数段录取人数出现040Sal,则要令40S8=1;次高分数段也类似处理;最低分数段以外的各段录取人数之和去减录取总人数所得的差就作为最低分数段录取人数。(二)胜负预测胜负的比较,如果能够通过“发挥出来的水平”的“得分”计算的话,就可以使用正态分布进行处理了。这里稍微解释一下什么叫通过“发挥出来的水平”的“得分”计算。统计对象如开机时间、射击成绩、跳远距离等等,都可以算是“各干各的”,最后“比较结果”并没有像足球比赛、篮球比赛这样的对抗评比。所以,本文讨论之后的应用也应该以这样的项目为研究对象。对于“各干各的”最后“比较结果”的比赛,我们先假设有两个不属于人类的事物,想赛之类都可以,标记为A、B。假如说A的平均成绩比B高,显然A会有更大的胜算。但是真正要想比较胜负,那就是“在某一次比赛中,A的成绩和B的成绩比较”了。A获胜,等价于A发挥出某个成绩的同时,B发挥出比这个低的水平。B获胜就是反过来的状况。当B发挥到极限好的时候如果成绩仍然不如A发挥到极限坏,那么B的胜率显然为0。这时我们假设出现了一个C,C的发挥特别的波动大,大到有些时候发挥出比A的最坏成绩高,这样AC竞争,C就有大于零的胜算。但是平均水平比B差,那么我们拿B、C较量的话,B更有可能打败C。到这个时候,我们会发现这种现象:B比C强,A比B、C都强,但是最弱小的C却比强于他的B更有可能打败A。在生活中,我们很少会承认这种事情的发生,但是,这是事实。所以说这种比赛不是简单的数据比较现象。此类胜负的竞争,应该是“胜者不一定强”的结果。而且,胜率的相对大小不足以说明各自的绝对水平。抽象至此,下边提供两个对象的胜负比较时使用的数值计算方法。还是假设有A、B两个对象。A的平均水平是a,发挥成绩的分布近似为正态分布Fa(x);B的平均水平是b,发挥成绩的分布近似为正态分布Fb(x)。这样,我们说:B相对A的胜算计算方式:PB战胜A=PB发挥出比A高的水平=pB发挥出比A高的水平|A发挥出ai水平*pA发挥出ai水平&考虑到A、B的理论上相互独立性,又有&=pB发挥出比ai高的水平*pA发挥出ai水平如果用积分表示,对于连续函数,有:B的胜率=PB战胜A=这是个二重积分。其中,外层积分小于零时取零。其中用到的各个因数可以通过很多很多次发挥水平的统计求得,最高最低水平用“3法则”确定。然后讨论对于人的应用。人因为其特殊性,受到心态的干扰,而心态不一定受到正态分布的限制,还有,心理水平的不断变化,有人越磨难越坚强,有人越磨难越崩溃,所以这些情况无法推断。能用在人身上的是更大的近似,也差不多用上述方法处理,只不过函数的影响因素多一个“比赛次数”,因为波动性也是次数的函数。这个计算就太复杂了。如果强行近似,就和上文写的“非人类胜算计算”方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论