数理统计在生活上的应用.docx_第1页
数理统计在生活上的应用.docx_第2页
数理统计在生活上的应用.docx_第3页
数理统计在生活上的应用.docx_第4页
数理统计在生活上的应用.docx_第5页
免费预览已结束,剩余6页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本科学年论文论文题目: 数理统计在实际生活中的应用 2目 录一、绪论1二、数理统计的方法2 (一)点估计2 1、点估计的概念2 2、点估计的优良性2 (1)无偏性2 (2)有效性3 (3)相合性3(二)方差分析4(三)假设检验5三、数理统计在实际生活中的应用6 (一) 检验汽车轮胎寿命6 (二) 关于男女色盲比例的问题6四、总结7参考文献8数理统计在实际生活中的应用内容摘要数理统计学是统计学的数学基础,从数学的角度去研究统计学,为各种应用统计学提供理论支持。它研究怎样有效地收集、整理和分析带有随机性的数据,以对所考察的问题做出推断或预测,直至为采取一定的决策和行动提供依据和建议的数学分支。概率论作为一门研究随机现象统计规律的数学学科,已在包括控制,通讯,生物,力学,金融,社会科学以及其他工程技术等领域得到了广泛的应用。关键词:点估计 方差分析 假设检验 8一、绪论数理统计是数学系各专业的一门重要课程。随着研究随机现象规律性的科学概率论的发展,应用概率论的结果更深入地分析研究统计资料,通过对某些现象的频率的观察来发现该现象的内在规律性,并作出一定精确程度的判断和预测;将这些研究的某些结果加以归纳整理,逐步形成一定的数学概型,这些组成了数理统计的内容。数理统计在自然科学、工程技术、管理科学及人文社会科学中得到越来越广泛和深刻的应用,其研究的内容也随着科学技术和政治、经济与社会的不断发展而逐步扩大,但概括地说可以分为两大类:试验的设计和研究,即研究如何更合理更有效地获得观察资料的方法;统计推断,即研究如何利用一定的资料对所关心的问题作出尽可能精确可靠的结论,当然这两部分内容有着密切的联系,在实际应用中更应前后兼顾。但按本专业的总体设计,我们的数理统计课程只讨论统计推断。数理统计以概率论为基础,根据试验或观察得到的数据,来研究随机现象统计规律性的学科。本课程的目的是让学生了解统计推断检验等方法并能够应用这些方法对研究对象的客观规律性作出种种合理的估计和判断。掌握总体参数的点估计和区间估计。掌握假设检验的基本方法与技巧。理解平方差分析及回归分析的原理,并能运用其方法和技巧进行统计推断。数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效的由集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策和行动提供依据或建议. 数理统计起源于人口统计、社会调查等各种描述性统计活动.公元前2250年,大禹治水,根据山川土质,人力和物力的多寡,分全国为九州;殷周时代实行井田制,按人口分地,进行了土地与户口的统计;春秋时代常以兵车多寡论诸侯实力,可见已进行了军事调查和比较;汉代全国户口与年龄的统计数字有据可查;明初编制了黄册与鱼鳞册,黄册乃全国户口名册,鱼鳞册系全国土地图籍,绘有地形,完全具有现代统计图表的性质.可见,我国历代对统计工作非常重视,只是缺少系统研究,未形成专门的著作. 在西方各国,统计工作开始于公元前3050年,埃及建造金字塔,为征收建筑费用,对全国人口进行普查和统计.到了亚里土多德时代,统计工作开始往理性演变.这时,统计在卫生、保险、国内外贸易、军事和行政管理方面的应用,都有详细的记载.统计一词,就是从意大利一词逐步演变而成的. 二、数理统计的方法(一)点估计 1、点估计概念点估计是数理统计理论的一个重要内容,主要包括制定估计量得一般方法,制定估计量的合理的优良性准则,寻求特定准则下的最优估计,记明特定估计量(用直观或某种一 般性方法得到)在某种准则之下有最优性。设总体的分布函数为F(x;),其中参数为未知,为参数空间,今由样本1,2,n建立统计量T(1,2,n),对于样本观察值(x1,x2,xn),若将Tx1,x2,xn=t作为的估计值,则称Tx1,x2,xn为的估计量,通常记做 =T(1,2,n)。建立一个这样的统计量T(1,2,n)作为的估计量,称之为参数的点估计。2、 点估计的优良性以下定义参数的估计量T(1,2,n)(1)无偏性无偏性体现了一种频率思想,只有在大量重复使用时,无偏性才有意义。任意有E=,则称是的无偏估计量或无偏估计。几个常用的无偏估计量,要记住:无论服从什么分分布,S2是样本方差,只要E=a 及D=2是有限的,则 =1n , 分别为a及2的无偏估计量。推导方法如下:ES2=D-D=2-D,其中D=2n则 ES2=E1n-1i=1ni-2=E(1n-1i=1n2-nn-12) =1n-1i=1nEi2-nn-1E(2) =nn-11ni=1nEi2-E(2) =nn-1E2-E(2) =nn-1D-D() =nn-1(2-2n) =2 (2)有效性其意义是:用估计时,除无系统偏差外,还要求估计精度更高。若有的两个无偏估计 1=1(X1,X2,Xn)与2=2(X1,X2,Xn),如果var(1)var(2),则称1比2有效。(3)相合性相合性和样本的容量有关,是在极限的意义下引进的,适用于大样本情形,当样本容量n越大时,总体的信息量增加,该估计也越精确越可靠,特别是当 样本容量趋于无穷大时,估计值将与参数真值几乎完全一致。相合性能在兼顾无偏性和离散性(方差的大小)两者的情况下建立“最优估计量”。点估计的优点是能较准确地给出未知参数大致值,缺点是不能反映出未知参数估计值的可信程度。参数点估计常用的三种方法是:矩法、极大似然方法和最小二乘法。(二)方差分析方差分析是通过实验数据对影响产品的质量、产量的多个可控因素做统计分析,分清因素的主次及水平组合形式,求最优组合,以提高产品质量、产量的一种数值分析方法1、单因素方差分析。设影响指标的因素仅有一个,设为A因素,该因素有a个水平(状态)A1,A2,Aa,在第n个水平下,分别作ni次实验,i=1,2,a,其样本值 XijN(,2),i=1,2,a,或 Xij=i+ij,ijN(0,2)(1)方差分析主要解决1H0:1=2=a(各水平下的均值相等)H1:至少有一对均值不相等,ij,ij,i,j=1,2,a. 其方法是若组间(各水平)平方和大,组内(随机误差)平方和小,即F值大,可拒绝H0,否则接受H0,表明A因素影响不显著2估计1,2,a及方差2(2)对样本值xij,i=1,2,a,j=1ni,i=1ani,i=1ani=n,共有n个样本值,总体均值x=1nxij(xij=i=1aj=1nixij,即所有试验数据之和), x2=1n2xij2,又xij=j=1nixij表示第i个水平下的样本值之和,i=1,2,a,xij=1ni=1nxij=1nixij,表示第i水平下的样本均值,则xij2=1ni2xij2,或xij2=1nixij2. 2、平方和 称(1)称ST=i=1aj=1ni(xij-x)2为总的离差平方和,则ST=i=1aj=1ni(xij-x)2xij-i=1aj=1ni(xij-x)x.ST=i=1aj=1ni(xij-x)xij-i=1aj=1ni(xij-x)x =i=1aj=1nixij2-xi=1aj=1nixij-x(nx-nx) =i=1aj=1njxij2-nx2 =i=1aj=1nixij2-1nxij2(2)称SA=i=1aj=1ni(xij-x)2为因素A的组间平方和,SA=i=1aj=1ni(xij-x)xij-i=1aj=1ni(xij-x)x=i=1aj=1nixij2-xi=1anixi-xi=1anixi-nx=i=1aj=1nixij2-xi=1axi-x(i=1aj=1nixij-nx) =i=1a1nxij2-nx2 =i=1a1nixij2-1nxij2(3)称i=1aj=1ni(xij-xij)2,为组内误差平方和,平方和分解 ST=i=1aj=1ni(xij-xij+xij-x)2 =i=1aj=1ni(xij-xij)2+i=1aj=1ni(xij-xij)2+2i=1aj=1nixij-xij(xij-x) =SA+SE+2i=1axi-x(nixij-nixij) =SA+SE3、统计分析 由n-12S22(n-1),得;令Si,则由-分布的可加性,得; SE ST SA ,由-分布的可加性,得从而 F对0F(a-1,n-1),又由ESE2=E2n-a=n-a,得ESEn-a=2方差的无偏估计量为2=SEn-a.(三)假设检验 假设检验的主要内容有:一个正态总体的假设检验、两个正态总体的假设检验以及分布律的假设检验.假设检验的基本方法(1) 提出待检验的假设H0它可能有以下几个来源: 依据以往的经验或某些实验的结果; 依据某种理论或某种模型; 根据事先所做的某种规定.(2)选择检验假设H0的统计量,并确定其分布,再根据样本观测值计算出该统计量的值.(3)确定拒绝域并作出判断在给定的检验水平(或显著性水平)(0t= 下结论:若Tt, 则否定H0;否则,一般情况下接受H0. 2 未知期望, 检验假设H0:202 (02已知)提出待检假设H0:202. 选取样本(X1,X2,Xn)的统计量 2=(n-1)S222(n-1)再根据样本观测值计算出统计量 2 的值. 查表得临界值:c2=c2(n-1).然后根据P22=,下结论:若22, 则否定H0;否则,一般情况下接受H0. 三、数理统计在实际生活中的应用数理统计方法是通过对收集的大量数据进行加工整理,统计计算,去粗取精,去伪存真,寻求事物规律性的一种科学方法,数理统计方法一般有以下几方面的用途:1提供表示事物特征的数据2比较两事物的差异3分析影响事物变化的因素4分析事物两种性质之间的相互关系5研究取样和试验方案,确定合理的试验方案,如随机抽样、优选法、正交试验设计法等6. 分析和掌握质量数据的分布状况(一)检验汽车轮胎寿命 例 一汽车轮胎制造商声称,他们生产的某一等级的轮胎平均寿命在一定汽车重量和正常行驶条件下大于50000km。现对这一等级的120个轮胎组成的随机样本进行了测试,测得平均每一个轮胎的寿命为51000km,样本标准差是5000km.已知这种轮胎寿命服从正态分布。试根据抽样数据在显著水平=0.05下判断该制造商的产品是否与他所说的标准相符合。解 设X表示制造商生产的某一等级轮胎的寿命(单位:km)。由题意知,XN(,),方差2未知。n=120,x=51000km,s=5000km.设统计假设H0:0=50000,H1:0=50000 设=0.05时,t1-n-1=t0.95119=1.65临界值C=Snt1-n-1=500012*1.65=753.1185拒绝域为K0=X-50000c=753.1185由于X-50000=1000c,所以拒绝域H0,接受H1,即认为该制造商的声称可信,其生产的轮胎平均寿命显著地大于50000km.(二)关于男女色盲比例的问题例6 从随机抽取的467名男性中发现有8名色盲,而433名女性中发现1人色盲,在 =0.01水平上能否认为女性色盲的比例比男性低?解 设男性色盲的比例为P1,女性色盲的比例为P2,那么要检验的假设为H0:P1P2 H1:P1P2由备择假设,利用大样本的正态近似得,在=0.01水平的拒绝域为u-2.33由样本得到的结果知:n=467,m=433P1=8467=0.01713,P2=1433=0.00231,P=8+1467+433=0.1 则 u=p1-p21n+1mP1-P=2.2326 未落在拒绝域中,因此在=0.01水平上可以认为女性色盲的比例低于男性。四、总 结在日益发展的信息社会中,即使一般的劳动者,也必须具备基本的数学运算能力以及应用数学思想去观察和分析工作、生活乃至从事经济、政治活动的能力存款、利息、股票、投资、保险、成本、利润、折扣、分期付款,以至文艺创作、心理分析、社会改革、哲学思辨等。随着科学技术的发展,概率论与数理统计在众多的学科(包括自然科学与社会科学)及生产实际部门中得到了越来越广泛的应用。特别是随着我国经济建设迅猛的发展,这方面的要求越来越多。此外,概率论是对随机现象统计规律演绎的研究;是专门处理随机现象的,其处理方法与其它数学学科很不一样,解决问题时更着重概念与思路,并且概率论具有非常强烈的直观意义,有利于理解与想象。概数理统计是对随机现象统计规律归纳的研究。即随机现象在现实世界中广泛存在,在大量同类随机现象中,就其个别随机现象来说,它的结果是不确定的,但对大量同类随机现象来说却遵守一定的集体规律性。参考文献1周纪芗,茆诗松主编.质量管理统计方法M.中国统计出版社,2008.(10). 75120. 2 赵慧琴.Bootstrap方法在区间估计中的应用J.江西科学.2010,28(4):429-4313 孙祝岭.点估计的一种新方法.统计与决策J.2010,11:163-1644 谢益辉,朱钰.Bootstrap方法的历史发展和前沿研究J.统计与信息论坛.2008,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论