统计量及其分布在实践中的应用 毕业论文.doc_第1页
统计量及其分布在实践中的应用 毕业论文.doc_第2页
统计量及其分布在实践中的应用 毕业论文.doc_第3页
统计量及其分布在实践中的应用 毕业论文.doc_第4页
统计量及其分布在实践中的应用 毕业论文.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计量及其分布在实践中的应用 数学科学学院 数学与应用数学 摘要:在实际生活中,有许多零散的数据,为了把这些零散的集中起来反映总体的特征,取得样本之后,并不是直接利用样本进行推断,而是需要对样本进行一番加工和提炼,把样本中所包含的有关信息尽可能地集中起来,而有效的办法就是运用假设检验,来判断总体分布是否具有指定的特征.基于以上本文就解决这些实际问题,列举出了一些具体的统计量,用统计量收集和利用数据资料,对数据进行分析(统计分析)从而对所研究的问题作出推断,预测和决策,进行阐述和研究并得出科学合理的结论.关键词:统计量;样本均差;假设检验;质量管理引言随着社会经济的迅猛发展,随着数学在经济活动和经济研究中的作用日益凸显,随着数学的理论和方法越来越广泛的运用到自然科学,社会科学和工程技术等各领域,它不仅提供了解决问题的有力教学工具,同时还给学生提供了一种思维应用型人才所必须具备的文化素质和修养. 同时市场的不断完善,假设检验理论在质量管理中的重要性与日俱增,作为一种由样本信息推断总体特征的数理统计方法,在生产的各个方面都得到了广泛的应用.本文从实际出发,不仅简单介绍了统计量的相关知识,而且详细阐述了假设检验中检验统计量的构造,具体的实施步骤,以及在应用中需要注意的问题,同时将假设检验应用到实际的产品质量控制当中,对相关产品的质量做出合理的结论,为管理者进行改进产品质量的决策提供一定的依据.1 介绍样本均值,样本方差,样本标准差在生活中的应用1.1 统计量与抽样分布 样本来自总体,含有总体各方面的信息,但这些信息较为分散,有时不能直接利用.为将这些分散的信息集中起来以反映总体的各种特征,需要对样本进行加工,最常用的加工方法是构造样本的函数,为此:定义5.3.1 设为取自某总体的样本,若样本函数中不含有任何未知参数,则称t为统计量.统计量的分布为抽样分布.按上述定义:设为样本,则都是统计量,当未知时,等都不是统计量.注 统计量不依赖于未知参数,但其分布一般是依赖于未知参数的.1.2 常用的统计量1.2.1 样本均值、样本方差、样本阶矩及阶中心矩定义 设是来自某总体的样本,称 为样本均值, 为样本方差,为样本标准差, 为样本(无偏)方差, 为样本(无偏)标准差. 为样本阶(原点)矩,为样本阶中心矩.注(1)= (2)在分组样本场合下,若为第组的组中值,为该组的个数,为组数,则 =1.2.2 次序统计量定义5.3.7设是取自总体的样本,将其从小到大排序得到.定义:不论取怎样的一组观测值, 总取为其观测值,称为第个次序统计量,从而有.,分别称为样本的最小、最大次序统计量.注 样本独立同总体分布,但既不独立又不同分布.1.3 统计量与的性质定理5.3.1 .定理5.3.2 数据观察值与均值的偏差平方和最小,即在形如的函数中,最小,其中为任意给定常数.定理5.3.3 设是来自某个总体的样本,为样本均值.1) 若总体分布为,则的精确分布为.2) 若总体分布未知或不是正态分布,但,则较大时的渐近分布为,记为.定理5.3.4 设总体具有二阶矩,即, 为从该总体中得到的样本,和分别是样本均值与样本方差,则.案例分析例1有甲乙两个单位都愿意聘用你,而你能获得如下信息:甲单位不同职位工资元1200140016001800获得相应职位的概率0.40.30.20.1乙单位不同职位工资元1000140018002200获得相应职位的概率0.40.30.20.1根据工资的待遇情况你会选择哪家单位?解:()=1400 ()=1400 =40000 =11200在两个单位工资的数学期望相等的情况下,如果认为自己能力很强,应选择工资方差大的单位,即乙单位:如果认为自己能力不强,就应选择工资方差小的单位,即甲单位.现在就业压力的形势非常巨大,我们在选择就业单位的同时,也要根据自己的能力去选择,千万不要好高骛远,盲目投简历.例2彩电的彩色浓度是彩电质量好坏的一个重要指标,20世纪70年代在美国销售的sony牌彩电有两个产地:美国和日本,两地的工厂是按同一的设计方案和相同的成产线生产同一型号sony彩电,连使用说明书和检验合格的标准也是一样的,其中关于彩色浓度x的标准是目标值为,公差为5,即当在-5,+5内该彩电的彩色浓度合格,否则不合格,在70年代后期,美国消费者购买日产sony彩电的热情高于购买美产sony彩电,原因何在?这就要考察这两个总体有什么差别,调查报告指出,日产sony彩电的彩色浓度服从正太分布n(,)这两个不同的分布代表了两个不同的总体,其均值相同,但方差不同,若彩色浓度与的距离在5/3以内为一等品,在5/3到10/3之间为二等品,在10/3到5之间为三等品,其他为四等品,如下表:各等级彩电的比例(%)等级一等品二等品三等品四等品美产33.333.333.30日产68.327.14.30.3从上表可以得出美国消费者愿意购买日产sony的主要原因.2 简单介绍三大分布在生活中的应用2.1 分布(卡方分布)定义5.4.1设独立同标准正态分布(0,1),则的分布称为自由度为的分布,记为.的密度函数为:,.卡方分布性质 可加性 若且与独立,则. 若, 则 分布的分位数定义5.4.2 若,对给定的,称满足 的是自由度为的分布的分位数.注 要会查分位数. 分布、分布仍有相应的分位数定义.2.2 分布1.定义 设,且与独立,则称的分布为自由度为的分布,记为,、分别为分子、分母的自由度.2.性质(1) 若.(2) .2.3 分布1.定义 设随机变量x服从则称的分布为自由度为的分布,记为.()分布的密度可由商的分布公式来推导,此处略,但必须注意:注 ()分布的密度函数为偶函数,从而时,=0. ()分布当充分大时(30),可用(0,1)分布近似.2.性质(1) 若,(2)案例分析 在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?处理发癌数未发癌数合计发癌率甲组52197173.24乙组3934292.86合计912211380.3352,19,39,3是表中最基本的数据,因此上表资料又被称之为四格表资料.卡方检验的统计量是卡方值,它是每个格子实际频数与理论频数差值平方与理论频数之比的累计和.每个格子中的理论频数是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为7191/113=57.18.故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大. 卡方分布实际上是比率检验的进一步延伸.1、利用卡方分布确定是否拒绝虚无假设.2、卡方应用于适合型检验,根据一个分类标准(变量),将一个事件总体划分为k类,考察k类中每一类的次数分布f是否符合某一理论次数分布的检验.3、卡方独立性检验,依照两个分类标准,将观察对象划分为多个类别得到的实际次数分布是否显示这两个分类标准是具有相互独立性的检验.3 统计量在区间估计的应用 样本均值和样本方差在区间估计中也有着重要的作用.区间估计是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间.其中这个给定的概率值称为置信度或置信水平,这个建立起区间估计来的包含待估计函数的区间称为置信区间,它指总体参数值落在样本统计值某一区内的概率,而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围.置信区间越大,置信水平越高.划定置信区间的两个数值分别称为置信下限和置信上限.案例分析(均值的区间估计与方差的区间估计)一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求.现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示.已知产品重量的分布服从正态分布,且总体标准差为10克.试估计该批产品平均重量和平均方差的置信区间,置信水平为95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3解:(1)已知, =25, 1- = 95%, =1.96.根据样本数据计算得:=100.536 总体均值m在置信水平下的置信区间为(101.44 ,109.28).该食品平均重量的置信区间为101.44克109.28克之间.解:(2)已知25,95% ,根据样本数据计算得=93.212置信度为95%的置信区间为 (7.54,13.43).该企业生产的食品总体重量标准差的的置信区间为7.54克13.43克.4 检验统计量在假设检验中的应用检验统计量是用于假设检验计算的统计量.在零假设情况下,这项统计量服从一个给定的概率分布,而这在另一种假设下则不然.从而若检验统计量的值落在上述分布的临界值之外,则可认为前述零假设未必正确.检验统计量的实例有统计量、统计量和德宾-沃森统计量.在现实的生产生活中,为了取得更好的经济和社会效益,企业单位会在产品生产的各个阶段进行控制,以便达到生产预期效果,达到计划目标.这些阶段包括原材料购进和产品交付,产品生产过程中的质量控制,改进生产后方法有效性的验证等等. 4.1 假设检验的基本原理和基本方法4.1.1 假设检验基本思想根据样本的信息来判断总体分布是否具有指定的特征.为了对总体的分布类型或分布中的未知参数作出推断,首先给出一个具有肯定意义的原假设,然后用统计方法对 做出拒绝或接受的检验,即在假设为真的前提下,通过对总体进行抽样来构造一个小概率事件,若在一次试验中,小概率事件居然发生了,就完全有理由拒绝接受,否则就没有充分的理由拒绝从而接受. 反证法和小概率事件是假设检验的核心思想,小概率事件原理就是如果一个事件发生的可能性很小,那么它在一次试验中出现的可能性也很小,当概率小于一个规定的界限时就认为它不可能发生.反证法就是先提出假设,进而按照适当的统计方法确定假设成立的可能性,如果可能性小就拒绝假设.两者结合就形成了假设检验的基本思想,即抽取样本资料进行检验统计量的计算,然后按照接受假设是否会出现小概率事件来决定是否接受原假设.4.1.2 基本步骤 (1)根据实际问题的要求提出一个关于质量特性值的论断,称为原假设,用h0表示,同时根据实际问题提出原假设的对立面,称为备择假设,用h1表示; (2)确定检验用的统计量和拒绝域的形式;(3)选取适当的显著性水平,通常取0.10,0.05,0.01等数值; (4)给出临界值,确定拒绝域; (5)根据样本观察值确定接受还是拒绝原假设h0.案例分析从以往大量的文献研究来看,应用基本上集中于以下几个方面:(1)原材料购进和产品交付时的检验.在质量管理中为了判定原料和产出品是否符合一定的质量要求,无论是在材料购买还是在产品交付中大都会采用抽样检查的方法,从而决定是接受还是拒绝.(2)在产品生产过程中使用假设检验方法确定生产是否处于控制状态.产品在生产过程中往往会受到各种因素的干扰,这些因素中随机因素是不可避免的,而系统因素则是可以改进的,所以确定产品是否受到此类因素的影响即产品是否处于控制状态就对产品质量有着十分重要的影响.(3)验证改进生产后改进方法是否有效.随着市场需求的不断发展,企业发展自身产品,改进生产工艺已经是生存的需要,可究竟改进后的产品或者生产工艺到底有没有效果,通过假设检验就可以帮助我们得到这方面的信息.两个独立样本的检验抽取某商场促销前后的各十多日的日销售额数据如下(单位:万元):促销前:314,583,735,462,405,508,498,422,435,235,289,216,555,594,440,535,380,412:促销后的:412,789,324,636,348,674,467,738,495,408,534,427,654,462,592,518.试根据给出数据分析某超市在促销前后的日销售额是否有显著变化.处理过程:根据促销前数据得出:=18,=445.4444,=132.44631:根据促销后数据得出:=16,=529.8750,=138.20076.建立假设: 根据检验统计量:=-1.82取显著水平, =1.697,1.821.697,所以拒绝.故而认为促销前后的日销售收入有显著的差异.案例分析生活中存在大量的非统计应用的假设检验,一个众所周知的例子就是对罪犯的审讯. 当一个人被控告为罪犯时,他将面临审讯.控告方提出控诉后,陪审团必须根据证据做出决策.事实上,陪审团就进行了假设检验.这里有两个要被证明的假设.第一个称为原假设,用表示(发音为h-nought, nought是零的英国表示方法).它表示 :被告无罪 第二个假设称为备择假设,用表示.在罪犯审讯中,它表示 :被告有罪当然,陪审团不知道哪个假设是正确的,他们根据控辩双方所提供的证据做出判断.这里只有两种可能:判定被告有罪或无罪释放.在统计应用中,判定被告有罪就相当于拒绝原假设:而判定被告无罪也就相当于不能拒绝原假设.应当注意,我们并不能接受原假设.在罪犯审判中,接受原假设意味着发现被告无罪.在我们司法系统中,并不允许这样的判定.当我们进行假设检验时,存在两种可能的错误.第一类错误是当原假设正确时,我们却拒绝了它.第二类错误被定义为当原假设有错误时,我们却并没有拒绝.在上面的例子中,第一类错误就是一个无罪的人被判定有罪.当一个有罪的被告被判定无罪时,第二类错误就发生了.我们把发生第一类错误的概率记为,通常它也被称作显著性水平.第二类错误发生的概率记为.发生错误的概率和是相反的关系,这就意味着任何尝试减少某一类错误的方法都会使另外一类错误发生的概率增加.在司法系统中,第一类错误被认为是更加严重的.这样,我们的司法系统的构建就要求第一类错误发生的概率要很小.要达到这样的结果,往往会对起诉证据进行限制(原告必须证明罪犯有罪,而被告则不需要证明什么),同时要求陪审团只有具有“远非想象的证据”时才能判定被告有罪.在缺少大量证据的情况下,尽管有一些犯罪证据,陪审团也必须判定其无罪.这样的安排必然使有罪的人被判无罪的概率比较大.美国最高法院法官奥利弗温德尔霍姆斯(oliver wendell holmes)曾经用下面一段话描述了第一类错误发生的概率与第二类错误发生概率之间的关系.他说,“判定100个有罪的人无罪,要比判1个无罪的人有罪好得多.”在霍姆斯看来,发生第一类错误的概率应该是第二类错误的1/100.这里一些关键的概念如下:1、这里有两个假设,一个叫做原假设,另一个叫做备择假设.2、这个检验过程从假设原假设是正确的开始.3、这个过程的目的是判定是否有足够的证据判断备择假设是正确的.4、这里有两个推断:拒绝原假设,赞成备择假设:不拒绝原假设.5、在任何的检验中,有两类可能的错误:第一类是原假设正确却拒绝它;第二类错误是当原假设不正确时却未能拒绝.(第一类错误)=(第二类错误)=我们把这些概念引申到统计假设检验中.在罪犯审讯的例子中,“足够的证据”定义为“超越合理怀疑的证据”.在统计学中,我们需要利用检验统计量的样本分布来定义“足够的证据”.假设检验基于样本统计量的抽样分布,得出一个假设检验的结果是对样本统计量的一个概率表述.计算检验统计量,并确定当原假设正确时有多大发生的可能性.如果概率很小,我们可断定原假设为真的,假定不成立,应该拒绝它.结束语随着数学在经济活动和经济研究中的作用日益凸显,根据数理统计的学科特点,数理统计是一门对随机现象进行有限次的观测或试验的结果进行数量研究,并依之对总体的数量规律性做出具有一定可靠性推断的应用数学学科,也就是说,数理统计学是统计学的数学基础,它是研究怎样有效地收集整理和分析带数据,以对所考察的问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议的数学分支. 近几十年来,数理统计的广泛应用是非常引人注目的. 在社会科学、选举人对政府意见的调查、民意测验,经济价值的评估、产品销路的预测以及犯罪案件的侦破等,都有数理统计的功劳. 在自然科学、军事科学、工农业生产以及医疗卫生等领域,哪一个门类都离不开数理统计. 统计量的应用不仅要不断提高理论统计学的基本素质,还要注重掌握经济学的理论,金融交易制度及金融理论,管理科学的理论与计算机的技术方法.统计理论与应用的紧密结合显得比以往任何一个时期都更为迫切,更加重要.生活中处处存在着统计量知识,只要我们经常善于发现,善于总结,就会发现数学的美,数学的乐趣.纵观统计学的发展,用统计量及其分布统计数据收集与使用的客观环境发生了很大的变化,特别是通过计算机与英特网的使用,数据的收集存储,信息交换的客观条件有了质的变化,现代社会所表现出的数据在它的容量规模,次元,对时空的依存性,不完全性,不均一性,复杂性及相关性等等,均与以往完全不同.社会经济的多元化,金融交易的多样化,国际市场间资本移动的迅猛,以及电子商务的出现,甚至对我们的日常生活产生影响.在这种变化中,21世纪的统计学理论应怎样更新?统计学的应用应该如何发展?统计理论的基本框架已经形成的时代背景与当今计算机大量普及的现实落差如何调和?这也是21世纪统计理论研究与应用的一个重大的课题.参考文献:1 王天营 谈数理统计在统计学中的地位j. 统计与决策,2006,(09) 2 何鹏光 充分统计量的证明及其相关结论j. 阜阳师范学院学报(自然科学版),2006,(03) 3 陈红 山其骞 几种重要统计量数字特征的简算法j. 青岛大学学报(自然科学版),1999,(01) 4 李秀兰 对教材中有关次序统计量分布证明的一点看法j. 雁北师范学院学报,2000,(06) 5 凯勒 沃拉克 统计学:在经济和管理中的应用m6 费青云 几个统计量的初等诠释j. 数学教学,1999,(04)7 唐轲 概率论与数理统计教学研究j.2009,(13)8 郑长波 概率知识在现实生活中的应用j.2010,(04)9 傅治梁 分析诊断企业产品实力的统计方法j统计与决策,2000,(7)10 龙永红 概率论与数理统计m高等教育出版社,200311 翁雪琴 假设检验在质量管理中的应用j.统计应用,2002,(1)12 张秀娟 统计技术与企业管理质量j.航空标准化与质量,2005,(2)13 陈亮 浅谈假设检验在质量管理中的应用j.技术经济与管理研究,2000,(2) statistics and their distribution in practical app

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论