武汉理工大学应用数理统计备考资料.ppt_第1页
武汉理工大学应用数理统计备考资料.ppt_第2页
武汉理工大学应用数理统计备考资料.ppt_第3页
武汉理工大学应用数理统计备考资料.ppt_第4页
武汉理工大学应用数理统计备考资料.ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用数理统计,武汉理工大学数学系,楚杨杰,绪论,1.数理统计的发展2.数理统计的应用3.本课程学习内容4.成绩评定方法5.参考文献,1.数理统计的发展,现今通行的统计学(Statistics)一词源出于意大利文Stato,其词根兼有“国家”和“情况”的意义.,统计学家(statistician)一词源出意文statista当时理解为“处理国务的人”,按这个涵义极广的理解,统计学就是“国情学”,这流行于16世纪的意大利,后来传播到法、德、荷等欧陆国家.,现代意义上使用“统计学”一词的,是英国学者辛克莱,在其所著ThestatisticalAccountofScotland1791-1799一书中.,有著作出版并对后世统计学发展有重大影响的,要推英国学者格朗特,他在1662年发表的关于死亡公报的自然和政治观察一书,是关于描述统计的开山之作,有的学者甚至把此书的出版看作统计史的起点.,1)古典统计:国情学.政治算术1750,人口统计,政治算术,威廉佩蒂(WillianPetty,1623-1687)是17世纪英国政治经济学家,建立“政治算术”,即将统计方法应用于广泛的社会、经济问题的分析,而不是只局限于人口统计问题.不依靠抽象的话语和看似灵巧的推理,一切让数字说话,他的思想受到英国伟大的科学-哲学家培根(FrancisBacon.1651-1626)很大的影响,培根的实证科学思想,即主张科学理论应以实际观察为依据并接受其检验.,英国学者格朗特,1662年发表的关于死亡公报的自然和政治观察一书,是关于描述统计的开山之作.格朗特的工作,在欧洲大陆也很有影响,如巴黎在1667年开始发布类似于伦敦死亡公报的材料。这方面的活动促成了在一些主要国家中建立政府统计部门.,天文观测,16世纪著名的丹麦天文学家第谷在长达25年的时间内对一些天体进行重复观测以资比较,由此对观测误差的量级获得了解,所得数据成为开普勒(15711630)日后建立行星运动定律的基础,而这又对牛顿建立其万有引力的学说起了极大的作用。不过,第谷和开普勒都还没有提及建立随机观测误差的概率理论的问题。,但开普勒在1619年发表的著作和谐的世界中提出了一些建模的原则,其中有一条是“模型选择的最终标准是其与观察数据的符合程度”,这“符合程度”的提法,蕴含了误差概率理论的问题。,伟大的天文学家伽利略(15641642)是第一个在其著作中提出随机误差这个概念,并对之有所讨论的学者。他在1632年出版的著作关于两个主要世界系统的对话托雷密和哥白尼中提及这个问题。他是用“观测误差”这个名称。他没有提出“随机”和“分布”这样的概念,但他所描述的“观测误差”的性质,实际上即我们现在所理解的随机误差分布,他提出了以下几点:,1所有观测值都可以有误差,其来源可归因于观测者、仪器工具以及观测条件。,3小误差出现得比大误差更频繁。,2观测误差对称地分布在0的两侧按:这当然假定已排除系统误差的情况,并明确表明他指的是随机误差。,2)统计思想与方法的形成17501900,在各实用领域中的学者因工作上的需要而分头发展了一些分析数据的方法,即统计方法。最主要的有3个方面:,天文和测地学,因误差分析问题而发明最小二乘法和正态误差分布,地球绕南北极的轴线自转,因离心力的作用,地球并非一个正园球,而是略有椭度.,早在18世纪初,通过恒星去确定船的纬度已有了相当的精度,但确定经度的问题则更困难.,土星和木星都是太阳系的大行星,由于引力而对各自的运动轨道产生的影响,计算其轨道是18世纪中许多天文学家和数学家关心的问题.,最二乘法在19世纪初发明后,很快得到欧洲一些国家的天文和测地学工作者的广泛使用,1837年出版的不列颠百科全书第7版,收进有关这个方法的介绍,在电子计算机出现以前,当参数个数较大时,计算的任务还是很繁重,1958年我国某研究所计算一个炼铁方面的课题,涉及用最小二乘法解13个自变量的线性回归,三十余人用电动计算机算,夜以继日花了一个多月的时间.,勒让德(1752.9.181833.1.10)是法国大数学家,在数学的许多领域,包括椭园积分,数论和几何等方面,都有重大的贡献。最小二乘法最先出现在他于1805年发表的一本题为计算慧星轨道的新方法的著作的附录中.美国统计学家斯蒂格勒认为最小二乘法之于数理统计学,有如微积分之于数学.,不少统计学著作把最小二乘法的发明归功于德国数学家高斯,但第一个公开用书面的形式发表这个方法的,是法国数学家勒让德,时间是1805年.,勒让德的工作没有涉及最小二乘法的误差分析问题.,1809年,高斯(17771855)发表了其数学和天体力学的名著绕日天体运动的理论.此书写了一节有关“数据结合”的问题,实际涉及的就是这个误差分布的确定问题.,高斯这项工作对后世的影响极大,它使正态分布同时有了“高斯分布”的名称,正态分布统治了19世纪的统计学.后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作.高斯是一个伟大的数学家,重要的贡献不胜枚举.原德国10马克的钞票上印有高斯的头像,其上还印有正态分布的密度曲线.这充分说明了高斯分布对人类科学贡献影响影响之大.,天文学家最早关心使用算术平均的合理性问题,并从误差分布理论的角度来考察这个问题。误差理论的基本问题是指随机测量误差服从怎样的概率规律.,辛普森(17101761),拉格朗日(17361813),拉普拉斯(17491827)等著名数学家都曾致力于寻找误差分布的问题,但进展甚微.,人口学,19世纪即开始孕育了抽样调查的思想.这也在20世纪得到发扬光大,成为现今统计方法中的重要组成部分.,魁特奈特(17961874比利时)是19世纪最有影响的统计学家之一.倡导并身体力行将正态分布用于连续性数据的分析.他的这一努力使正态分布在19世纪统计应用中大为流行.,拉普拉斯提出“代表性抽样”,1802年,拉普拉斯受法国政府的委托,用其“比例法”,通过抽样对法国人口总数进行估计提出在国内选择30个左右的地区,要求这些地区尽可能均匀地分布在国内,以使结果不受局部地区的特殊性的影响.,凯尔在19世纪最后二十余年中领导了挪威关于全国人口和农业的普查工作。在这段期间他发展了“代表性抽样”的思想.所谓代表性抽样,是指从总体中抽出的一组可代表该总体(在选定的指标上)的样本,是一个“小型化”了的总体。,生物学,特别是遗传学,英国学者高尔顿在1874到1890年间的工作,引进了相关和回归的思想。其重大意义在于它开创了分析多维数据的统计方法。此前的统计方法都是单指标性的,不能顾及指标间的相互关系。而在实用问题中一般涉及多个彼此相依的指标,孤立地分析单个指标无法得出符合实际的结论。高尔顿的工作经过埃其渥斯、卡皮尔逊和约尔在数学上的整理,到20世纪又经过费歇尔等一批学者的深化,直到目前仍不失为应用统计方法中的主流方向之一和理论统计学中的精华。,3)统计学科理论的形成约19001950,他在英国一个农业试验站工作了十多年,从事农业试验及其统计分析的研究工作.提出了用随机的方法分配田间试验小区的论据以及进行这种试验设计的若干原则,其中的“划分区组”与抽样调查中的“分层”的思想一致,即在随机化的设计中融入系统性因子的作用以降低由随机化带来的误差。,以费歇尔,卡皮尔逊,奈曼,欧根皮尔逊和瓦尔德等为代表的统计学大师建立了数理统计学理论框架.使数理统计学被承认为一门数学上严整的学科,1921年费歇尔发表了题为“理论统计学的数学基础的论”,他一般性地规定了数理统计学的任务为模型估计与抽样分布,并引进了若干诸如相合性等重要概念,自此数理统计学问题有了统一的数学提法,可以说费歇尔制定的框架的基本精神一直沿用至今.,奈曼在1934年发表论文关于代表性方法的两个不同方面:分层抽样和目的性抽样。在此文中奈曼对目的性抽样从理论上作了批评,把与分层相结合的随机抽样建立在一个严格的理论基础上,并发展了一种不依靠贝叶斯假设的估计方法,这是他发展一个全面的区间估计理论的重要一环。,印度著名统计学家马哈拉诺比斯对抽样方法的理论和实践也作出过重要的贡献,1937年奈曼发表了关于置信区间估计的奠基性论文,这段时期其中包含了奈曼-皮尔逊假设检验理论的建立。,1950年瓦尔德出版了统计决策函数一书,他把一切数理统计问题归化为一个数学优化问题,这一思想起源于奈曼-皮尔逊关于假设检验的理论,而瓦尔德将其推广到其他领域.瓦尔德的思想对1950年以后的数理统计学发展起了不小的影响,且他提出的损失函数的概念沟通了统计方法与经济决策的联系,自30年代以来,抽样调查方法受到包括美国在内的一些国家的重视,其应用也变得经常。战后建立的联合国,也于1947年在其统计司中建立了一个抽样分委员会,发布过一些指导性文件,对抽样调查方法在全球的应用和推广起了很大的作用,4)统计理论的深化与应用1950,这个时期也是数理统计学走向高度数学化的时期,数理统计学研究内容中纯数学性的内生性问题的比重大为增加.,把数理统计学比喻为一个建筑物,则这个时期的成就在于其内部装修一些重要的理论和方法,如极大似然估计在此前只有一个粗糙的形态,在这个时期达到数学上的严格化,参数估计和非参数统计的精细发展也到这个时期才完成.截尾数据的可靠性分析与生存分析包括时间序列分析在内的随机过程统计和贝叶斯统计等理论的重大进展也产生,这个时期,另外社会经济的发展推动了统计学在各领域的广泛应用,而计算机的发明及其普遍应用使许多需要大量繁杂的计算的统计方法的使用成为可能这些又反过来推动了数理统计学中新问题的提出和研究,2.数理统计的应用,大量的原始数据如果不经过有其目的的整理、分类、排比、分析,并通过适当的形式表示出来,就好比一堆没有经过冶炼的矿物,没有什么用处.,在生产实践和科学实验中,经常会遇到大量的各种不同类型的数据.这些数据为我们提供了很有用的信息,它可以帮助我们认识事物的内在规律、研究事物之间的关系、预测事物的可能发展,是指导生产实践和科学实验的重要依据.,原始数据中有用的信息并非一目了然,而是蕴藏在大量的数据之中,要想从这大量的数据中找到有用的信息,必须对数据进行分析整理,去伪存真、去粗取精、由表及里、抓住主要矛盾,尽可能充分地、正确地从数据中提取出有用的信息,数理统计学为我们分析、处理数据提供了许多有用的统计方法.,数理统计学是“收集和分析带随机性的数据的科学和艺术”,观测得到的数据难免存在误差,如实验误差(随机误差,系统误差,过失误差),对数据分析处理时,也会产生一些计算误差(截断误差,舍入误差).因误差的普遍存在,我们有必要对误差及含有误差的数据处理问题进行研究。,用统计方法解决实际问题时,首先要建立它的统计数学模型,也就是要把这个具体问题经过抽象化简,建立有关量应满足的统计关系式即制定描述这些量的统计数学模型。,系统,1)系统参数辨识:参数估计,假设检验,3)系统输入输出相关分析:多元相关分析,4)决策分析:多元统计分析,判别分析,5)散乱数据分析:统计规律的挖掘,2)系统影响分析:方差分析,正交试验设计,3.本课程学习内容,第一章抽样分布第二章参数估计第三章假设检验第四章方差分析第五章正交试验设计,第一部分:数理统计基础,第六章线性回归分析第七章主成分分析典型相关分析第八章因子分析,第二部分:多元线性统计模型,第九章判别分析第十章聚类分析,第三

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论