统计学原理绪论PPT课件.ppt_第1页
统计学原理绪论PPT课件.ppt_第2页
统计学原理绪论PPT课件.ppt_第3页
统计学原理绪论PPT课件.ppt_第4页
统计学原理绪论PPT课件.ppt_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,STATISTICS统计学,2,相关学习资料下载邮箱,公共邮箱:statisticsnankai密码:nankai,3,阐明统计工作的基本理论和方法。学习如何搜集统计资料,整理统计资料,并从定性和定量的联系中分析统计资料,培养学生分析问题、解决问题的能力。掌握各种统计计算方法,学会利用有关的统计软件分析数据和处理数据,适应现代统计的需要。为学生学习有关的经济、管理理论提供必要的数量分析方法。,课程说明教学目的,4,课程说明预备知识,线性代数概率论与数理统计统计学原理,5,参考书目,商务与经济统计第11版,张建华等译,北京:机械工业出版社,2010贾俊平等,统计学,第4版,北京:中国人民大学出版社,2009DavidFreedman著,魏宗舒等译,1997:统计学,第1版,北京:中国统计出版社袁卫等,2000:统计学,第1版,北京:高等教育出版社StatisticsandEconometrics,2nd,DominickSalvatoreandDerrickReagle,2002,McGraw-Hill,6,古扎拉蒂,2000:计量经济学(第三版),第1版,北京:中国人民大学出版社何晓群等,2001:应用回归分析,第1版,北京:中国人民大学出版社范大茵等,1996:概率论与数理统计,第1版,杭州:浙江大学出版社,7,8,9,课程内容,概论第一章数据与统计资料第二章描述统计学:表格和图形法第三章描述统计学:数字特征上机(1)软件操作演示第四章抽样技术和抽样调查方法第五章参数估计上机(2)软件操作演示,10,课程内容,第六章假设检验上机(3)软件操作演示第七章方差分析上机(4)软件操作演示第八章指数第九章时间序列分析上机(5)软件操作演示第十章多元统计分析初步(选讲主成分分析)上机(6)软件操作演示,11,考核方式,闭卷考试:60%70%学期论文(要求见公共邮箱)平时作业,12,导论,13,统计是什么?,统计是人类思维的一个归纳过程站在一个路口,看到每过去20辆小轿车时,就有100辆自行车通过,而且平均每10个轿车载有12个人,于是,你认为小汽车和自行车在这个路口的运载能力为24:100这是一个典型的统计思维过程,14,统计是什么?,一般来说,统计先从现实世界收集数据(信息)(如:观测路口的交通)。然后,根据数据作出判断,称为模型。,15,统计数据数据,16,模型,模型是从数据产生的。模型也需要根据新的信息来改进,不存在完美的模型。模型的最终结局都是被更能够说明现实世界的新模型所取代。,17,什么是统计学?,统计学是一门收集、处理、分析、解释数据并从数据中得出结论的科学.Statistics:thescienceofcollecting,analyzing,presenting,andinterpretingdata.不列颠百科全书,18,*,统计学研究什么?,统计学没有任何固定的对象,是一门独特的学问统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并兴旺发达。按萨维奇(L.J.Savage)的说法:统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱。,19,*,统计学研究什么?,物理学研究的是如热、光、电、运动规律那样的自然现象;化学家测定物质的组成及化学元素之间的交互作用;生物学家研究植物和动物的生活;数学家则在给出的假定之下沉溺于他自己推演各种命题的游戏这些学科中的每一门都有它自己的问题,而且有解决这些问题的各自的方法,各学科为此而成为一门单独的学科,20,统计学研究什么?,统计学是一门科学统计学提供一套方法和技术,这些方法和技术不能用于固定模式,使用者在给定的情况下必须根据所掌握的专门知识选择使用的方法,而且,如果需要还要进行必要的修正统计方法是通用的数据分析方法。这些方法不是为某个特定的问题领域而构造的统计学是一种技术如同工业生产过程中的质量控制程序一样,统计方法是为保证产品达到所希望的质量和保持其稳定性的的管理系统中建立起来的统计方法也能用于控制、减少和考察不确定性统计学是一门艺术作为归纳推理的统计方法不是没有争议的。不同的人对同一组数据的分析可能得到不同的结论使用数字讲故事取决于统计学家的技巧和他们的经验。在这个意义下,统计学也是一门艺术印度小说红色城堡(TheRedFort),21,统计方法描述统计和推断统计,22,统计方法描述统计,内容数据收集、处理、汇总、描述、概括与分析等。以统计图、统计表和数字特征的形式出现,是推断统计的基础。目的描述数据特征,找出数据的基本规律,23,一个例子:50个计算机购买者所购买的不同品牌的机型数据,24,公司频数频率频率百分数Apple130.2626Compaq120.2424Gatewy200050.1010IBM90.1818PackardBell110.2222Total501.00100,频数分布表,25,条形图,26,由Excel输出的描述统计量,27,统计方法推断统计,内容参数估计假设检验,28,统计中的几个基本概念总体、个体和样本,1.总体(Population)所关心的对象的全体2.个体总体中的每一个对象3.样本(Sample)总体的一部分,29,总体的特点,同质性变异性大量性综合性,30,总体与变量之间的关系,31,总体的类型,有限总体和无限总体一元总体与多元总体,32,变量及其类型,变量,33,个体,个体的定义个体的几种情形:,自然、明确和无异议的变量的每个值视为个体概念不唯一,34,2样本,样本样本容量,35,统计中的几个基本概念参数和统计量,1.参数(Parameter)总体的数字特征2.统计量(Statistic)样本的概括性测度值,36,推断统计利用样本数据了解总体特征,37,描述统计与推断统计的关系,反映客观现象的数据,描述统计(统计数据的搜集、整理、显示和分析等),统计学探索现象数量规律性的过程,38,1.1.2统计的应用领域,39,*,统计的应用领域,【例1-1】用统计识别作者17871788年,三位作者AlexanderHamilton,JohnJay和JamesMadison为了说服纽约人认可宪法,匿名发表了著名的85篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的12篇论文的作者身份引起了争议通过对不同单词的频数进行统计分析,得出的结论是,JamesMadison最有可能是这12篇论文的作者。现在,对于这些存在争议的论文,认为JamesMadison是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确,40,*,统计的应用领域,【例1-2】用简单的描述统计量得到一个重要发现费舍(RAFisher)在1952的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现。20世纪早期,哥本哈根卡尔堡实验室的施密特(J.Schmidt)发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向。然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值。由此,施密特推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的后来名为“戴纳(Dana)”的科学考察船在一次远征中发现了这个场所,41,*,统计的应用领域,【例1-3】挑战者号航天飞机失事预测1986年1月28日清晨,载有7名宇航员的挑战者号进入发射状态。就在发射前,有冰片牢附在机壳上。几分钟后,正当电视新闻报道它已进入轨道时,航天飞机在毁灭性的爆炸声中化成碎片,机上的宇航员片骨未存推动航天飞机进入太空的两个固体燃料发动机是由Thiokol公司制造的。失事前一天晚上,Thiokol公司的经理们和国家航空航天局就如期发射还是推迟发射产生了争执。天气预报发射时的气温为310F。争执的结果采纳了Thiokol公司经理们的建:按计划发射航天飞机。因为他们觉得没有确凿证据表明低温会对固体燃料火箭推进器的性能产生影响,42,*,统计的应用领域,【例1-3】挑战者号航天飞机失事预测在此次失事前,该航天飞机24次发射成功。将航天飞机送入太空的两个固体燃料推进器由6只O型项圈密封。在几次飞行中,曾发生过O型项圈被腐蚀或气体泄漏事故。这样的事故是及其危险的。前24次发射中有一次发动机遭到了永久性破坏。根据23次飞行中发生腐蚀或泄漏事故的次数(因变量)及火箭连接处的温度(自变量)数据,进行线性回归得到的回归方程为当温度为310F时,O型项圈发生事故的预计次数为2.225次。结果显示连接处的温度与O型项圈事故之间有一定的相关性。如果当时那些经理们看到了回归的预测结果,也许推迟发射会成为其谨慎的选择,43,统计的应用领域(续),actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学),44,应用统计的领域(续),hydrology(水文学)Industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善),45,统计在工商管理中的一些应用,企业发展战略产品质量管理市场研究财务分析经济预测人力资源管理,46,统计学与其他学科的关系,统计学可以用到几乎所有的学科领域统计学可以帮助其他学科探索学科内在的数量规律性统计学不能解决各学科领域的所有问题对统计分析结果的解释需要各学科领域的专业人员,47,统计学与数学的关系(联系),统计学运用到大量的数学知识数学为统计理论和统计方法的发展提供基础不能将统计学等同于数学,48,统计学与数学的关系(区别),数学研究的是抽象的数量规律,统计学则是研究具体的、实际现象的数量规律数学研究的是没有量纲或单位的抽象的数,统计学研究的是有具体实物或计量单位的数据统计学与数学研究中所使用的逻辑方法不同数学研究所使用的主要是的演绎统计学则是演绎与归纳相结合,占主导地位的是归纳,49,历史上著名的统计学家,50,历史上著名的统计学家,JacobBernoulli(伯努利)(1654-1705)EdmondHalley(哈雷)(1656-1742)DeMoivre(棣美佛)(1667-1754)ThomasBayes(贝叶斯)(1702-1761)LeonhardEuler(欧拉)(1707-1783)PierreSimonLaplace(拉普拉斯)(1749-1827)AdrienMarieLegendre(勒让德)(1752-1833)ThomasRobertMalthus(马尔萨斯)(1766-1834)FriedrichGauss(高斯)(1777-1855)JohannGregorMendel(孟德尔)(1822-1884)KarlPearson(皮尔森)(1857-1936)RonaldAylmerFisher(费歇)(1890-1962)JerzyNeyman(内曼)(1894-1981)EgonSharpePearson(皮尔森)(1895-1980)WilliamFeller(费勒)(1906-1970),51,第三节统计、计算机与统计软件,统计、计算机与统计软件常用统计分析软件,52,常用统计分析软件,stataSasSpssSplusMathematicaMatlabGaussEviews,53,统计、计算机与统计软件,现代生活越来越离不开计算机了最初的计算机仅仅是为科学计算而设计和建造的。统计是大型计算机的最早用户,现在仍然是数值计算的主要用户计算机的使用,从计算机语言到“傻瓜式”地点击鼠标输出结果也从数字输出到各种可以想象得到的形式。输入数据,点鼠标做一些选项,就可得到漂亮结果但其中充满了危险的陷阱,54,统计、计算机与统计软件,计算机无法识别你的统计方面的错误错误的方法、错误的数据形式都必然输出错误的结果(虽然看上去可能很漂亮),得到大量垃圾另外,统计软件输出的结果太多、很难都理解,55,统计、计算机与统计软件,统计软件的种类很多。仅介绍最常见的几种。只要学会使用一种“傻瓜式”软件或编程软件,使用其他类似的软件也不会困难;最多看看帮助和说明即可。学习软件的最好方式是需要时在使用中学。,56,数据挖掘,利用统计和计算机科学的方法从非常大的数据库中获取有用信息的过程。在揭示数据中的关系和预测未来结果时,统计方法在数据挖掘中扮演着重要的角色。,57,*,统计的误用与滥用,大约在一个世纪以前,政治家BenjaminDisraeli曾有一个著名的论断:“有三类谎言:谎言、糟透的谎言和统计”。他还说:“图并没有说谎,是说谎者在画图”历史学家AndrewLang说,一些人使用统计“就像喝醉酒的人使用街灯柱-支撑的功能多于照明”统计滥用不好的样本过小的样本误导性图表局部描述故意曲解,58,统计实践的道德准则,公平谨慎客观中立意识到统计实践中可能存在不道德行为关注统计分析结果的来源、目的和客观性,59,统计研究中的不道德行为,不正确的抽样不恰当的数据分析误导性的图表绘制不恰当地使用统计摘要片面解释统计结果,60,*,统计的误用与滥用,统计应用上的两个极端不用或几乎不用统计简单问题复杂化在统计应用中,这两个极端都是不可取的简单的方法不一定没用,复杂的方法也不一定有用。正如有的学者所说的,最简单的模型往往是最有用的统计应该恰当地应用到它能起作用的地方。不能把统计神秘化,更不能歪曲统计,把统计作为掩盖实事的陷阱,61,幸存者偏差(survivorshipbias),1941年,英国皇家空军的作战指挥官拜访了美国哥伦比亚大学著名统计学家沃德教授(AbrahamWald),请求他协助英国皇家空军改善飞机防弹能力!沃德接下这个紧急研究案,他分析德国地面炮火击中联军轰炸机的资料后,以统计专家的身份建议机体装甲应该如何加强,才能降低被炮火击落的机会。但依照当时的航空技术,机体装甲只能局部加强,否则机体过重,会导致起飞困难及操控迟钝。沃德将联军轰炸机的弹着点资料,描绘成两张比较表,发现机翼是最容易被击中的部位,而飞行员的座舱与机尾,则是最少被击中的部位。但在研究成果报告的会议上,负责该项目的作战指挥官说:“沃德教授的研究清楚地显示,联军轰炸机的机翼,弹孔密密麻麻,最容易中弹。因此,我们应该加强机翼的装甲”。沃德客气但坚定地说:“将军,我尊敬你在飞行上的专业,但我有完全不同的看法,我建议加强飞行员座舱与机尾发动机部位的装甲,因为那儿最少发现弹孔”。在全场错愕怀疑的眼光中,沃德解释说:“我所分析的样本中,只包含顺利返回基地的轰炸机。从统计的观点来看,我认为被多次击中机翼的轰炸机,似乎还是能够安全返航,而飞机很少发现弹着点的部位,并非真的不会中弹,而是一旦中弹,根本就无法返航”。指挥官反驳说:“我很佩服沃德教授没有任何飞行经验,就敢做这么大胆的推论,就我个人而言,过去在执行任务时,也曾多次机翼中弹严重受创,要不是我飞行技术老到,运气也不错,早就机毁人亡了,所以,我依然强烈主张应该加强机翼的装甲”。这两种意见僵持不下,皇家空军部部长陷入苦思。他到底要相信这个作战经验丰富的飞将军,还是要相信一个独排众议的统计学家?由于战况紧急,无法做更进一步的研究,部长决定接受沃德的建议,立刻加强驾驶舱与机尾发动机的防御装甲。不久之后,联军轰炸机被击落的比例,果然显著降低。为了确认这个决策的正确性,一段时间后,英国军方动用了敌后工作人员,搜集了部份坠毁在德国境内的联

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论