




已阅读5页,还剩71页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020/6/14,统计学第1章绪论,1-1,统计学,主编:费宇,石磊,2020/6/14,统计学第1章绪论,1-2,第1章绪论,1.1统计数据与统计学1.2统计学的历史1.3统计学的分类1.4统计学基本概念1.5常用分布1.6正态总体的抽样分布,2020/6/14,统计学第1章绪论,1-3,【引例1.0】统计数据,统计数据,往往是一个“出新闻”的地方。2010年1月19日,在国家统计局的网站首页的头条,人们看见了“期待已久”的“2009年全国房地产市场运行情况”统计报告。按照统计局公布的这份报告:2009年12月份,全国70个大中城市房屋销售价格仅仅只同比上涨了7.8%。特别是城市居民最关心的新建住房销售价格,同比上涨(也就是一年的涨幅)一成都不到,只有9.1%(仅仅比国家统计局公布的2008年涨幅高了2个百分点);二手住房的销售价格,更是只比上年同期“慢慢涨了”6.8%。就连一些一线大城市,国家统计局的公布的2009年一年的房价涨幅,同样也“适度而温和”,绝不“吓人”:房价“最热”的北京,它的房屋销售价格,一年也就上涨了9.2%,天津为8.7%,上海、广州和深圳,分别也就7.4%、8.7%和18.9%。按照这份“官方的权威统计”,在这全国70个大中城市中,房价涨幅一年超过10%的,仅仅只有六七个城市左右,很多城市的房价涨幅连5%都不到。,2020/6/14,统计学第1章绪论,1-4,【引例1.0】统计数据,但是作为全国最大房地产专业门户网站之一的搜房网,2009年曾发布了一个号称“老百姓自己的房价榜”。他们通过对南京市的楼盘和各区域房价的全面统计和加权分析,得出2009年10月份该市商品房住宅价格比2010年年初的1月份上涨34.18%,环比也较上月全市上涨6.34%。而与此同时,国家统计局网站上公布的同比涨幅仅为4.3%,环比也只有2.4%。另外,据国务院发展研究中心宏观经济研究部的一次报告计算,2009年全国住宅销售的房价涨幅已经高达27.28%,整整超过了国家统计局公布的“新建住房销售价格”涨幅的两倍。各种房价涨幅数据再一次“打架”引发了“强烈的热议”。那么,如何判断现实中的诸多统计数据的合理性,要求我们对统计数据和统计学的基本原理具有一定的认识。(资料来源:FT中文网:,2020/6/14,统计学第1章绪论,1-5,1.1统计数据与统计学,1.1.1统计数据在日生活中(新闻、消息和报道中)我们会碰到各式各样的统计数据,只有正确理解这些统计数据,才能真正读懂这些新闻、消息和报道。统计数据与我们的日常生活息息相关,2020/6/14,统计学第1章绪论,1-6,【例1.1】,据中国国家统计局网公布的消息,2010年2月份,居民消费价格同比上涨2.7%,涨幅比上月扩大1.2个百分点。其中,城市同比上涨2.6%,农村上涨2.9%;食品价格上涨6.2%,非食品价格上涨1.0%;消费品价格上涨3.0%,服务项目价格上涨1.7%。,2020/6/14,统计学第1章绪论,1-7,问题,“居民消费价格同比上涨2.7%”确切的含义是什么?,2020/6/14,统计学第1章绪论,1-8,【例1.2】中国网(),2009年10月28日消息,国家统计局上海调查总队近期对1000户城市居民家庭开展了一项有关消费意向和消费观念的专题调查。调查结果显示,以下领域存在较大消费潜力:首先是住房消费。调查中,在问及购房意向时,有2.9%的家庭表示年内打算购房,另有9.6%表示在三年内有购房意向。而抽样调查显示,2008年只有1.1%的城市居民家庭实际购房。在有购房意向的被访家庭中,有46.4%表示是结婚用房,49.6%表示为改善居住条件。作为投资或其他用途的比重很小,只占4%。可见,对房价的稳定预期和刚性需求的持续增长,仍将有力支撑上海房地产市场的需求量。,2020/6/14,统计学第1章绪论,1-9,问题,“有2.9%的家庭表示年内打算购房,另有9.6%表示在三年内有购房意向”这两个数字的可靠性怎样?,2020/6/14,统计学第1章绪论,1-10,【例1.3】北京日报,2009年1月12日报道,2008年中国民生问题调查:食品安全状况最令人担忧,调查中对城乡居民询问了人身、个人和家庭财产、个人信息隐私、交通、劳动、医疗、食品等7个方面的安全感,结果发现在上述7个方面平均有74.6%的人表示“很安全”或“比较安全”。其中人身方面的安全感最高(很安全和比较安全合计83.2%),而食品和交通方面的安全感最低,分别只有65.3%和65.7%,认为不安全的人达30%以上。特别值得提及的是,在2006年和2008年的两次调查中,食品安全状况都在各类安全感中排在倒数第一,这说明公众对食品卫生和安全有着长期的担忧。调查的时间:2008年5月至9月,调查样本:此项全国抽样调查覆盖全国28个省市区的134个县(市、区)、251个乡(镇、街道)和523个村(居委会),共成功入户访问了7139位年龄在18至69岁的居民,调查误差小于2%,符合统计推论的科学要求。,2020/6/14,统计学第1章绪论,1-11,问题,“共成功入户访问了7139位年龄在18至69岁的居民,调查误差小于2%,符合统计推论的科学要求。”这里“调查误差小于2%”是什么意思?,2020/6/14,统计学第1章绪论,1-12,【例1.4】,2008年美国发表的两项大型临床试验结果显示,维生素及其它抗氧化剂丝毫无助于预防前列腺癌。美国医学会杂志在网络版上公布了这一结果:第一项研究是迄今进行过的规模最大的癌症预防对照试验之一,有3.55万名中年男性参加,服用维生素E、硒或安慰剂的时间超过5年。第二项试验历时8年,观察了维生素C和E对近1.5万名男性的影响。两项研究均显示,无论是对前列腺癌,还是所有种类的癌症,这些补充剂都没有预防效果。,2020/6/14,统计学第1章绪论,1-13,问题,“维生素及其它抗氧化剂丝毫无助于预防前列腺癌。”这个结论是如何得到的?这个结论可靠吗?,2020/6/14,统计学第1章绪论,1-14,1.1.2统计学,什么是统计学?一般的教科书:统计学是研究如何有效地收集数据、整理数据、分析数据,并根据数据作出推断的一门方法论科学。不列颠百科全书的定义:统计是“收集和分析数据的科学(science)和艺术(art)”。,2020/6/14,统计学第1章绪论,1-15,回顾问题,例1.1中“居民消费价格同比上涨2.7%”确切的含义是什么?第9章例1.2中“有2.9%的家庭表示年内打算购房,另有9.6%表示在三年内有购房意向”这两个数字的可靠性怎样?第3章例1.3中“调查误差小于2%”是如何估算出来的?第8章例1.4“维生素及其它抗氧化剂丝毫无助于预防前列腺癌。”这个结论是如何得到的?第4章,2020/6/14,统计学第1章绪论,1-16,1.2统计学的历史,统计活动的历史非常悠久统计学的历史却不算很长统计学两个主要来源:17世纪德国的国势学和17世纪英国的政治算术。,2020/6/14,统计学第1章绪论,1-17,国势学,以国家政治社会情况作为研究对象,运用对比的方法来研究各国实力的强弱。国势学派的主要代表人物:康令(H.Conring)和阿亨瓦尔(G.Achenwall),2020/6/14,统计学第1章绪论,1-18,政治算术,创始人:英国的配第(W.Petty)他在1690年出版的政治算术一书中以数字资料为基础,采用数量分析方法研究政治问题,第一次提出统计方法并利用统计方法分析数字资料。,2020/6/14,统计学第1章绪论,1-19,统计学与概率论结合,从18世纪开始统计学与概率论结合,概率论为统计学的进一步发展奠定了坚实的数理基础,促进了统计学理论和实践的繁荣昌盛。到19世纪末已经形成了古典统计学(描述统计学)的主要框架。,2020/6/14,统计学第1章绪论,1-20,统计学发展迅速,20世纪:统计学渗透到社会学、生物学、经济学等领域。哥塞特(W.S.Gosset)1908年以Student为笔名在生物计量学杂志上发表论文均值的或然误差,提出了著名的t统计量,开创了小样本理论先河;费雪(R.A.Fisher)对t分布、分布和F分布加以综合研究,提出了方差分析方法和最大似然估计方法,大大促进了推断统计学的发展;,2020/6/14,统计学第1章绪论,1-21,统计学发展迅速,奈曼(J.Neyman)和皮尔逊(E.S.Pearson)提出了系统的统计假设检验理论,并对区间估计做出了系统发展,瓦尔德(A.Wald)提出序贯分析法和统计决策函数理论,进一步丰富了现代统计学的理论,形成了现代统计学,即推断统计学的框架。,2020/6/14,统计学第1章绪论,1-22,1.3统计学的分类,从统计学的研究内容和方法上分类描述统计(descriptivestatistics):用数字和图表等方法对数据进行总结和展示,揭示数据的基本特征,为进一步的统计推断作准备。推断统计(inferentialstatistics):根据样本数据对总体进行估计、预测和推断,这是现代统计学的核心内容。,2020/6/14,统计学第1章绪论,1-23,【例1.5】中国经济增长2008-2009,2020/6/14,统计学第1章绪论,1-24,【例1.6】“三驾马车”,【根据国家统计局最新的数据显示,在拉动2009年GDP增长的“三驾马车”中,最终消费对经济增长的贡献率为52.5%,拉动GDP增长4.6个百分点,投资对经济增长的贡献率为92.3%,拉动GDP增长8个百分点。而国外需求,即“净出口”,对经济增长的贡献率为负44.8%,下拉GDP增长负3.9个百分点。,2020/6/14,统计学第1章绪论,1-25,【例1.7】全球最佳CEO,全球最佳CEO中介绍道,如果根据全球各顶尖首席执行官整个任期内的股东投资回报率和市值变化来排序,那么分析1995年至2009年间1109位首席执行官后可以发现,拥有MBA学位的平均表现要好于那些没有的。,2020/6/14,统计学第1章绪论,1-26,【例1.8】零点研究咨询集团,零点研究咨询集团、北汽福田汽车股份有限公司、新浪汽车联合发布的2009福田指数中国居民生活机动性指数研究报告指出:在参与调查的7个城市中,北京居民上下班或上下学拥堵经济成本为335.6元/月,处在各城市之首。其次是广州和上海,拥堵经济成本分别为265.9元/月和253.6元/月,低于北京。同时,北京居民上下班时间花费也居高位,道路畅通时平均花费时间40.1分钟,而道路拥堵时则达到62.3分钟。,2020/6/14,统计学第1章绪论,1-27,1.4统计学基本概念,四个最基本的概念:随机变量、总体、样本和统计量。,2020/6/14,统计学第1章绪论,1-28,1.4.1随机变量及其分布,随机变量(randomvariable)是定义在样本空间上的实值函数X=X(),它随样本点的变化而变化,它用来描述随机试验的结果。如果一个随机变量只能取有限个或可列个值,则称它为离散型随机变量(discreterandomvariable);如果一个随机变量的可能取值充满数轴上的一个区间,则称它为连续型随机变量(continuousrandomvariable)。,2020/6/14,统计学第1章绪论,1-29,几个例子,【例1.9】抛一颗六面均匀的骰子,观察出现的点数,则出现的点数X是一个随机变量。【例1.10】调查100个顾客,考察顾客对某个品牌笔记本电脑的偏好,记录喜欢这个品牌笔记本电脑的人数X,则X是一个随机变量。【例1.11】为了检验某电子产品的质量,检测它的使用寿命(以分钟记),则产品的使用寿命X是一个随机变量。【例1.12】从一大批产品中随机抽取若干个产品,考察次品率X,则X是一个随机变量。,2020/6/14,统计学第1章绪论,1-30,分布函数,描述随机变量分布的重要工具,可以用来描述离散型和连续型随机变量。定义1.1设X是一个随机变量,对任意实数x,称F(x)=P(Xx)(1.1)为随机变量X的分布函数(distributionfunction),称X服从F(x),简记为XF(x)。,2020/6/14,统计学第1章绪论,1-31,概率密度函数,定义1.2设随机变量X的分布函数是F(x),如果存在一个非负函数f(x),使得对任意实数x,有(1.2)则称f(x)是连续型随机变量X的概率密度函数(probabilitydensityfunction),简称为密度函数。,2020/6/14,统计学第1章绪论,1-32,1.4.2总体和总体分布,什么是总体?研究对象的全体就称为总体(population)或母体,总体中的元素称为个体。如果总体包含的个体的数目是有限的,则称之为有限总体;如果总体包含的个体的数目是无限的,就称之为无限总体。,2020/6/14,统计学第1章绪论,1-33,总体是随机变量,【例1.13】一批电子元件共10万个,研究这批电子元件的平均使用寿命,则该批电子元件的全部使用寿命就构成一个总体,而每个电子元件的使用寿命就是个体。【例1.14】考察某大学一年级新生的身高情况,则全体新生的身高就构成一个总体,而其中每个学生的身高就是个体。,2020/6/14,统计学第1章绪论,1-34,1.4.3样本和样本分布,样本:从总体中取出的部分个体构成的集合.样本容量:样本中的个体数目。抽样(sampling):取得样本的过程。常用抽样方法:简单随机抽样、分层抽样、整群抽样、等距抽样等第8章。,2020/6/14,统计学第1章绪论,1-35,简单随机样本,我们讨论的样本都是指简单随机抽样得到的简单随机样本(simplerandomsample),简称为样本(sample)。记(x1,xn)为样本容量为n的样本,其中x1,xn是相互独立的与总体X同分布的n个随机变量;(x1,xn)的观测值称为样本值,仍记作(x1,xn)。,2020/6/14,统计学第1章绪论,1-36,样本联合分布函数,对于简单随机样本,若总体X的分布函数为F(x),则样本(x1,xn)的联合分布函数为,2020/6/14,统计学第1章绪论,1-37,样本联合概率密度函数,若总体X的概率密度函数为f(x),则样本(x1,xn)的联合概率密度函数为,2020/6/14,统计学第1章绪论,1-38,样本联合概率函数,若总体X是离散型随机变量,其概率函数为p(x)=P(X=x),则样本(x1,xn)的联合概率函数为,2020/6/14,统计学第1章绪论,1-39,1.4.4统计量,抽样获得样本后,根据样本信息推断总体时,通常需要对样本信息进行加工整理,针对不同的问题构造适当的样本函数,这种用来推断总体的样本函数称为统计量(statistic)。统计量是用作统计推断的量,所以统计量不能含有未知参数。,2020/6/14,统计学第1章绪论,1-40,1.样本均值,称为样本均值(samplemean);它是总体期望的无偏估计。,2020/6/14,统计学第1章绪论,1-41,2.样本方差,称为样本方差(samplevariance),其算术平方根称为样本标准差(samplestandarddevication)。,2020/6/14,统计学第1章绪论,1-42,修正样本方差,称为修正样本方差。因为修正样本方差是总体方差的无偏估计,在实际中,修正样本方差比样本方差更常用,今后提到样本方差通常是指修正样本方差。,2020/6/14,统计学第1章绪论,1-43,3.样本矩,称为样本k阶原点矩和样本k阶中心矩;样本矩可以用来估计总体矩,从而获得相应的矩估计。,2020/6/14,统计学第1章绪论,1-44,4.次序统计量,将样本按由小到大排列得到的有序样本(x(1),x(n)称为样本的次序统计量(orderstatistic),其中,x(i)为样本的第i个次序统计量;x(1)称为样本的最小次序统计量,x(n)称为样本的最大次序统计量。,2020/6/14,统计学第1章绪论,1-45,5.样本中位数和样本极差,设(x(1),x(n)为有序样本,则样本中位数Me(median)定义为,2020/6/14,统计学第1章绪论,1-46,样本极差,样本极差(range)定义为:R=x(n)-x(1)它是反映样本值分散程度的量,可以用于推断总体的标准差。,2020/6/14,统计学第1章绪论,1-47,6.经验分布函数,设(x(1),x(n)为来自于总体的有序样本,对任意实数x,称(1.8)是经验分布函数,2020/6/14,统计学第1章绪论,1-48,1.5常用分布,统计量的概率分布称为抽样分布(samplingdistribution),经典的统计推断大多是基于正态分布以及正态变量构造的三个著名分布(分布、t分布和F分布)下面介绍这四分布和两个离散型分布(二项分布和泊松分布)的定义及主要性质。,2020/6/14,统计学第1章绪论,1-49,1.5.1正态分布,定义1.3如果随机变量X的密度函数为则称X服从参数为和2的正态分布(normaldistribution),记为XN(,2),其中和(0)都是常数。,2020/6/14,统计学第1章绪论,1-50,图1.1正态分布密度函数的曲线,2020/6/14,统计学第1章绪论,1-51,图1.2正态分布N(,1),N(,22)和N(,32)的密度曲线,2020/6/14,统计学第1章绪论,1-52,图1.3标准正态分布的密度曲线,2020/6/14,统计学第1章绪论,1-53,正态分布的性质,性质1.1若XN(,2),则E(X)=,Var(X)=2,性质1.2若XN(,2),则即任何一个一般的正态分布都可以经过简单的线性变换转化为标准正态分布。,2020/6/14,统计学第1章绪论,1-54,标准正态分布的分位数,对于标准正态分布随机变量X,对给定,称满足P(XZ)=的是标准正态分布的分位数。分位数可以从附表1里查到,比如=0.025,查附表1可得Z=1.96。,2020/6/14,统计学第1章绪论,1-55,1.5.2分布,2020/6/14,统计学第1章绪论,1-56,卡方分布的性质,2020/6/14,统计学第1章绪论,1-57,图1.4卡方分布的密度函数,2020/6/14,统计学第1章绪论,1-58,1.5.3t分布,2020/6/14,统计学第1章绪论,1-59,t分布的性质,2020/6/14,统计学第1章绪论,1-60,图1.5t(n)分布与标准正态N(0,1)的密度函数,2020/6/14,统计学第1章绪论,1-61,1.5.4F分布,2020/6/14,统计学第1章绪论,1-62,F分布的性质,2020/6/14,统计学第1章绪论,1-63,图1.6F(m,n)分布的密度函数,2020/6/14,统计学第1章绪论,1-64,1.5.5二项分布,2020/6/14,统计学第1章绪论,1-65,1.5.6泊松分布,2020/6/14,统计学第1章绪论,1-66,1.6正态总体的抽样分布,2020/6/14,统计学第1章绪论,1-67,2020/6/14,统计学第1章绪论,1-68,2020/6/14,统计学第1章绪论,1-69,2020/6/14,统计学第1章绪论,1-70,1.7统计软件SPSS简介,常用统计软件SAS,S-Plus,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东省佛山市南海区大沥镇石门实验中学2025-2026学年八年级上学期开学考试英语试卷(含答案)
- 眼科病例题库及答案
- 2025学年广东省高三语文上学期8月摸底检测试卷附答案解析
- 2025年抗心绞痛药项目合作计划书
- 扩张血管输液课件
- 2025年大板桥焊工考试题及答案
- 2025年市场调研考试试卷及答案
- 情绪正能量课件
- 锅炉培训考试试题合集及答案
- 托福考试口语题库及答案
- 《中国传统文化课件》课件
- 水利信息化水质监测系统单元工程质量验收评定表、检查记录
- 管理会计学(第6版) 课件 郭晓梅 第1-3章 管理会计导论、成本性态分析与变动成本计算法、作业成本计算法
- 云南省工程质量安全手册实施细则(试行)安全管理行为分册
- 2024版门面租赁合同书范本下载
- 2024 体育生规章制度
- 九年级化学开学第一课
- 事业单位行政单位物业管理服务方案(技术标)
- 单位食堂制止浪费方案
- 建筑施工安全技术操作规程
- 2024-2030年全球与中国发泡稀奶油行业竞争动态及营销动态研究报告
评论
0/150
提交评论