统计量和抽样分布_第1页
统计量和抽样分布_第2页
统计量和抽样分布_第3页
统计量和抽样分布_第4页
统计量和抽样分布_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计量和抽样分布第1页,共37页,2023年,2月20日,星期二2023/4/161说明样本的分布虽然能够反映总体的特征,但样本是一个多维随机变量,对其分布的研究当然也非常麻烦。所以,在对总体的分布或某些特征进行统计推断的时候,并不是直接利用样本的分布,而是通过建立样本的一个适当的函数,对总体的某方面的特征进行统计推断。也就是建立一个统计量。第2页,共37页,2023年,2月20日,星期二2023/4/162第一节统计量第3页,共37页,2023年,2月20日,星期二2023/4/163定义:设X1,X2,…,Xn是来自总体的一个样本,g(X1,X2,…,Xn)是样本的函数,若g中不含任何未知参数,则称g(X1,X2,…,Xn)是一个统计量。若(x1,x2,…,xn

)

是样本(X1,X2,…,Xn)的观察值,则g(x1,x2,…,xn

)是g(X1,X2,…,Xn)的观察值。如是来自总体的一个样本,则都是统计量;若未知,则就不是统计量。第4页,共37页,2023年,2月20日,星期二2023/4/164补充说明统计量是我们对总体的分布函数或数字特征进行统计推断的最重要的基本概念,所以建立适当的统计量,以及寻求统计量的分布成为数理统计的基本问题之一。并把统计量的分布称为抽样分布。第5页,共37页,2023年,2月20日,星期二2023/4/165第二节常用统计量常用的统计量主要有两种类型:1、描述数据分布的中心位置;2、描述数据分布的分散程度。第6页,共37页,2023年,2月20日,星期二2023/4/166一、样本均值1、定义式:①一般地,②分组情形:TH1【样本的所有偏差之和为0】TH2【样本观察值与均值的偏差平方和最小】第7页,共37页,2023年,2月20日,星期二2023/4/167TH2的证明证:由TH1知=0第8页,共37页,2023年,2月20日,星期二2023/4/168二、样本方差与样本标准差1、定义式:①②注:②式比①式更常用,是D(X)的无偏估计;n-1称为偏差平方和的自由度。中只有n-1个数据可以变动。为偏差平方和,第9页,共37页,2023年,2月20日,星期二2023/4/1692、偏差平方的其他计算式在分组情形下,注:称为样本的标准差。第10页,共37页,2023年,2月20日,星期二2023/4/1610三、样本中位数次序统计量:把简单随机样本按照其取值从小到大的次序排列,记为称之为次序统计量。在次序统计量中,位于中间一个位置的x称为样本中位数。并且有第11页,共37页,2023年,2月20日,星期二2023/4/1611样本中位数M=med=n为奇数时;n为偶数时.注:样本均值和样本中位数都是描述数据分布的中心位置的常用统计量;对于对称分布有第12页,共37页,2023年,2月20日,星期二2023/4/1612四、样本相关系数和散点图为样本相关系数。且规定第13页,共37页,2023年,2月20日,星期二2023/4/1613以成对样本数据的对应取值(x,y)作为平面上点的坐标,在平面坐标系中画出这些点,就得到所谓数据对的散点图。详见P105-图9.2。注:样本相关系数反映了成对数据的关联程度。例如,考察中学生的物理成绩与数学成绩的散点图,并说明两科成绩的关联程度。第14页,共37页,2023年,2月20日,星期二2023/4/1614第三节抽样分布统计量的分布,即称为抽样分布。统计推断就是根据抽样分布来作出的。第15页,共37页,2023年,2月20日,星期二2023/4/1615一、有限总体的抽样分布TH1设总体中的个体总数为N,样本容量为n,且总体具有有限的均值μ和方差σ2,则有第16页,共37页,2023年,2月20日,星期二2023/4/1616样本均值的方差较小,体现了样本均值的稳定性。并且,样本容量越大,反映总体越可靠。补充说明如果n<<N,则不放回抽样可以近似看作是有放回抽样。对于无限总体,不论放回、不放回抽样,都可以看作是有放回抽样。本教材主要研究从无限总体的简单随机抽样,较大容量的有限总体可以看作是无限总体。第17页,共37页,2023年,2月20日,星期二2023/4/1617在推断统计中,以正态变量为基石而构造的三个著名统计量,在实践中有广泛的应用,即统称为“三大抽样分布”。分布,分布,分布,二、三个重要分布第18页,共37页,2023年,2月20日,星期二2023/4/1618一、分布〔卡方分布〕定义1设独立,且都服从标准正态分布,服从的分布为自由度为n

的分布,记作:即,则称注:服从分布的随机变量取值非负,其密度函数及其图形如下:第19页,共37页,2023年,2月20日,星期二2023/4/1619n=4n=6n=10注:随n的增大,其偏度越来越小。

分布分位数表(P425)实际上也是分布函数数值表。~Ga(n/2,1/2)=分布是Ga分布的特例。独立,则第20页,共37页,2023年,2月20日,星期二2023/4/1620二、F分布且X与Y相互定独立,则称其中m称为第一自由度,n称为第二自由度。定义2设所服从的分布为自由度是(m,n)的F分布,记作:第21页,共37页,2023年,2月20日,星期二2023/4/1621F分布的图形及性质,则易证:如果进而有:其中,第22页,共37页,2023年,2月20日,星期二2023/4/1622的证明证:第23页,共37页,2023年,2月20日,星期二2023/4/1623三、t分布所服从的分布是自由度为n的t分布,记作:显然,t分布是由标准正态分布与分布组合成的。定义3设则称统计量且X与Y相互独立,t分布也称为学生-student分布,其密度函数如下:第24页,共37页,2023年,2月20日,星期二2023/4/1624t分布的图形与性质n=10n=4n=1t(x;n)性质:t分布与标准正态分布有着相似的性质;而且,随着n的增加,它与标准正态分布越来越接近。当n>30时,两者的区别非常小。可以比较这两种分布的数值表。第25页,共37页,2023年,2月20日,星期二2023/4/1625四、抽样分布定理分别为样本均值与样本方差,则1.2.与相互独立;3.定理1若,是来自正态总体的一个样本,与第26页,共37页,2023年,2月20日,星期二2023/4/1626证明由定理4知所以又的一个样本,则定理2若是来自正态总体第27页,共37页,2023年,2月20日,星期二2023/4/1627由于与相互独立,因此与相互独立,从而由t分布的定义有:第28页,共37页,2023年,2月20日,星期二2023/4/1628其中的两个样本,且它们相互独立,则定理3设和是分别来自正态总体和第29页,共37页,2023年,2月20日,星期二2023/4/1629证明由定理条件有所以又因并且它们是相互独立的,故由分布的可加性可知第30页,共37页,2023年,2月20日,星期二2023/4/1630从而由独立性条件及t分布的定义有即第31页,共37页,2023年,2月20日,星期二2023/4/1631的两个样本,且它们相互独立,则定理4设和是分别来自正态总体和其中,第32页,共37页,2023年,2月20日,星期二2023/4/1632由相互独立性及F分布的定义可知:证明注:若,则第33页,共37页,2023年,2月20日,星期二2023/4/1633例某镇有25000户家庭,平均拥有汽车1.2辆,标准差为0.90辆,他们中10%没有汽车。现有1600户家庭的随机样本,问在样本中9%至11%之间的家庭没有汽车的概率是多少?分析:因此,这两个条件与所求问题无关。平均拥有汽车1.2辆,标准差为0.90辆,是关于拥有汽车数量的两个条件;而所求问题是拥有汽车的家庭平均所占的比例。主要的条件是10%没有汽车第34页,共37页,2023年,2月20日,星期二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论