基本概念与抽样分布_第1页
基本概念与抽样分布_第2页
基本概念与抽样分布_第3页
基本概念与抽样分布_第4页
基本概念与抽样分布_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于基本概念与抽样分布一、基本概念1.总体总体中每个成员称为个体.一个统计问题总有它明确的研究对象.研究对象的全体称为总体(母体),…研究某批灯泡的质量总体第2页,共58页,2024年2月25日,星期天

然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.某批灯泡的寿命该批灯泡寿命的全体就是总体国产轿车每公里的耗油量国产轿车每公里耗油量的全体就是总体第3页,共58页,2024年2月25日,星期天

由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.这样总体就可以用一个随机变量及其分布来描述.统计中,总体这个概念的要旨是:

总体就是一个随机变(向)量或其概率分布.数理统计研究的内容:总体相应随机变(向)量的概率分布及数字特征.第4页,共58页,2024年2月25日,星期天

为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.2.样本从国产轿车中抽5辆进行耗油量试验样本容量为5(1).抽样、样本、样本值第5页,共58页,2024年2月25日,星期天

但是,一旦取定一组样本,得到的是n个具体的数

(X1,X2,…,Xn),称为样本的一次观察值,简称样本值.

样本是随机变量.抽到哪5辆是随机的容量为n的样本可以看作n维随机向量.第6页,共58页,2024年2月25日,星期天样本具有两重性:10.随机性样本(X1,X2,…,Xn)本身是随机向量。20.相对确定性经过一次抽样否,样本(X1,X2,…,Xn)又是一组确定的样本值(x1,x2,…,xn)。第7页,共58页,2024年2月25日,星期天

由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.

最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面三点:10.随机性:X1,X2,…,Xn每个结果等可能被抽取。20.代表性:X1,X2,…,Xn中每一个与所考察的总体有相同的分布;30.独立性:X1,X2,…,Xn是相互独立的随机变量,每个样本值互不干扰。(2).简单随机样本第8页,共58页,2024年2月25日,星期天

由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个随机变量X1,X2,…,Xn表示.

简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.

数学定义:

n个随机变量X1,X2,…,Xn独立同分布(X与同分布),则称(X1,X2,…,Xn)来自总体X的容量为n的简单随机样本,简称为样本.第9页,共58页,2024年2月25日,星期天

事实上我们抽样后得到的资料都是具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.3.总体、样本、样本值的关系第10页,共58页,2024年2月25日,星期天总体(理论分布)?样本

样本值

统计是从手中已有的资料--样本值,去推断总体的情况---总体分布F(x)的性质.

总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.样本是联系二者的桥梁第11页,共58页,2024年2月25日,星期天实际上,样本的分布与总体分布的关系如下

定理1.若总体的分布函数为F(x),则其简单随机样本的联合分布函数为第12页,共58页,2024年2月25日,星期天

由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.二、统计量1.定义

设(X1,X2,…,Xn)为总体X的一个样本,f(X1,X2,…,Xn)是一个不含任何有关总体分布未知参数的函数,称为此总体的一个统计量,它是完全由样本决定的量.

统计量实际上也是一个随机变量,它是一个随机向量的函数。第13页,共58页,2024年2月25日,星期天是统计量.不是统计量.统计量的两重性(1).统计量f(X1,X2,…,Xn)本身是随机向量,他有确定的概率分布-抽样分布。(2).经过一次抽样否,f(X1,X2,…,Xn)又是由样本值(x1,x2,…,xn)确定的一个统计值。第14页,共58页,2024年2月25日,星期天样本k-阶原点矩样本k-阶中心矩

k=1,2,…它反映了总体k阶矩的信息它反映了总体k阶中心矩的信息2.常用的统计量(样本矩)(1).定义它们均是随机变量第15页,共58页,2024年2月25日,星期天样本均值样本方差它反映了总体均值的信息它反映了总体方差的信息k=1时,A1称为样本均值k=2时,B2称为样本方差更加常用简称为样本方差第16页,共58页,2024年2月25日,星期天(2).矩的性质性质1.由大数定律可知

大样本条件下,一次抽样后样本均值、方差可作为总体的均值、方差的近似。

一般地,抽样分为大样本和小样本问题。第17页,共58页,2024年2月25日,星期天性质2.证第18页,共58页,2024年2月25日,星期天推论证第19页,共58页,2024年2月25日,星期天第20页,共58页,2024年2月25日,星期天3.次序统计量(1).定义

即:X(k)的取值x(k)为(x(1),…,x(n))按从小到大的次序重新排列后第k个位置的数,第21页,共58页,2024年2月25日,星期天第22页,共58页,2024年2月25日,星期天(2).最小、最大的分布另外,(X(1),X(2),…,X(n))联合密度第23页,共58页,2024年2月25日,星期天(3).中位数、样本极差中位数样本极差次序统计量、中位数、样本极差都是统计量。极差可以反映样本值变化的程度或离散程度。第24页,共58页,2024年2月25日,星期天

例1.用Excel计算下列样本中位数、均值、方差、标准差、极差.解第25页,共58页,2024年2月25日,星期天4.经验分布函数(1).定义当给定次序统计量的一组值定义对

称Fn(x)为总体X的经验分布函数。为样本值不超过x的频率。第26页,共58页,2024年2月25日,星期天经验分布函数Fn(x)从样本直观得到描述性分布.样本直方图可以描述.(2).经验分布函数的性质10.具有通常分布函数的三个性质,图形呈跳跃上升;20.Fn(x)是一个随机变量;第27页,共58页,2024年2月25日,星期天30.经验分布函数Fn(x)与总体分布函数F(x)的关系格列汶科(Glivenko)定理:第28页,共58页,2024年2月25日,星期天三、抽样分布

统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布”

.

抽样分布精确抽样分布渐近分布(小样本问题中使用)(大样本问题中使用)

抽样分布是由一个统计量(随机变量函数)的分布.研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.第29页,共58页,2024年2月25日,星期天

由实际问题与中心极限定理可知,讨论正态总体的样本统计量的分布非常必要。1.正态总体X与样本线性函数的分布(1)总体X~第30页,共58页,2024年2月25日,星期天(2)(X1,…,Xn)来自总体X~第31页,共58页,2024年2月25日,星期天设X1,…,Xn~N(0,1)且相互独立,则称随机变量:是由正态分布派生出来的一种分布.(1).定义所服从的分布为自由度为

n

的n为独立随机正态变量的个数,也称为第32页,共58页,2024年2月25日,星期天其中Γ(x)为伽玛(Gamma)函数具有如下性质:可由数归法得到第33页,共58页,2024年2月25日,星期天10.

设X1,…,Xn~则E(X)=n,D(X)=2n由定义知E(Xi)=0,D(Xi)=1=n第34页,共58页,2024年2月25日,星期天30.

2变量的可加性要用到独立随机变量和的卷积公式和Γ(x)

的性质。=2n第35页,共58页,2024年2月25日,星期天更一般地有柯赫伦(Cochran)分解定理:设X1,…,Xn~N(0,1)且相互独立,其在方差分析中有很重要的作用。第36页,共58页,2024年2月25日,星期天应用Lindeberg中心极限定理可得:40.极限分布第37页,共58页,2024年2月25日,星期天记为T~t(n).

设X~N(0,1),Y~

2(n),且相互独立,则称随机变量所服从的分布为自由度为n的t分布,也称为t变量.3.t-分布(1).定义:(2).T变量的密度函数为:第38页,共58页,2024年2月25日,星期天10.T~t(n)为具有自由度为n的t分布的随机变量,则T的数字特征具有如下性质:当

n=1时,

T~t(n)实际上是柯西分布,任何阶矩均不存在;(3).T变量的性质:当n>2,

E(T)=0;D(T)=n/(n-2)

.

且有第39页,共58页,2024年2月25日,星期天事实上第40页,共58页,2024年2月25日,星期天

当n充分大时,其图形类似于标准正态分布密度函数的图形.t分布的密度函数关于x=0对称,是偶函数,且应用Γ函数的性质及司特林(Stirling)公式得:30.极限分布

当n充分大时,t分布近似N

(0,1)分布.但对于较小的n,t分布与N(0,1)分布相差很大.第41页,共58页,2024年2月25日,星期天由定义可见,服从自由度为n1及n2

的F-分布,n1称为第一自由度,n2称为第二自由度,记作F~F(n1,n2).~F(n2,n1)4.F-分布(1).定义也称为F变量第42页,共58页,2024年2月25日,星期天EX不依赖于第一自由度n1.10.若X~F(n1,n2),X的数学特征:若n2>2(2).若X~F(n1,n2),X的概率密度为(3).F变量的性质第43页,共58页,2024年2月25日,星期天20.若n1=1时,F~F(1,n2)=t2(n2).30.极限分布若X~F(n1,n2),n2>4,则第44页,共58页,2024年2月25日,星期天40.分解定理:设X1,…,Xn~N(0,σ2)且相互独立,

是柯赫伦(Cochran)分解定理的具体应用,它也在方差分析中有重要作用。第45页,共58页,2024年2月25日,星期天四、抽样分布定理

当总体为正态分布时,我们简单地叙述几个抽样分布定理.1.一个正态总体X~设X1,X2,…,Xn是来自总体X~(1).定理1.(样本均值的分布)第46页,共58页,2024年2月25日,星期天n取不同值时样本均值的分布第47页,共58页,2024年2月25日,星期天n取不同值时的分布第48页,共58页,2024年2月25日,星期天(2).定理2(样本方差的分布)则有X1,X2,…,Xn是来自总体X~第49页,共58页,2024年2月25

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论