第5章_样本及其分布(数应)_第1页
第5章_样本及其分布(数应)_第2页
第5章_样本及其分布(数应)_第3页
第5章_样本及其分布(数应)_第4页
第5章_样本及其分布(数应)_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章样本及其分布样本及其分布机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 第五章第五章 样本及其分布样本及其分布 简单随机样本简单随机样本 抽样分布抽样分布研究某批灯泡的质量研究某批灯泡的质量 一个统计问题总有它明确的研究对象一个统计问题总有它明确的研究对象. 研究对象的全体称为研究对象的全体称为总体总体(母体母体), 总体中每总体中每个成员称为个成员称为个体个体.机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 总体总体 然而在统计研究中然而在统计研究中, 人们关心总体仅仅人们关心总体仅仅是关心其每个个体的一项是关心其每个个体的一项(或几项或几项)数量指标数量

2、指标和该数量指标在总体中的分布情况和该数量指标在总体中的分布情况. 这时这时, 每每个个体具有的数量指标的全体就是总体个个体具有的数量指标的全体就是总体.某批某批灯泡的寿命灯泡的寿命该批灯泡寿命的该批灯泡寿命的全体就是总体全体就是总体国产轿车每公里国产轿车每公里的耗油量的耗油量国产轿车每公里耗油国产轿车每公里耗油量的全体就是总体量的全体就是总体机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 由于每个个体的出现是随机的由于每个个体的出现是随机的, 所以相应所以相应的数量指标的出现也带有随机性的数量指标的出现也带有随机性. 从而可以把从而可以把这种数量指标看作一个随机变量这种数量指标看

3、作一个随机变量, 因此随机变因此随机变量的分布就是该数量指标在总体中的分布量的分布就是该数量指标在总体中的分布. 这样这样, 总体就可以用一个随机变量及其分总体就可以用一个随机变量及其分布来描述布来描述. 若用若用 表示总体的表示总体的 个指标个指标, 它是一它是一个个 维随机变量维随机变量, 其分布函数是其分布函数是 , 则则称该总体为具有分布函数称该总体为具有分布函数 的总体的总体. 1,nXX),(1nxxFnn),(1nxxF机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 而而概率分布概率分布正是刻划这种集体性质正是刻划这种集体性质的适当工具的适当工具. 因此在理论上可以把

4、总体与因此在理论上可以把总体与概率分布等同起来概率分布等同起来. 从另一方面看从另一方面看, 统计的任务统计的任务, 是根据从是根据从总体中抽取的样本总体中抽取的样本, 去推断总体的性质去推断总体的性质. 由于我们关心的是总体中的个体的由于我们关心的是总体中的个体的某项指标某项指标(如人的身高、体重如人的身高、体重, 灯泡的寿命灯泡的寿命,汽车的耗油量汽车的耗油量) , 所谓总体的性质所谓总体的性质, 无非无非就是这些就是这些指标值的集体的性质指标值的集体的性质.机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 例如例如: 研究某批灯泡的寿命时研究某批灯泡的寿命时, 关心的数量关心的

5、数量指标就是寿命指标就是寿命, 那么那么, 此总体就可以用随机变此总体就可以用随机变量量X表示表示, 或用其分布函数或用其分布函数F(x)表示表示.某批某批灯泡的寿命灯泡的寿命总体总体寿命寿命X可用一概可用一概率分布来刻划率分布来刻划 鉴于此鉴于此, 常用随机变量常用随机变量的记号或用其分布函数表示的记号或用其分布函数表示总体总体. 如说总体如说总体X或总体或总体F(x).F(x)机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 类似地类似地, 在研究某地区中学生的营养状在研究某地区中学生的营养状况时况时, 若关心的数量指标是身高和体重若关心的数量指标是身高和体重, 我我们用们用X和

6、和Y分别表示身高和体重分别表示身高和体重, 那么此总体那么此总体就可用二维随机变量就可用二维随机变量(X, Y)或其联合分布函或其联合分布函数数F(x, y)来表示来表示. 统计中统计中, 总体这个概念总体这个概念 的要旨是的要旨是: 总体就是一个总体就是一个 概率分布概率分布.机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 为推断总体分布及各种特征为推断总体分布及各种特征, 按一定规按一定规则从总体中抽取若干个体进行观察试验则从总体中抽取若干个体进行观察试验, 以以获得有关总体的信息获得有关总体的信息, 这一抽取过程称为这一抽取过程称为“抽样抽样”, 所抽取的部分个体称为所抽取的

7、部分个体称为样本样本. 样样本中所包含的个体数目称为本中所包含的个体数目称为样本容量样本容量.从国产轿车中抽从国产轿车中抽5辆辆进行耗油量试验进行耗油量试验样本容量为样本容量为5机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 但是但是, 一旦取定一组样本一旦取定一组样本, 得到的是得到的是n个具体的数个具体的数 (X1, X2, Xn), 称为样本的一称为样本的一次观察值次观察值, 简称简称样本值样本值. 样本是随机变量样本是随机变量.抽到哪抽到哪5辆是随机的辆是随机的容量为容量为n的样本可以看作的样本可以看作n维随机变量维随机变量.机动机动 目录目录 上页上页 下页下页 返回返回

8、 结束结束 2. 独立性独立性: X1, X2, , Xn是相互独立的随是相互独立的随机变量机变量. 由于抽样的目的是为了对总体进行由于抽样的目的是为了对总体进行统计推断统计推断, 为了使抽取的样本能很好地反为了使抽取的样本能很好地反映总体的信息映总体的信息, 必须考虑抽样方法必须考虑抽样方法. 最常用的一种抽样方法叫作最常用的一种抽样方法叫作“简单随简单随机抽样机抽样”, 它要求抽取的样本满足下面两点它要求抽取的样本满足下面两点:1. 代表性代表性: X1, X2, , Xn中每一个与所考察中每一个与所考察的总体有相同的分布的总体有相同的分布.机动机动 目录目录 上页上页 下页下页 返回返回

9、 结束结束 由简单随机抽样得到的样本称为由简单随机抽样得到的样本称为简单简单随机样本随机样本, 它可以用与总体独立同分布的它可以用与总体独立同分布的n个相互独立的随机变量个相互独立的随机变量X1, X2, , Xn表示表示. 简单随机样本是应用中最常见的情形简单随机样本是应用中最常见的情形, 今后今后, 当说到当说到“X1, X2, , Xn是取自某总体的是取自某总体的样本样本”时时, 若不特别说明若不特别说明, 就指简单随机样本就指简单随机样本.机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 设总体设总体X的分布为的分布为F(x), 则则其简单随机样其简单随机样本本(X1, X2

10、, , Xn)的联合分布函数为的联合分布函数为),(),(221121nnnxXxXxXPxxxF)()()(2211nnxXPxXPxXPniinxFxFxFxF121)()()()(机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 当总体当总体X是离散型时是离散型时, 其分布律为其分布律为iipxXP)(, 2 , 1i样本的联合分布律为样本的联合分布律为11221122(,)() ()()nnnnP Xx XxXxP Xx P XxP XxniixXP1)( 当总体当总体X是连续型时是连续型时, Xf(x), 则样本的

11、则样本的联合密度为联合密度为niinxfxxxf121)(),( 事实上我们抽样后得到的资料都是具事实上我们抽样后得到的资料都是具体的、确定的值体的、确定的值. 如我们从某班大学生中抽如我们从某班大学生中抽取取10人测量身高人测量身高, 得到得到10个数个数, 它们是样本它们是样本取到的值而不是样本取到的值而不是样本. 我们只能观察到随机我们只能观察到随机变量取的值而见不到随机变量变量取的值而见不到随机变量.机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 总体总体(理论分布理论分布) ? 样本样本 样本值样本值 统计是从手中已有的资料统计是从手中已有的资料-样本值样本值, 去去推断

12、总体的情况推断总体的情况-总体分布总体分布F(x)的性质的性质. 总体分布决定了样本取值的概率规律总体分布决定了样本取值的概率规律, 也就是样本取到样本值的规律也就是样本取到样本值的规律, 因而可以由因而可以由样本值去推断总体样本值去推断总体. 样本是联系二者的桥梁样本是联系二者的桥梁机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 例例 设设),(2NX(X1, X2, , Xn)为为X的一个的一个样本样本, 求求(X1, X2, , Xn)的密度函数的密度函数.解解 (X1, X2, , Xn)为为X的一个样本的一个样本

13、, 故故),(2NXiniinxfxxxf121)(),(nixie12)(22212211()212niinxeni, 2 , 1机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 例例 设某电子产品的寿设某电子产品的寿命命X服从指数分布服从指数分布, 密密度函数度函数000)(xxexfx(X1, X2, , Xn)为为X的一个样本的一个样本, 求其密度函数求其密度函数.解解 因为因为(X1, X2, , Xn)为为X的一个样本的一个样本,niinxfxxxf121)(),(其他0), 2 , 1(01nixeinixi机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 e

14、xxXPx!)(, 2 , 1 , 0 xniinnxXPxXxXxXP12211)(),(1!ixniiexnnxexxxnii!211解解例例 某商场每天客流量某商场每天客流量X服从参数为服从参数为 的泊松的泊松分布分布, 求其样本求其样本(X1, X2, , Xn)的联合分布律的联合分布律. 由样本值去推断总体情况由样本值去推断总体情况, 需要对样需要对样本值进行本值进行“加工加工”, 这就要构造一些样本这就要构造一些样本的函数,它把样本中所含的的函数,它把样本中所含的(某一方面某一方面)的的信息集中起来信息集中起来.机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 (X1,

15、X2, , Xn)g(X1, X2, , Xn)其中其中g(x1, x2, , xn)是是(x1, x2, , xn)的连续函的连续函数数. 如果如果g(X1, X2, , Xn)中中不含有未知参数不含有未知参数, 称称g(X1, X2, , Xn)为为统计量统计量. (不含未知参数不含未知参数的样本的函数的样本的函数),(2NX如如2,未知未知,(X1, X2, , Xn)为为X的一个样本的一个样本niiXnX11niiX12均为统计量均为统计量X221iX不是统计量不是统计量521,maxXXXX均为统计量均为统计量机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 若若 已知已知

16、, 未知未知, (X1, X2, , X5)为为X的一个样本的一个样本2 几个常见统计量几个常见统计量样本均值样本均值样本方差样本方差niiXnX11niiXXnS122)(11它反映了总体均值它反映了总体均值的信息的信息它反映了总体方差它反映了总体方差的信息的信息机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩11nkkiiAXn11()nkkiiSXXn k=1, 2, 它反映了总体它反映了总体k阶矩的信息阶矩的信息它反映了总体它反映了总体k阶阶中心矩的信息中心矩的信息机动机动 目录目录 上页上页 下页下页 返回返回 结束结束

17、 统计量既然是依赖于样本的统计量既然是依赖于样本的, 而后者而后者又是随机变量又是随机变量, 故统计量也是随机变量故统计量也是随机变量, 因而就有一定的分布因而就有一定的分布, 这个分布叫做这个分布叫做统计统计量的量的“抽样分布抽样分布”. 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 抽样分布就是通常的随机变量函数的抽样分布就是通常的随机变量函数的分布分布. 只是强调这一分布是由一个统计量只是强调这一分布是由一个统计量所产生的所产生的. 研究统计量的性质和评价一个研究统计量的性质和评价一个统计推断的优良性统计推断的优良性, 完全取决于其抽样分完全取决于其抽样分布的性质布的性质.

18、抽样分布抽样分布精确抽样分布精确抽样分布渐近分布渐近分布(小样本问题中使用小样本问题中使用)(大样本问题中使用大样本问题中使用)机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 分布构造分布构造2统计量的分布称为抽样分布统计量的分布称为抽样分布. .数理统计数理统计中常用到如下三个分布中常用到如下三个分布: : 分布、分布、 分布和分布和 分布分布. . 2tF设设 , 则则 称为自由度为称为自由度为 的的 分布分布. 1,(0,1)iidnXXN2221( )niiXnn2机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 -分布的密度函数分布的密度函数 曲线曲线0, 00

19、,)(212)2/(212/yyeyyfynnn2)(yf机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 2( )n 卡方分位点卡方分位点 设设 , 若对于若对于 存在存在, 满足满足0)(2n2( ),P Xn则称则称 为为 2( )n)(2n分布的上分布的上 分位点分位点.2( )Xn10:机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 卡方分布性质卡方分布性质机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 2212( ),(),XnYn,X Y212()XYnn若若a. 分布可加性分布可加性 独立独立, 则则2( )Xn(),()2E Xn D Xnb

20、. 期望与方差期望与方差若若 ,则则例例),(2NX, (X1, X2, X3)为为X的一个样本的一个样本求求232221XXX的分布的分布.解解 因为因为(X1, X2, X3)为为X的一个样本的一个样本XiN(0,1), i=1, 2, 3则则) 1 , 0( NXii=1, 2, 3) 3 (2232221XXX机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 t 分布构造分布构造若若 , 与与 独立独立, 则则 ( )./XTt nY n称为自由度为称为自由度为 的的 分布分布.2(0,1),( )XNYnXY)(ntnt机动机动 目录目录 上页上页 下页下页 返回返回 结束

21、结束 的概率密度为的概率密度为tntnnntfn,)1 ()2()21()(212)(nt机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 (2) 的极限为的极限为 的密度函数的密度函数, 即即 xettftn,21)()(lim22)(tf) 1 , 0(N机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 t 分布性质分布性质)(tf0t(1) 关于关于 (纵轴纵轴)对称对称. t 分布分位点分布分位点, 则称则称 为为 的的 分位点分位点.设设 , 若对若对 存在存在 , 满足满足 )( ntT10:( ) 0t n( )PT t n( )t n)(nt注注:)()(1

22、ntnt1( )tn( )t n机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 例例 ),(2NX(X1, X2, X3)为为X的一个样本的一个样本, 求求23221)()()(2XXX的分布的分布.),(2NXi) 1 , 0( NXii=1, 2, 3) 1 , 0(1NX解解 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 ) 2(22322XX) 2(223221tXXX) 2()()()(223221tXXX) 1 , 0(1NX机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 0, 00,)1)(2()()/)(2()(2/ )(2122122/2

23、12121111yyynnnynnnnyhnnnnn称为称为第一自由度第一自由度为为 , 第二自由度第二自由度为为 的的 分布分布, ,其概率密度为其概率密度为1n2nF若若 独立独立, ,则则111222/( ,)./XnFF n nXn22112212( ),(),XnXnXX机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 F分布构造分布构造12( ,)F n n对于对于 , 若存若存在在 , 满足满足 , 则称则称 为为 的的 分位点分位点.10:12(,)0Fn n12( ,)P FF n n12( ,)F n n),(21nnF机动机动 目录目录 上页上页 下页下页 返回

24、返回 结束结束 F分布的分位点分布的分位点),(1),(12211nnFnnF注注:112( ,)1P FFn n 11211 1( ,)PFFn n 11211( ,)PFFn n211(,)PFnnF得证得证! !证明证明: 设设 , ,则则),(112nnFF),(21nnFF机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 定理定理1 (样本均值的分布样本均值的分布)设设X1, X2, Xn是取自正态总体是取自正态总体),(2 N的样本的样本, 则有则有),(2nNX ) 1 , 0( NnX 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 n取取不同值时样本均值

25、不同值时样本均值 的分布的分布X机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 定理定理 2 (样本方差的分布样本方差的分布) 1() 1() 1 (222nSn 设设X1, X2, , Xn是取自正态总体是取自正态总体),(2 N的样本的样本,2SX和分别为样本均值和样本方差分别为样本均值和样本方差,则有则有.)(相互独立和22SX机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 n取不同值时取不同值时 的分布的分布22) 1(Sn 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 定理定理3 设设X1, X2, , Xn是取自正态总体是取自正态总体),(2

26、N的样本的样本,2SX和分别为样本均值和样本方差分别为样本均值和样本方差,则有则有) 1(ntnSX 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 定理定理4 (两总体样本均值差的分布两总体样本均值差的分布) 12221212()(0,1)XYNnn221122(,)(,)XNYN 设,YX和分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1, X2, ,1nX是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值均值,2221SS 和则有则有Y1, Y2, ,2nY是是样本样本机动机动 目录目录 上页上页 下页

27、下页 返回返回 结束结束 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 121212() (2)1/1/wXYTt nnSnn2212若假设若假设, 则则222112212(1)(1)2wnSnSSnn其中其中称为混合样本方差称为混合样本方差.定理定理5 (两总体样本方差比的分布两总体样本方差比的分布) ) 1, 1(2122222121nnFSS ,设),(),(222211NYNXYX和分别是这两个样本的分别是这两个样本的且且X与与Y独立独立,X1, X2, ,1nX是取自是取自X的样本的样本,取自取自Y的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,均值

28、均值,2221SS 和则有则有Y1, Y2, ,2nY是是样本样本机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 例例 设总体设总体XN(10, 32), (X1, X2, , X6)是它的一是它的一个样本个样本, 设设 ,61iiXZ(1) 写出写出Z所服从的分布所服从的分布; (2) 求求P(Z11).解解 (X1, X2, , X6)是是XN(10, 32)的样本的样本, 因此因此 XiN(10, 32), 且且Xi相互独立相互独立, i=1, 2, , 6, 所以所以)36 ,60(261NXZii机动机动 目录目

29、录 上页上页 下页下页 返回返回 结束结束 )36 ,60(261NXZii(11)1(11)P ZP Z )668. 6(11)668. 6(基本步骤基本步骤: 样本分组、确定组距、确定组限、样本分组、确定组距、确定组限、统计频率、画直方图统计频率、画直方图机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 为研究某厂工人生产某种产品的能力为研究某厂工人生产某种产品的能力, 随机调查了随机调查了20位工人某天生产的该产品的数位工人某天生产的该产品的数量量, 数据如下数据如下: 160, 196, 164, 148, 170, 175, 178, 166, 181, 162, 161,

30、 168, 166, 162, 172, 156, 170, 157, 162, 154. 建立该批数量的频数频率分布表建立该批数量的频数频率分布表. 过程:过程:(1) 确定样本分组数确定样本分组数k,通常组数通常组数5-10组组, 组数主要取决于样本容量组数主要取决于样本容量.样本容量样本容量n50, 组数增加组数增加.本例本例k=5(2) 确定各组组距确定各组组距d 各组区间长度各组区间长度: 组距组距. 一般各组组距相同一般各组组距相同(也可不同也可不同)dk组组距距( (样样本本最最大大观观测测值值- -样样本本最最小小观观测测值值) )/ /组组数数0kaadk= =机动机动 目录目录 上页上页 下页下页 返回返回 结束结束 maxmin196 1489.65xxdk方便起见方便起见, 取取d=10(3) 确定每组组限确定每组组限1(, (1,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论