统计量及其抽样分布_第1页
统计量及其抽样分布_第2页
统计量及其抽样分布_第3页
统计量及其抽样分布_第4页
统计量及其抽样分布_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 6 章 统计量及其抽样分布作者:中国人民大学统计学院作者:中国人民大学统计学院作者:中国人民大学统计学院作者:中国人民大学统计学院作者:中国人民大学统计学院作者:中国人民大学统计学院贾俊平贾俊平贾俊平贾俊平贾俊平贾俊平统计学第 6 章 统计量及其抽样分布6.1 统计量统计量6.2 关于分布的几个概念关于分布的几个概念 6.3 由正态分布导出的几个重要分布由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理样本均值的分布与中心极限定理6.5 样本比例的抽样分布样本比例的抽样分布6.6 两个样本平均值之差的分布两个样本平均值之差的分布6.7 关于样本方差的分布关于样本方差的分布

2、作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.了解统计量及其分布的几个概念了解统计量及其分布的几个概念2.了解由正态分布导出的几个重要分布了解由正态分布导出的几个重要分布 3.理解样本均值的分布与中心极限定理理解样本均值的分布与中心极限定理4.掌握单样本比例和样本方差的抽样分布掌握单样本比例和样本方差的抽样分布学习目标6.1 统计量6.1.1 统计量的概念统计量的概念6.1.2 常用统

3、计量常用统计量6.1.3 次序统计量次序统计量 6.1.4 充分统计量充分统计量 作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.设x1,x2,xn是从总体x中抽取的容量为n的一个样本,如果由此样本构造一个函数t(x1,x2,xn),不依赖于任何未知参数,则称函数t(x1,x2,xn)是一个统计量样本均值、样本比例、样本方差等都是统计量2.统计量是样本的一个函数3.统计量是统计推断的基础

4、统计量(statistic)作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.一组样本观测值x1,x2,xn由小到大的排序 x(1)x(2) x(i) x(n) 后,称x(1),x(2),x(n)为次序统计量 2.中位数、分位数、四分位数等都是次序统计量次序统计量6.2 关于分布的几个概念6.2.1 抽样分布抽样分布6.2.2 渐进分布渐进分布6.2.3 随机模拟获得的近似分布随机模拟获得

5、的近似分布 作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 2.随机变量是 样本统计量样本统计量样本均值, 样本比例,样本方差等3.结果来自容量相同容量相同的所有所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布 (sam

6、pling distribution)6.3 由正态分布导出的几个重要分布 6.3.1 2分布分布6.3.2 t 分布分布6.3.3 f 分布分布2 分布作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )2 分布的使用 如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从如果一个变量的诸数值可视为几个独立变量值的平方和,则该变量服从2 分布分布 方差就可视为若干随机变量值的平方和方差

7、就可视为若干随机变量值的平方和 样本中各随机数值与均值之离差的平方和样本中各随机数值与均值之离差的平方和(即样本方差的即样本方差的n-1倍倍)与总体方与总体方差之比,服从自由度为差之比,服从自由度为n-1的的2 分布分布作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.由阿贝(abbe) 于1863年首先给出,后来由海尔墨特(hermert)和卡皮尔逊(kpearson) 分别于1875年

8、和1900年推导出来2.设 ,则3.令 ,则 y 服从自由度为1的2分布,即4. 5.当总体 ,从中抽取容量为n的样本,则2分布(2 distribution)作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.分布的变量值始终为正 2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.期望为:e(2)=n,方差为:d(2)=2n(n为自由度) 4

9、.可加性:若u和v为两个独立的2分布随机变量,u2(n1),v2(n2),则u+v这一随机变量服从自由度为n1+n2的2分布 2分布(性质和特点)作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )2分布(图示)t 分布作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatistics

10、statistics( ( (第五版第五版第五版第五版第五版第五版) ) )t 分布作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )t 分布图示作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) )

11、 )t分布的图形作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )t分布的使用f 分布作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )f分布 两个都服从两个都服从2 分布的变量之比的分布规律

12、。分布的变量之比的分布规律。 可以设想为两个方差之比可以设想为两个方差之比 方差之比会接近方差之比会接近1(因为前面已经假设各变量都服从标准因为前面已经假设各变量都服从标准正态分布正态分布),似乎存在一个,似乎存在一个“两端少,中间多两端少,中间多”的特征,的特征,但不对称(除非其中存在一个无限总体,使样本数量但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个)为无穷大,则样本方差有无穷多个)作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatistics

13、statistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.由统计学家费希尔(r.a.fisher) 提出的,以其姓氏的第一个字母来命名2.设若u为服从自由度为n1的2分布,即u2(n1),v为服从自由度为n2的2分布,即v2(n2),且u和v相互独立,则称f为服从自由度n1和n2的f分布,记为f分布(f distribution)作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版)

14、 ) )f分布 两个都服从两个都服从2 分布的变量之比的分布规律。分布的变量之比的分布规律。 可以设想为两个方差之比可以设想为两个方差之比 方差之比会接近方差之比会接近1(因为前面已经假设各变量都服从标准因为前面已经假设各变量都服从标准正态分布正态分布),似乎存在一个,似乎存在一个“两端少,中间多两端少,中间多”的特征,的特征,但不对称(除非其中存在一个无限总体,使样本数量但不对称(除非其中存在一个无限总体,使样本数量为无穷大,则样本方差有无穷多个)为无穷大,则样本方差有无穷多个)作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学

15、统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )f分布(图示)作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )f分布的图形此处的n和m分别相当于n1、n2作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学stati

16、sticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )f分布的使用 应用很广泛,可用来检验两状态总体方差是否相等,应用很广泛,可用来检验两状态总体方差是否相等,检验回归方差是否有代表性,在方差分析和多元统检验回归方差是否有代表性,在方差分析和多元统计中都是重要的检验手段。计中都是重要的检验手段。作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) )

17、)三种抽样分布的对比 2 分布可视为关于方差的分布规律。分布可视为关于方差的分布规律。 t 分布中的两个变量,一个服从正态分布,另一个服从分布中的两个变量,一个服从正态分布,另一个服从2 分布。可视为均值与方差之比的分布规律。分布。可视为均值与方差之比的分布规律。 f分布的变量都服从分布的变量都服从2 分布,可以设想为两个方差之比的分布,可以设想为两个方差之比的分布规律。分布规律。 这些“分布”都说明变量的规律,某些具有相同特征,某些具有相同特征的变量具有什么样的共同规律。现实中,按图索骥,依样的变量具有什么样的共同规律。现实中,按图索骥,依样画葫芦。画葫芦。作者:贾俊平,中国人民大学统计学院

18、作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )三种抽样分布综述为什么要使用统计方法?因为要了解事物的数量特征几乎惟一的方法是抽样,随机抽样抽样可以有很多结果,众结果的随机性规律是正态分布为什么要导出三大抽样分布?因为要了解的数量特征的性质不同,比如,可能要了解样本方差的规律若干个变量都服从正态分布,每变量有不同取值,计算每组取值中各值的平方,再加起来,该总和服从2 分布每次抽样的误差与平均误差之比服从t分布两个样本的方差之

19、比服从f分布什么是分布?骰子点数服从均匀分布,身高服从正态分布。分布就是各种情况发生概率的全体组合。6.4 样本均值的分布与中心极限定理 作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )抽样分布 抽样分布 从总体种抽出容量相同的样本,计算统计量的值,然后按统计量的值所编制的频数分布。 抽样分布的作用: 根据抽样分布研究统计量的性质 对统计推断方法进行评价抽样分布:样本统计量所有可能值的概率分

20、布。样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量分布的形状及接近总体参数的程度stat作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) ) 知道这些“分布”有什么用?从现象上看,事物非常复杂,但其中某些内容具有某种意义上从现象上看,事物非常复杂,但其中某些内容具有某种意义上的相同性质(比如的相同性质

21、(比如7 7条鱼与条鱼与7 7天之间都有天之间都有7 7这个数量)这个数量)从逻辑上看,可以在某些限定条件下构造许多模型,即数量关从逻辑上看,可以在某些限定条件下构造许多模型,即数量关系(此处都用系(此处都用“等于等于”关系),这些关系的总和都符合逻辑,关系),这些关系的总和都符合逻辑,现实中事物如果符合那些限定条件,则其本角度的其他特征现实中事物如果符合那些限定条件,则其本角度的其他特征(可视为进一步的发展结果)都会服从逻辑模型所表述的变化(可视为进一步的发展结果)都会服从逻辑模型所表述的变化规律规律统计分布类型就是:在某些限定条件下,考察不同类型的个别统计分布类型就是:在某些限定条件下,考

22、察不同类型的个别数量现象在总体上具有什么样的分布特征,熟知的如正态分布。数量现象在总体上具有什么样的分布特征,熟知的如正态分布。这些模型的结果告诉我们各种情况出现的可能性。这些模型的结果告诉我们各种情况出现的可能性。抽样分布分布的特征值:均值和标准差样本主要统计量:平均数比率(成数)方差xp2sstat统计学第四章 抽样估计作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.在重复选取容量为

23、n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的抽样分布作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )样本均值的抽样分布与中心极限定理x作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatisti

24、cs( ( (第五版第五版第五版第五版第五版第五版) ) )中心极限定理(central limit theorem)学生成绩 30 40 50 60 70 80 90按随机原则抽选出名学生,并计算平均分数。平均数的抽样分布样本样本均值均值样本样本均值均值样本样本均值均值abcdabceabcfabcgabdeabdfabdgabefabegabfgacdeacdf4547.55052.55052.5555557.56052.555acdgacefacegacfgadefadegadfgaefgbcdebcdfbcdgbcef57.557.56062.56062.56567.55557.560

25、60bcegbcfgbdefbdegbdfgbefgcdefcdegcdfgcefgdefg62.56562.56567.5706567.57072.575样本均值样本均值 45 47.5 50 52.5 55 57.5 60出现次数出现次数 1 1 2 3 4 4 5样本均值样本均值 62.5 65 67.5 70 72.5 75出现次数出现次数 4 4 3 2 1 1二者均值相等样本均值的平均数总体的平均数平均数的抽样分布全部可能样本平均数的均值等于总体均值,即: 从非正态总体中抽取的样本平均数当n足够大时其分布接近正态分布。 从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。样

26、本均值的标准差为总体标准差的 。n1)()(xxestat),(nnx作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) ) an example a die is thrown infinitely many times. let x represent the number of spots showing on any throw.一个骰子被投掷了无数次,用x表示每一次出现的点数. the

27、probability distribution of x x 1 2 3 4 5 6p(x) 1/6 1/6 1/6 1/6 1/6 1/6e(x) = 1(1/6) +2(1/6) + 3(1/6)+= 3.5v(x) = (1-3.5)2 +(2-3.5)2 + . = 2.92 作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) ) suppose we want to estimate

28、from the mean of a sample of size n = 2. what is the distribution that can follow样本平均的分布是什么样?1 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.06/365/364/363/362/361/36xe( ) =1.0(1/36)+1.5(2/36)+.=3.5v(x) = (1.0-3.5)2(1/36)+(1.5-3.5)2(2/36). = 1.46x2and:n111666)5(5833.5 . 35n2x2xx)10(2917.5 . 310n2x2xx)25(116

29、7.5 . 325n2x2xxnotice that is smaller than x. the larger the samplesize the smaller . therefore, tends to fall closer to , as the sample size increases.2x2xx作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) ) simulation of d

30、ice 11.522.533.544.555.56more11.522.533.544.555.56more11.522.533.544.555.56moren = 2n = 5n = 10mean = 3.494stand. dev. = 0.544mean = 3.486stand. dev. = 1.215mean = 3.495stand. dev. = 0.749作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五

31、版第五版第五版第五版) ) )the variance of the sample mean is smaller than the variance of the population.样本平均数方差小于总体方差123also,expected value of the population = (1 + 2 + 3)/3 = 2mean = 1.5mean = 2.5mean = 2.population1.51.51.51.51.51.51.51.51.51.51.51.51.52.52.52.52.52.52.52.52.52.52.52.52.52.522222222222expec

32、ted value of the sample mean = (1.5 + 2 + 2.5)/3 = 2compare the variability of the populationto the variability of the sample mean.let us take samplesof two observations作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )the

33、sampling distribution of the sample mean样本平均数分布size. sample largely sufficient for ddistributenormally ely approximat is x nonnormal is xif normal. is x normal, isxif. 3n. 2. 12x2xxx作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五

34、版第五版) ) )4.2.1抽样推断的理论基础 大数定律 大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。其一般意义是:在随机试验过程中,每次试验的结果不同,但大量重复试验后,所出现结果的平均值总是接近某一确定的值。 中心极限定理 第一,如果总体很大,而且服从正态分布,样本平均数(或成数)的分布也同样服从正态分布。第二,如果总体很大,但不服从正态分布,只要样本容量足够大(n30),样本平均数(或成数)的分布趋近于正态分布。第三,样本平均数(或成数)的平均数,等于总体平均数(或成数)。 作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统

35、计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )stat统计学第四章 抽样估计样本均值样本均值 45 47.5 50 52.5 55 57.5 60出现次数出现次数 1 1 2 3 4 4 5离差离差 -15 -12.5 -10 -7.5 -5 -2.5 0样本均值样本均值 62.5 65 67.5 70 72.5 75出现次数出现次数 4 4 3 2 1 1离差离差 2.5 5 7.5 10 12.5 15学生成绩 30 40 50 60 70 80 90离差 -30 -20 -10

36、 0 10 20 3007. 7100214201747122nnnnx2007.7x作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )中心极限定理 (central limit theorem)6.5 样本比例的抽样分布 作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院作者:贾俊平,中国人民大学统计学院统计学统计学统计学统计学统计学统计学statisticsstatisticsstatistics( ( (第五版第五版第五版第五版第五版第五版) ) )1.总体(或样本)中具有某种属性的单位与全部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论