管理统计学第06章抽样与抽样分布课件_第1页
管理统计学第06章抽样与抽样分布课件_第2页
管理统计学第06章抽样与抽样分布课件_第3页
管理统计学第06章抽样与抽样分布课件_第4页
管理统计学第06章抽样与抽样分布课件_第5页
已阅读5页,还剩159页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理统计学毕德春辽东学院信息技术学院管理统计学毕德春辽东学院信息技术学院1第6章

抽样与抽样分布第6章抽样与抽样分布2第1节抽样方法第1节抽样方法3第6章第1节

抽样方法关于抽样的基础概念1总体(population)所研究的全部个体(数据)的集合,其中的每一个元素称为个体,总体中所包含的元素数量多少称为总体容量,用N表示。有限总体有限总体的范围能够明确确定,且元素的数目是有限的1无限总体无限总体所包括的元素是无限的,不可数的2第6章第1节抽样方法关于抽样的基础概念1总体(popula第6章第1节

抽样方法关于抽样的基础概念1什么才是好的抽样?有足够的代表性符合统计学基本原理具有充分的可操作性有效率的实施/执行中的偏差越小越好第6章第1节抽样方法关于抽样的基础概念1什么才是好的抽样?5从理论上讲,样本数越大,抽样误差越小,结果的代表性越好。但是,同时考虑费用和时间因素,大样本量不一定是最有效率的办法。在随机抽样条件下,不同样本规模的抽样误差如下:

第6章第1节

抽样方法关于抽样的基础概念1样本量的选取置信度样本量80%90%95%99%1505.23%6.72%8.00%10.52%2004.53%5.82%6.93%9.11%2504.05%5.20%6.20%8.15%3003.70%4.75%5.66%7.44%5002.87%3.68%4.38%5.76%从理论上讲,样本数越大,抽样误差越小,结果的代表性越好。但是6样本(sample)从总体中抽取的一部分元素的集合,构成样本的元素数目称为样本容量,用n表示。第6章第1节

抽样方法关于抽样的基础概念1=<30小样本>30大样本样本(sample)从总体中抽取的一部分元素的集合,构成样本7参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值,所关心的参数主要有总体均值()、标准差()、总体比例()等,总体参数通常用希腊字母表示。第6章第1节

抽样方法关于抽样的基础概念1πμσ总体均值标准差总体比例参数(parameter)描述总体特征的概括性数字度量,是研8统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等,样本统计量通常用小写英文字母表示。第6章第1节

抽样方法关于抽样的基础概念1pxs样本均值样本标准差样本比例统计量(statistic)用来描述样本特征的概括性数字度量9总体参数样本统计量第6章第1节

抽样方法关于抽样的基础概念1抽样推断的过程总体参数样本统计量第6章第1节抽样方法关于抽样的基础概念110抽样方法概率抽样非概率抽样多阶段抽样整群抽样系统抽样自愿抽样配额抽样简单随机抽样分层抽样方便抽样判断抽样滚雪球抽样抽样第6章第1节

抽样方法关于抽样的方法2抽样方法概率抽样非概率抽样多阶段抽样整群抽样系统抽样自愿抽样11第6章第1节

抽样方法关于抽样的方法2概率抽样非概率抽样概率抽样也称随机抽样,是按照随机原则抽选样本的抽样方式,抽样时每个样本单位被选中的概率是已知。不满足概率抽样要求的抽样都被归为非概率抽样。非概率抽样单个单位被选中的概率是不可知的第6章第1节抽样方法关于抽样的方法2概率抽样非概率抽样概率12简单随机抽样(SimpleRandomSampling)也称纯随机抽样。直接从总体单位中抽选样本单位,每个个体被选入样本的概率都相等。可分为有放回和无放回两种方式。是最基本的抽样方法,许多抽样方法都是在它的基础上发展起来的。其数学性质简单,理论也最为成熟。第6章第1节

抽样方法关于抽样的方法2简单随机抽样(SimpleRandomSampli13整群抽样(ClusterSampling)先将总体分为R个群(即次级单位或子总体),每个群包含若干总体单位。按某种方式从中随机抽取r个群,然后对抽中的群的所有单位都进行调查的抽样方式。总体分成4个群随机选择2个群构成样本第6章第1节

抽样方法关于抽样的方法2整群抽样(ClusterSampling)先将总体分为14多阶段抽样先从总体中随机地抽取若干初级单位,再从初级单位中抽取若干二级单位,……如此下去直至抽取所要调查的基本单位的抽样方法。例:[统计年鉴2004指出]2003年人口变动情况抽样调查是以全国为总体,各省、自治区、直辖市为次总体,采用分层、等距、整群抽样方法,在全国31个省、自治区、直辖市抽取了990个县(市、区)、3734个乡(镇、街道)、6544个调查小区的126万人。第6章第1节

抽样方法关于抽样的方法2多阶段抽样先从总体中随机地抽取若干初级单位,再从初级单位中抽15分层抽样(StratifiedSampling)也称分类抽样或类型抽样。即先将总体所有单位按某种标志划分为若干层,然后从各层中随机抽取一定数目的单位构成样本,根据各层样本汇总对总体指标作出估计的一种抽样方式。男生女生样本第6章第1节

抽样方法关于抽样的方法2分层抽样(StratifiedSampling)也称分类16例:一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?第6章第1节

抽样方法关于抽样的方法2分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;35~49岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。例:一个单位的职工有500人,其中不到35岁的有125人,317解:抽取人数与职工总数的比是100:500=1:5,则各年龄段(层)的职工人数依次是125:280:95=25:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人。第6章第1节

抽样方法关于抽样的方法2解:抽取人数与职工总数的比是100:500=1:5,则各年龄1819系统抽样也称等距抽样(SystematicSampling)将总体N个单位按某种顺序排列,按规则确定一个随机起点,再每隔一定间隔逐个抽取样本单位的抽样方法。直线等距抽样:将总体分成n个组,每组有k=N/n个单位。在第一组随机选择一个单位,之后每隔k个选择一个。N=64n=8k=8第一组第6章第1节

抽样方法关于抽样的方法219系统抽样也称等距抽样(SystematicSampl例:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。这里选用了哪种抽取样本的方法?写出抽取过程。第6章第1节

抽样方法关于抽样的方法2由于每排的座位有40个,各排每个号码被抽取的概率都是,第1排被抽取前,其他各排中各号码被抽取哪率也是,也就是说被抽取的概率是,每排的抽样也是简单随机抽样,因此这种抽样的方法是系统抽样。例:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐20方便抽样(Conveniencesampling)纯粹以方便基本着眼的抽样方法,事先不预定样本,碰到即问或被调查者主动回答问题。又称便利抽样、偶遇抽样。例:在街头的拦截式访问。登在报刊、网上的问卷。第6章第1节

抽样方法关于抽样的方法2方便抽样(Conveniencesampling)纯粹以方21判断抽样(JudgmentSampling)调查者根据主观经验和判断从总体中选取有代表性的单位构成样本。精度取决于抽样者的经验。不能获得估计值的精度。适用于总体单位极不相同而样本容量又很小的情况第6章第1节

抽样方法关于抽样的方法2判断抽样(JudgmentSampling)调查者根据主22配额抽样(Quotasampling)是非随机抽样方法中最常用的一种抽样方法。分为两个步骤:根据研究人员认为较重要的一些变量把总体单位分类,指定每一类中的定额;然后在每一类中使用方便抽样或判断抽样的方法抽选指定数量的样本单位。问题:与分层抽样的区别?第6章第1节

抽样方法关于抽样的方法2配额抽样(Quotasampling)是非随机抽样方法中23雪球抽样也译为滚雪球抽样(SnowballSampling)其原理是先找到最初的样本单位,然后根据他们提供的信息去获得新的样本单位;这种过程不断继续,直到完成规定的样本容量为止。主要用于对稀少群体的调查。例:某研究部门在调查保姆问题时,先访问了7名保姆,然后再请她们提供其他保姆名单,逐步扩大到近百人。第6章第1节

抽样方法关于抽样的方法2雪球抽样也译为滚雪球抽样(SnowballSampli24在下列问题中,各采用什么抽样方法抽取样本较合适?从20台电脑中抽取4台进行质量检测;从2004名同学中,抽取一个容量为20的样本某中学有180名教工,其中业务人员136名,管理人员20名,后勤人员24名,从中抽取一个容量为15的样本。简单抽样系统抽样分层抽样第6章第1节

抽样方法关于抽样的方法2在下列问题中,各采用什么抽样方法抽取样本较合适?从20台电脑25抽样调查中的误差抽样误差非抽样误差计量误差抽样框误差无回答误差第6章第1节

抽样方法抽样调查中的误差3抽样调查中的误差抽样误差非抽样误差计量误差抽样框误差无回答误26误差是指估计值与真实值之间的差异。抽样误差(Samplingerror):由于抽选样本的随机性造成的误差,也称为代表性误差。样本只是总体的一部分,它对总体的代表性存在局限性,从而会造成误差。在抽样调查中,抽样误差就不可避免。在概率抽样中抽样误差是能够计量且可以得到控制的。影响抽样误差的主要因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法等。第6章第1节

抽样方法抽样调查中的误差3误差是指估计值与真实值之间的差异。第6章第1节抽样方法抽样27非抽样误差(Nonsamplingerror)除抽样误差以外的所有误差。通常认为是由于调查程序执行中的错误与不足引起的。主要包括抽样框误差、无回答误差和计量误差。国内也称为“工作误差”或“调查误差”。

第6章第1节

抽样方法抽样调查中的误差3非抽样误差(Nonsamplingerror)除抽样误差以28在抽样调查中可以把总体分成若干个互不重叠又穷尽的有限个部分,每个部分称为一个抽样单位(Samplingunit)。抽样单位可以是一个总体单位,也可以包含多个个体。抽样单位的名单称为抽样框(SamplingFrame)。抽样框应尽可能与目标总体相一致。例如名单抽样框、区域抽样框、时间表抽样框。

第6章第1节

抽样方法抽样调查中的误差3在抽样调查中可以把总体分成若干个互不重叠又穷尽的有限个部分,29大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……。例:要从10000名职工中抽出200名组成一个样本,抽样框是什么?10000名职工的名册第6章第1节

抽样方法抽样调查中的误差3大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出30抽样框误差(samplingframeerror,CoverageError)当目标总体与抽样框所涵盖的元素不一致时,就会产生抽样误差。抽样框误差包括:丢失目标总体单位、包含非目标总体单位,复合连接等。第6章第1节

抽样方法抽样调查中的误差3抽样框误差(samplingframeerror,C31案例:《文学摘要》民意测验1936年美国总统选举F.D.Roosevelt(罗斯福)任美国总统的第一任期届满(民主党)A.Landon(兰登)Kansas州州长(共和党)经济背景:国家正努力从大萧条中恢复,失业人数高达九百万人。TheliteraryDigest《文学摘要》进行民意测验,将问卷邮寄给一千万人,他们的名字和地址摘自电话簿或俱乐部会员名册。其中240万人寄回答案(回收率24%)。预测结果:Roosevelt43%,Landon57%竞选结果:

Roosevelt62%,Landon38%主要原因:选择偏倚——将一类人排除在外(当时四个家庭中,只有一家安装电话)不回答偏倚——低收入和高收入的人倾向不回答抽样总体目标总体第6章第1节

抽样方法抽样调查中的误差3案例:《文学摘要》民意测验1936年美国总统选举抽样总体321936年美国总统竞选(Gallup的预测)样本容量3000人,在《摘要》公布其预测结果之前,仅以一个百分位数的误差预言了《摘要》的预测结果。方法:从《摘要》要用的名单中随机选取3000人,并给他们每人寄去一张明信片,询问他们打算怎样投票。大样本并不能防止偏倚:当抽样框不正确时,抽取一个大的样本并无帮助,它只不过是在较大的规模下,去重复基本错误。利用一个约5万人的样本,正确地预测了Roosevelt的胜利。

Roosevelt的百分数盖洛普预言《摘要》的预测结果44《摘要》预测的选举结果43

Roosevelt的百分数盖洛普预测的选举结果56选举结果62第6章第1节

抽样方法抽样调查中的误差31936年美国总统竞选(Gallup的预测)样本容量300033无回答误差(NonresponseError)因缺失部分指定样本单位的数据或调查问卷中的部分数据项而引起的误差都称为无回答误差。样本个体拒绝访问样本个体无法接受访问样本个体拒绝回答部分问题第6章第1节

抽样方法抽样调查中的误差3无回答误差(NonresponseError)因缺失部分34计量误差(MeasurementError)是指调查中获得的数据与调查项目真实值之间不一致而产生的误差,也称为登记性误差。测量工具不准确调查员的工作失误(如计量错误、计算错误、记录错误等)被调查者没有提供真实情况第6章第1节

抽样方法抽样调查中的误差3计量误差(MeasurementError)是指调查中35第2节样本均值的分布与中心极限定理第2节样本均值的分布与中心极限定理36总体分布(populationdistribution)总体中各元素的观察值所形成的分布。分布通常是未知的可以假定它服从某种分布总体第6章第2节

样本均值的分布与中心极限定理样本均值的分布1总体分布(populationdistribution)总37样本分布(sampledistribution)一个样本中各观察值的分布,也称经验分布,是指当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。样本第6章第2节

样本均值的分布与中心极限定理样本均值的分布1样本分布(sampledistribution)一个样本中38抽样分布(SamplingDistribtuion)按照简单随机抽样方法,从个数为N的总体中抽取容量为n的样本,两种抽法:放回抽样:样本个数为不放回抽样:样本个数为每一个可能的样本都有一个对应的均值和标准差,那么所有样本均值的分布就是样本均值的抽样分布,所有样本的标准差的分布就是样本标准差的抽样分布。第6章第2节

样本均值的分布与中心极限定理样本均值的分布1抽样分布(SamplingDistribtuion)按照简39总体计算样本统计量如:样本均值、比例、方差样本抽样分布的形成过程第6章第2节

样本均值的分布与中心极限定理样本均值的分布1总体计算样本统计量样本抽样分布的形成过程第6章第2节样本均40样本均值的抽样分布在重复选取容量为n的样本时,由样本均值所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 第6章第2节

样本均值的分布与中心极限定理样本均值的分布1样本均值的抽样分布在重复选取容量为n的样本时,由样本均值所有41例:设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下均值和方差总体分布14230.1.2.3第6章第2节

样本均值的分布与中心极限定理样本均值的分布1例:设一个总体,含有4个元素(个体),即总体单位数N=4。442例:现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)第6章第2节

样本均值的分布与中心极限定理样本均值的分布1例:现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共43计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第6章第2节

样本均值的分布与中心极限定理样本均值的分布1计算出各样本的均值,如下表。并给出样本均值的抽样分布3.5344式中:M为样本数目,比较及结论:

样本均值的均值(数学期望)等于总体均值样本均值的方差等于总体方差的1/n第6章第2节

样本均值的分布与中心极限定理样本均值的分布1式中:M为样本数目,比较及结论:第6章第2节样本均值的分45抽样分布=2.5σ2=1.25总体分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x样本均值的分布与总体分布的比较第6章第2节

样本均值的分布与中心极限定理样本均值的分布1抽样分布=2.5σ2=1.25总体分布14246例:设一个总体(比如掷骰子),含有6个元素(个体),即总体单位数N=6。6个个体分别为x1=1,x2=2,x3=3,x4=4,x5=5,x6=6。现从总体中抽取n=2的简单随机样本,试比较总体分布和样本均值分布。第6章第2节

样本均值的分布与中心极限定理样本均值的分布1例:设一个总体(比如掷骰子),含有6个元素(个体),即总体47解:总体的均值、方差及分布如下:第6章第2节

样本均值的分布与中心极限定理样本均值的分布1均值和方差解:总体的均值、方差及分布如下:第6章第2节样本均值的分布48现从总体中抽取n=2的简单随机样本,在重复抽样条件下,有62=36个样本。所有样本的结果为:

第二观察值第一观察值1234561(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)2(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)3(3,1)(3,2)(3,3)(3,4)(3,5)(3,6)4(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)5(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)6(6,1)(6,2)(6,3)(6,4)(6,5)(6,6)第6章第2节

样本均值的分布与中心极限定理样本均值的分布1现从总体中抽取n=2的简单随机样本,在重复抽样条件下,有6249计算出各样本的均值,如下表。并给出样本均值的抽样分布

第二观察值第一观察值123456111.522.533.521.522.533.54322.533.544.542.533.544.55533.544.555.563.544.555.5636个样本的均值第6章第2节

样本均值的分布与中心极限定理样本均值的分布1计算出各样本的均值,如下表。并给出样本均值的抽样分布第二观50=3.5σ2=2.9=3.5σ2=1.45样本均值的抽样分布与总体分布的比较第6章第2节

样本均值的分布与中心极限定理样本均值的分布1=3.5=3.5样本均值的抽样分布与总体分布51=50σ2

=10X总体分布n=2抽样分布Xn=4当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)σ2

=5σ2

=2.5第6章第2节

样本均值的分布与中心极限定理样本均值的分布1=50σ2=10X总体分布n=2抽样分布Xn=52当样本容量足够大时(n>30),样本均值的抽样分布逐渐趋于正态分布中心极限定理(centrallimittheorem)设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体X第6章第2节

样本均值的分布与中心极限定理中心极限定理2当样本容量足够大时(n>30),样本均值的抽样分布逐渐趋53极限定理:简单讲,凡是采用极限的方法(例如,观察次数n趋于无限)所得出的一系列定理统称极限定理。极限定理分为两类:大数定理(Lawoflargenumbers)中心极限定理(Centrallimittheorem)

第6章第2节

样本均值的分布与中心极限定理中心极限定理2极限定理:简单讲,凡是采用极限的方法(例如,观察次数n趋于无54中心极限定理(centrallimittheorem)说明,任何变量,不管其原有分布如何,如果把它们n个加在一起,只要n足够大,其和的分布必然接近正态分布,均值的分布也接近正态分布。

第6章第2节

样本均值的分布与中心极限定理中心极限定理2中心极限定理(centrallimittheorem)说55x的分布趋于正态分布的过程第6章第2节

样本均值的分布与中心极限定理中心极限定理2x的分布趋于正态分布的过程第6章第2节样本均值的分布与56为什么社会经济生活、自然界存在许多随机变量的分布都服从正态分布?请结合中心极限定理来解释。第6章第2节

样本均值的分布与中心极限定理中心极限定理2为什么社会经济生活、自然界存在许多随机变量的分布都服从正态分57如果一个现实的量是由大量独立偶然的因素的影响叠加而得,且其中每一个偶然因素的影响又是均匀地微小的话,可以断定这个量将近似地服从正态分布。这就解释了为什么在自然、社会、经济领域里大量存在服从正态分布的随机变量。例如,身高、体重、智商、婚龄等等,因为影响它们的因素都是大量的。

第6章第2节

样本均值的分布与中心极限定理中心极限定理2如果一个现实的量是由大量独立偶然的因素的影响叠加而得,且其中58抽样分布与总体分布的关系从正态总体中抽取的全部可能样本,无论样本容量有多大,样本平均数的抽样分布必定遵从于正态分布;如果是从非正态总体中抽样,只要n≥30,样本均值的抽样分布必定趋近于正态分布;第6章第2节

样本均值的分布与中心极限定理中心极限定理2抽样分布与总体分布的关系从正态总体中抽取的全部可能样本,无论59对称钟形分布中的3σ法则3σ法则——关于钟形分布的一个近似的或经验的法则:变量值落在[-3σ,+3σ]范围以外的情况极为少见。因此通常将落在区间[-3σ,+3σ]之外的数据称为异常数据或称为离群点。x99.73%68.27%95.45%第6章第2节

样本均值的分布与中心极限定理中心极限定理2对称钟形分布中的3σ法则3σ法则——关于钟形分布的一个近似60正态分布非正态分布大样本小样本大样本小样本总体分布正态分布正态分布正态分布第6章第2节

样本均值的分布与中心极限定理中心极限定理2正态分布非正态分布大样本小样本大样本小样本总体分布正态分布正61例:每到临近重大节日,为了满足巨大的市场需要,副食品加工厂提高了对于食品的生产规模,而此时工厂的质量管理人员,对工厂生产的副食品进行质量检验,检验的指标中主要是某个硝酸盐的NO(<45mg/kg)指标是否超标,一个生产商声明自己的食品中NO的含量为43mg/kg,标准差为8mg。假设质量监督机构决定抽取40个样本来检测含量,来进行核实。假设如下:(1)建设这个生产商所言是真实的,尝试描述这40个样本的平均NO含量的抽样分布;(2)假设这个生产商的包装说明是真实的,则质监部门抽取的样本硝酸盐含量等于45mg的概率是多少?第6章第2节

样本均值的分布与中心极限定理中心极限定理2例:每到临近重大节日,为了满足巨大的市场需要,副食品加工厂提62解:(1)尽管我们没有总体分布信息,但是根据中心极限定理推断:对着这40个样本来说,平均的NO含量的抽样分布是近似正态分布的。因此这批样本的均值与总体的均值是相同的。根据生产商的声明,平均含量为43mg,方差为5mg,则样本方差为:如果我们假设此声明是真实的,则这40个样本平均寿命的抽样分布如下图所示:第6章第2节

样本均值的分布与中心极限定理中心极限定理2解:(1)尽管我们没有总体分布信息,但是根据中心极限定理推断63(2)假设生产商声称的是真实的,则对于其40个样本来说,硝酸盐含量大于等于45mg/kg的概率P(x>=45)计算公式如下:可以算出来z(2.53)=0.9943,即根据生产商的声明,硝酸盐含量高于45mg的概率为1-0.9943=0.0057,因此根据这个结果.该食品在此次抽样中出现硝酸盐含量超标的可能性为极小概率事件,如果此次样本抽查出其中一个出现超标(1/40=0.025),则有理由认为该厂生产的食品不合格。第6章第2节

样本均值的分布与中心极限定理中心极限定理2(2)假设生产商声称的是真实的,则对于其40个样本来说,硝酸64例:在一次研究某一企业职工收入情况的调查中,准备从该企业随机抽取100个职工个人的收入状况数据构成样本,以此推断该企业职工平均月收入。若该企业职工平均月收入的总体均值为2000元,总体标准差为为250元,试计算样本均值不小于1950元的概率。第6章第2节

样本均值的分布与中心极限定理中心极限定理2例:在一次研究某一企业职工收入情况的调查中,准备从该企业随机65解:根据中心极限定理,在样本容量充分大时,样本均值渐进地趋于数学期望为总体均值,方差为总体方差的n分之一的正态分布,有本例的样本均值渐进地趋于数学期望为2000元,标准差为25的正态分布,即。代入正态分布概率计算公式,得

即样本均值不小于1950元的概率为97.7%。(查表)第6章第2节

样本均值的分布与中心极限定理中心极限定理2解:根据中心极限定理,在样本容量充分大时,样本均值渐进地趋于66σx=均值的标准误

σ=个体标准差n=均值的样本容量样本均值的标准差小于总体标准差,且随着样本容量的增加减小,这也正是抽样平均误差的度量。第6章第2节

样本均值的分布与中心极限定理中心极限定理2σx=均值的标准误σ=个体标准差n=均值的样本容量67样本均值的数学期望样本均值的方差重复抽样不重复抽样样本均值的抽样分布(数学期望与方差)第6章第2节

样本均值的分布与中心极限定理中心极限定理2样本均值的数学期望样本均值的抽样分布(数学期望与方差)第6章68样本方差的分布:在重复选取容量为的样本时,由样本方差的所有可能取值形成的相对频数分布。对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为(n-1)的2分布,即第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3样本方差的分布:在重复选取容量为的样本时,由样本方差的所有可69设总体服从正态分布N~(μ,σ2),X1,X2,…,Xn为来自该正态总体的样本,则样本方差s2的分布为将2(n–1)称为自由度为(n-1)的卡方分布第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3设总体服从正态分布N~(μ,σ2),X1,X2,…,70两个总体都为正态分布,即,两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差方差为各自的方差之和 两个样本均值之差的抽样分布第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3两个总体都为正态分布,即71

m1s1总体1s2

m2总体2抽取简单随机样样本容量n1计算x1抽取简单随机样样本容量n2计算x2计算每一对样本的x1-x2所有可能样本的x1-x2m1-m2抽样分布第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3m1s1总体1s2m2总体2抽取简单随机样72两个总体都为正态分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1)的F分布,即两个样本方差比的抽样分布第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3两个总体都为正态分布,即X1~N(μ1,σ12),X2~N73c2-分布(2-distribution)由阿贝(Abbe)

于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)

分别于1875年和1900年推导出来。设X1,X2,┈,Xn是来自总体N(0,1)的样本,则称随机变量X1,X2,┈,Xn

2=

X12+X22+,┈+Xn2服从自由度为n的2分布,记为2∽

2(n)第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3c2-分布(2-distribution)第6章第2节样74分布的变量值始终为正;分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称;期望为:E(2)=n,方差为:D(2)=2n(n为自由度);可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布。c2-分布(性质和特点)第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3分布的变量值始终为正;分布的形状取决于其自由度n的大小,通7576c2n=1n=4n=10n=20第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3不同自由度的c2-分布76c2n=1n=4n=10n=20第6章第2节样本均值t-分布(t-distribution)提出者是WilliamGosset,也被称为学生分布(student’st)t-分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布xt分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)z第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3t-分布(t-distribution)提出者是Willi77

设X1,X2,…,Xn是来自正态总体N~(μ,σ2)的一个样本,称为统计量,它服从自由度为(n-1)的t分布Xt分布与正态分布的比较正态分布t分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)Z第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3设X1,X2,…,Xn是来自正态总体N~(μ,σ2)的一78F-分布(F

distribution)为纪念统计学家费希尔(R.A.Fisher)

以其姓氏的第一个字母来命名;设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3F-分布(Fdistribution)为纪念统计学家费希尔79F(1,10)(5,10)(10,10)第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3不同自由度的F分布F(1,10)(5,10)(10,10)第6章第2节样本均80

选择容量为n的简单随机样本计算样本方差S2计算卡方值2=(n-1)S2/σ2计算出所有的

2值不同容量样本的抽样分布c2n=1n=4n=10n=20ms总体卡方(c2)分布第6章第2节

样本均值的分布与中心极限定理常用统计量的分布3选择容量为n的计算卡方值计算出所有的不同容量样本的抽样分81THANKS

FORYOURATTENTIONTHANKS82管理统计学毕德春辽东学院信息技术学院管理统计学毕德春辽东学院信息技术学院83第6章

抽样与抽样分布第6章抽样与抽样分布84第1节抽样方法第1节抽样方法85第6章第1节

抽样方法关于抽样的基础概念1总体(population)所研究的全部个体(数据)的集合,其中的每一个元素称为个体,总体中所包含的元素数量多少称为总体容量,用N表示。有限总体有限总体的范围能够明确确定,且元素的数目是有限的1无限总体无限总体所包括的元素是无限的,不可数的2第6章第1节抽样方法关于抽样的基础概念1总体(popula第6章第1节

抽样方法关于抽样的基础概念1什么才是好的抽样?有足够的代表性符合统计学基本原理具有充分的可操作性有效率的实施/执行中的偏差越小越好第6章第1节抽样方法关于抽样的基础概念1什么才是好的抽样?87从理论上讲,样本数越大,抽样误差越小,结果的代表性越好。但是,同时考虑费用和时间因素,大样本量不一定是最有效率的办法。在随机抽样条件下,不同样本规模的抽样误差如下:

第6章第1节

抽样方法关于抽样的基础概念1样本量的选取置信度样本量80%90%95%99%1505.23%6.72%8.00%10.52%2004.53%5.82%6.93%9.11%2504.05%5.20%6.20%8.15%3003.70%4.75%5.66%7.44%5002.87%3.68%4.38%5.76%从理论上讲,样本数越大,抽样误差越小,结果的代表性越好。但是88样本(sample)从总体中抽取的一部分元素的集合,构成样本的元素数目称为样本容量,用n表示。第6章第1节

抽样方法关于抽样的基础概念1=<30小样本>30大样本样本(sample)从总体中抽取的一部分元素的集合,构成样本89参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值,所关心的参数主要有总体均值()、标准差()、总体比例()等,总体参数通常用希腊字母表示。第6章第1节

抽样方法关于抽样的基础概念1πμσ总体均值标准差总体比例参数(parameter)描述总体特征的概括性数字度量,是研90统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等,样本统计量通常用小写英文字母表示。第6章第1节

抽样方法关于抽样的基础概念1pxs样本均值样本标准差样本比例统计量(statistic)用来描述样本特征的概括性数字度量91总体参数样本统计量第6章第1节

抽样方法关于抽样的基础概念1抽样推断的过程总体参数样本统计量第6章第1节抽样方法关于抽样的基础概念192抽样方法概率抽样非概率抽样多阶段抽样整群抽样系统抽样自愿抽样配额抽样简单随机抽样分层抽样方便抽样判断抽样滚雪球抽样抽样第6章第1节

抽样方法关于抽样的方法2抽样方法概率抽样非概率抽样多阶段抽样整群抽样系统抽样自愿抽样93第6章第1节

抽样方法关于抽样的方法2概率抽样非概率抽样概率抽样也称随机抽样,是按照随机原则抽选样本的抽样方式,抽样时每个样本单位被选中的概率是已知。不满足概率抽样要求的抽样都被归为非概率抽样。非概率抽样单个单位被选中的概率是不可知的第6章第1节抽样方法关于抽样的方法2概率抽样非概率抽样概率94简单随机抽样(SimpleRandomSampling)也称纯随机抽样。直接从总体单位中抽选样本单位,每个个体被选入样本的概率都相等。可分为有放回和无放回两种方式。是最基本的抽样方法,许多抽样方法都是在它的基础上发展起来的。其数学性质简单,理论也最为成熟。第6章第1节

抽样方法关于抽样的方法2简单随机抽样(SimpleRandomSampli95整群抽样(ClusterSampling)先将总体分为R个群(即次级单位或子总体),每个群包含若干总体单位。按某种方式从中随机抽取r个群,然后对抽中的群的所有单位都进行调查的抽样方式。总体分成4个群随机选择2个群构成样本第6章第1节

抽样方法关于抽样的方法2整群抽样(ClusterSampling)先将总体分为96多阶段抽样先从总体中随机地抽取若干初级单位,再从初级单位中抽取若干二级单位,……如此下去直至抽取所要调查的基本单位的抽样方法。例:[统计年鉴2004指出]2003年人口变动情况抽样调查是以全国为总体,各省、自治区、直辖市为次总体,采用分层、等距、整群抽样方法,在全国31个省、自治区、直辖市抽取了990个县(市、区)、3734个乡(镇、街道)、6544个调查小区的126万人。第6章第1节

抽样方法关于抽样的方法2多阶段抽样先从总体中随机地抽取若干初级单位,再从初级单位中抽97分层抽样(StratifiedSampling)也称分类抽样或类型抽样。即先将总体所有单位按某种标志划分为若干层,然后从各层中随机抽取一定数目的单位构成样本,根据各层样本汇总对总体指标作出估计的一种抽样方式。男生女生样本第6章第1节

抽样方法关于抽样的方法2分层抽样(StratifiedSampling)也称分类98例:一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?第6章第1节

抽样方法关于抽样的方法2分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;35~49岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。例:一个单位的职工有500人,其中不到35岁的有125人,399解:抽取人数与职工总数的比是100:500=1:5,则各年龄段(层)的职工人数依次是125:280:95=25:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人。第6章第1节

抽样方法关于抽样的方法2解:抽取人数与职工总数的比是100:500=1:5,则各年龄100101系统抽样也称等距抽样(SystematicSampling)将总体N个单位按某种顺序排列,按规则确定一个随机起点,再每隔一定间隔逐个抽取样本单位的抽样方法。直线等距抽样:将总体分成n个组,每组有k=N/n个单位。在第一组随机选择一个单位,之后每隔k个选择一个。N=64n=8k=8第一组第6章第1节

抽样方法关于抽样的方法219系统抽样也称等距抽样(SystematicSampl例:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。这里选用了哪种抽取样本的方法?写出抽取过程。第6章第1节

抽样方法关于抽样的方法2由于每排的座位有40个,各排每个号码被抽取的概率都是,第1排被抽取前,其他各排中各号码被抽取哪率也是,也就是说被抽取的概率是,每排的抽样也是简单随机抽样,因此这种抽样的方法是系统抽样。例:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐102方便抽样(Conveniencesampling)纯粹以方便基本着眼的抽样方法,事先不预定样本,碰到即问或被调查者主动回答问题。又称便利抽样、偶遇抽样。例:在街头的拦截式访问。登在报刊、网上的问卷。第6章第1节

抽样方法关于抽样的方法2方便抽样(Conveniencesampling)纯粹以方103判断抽样(JudgmentSampling)调查者根据主观经验和判断从总体中选取有代表性的单位构成样本。精度取决于抽样者的经验。不能获得估计值的精度。适用于总体单位极不相同而样本容量又很小的情况第6章第1节

抽样方法关于抽样的方法2判断抽样(JudgmentSampling)调查者根据主104配额抽样(Quotasampling)是非随机抽样方法中最常用的一种抽样方法。分为两个步骤:根据研究人员认为较重要的一些变量把总体单位分类,指定每一类中的定额;然后在每一类中使用方便抽样或判断抽样的方法抽选指定数量的样本单位。问题:与分层抽样的区别?第6章第1节

抽样方法关于抽样的方法2配额抽样(Quotasampling)是非随机抽样方法中105雪球抽样也译为滚雪球抽样(SnowballSampling)其原理是先找到最初的样本单位,然后根据他们提供的信息去获得新的样本单位;这种过程不断继续,直到完成规定的样本容量为止。主要用于对稀少群体的调查。例:某研究部门在调查保姆问题时,先访问了7名保姆,然后再请她们提供其他保姆名单,逐步扩大到近百人。第6章第1节

抽样方法关于抽样的方法2雪球抽样也译为滚雪球抽样(SnowballSampli106在下列问题中,各采用什么抽样方法抽取样本较合适?从20台电脑中抽取4台进行质量检测;从2004名同学中,抽取一个容量为20的样本某中学有180名教工,其中业务人员136名,管理人员20名,后勤人员24名,从中抽取一个容量为15的样本。简单抽样系统抽样分层抽样第6章第1节

抽样方法关于抽样的方法2在下列问题中,各采用什么抽样方法抽取样本较合适?从20台电脑107抽样调查中的误差抽样误差非抽样误差计量误差抽样框误差无回答误差第6章第1节

抽样方法抽样调查中的误差3抽样调查中的误差抽样误差非抽样误差计量误差抽样框误差无回答误108误差是指估计值与真实值之间的差异。抽样误差(Samplingerror):由于抽选样本的随机性造成的误差,也称为代表性误差。样本只是总体的一部分,它对总体的代表性存在局限性,从而会造成误差。在抽样调查中,抽样误差就不可避免。在概率抽样中抽样误差是能够计量且可以得到控制的。影响抽样误差的主要因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法等。第6章第1节

抽样方法抽样调查中的误差3误差是指估计值与真实值之间的差异。第6章第1节抽样方法抽样109非抽样误差(Nonsamplingerror)除抽样误差以外的所有误差。通常认为是由于调查程序执行中的错误与不足引起的。主要包括抽样框误差、无回答误差和计量误差。国内也称为“工作误差”或“调查误差”。

第6章第1节

抽样方法抽样调查中的误差3非抽样误差(Nonsamplingerror)除抽样误差以110在抽样调查中可以把总体分成若干个互不重叠又穷尽的有限个部分,每个部分称为一个抽样单位(Samplingunit)。抽样单位可以是一个总体单位,也可以包含多个个体。抽样单位的名单称为抽样框(SamplingFrame)。抽样框应尽可能与目标总体相一致。例如名单抽样框、区域抽样框、时间表抽样框。

第6章第1节

抽样方法抽样调查中的误差3在抽样调查中可以把总体分成若干个互不重叠又穷尽的有限个部分,111大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……。例:要从10000名职工中抽出200名组成一个样本,抽样框是什么?10000名职工的名册第6章第1节

抽样方法抽样调查中的误差3大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出112抽样框误差(samplingframeerror,CoverageError)当目标总体与抽样框所涵盖的元素不一致时,就会产生抽样误差。抽样框误差包括:丢失目标总体单位、包含非目标总体单位,复合连接等。第6章第1节

抽样方法抽样调查中的误差3抽样框误差(samplingframeerror,C113案例:《文学摘要》民意测验1936年美国总统选举F.D.Roosevelt(罗斯福)任美国总统的第一任期届满(民主党)A.Landon(兰登)Kansas州州长(共和党)经济背景:国家正努力从大萧条中恢复,失业人数高达九百万人。TheliteraryDigest《文学摘要》进行民意测验,将问卷邮寄给一千万人,他们的名字和地址摘自电话簿或俱乐部会员名册。其中240万人寄回答案(回收率24%)。预测结果:Roosevelt43%,Landon57%竞选结果:

Roosevelt62%,Landon38%主要原因:选择偏倚——将一类人排除在外(当时四个家庭中,只有一家安装电话)不回答偏倚——低收入和高收入的人倾向不回答抽样总体目标总体第6章第1节

抽样方法抽样调查中的误差3案例:《文学摘要》民意测验1936年美国总统选举抽样总体1141936年美国总统竞选(Gallup的预测)样本容量3000人,在《摘要》公布其预测结果之前,仅以一个百分位数的误差预言了《摘要》的预测结果。方法:从《摘要》要用的名单中随机选取3000人,并给他们每人寄去一张明信片,询问他们打算怎样投票。大样本并不能防止偏倚:当抽样框不正确时,抽取一个大的样本并无帮助,它只不过是在较大的规模下,去重复基本错误。利用一个约5万人的样本,正确地预测了Roosevelt的胜利。

Roosevelt的百分数盖洛普预言《摘要》的预测结果44《摘要》预测的选举结果43

Roosevelt的百分数盖洛普预测的选举结果56选举结果62第6章第1节

抽样方法抽样调查中的误差31936年美国总统竞选(Gallup的预测)样本容量3000115无回答误差(NonresponseError)因缺失部分指定样本单位的数据或调查问卷中的部分数据项而引起的误差都称为无回答误差。样本个体拒绝访问样本个体无法接受访问样本个体拒绝回答部分问题第6章第1节

抽样方法抽样调查中的误差3无回答误差(NonresponseError)因缺失部分116计量误差(MeasurementError)是指调查中获得的数据与调查项目真实值之间不一致而产生的误差,也称为登记性误差。测量工具不准确调查员的工作失误(如计量错误、计算错误、记录错误等)被调查者没有提供真实情况第6章第1节

抽样方法抽样调查中的误差3计量误差(MeasurementError)是指调查中117第2节样本均值的分布与中心极限定理第2节样本均值的分布与中心极限定理118总体分布(populationdistribution)总体中各元素的观察值所形成的分布。分布通常是未知的可以假定它服从某种分布总体第6章第2节

样本均值的分布与中心极限定理样本均值的分布1总体分布(populationdistribution)总119样本分布(sampledistribution)一个样本中各观察值的分布,也称经验分布,是指当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。样本第6章第2节

样本均值的分布与中心极限定理样本均值的分布1样本分布(sampledistribution)一个样本中120抽样分布(SamplingDistribtuion)按照简单随机抽样方法,从个数为N的总体中抽取容量为n的样本,两种抽法:放回抽样:样本个数为不放回抽样:样本个数为每一个可能的样本都有一个对应的均值和标准差,那么所有样本均值的分布就是样本均值的抽样分布,所有样本的标准差的分布就是样本标准差的抽样分布。第6章第2节

样本均值的分布与中心极限定理样本均值的分布1抽样分布(SamplingDistribtuion)按照简121总体计算样本统计量如:样本均值、比例、方差样本抽样分布的形成过程第6章第2节

样本均值的分布与中心极限定理样本均值的分布1总体计算样本统计量样本抽样分布的形成过程第6章第2节样本均122样本均值的抽样分布在重复选取容量为n的样本时,由样本均值所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 第6章第2节

样本均值的分布与中心极限定理样本均值的分布1样本均值的抽样分布在重复选取容量为n的样本时,由样本均值所有123例:设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下均值和方差总体分布14230.1.2.3第6章第2节

样本均值的分布与中心极限定理样本均值的分布1例:设一个总体,含有4个元素(个体),即总体单位数N=4。4124例:现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)第6章第2节

样本均值的分布与中心极限定理样本均值的分布1例:现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共125计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第6章第2节

样本均值的分布与中心极限定理样本均值的分布1计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53126式中:M为样本数目,比较及结论:

样本均值的均值(数学期望)等于总体均值样本均值的方差等于总体方差的1/n第6章第2节

样本均值的分布与中心极限定理样本均值的分布1式中:M为样本数目,比较及结论:第6章第2节样本均值的分127抽样分布=2.5σ2=1.25总体分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x样本均值的分布与总体分布的比较第6章第2节

样本均值的分布与中心极限定理样本均值的分布1抽样分布=2.5σ2=1.25总体分布142128例:设一个总体(比如掷骰子),含有6个元素(个体),即总体单位数N=6。6个个体分别为x1=1,x2=2,x3=3,x4=4,x5=5,x6=6。现从总体中抽取n=2的简单随机样本,试比较总体分布和样本均值分布。第6章第2节

样本均值的分布与中心极限定理样本均值的分布1例:设一个总体(比如掷骰子),含有6个元素(个体),即总体129解:总体的均值、方差及分布如下:第6章第2节

样本均值的分布与中心极限定理样本均值的分布1均值和方差解:总体的均值、方差及分布如下:第6章第2节样本均值的分布130现从总体中抽取n=2的简单随机样本,在重复抽样条件下,有62=36个样本。所有样本的结果为:

第二观察值第一观察值1234561(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)2(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)3(3,1)(3,2)(3,3)(3,4)(3,5)(3,6)4(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)5(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)6(6,1)(6,2)(6,3)(6,4)(6,5)(6,6)第6章第2节

样本均值的分布与中心极限定理样本均值的分布1现从总体中抽取n=2的简单随机样本,在重复抽样条件下,有62131计算出各样本的均值,如下表。并给出样本均值的抽样分布

第二观察值第一观察值123456111.522.533.521.522.533.54322.533.544.542.533.544.55533.544.555.563.544.555.5636个样本的均值第6章第2节

样本均值的分布与中心极限定理样本均值的分布1计算出各样本的均值,如下表。并给出样本均值的抽样分布第二观132=3.5σ2=2.9=3.5σ2=1.45样本均值的抽样分布与总体分布的比较第6章第2节

样本均值的分布与中心极限定理样本均值的分布1=3.5=3.5样本均值的抽样分布与总体分布133=50σ2

=10X总体分布n=2抽样分布Xn=4当总体服从正态分布N~(μ,σ2)时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)σ2

=5σ2

=2.5第6章第2节

样本均值的分布与中心极限定理样本均值的分布1=50σ2=10X总体分布n=2抽样分布Xn=134当样本容量足够大时(n>30),样本均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论