版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
5.1.3抽样与抽样分布1
常用的抽样方法2抽样分布3
中心极限定理的应用学习目标了解抽样的概率抽样方法理解抽样分布的意义了解抽样分布的形成过程理解中心极限定理理解抽样分布的性质常用的抽样方法一、简单随机抽样二、分层抽样三、系统抽样四、整群抽样抽样方法概率抽样
(probabilitysampling)根据一个已知的概率来抽取样本单位,也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样
(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为样本都有相同的机会(概率)被抽中抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率分层抽样
(stratifiedsampling)将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(等距抽样)
(systematicsampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样
(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布与中心极限定理一、抽样分布的概念二、样本均值抽样分布的形式三、样本均值抽样分布的特征四、中心极限定理样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布
(samplingdistribution)抽样分布的形成过程
(samplingdistribution)总体计算样本统计量如:样本均值、比例、方差样本样本均值的抽样分布在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布一种理论概率分布推断总体均值的理论基础 样本均值的抽样分布样本均值的抽样分布
(例题分析)【例】设一个总体,含有4个元素(个体)
,即总体单位数N=4。4
个个体分别为x1=1,x2=2,x3=3,x4=4
。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差样本均值的抽样分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布
(例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P
(x)1.53.04.03.52.02.5样本均值的抽样分布(例题分析)根据表中数据求得样本均值的均值为:
样本均值的方差为:比较及结论:1.样本均值的均值等于总体均值
2.样本均值的方差等于总体方差的1/n样本均值的抽样分布(例题分析)=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5xP(X)X比较总体分布和样本均值的抽样分布,可以看出,此例尽管总体为均匀分布,但样本均值的抽样分布却是对称的钟型分布。样本均值抽样分布的形式与特征=50
=10X总体分布n=4抽样分布xn=16P(X)数理统计理论证明:当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,样本均值的数学期望为总体均值,样本均值的方差为总体方差的1/n。即x~N(μ,σ2/n)。若X~N(50,102),则有:当n=4,x~N(50,52);当n=16,x~N(50,2.52)
中心极限定理(centrallimittheorem)当总体为非正态分布时依据以下中心极限定理。中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大(通常n30)时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。当样本容量足够大时(n
30),样本均值的抽样分布逐渐趋于正态分布一个任意分布的总体X中心极限定理
(centrallimittheorem)x的分布趋于正态分布的过程抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布样本均值的数学期望样本均值的方差重复抽样不重复抽样样本均值的抽样分布
(数学期望与方差)样本比例的抽样分布在工程以及商务与经济管理中,许多情况下要用到比率估计;需要用到样本的比例去估计总体的比例。举例:在一批抽样的产品中,有合格的产品和不合格的产品,其中合格产品和不合格产品的比率就是一个值得关注的统计量。适用于研究分类或定型的变量。比例(proportion)是总体或样本中具有某种属性的单位数与全部单位总数之比。总体比例可表示为样本比例可表示为总体或样本中具有某种特征的单位数服从二项分布。㈡样本比例的抽样分布样本比例的抽样分布是容量相同的所有可能样本的样本比例的概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似是一种理论概率分布是推断总体比例的理论基础 样本比例抽样分布的性质及特点样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比例的数学期望与方差
(简单随机样本)样本方差的抽样分布
用样本方差去推断总体方差,就必须知道样本方差的分布。在重复选取容量为n的样本时,由样本方查所有可能值形成的频数分布就是样本方差的抽样分布。统计证明:对于来自正态总体的简单随机样本,比值:的抽样分布服从自由度为(n-1)的2的分布
分布由阿贝(Abbe)
于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)
分别于1875年和1900年推导出来设xN(,2),则令Y=Z2
,则Y服从自由度为1的2分布,即当总体XN(,2),从中抽取容量为n的样本,则2分布c2分布
选择容量为n的简单随机样本计算样本方差s2计算卡方值2=(n-1)s2/σ2计算出所有的
2值不同容量样本的抽样分布c2n=1n=4n=10n=20ms总体五、两个总体的抽样分布㈠两个总体的样本均值之差的抽样分布㈡两个总体的样本比例之差的抽样分布㈢两个总体的样本方差比的抽样分布(略)问题的提出实际问题中,我们需要研究两个总体的比较问题,这就需要进一步研究两总体均值之差,两总体比例之差,两总体方差之比。研究两总体均值之差,需要了解样本均值的分布。设从两个总体中分别独立地抽取样本容量为n1和n2的样本,由两个样本均值之差的所有可能取值形成的相对频数分布。若两个总体都为正态分布,即
则可以证明,抽自两个总体的两个样本的均值之差的抽样分布服从正态分布其分布的数学期望为两个总体均值之差其方差为各自的方差之和 ㈠两个总体的样本均值之差的抽样分布两个样本均值之差的抽样分布
m1s1总体1s2
m2总体2抽取简单随机样本,样本容量n1计算x1抽取简单随机样本,样本容量n2计算x2计算每一对样本的x1-x2所有可能样本的X1-X2m1-m2抽样分布若两个总体都服从二项分布,则可以证明,分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差p1-p2的抽样分布可用正态分布来近似其分布的数学期望为总体比例之差其方差为各自的方差之和 ㈡两个总体的样本比例之差的抽样分布两个样本均值之差的抽样分布两个总体都为正态分布,即:两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差:方差为各自的方差之和
m1s1总体1s2
m2总体2计算每一对样本的m1-m2抽样分布抽取简单随机样本x2、样本容量n2计算抽取简单随机样本x1、样本容量n1计算所有可能样本的两个样本均值之差的抽样分布即:两个样本均值之差的抽样分布两个样本比例之差的抽样分布假设两个总体服从二项分布,分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,则两个样本比率的抽样分布可以用正态分布来近似,其分布的均值和方差分别为:即:两个样本比例之差的抽样分布两个样本方差比的抽样分布假设两个总体都为正态分布:分别从两个总体中抽取容量为n1和n2的独立样本,两个样本方差比
的抽样分布,服从F分布,即:由统计学家费希尔(R.A.Fisher)
提出的,以其姓氏的第一个字母来命名设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为F分布
(F
distribution)F分布(图示)
不同自由度的F分布F(1,10)(5,10)(10,10)(第14讲)考场作文开拓文路能力•分解层次(网友来稿)江苏省镇江中学陈乃香说明:本系列稿共24讲,20XX年1月6日开始在资源上连载【要义解说】文章主旨确立以后,就应该恰当地分解层次,使几个层次构成一个有机的整体,形成一篇完整的文章。如何分解层次主要取决于表现主旨的需要。【策略解读】一般说来,记人叙事的文章常按时间顺序分解层次,写景状物的文章常按时间顺序、空间顺序分解层次;说明文根据说明对象的特点,可按时间顺序、空间顺序或逻辑顺序分解层次;议论文主要根据“提出问题-—分析问题——解决问题”顺序来分解层次。当然,分解层次不是一层不变的固定模式,而应该富于变化。文章的层次,也常常有些外在的形式:1.小标题式。即围绕话题把一篇文章划分为几个相对独立的部分,再给它们加上一个简洁、恰当的小标题。如《世界改变了模样》四个小标题:寿命变“长”了、世界变“小”了、劳动变“轻”了、文明变“绿”了。2.序号式。序号式作文与小标题作文有相同的特点。序号可以是“一、二、三”,可以是“A、B、C”,也可以是“甲、乙、丙”……从全文看,序号式干净、明快;但从题目上看,却看不出文章内容,只是标明了层次与部分。有时序号式作文,也适用于叙述性文章,为故事情节的展开,提供了明晰的层次。3.总分式。如高考佳作《人生也是一张答卷》。开头:“人生就是一张答卷。它上面有选择题、填空题、判断题和问答题,但它又不同于一般的答卷。一般的答卷用手来书写,人生的答卷却要用行动来书写。”主体部分每段首句分别为:选择题是对人生进行正确的取舍,填空题是充实自己的人生,判断题是表明自己的人生态度,问答题是考验自己解决问题的能力。这份“试卷”设计得合理而且实在,每个人的人生都是不同的,这就意味着这份人生试卷的“答案是丰富多彩的”。分解层次,应追求作文美学的三个价值取向:一要匀称美。什么材料在前,什么材料在后,要合理安排;什么材料详写,什么材料略写,要通盘考虑。自然段是构成文章的基本单位,恰当划分自然段,自然就成为分解层次的基本要求。该分段处就分段,不要老是开头、正文、结尾“三段式”,这种老套的层次显得呆板。二要波澜美。文章内容应该有张有弛,有起有伏,如波如澜。只有这样才能使文章起伏错落,一波三折,吸引读者。三要圆合美。文章的开头与结尾要遥相照应,把开头描写的事物或提出的问题,在结尾处用各种方式加以深化或回答,给人首尾圆合的感觉。【例文解剖】话题:忙忙,不亦乐乎忙,是人生中一个个步骤,每个人所忙的事务不同,但是不能是碌碌无为地白忙,要忙就忙得精彩,忙得不亦乐乎。忙是问号。忙看似简单,但其中却大有学问。忙是人生中不可缺少的一部分,但是怎么才能忙出精彩,忙得不亦乐乎,却并不简单。人生如同一张地图,我们一直在自己的地图上行走,时不时我们眼前就出现一个十字路口,我们该向哪儿,面对那纵轴横轴相交的十字路口,我们该怎样选择?不急,静下心来分析一下,选择适合自己的坐标轴才是最重要的。忙就是如此,选择自己该忙的才能忙得有意义。忙是问号,这个问号一直提醒我们要忙得有意义,忙得不亦乐乎。忙是省略号。四季在有规律地进行着冷暖交替,大自然就一直按照这样的规律不停地忙,人们亦如此。为自己找一个目标,为目标而不停地忙,让这种忙一直忙下去。当目标已达成,那么再找一个目标,继续这样忙,就像省略号一样,毫无休止地忙下去,翻开历史的长卷,我们看到牛顿在忙着他的实验;爱迪生在忙着思考;徐霞客在忙着记载游玩;李时珍在忙着编写《本草纲目》。再看那位以笔为刀枪的充满着朝气与力量的文学泰斗鲁迅,他正忙着用他独有的刀和枪在不停地奋斗。忙是省略号,确定了一个目标那么就一直忙下去吧!这样的忙一定会忙出生命灵动的色彩。忙是惊叹号。世界上的人都在忙着自己的事,大自然亦如此,小蜜蜂在忙,以蜂蜜为回报。那么人呢?居里夫人的忙,以放射性元素的发现而得到了圆满的休止符;爱因斯坦在忙,以相对论的问世而画上了惊叹号;李白的忙,以那豪放的诗歌而有了很大的成功;张衡的忙,因为那地动仪的问世而让世人仰慕。每个人都应该有效率的忙,而不是整天碌碌无为地白忙。人生是有限的、短暂的,因此,每个人都应该在有限的生命里忙出属于他的惊叹号;都应在有限的生命里忙出他的人生精彩篇章。忙是万物、世界、人生中都不可缺少的一部分。作为这世上最高级动物的我们,我们在忙什么呢?我们要忙得有意义,有价值,我们要忙出属于我们的精彩。我们的忙不能永远是问号,而应是省略号和感叹号。忙就要忙得精彩,忙得不亦乐乎。解剖:本文将生活中的一句口头禅“忙得不亦
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一体化压铸模具寿命延长技术项目可行性研究报告
- 成本经济可行性研究报告
- 广告新媒体的运营方案
- 海鲜超市加工运营方案
- 分公司合作运营方案
- 抖音美容门店运营方案
- 原产地运营方案
- it桌面运维运营方案
- 阿里店铺店铺运营方案
- 数字化转型2025生产成本管理方案解析
- 司法实践中的价格鉴证应用
- 2025重庆机场集团有限公司校园招聘36人考试核心试题及答案解析
- 中华护理学会招聘1人参考笔试题库及答案解析
- 2025年法检系统书记员招聘考试(法律基础知识)自测试题及答案
- 新能源汽车商业计划书范本
- 浙江国企招聘2025杭州萧山水务有限公司招聘40人笔试历年常考点试题专练附带答案详解试卷2套
- 农村民法典宣传课件
- 粮库有限空间安全培训课件
- 氯碱电解工艺事故案例分析
- 《C++程序设计及项目实践》 课件 第16章 标准模板库
- 2025版《煤矿安全规程》解读
评论
0/150
提交评论