第四章 抽样与参数估计-1.ppt_第1页
第四章 抽样与参数估计-1.ppt_第2页
第四章 抽样与参数估计-1.ppt_第3页
第四章 抽样与参数估计-1.ppt_第4页
第四章 抽样与参数估计-1.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第4章 抽 样 与 参 数 估 计,统计学的分类,2,分析数据方式,参数估计在统计方法中的地位,统计方法,描述统计,推断统计,假设检验,4,总体、个体和样本 (概念要点),总体(Population):调查研究的事物或现象的全体 个体(Item unit):组成总体的每个元素 样本(Sample):从总体中所抽取的部分个体 样本容量(Sample size):样本中所含个体的数量,问题引入,问题1 浙江省今年高考考生达37万,为了调查了解这些考生数学试题的得分情况,将他们所有的考试卷加以统计,那将是十分麻烦的,怎样才能既科学又客观地了解这些考生数学试题的得分情况呢?,问题2 现有某灯泡厂生

2、产的灯泡10000只,怎样才能了解这批灯泡的使用寿命呢?,另一类是如何根据对样本的整理、计算和分析,对总体的情况作出推断,统计推断的核心问题:,是如何根据样本的情况对总体的情况作出一种推断,这里包括两类问题:一类是如何从总体中抽取样本;,参数估计:根据样本数据提供的信息来推断总体的参数,7,统计推断的过程,主要内容:,4.1、抽样与抽样分布 4.2、参数估计的一般原理 4.3、总体均值的区间估计 4.4、总体比例的区间估计 4.5、样本容量的确定,8,抽样方法,概率抽样方法 非概率抽样方法 一般的抽样推断都是建立在概率抽样的基础上,9,概率抽样,10,总体中的每一个个体都有被抽到的可能,完全排

3、除人的主观因素的影响,11,简单随机抽样:是其他抽样方法的基础(抽签法和随机数表法) 两种抽取单位的具体方法:重复抽样、不重复抽样,分层抽样:按不同特征划分层(strata),在每一层中抽取一定的单位组成一个样本 性别、行业、年龄等 优点:分层抽样的样本分布在各个层内,使样本在总体中的分布比较均匀,样本更具代表性,方法简单、精度高,12,黄色为总体 红色为群 白点为基本单元,整群抽样:将总体划分为若干群(cluster),以群为单位随机抽取几个群,再对抽中的各个群中所包含的所有元素进行观察 自然(行政)区域,优点:由于群内各单位比较集中,对样本进行调查比较方便,节约费用,系统抽样(等距抽样):

4、先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个单位,直至抽取n个形成一个样本,14,优点:具有简单随机抽样的特征,能比较均匀地抽到总体中各个部分的单位,简单易行,练习,下列问题中 , 采用怎样的抽样方法较为合理 ?,( 1 ) 从 10 台冰箱中抽取 3 台进行质量检查;,( 2 ) 某电影院有32排座位,每排有40个座位,座位号为140。有一次报告会坐满了听众,报告会结束以后为听取意见,需留下 32 名听众进行座谈;,( 3 ) 某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一

5、个容量为20的样本。,解 :,(1)总体容量比较小 , 用抽签法或随机数表法 .,(2)总体容量比较大,人员没有明显差异,且刚好32排 ,每排人数相同,可采用系统抽样.将每排的40个人组成一组,共32组,从第一排至第32排分别为第132组,先在第一排用简单随机抽样法抽出一名听众,再将其他各排与此听众座位号相同的听众全部取出 .,(3)差异明显,采用分层抽样.总体容量为160,故样本中教师人数应为 120(20/160)=15名,行政人员应为16(20/160)=2名,后勤人员应为 24(20/160)=3名.,非概率抽样,从方便出发或根据研究人员的主观判断来抽取样本,17,方便抽样:,根据调查

6、人员最方便的途径来选定样本 节省经费,实施方便,速度快;抽样误差大,结果可靠性差 适用于预备性调查研究,18,判断抽样:根据专家的经验和判断,或调查人员的主观决定选取样本的方法 典型调查和重点调查 适合特殊需要,调查回收率高,过程简单,但容易因研究人员主观判断偏差而导致误差,19,自愿抽样 有偏,反映某类群体的一般看法 滚雪球抽样 特定群体的研究,20,概率抽样与非概率抽样的比较,概率抽样依据随机原则抽取样本,可用于对总体给出很准确的估计情况 非概率抽样得到的统计量的分布是不确定的,因而不能用于总体参数的推断,可用于探索性的研究,21,三种不同性质的分布,总体分布 样本分布 抽样分布:样本统计

7、量的概率分布。,23,频数分布表、图等,117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121,24,某生产车间50名工人日加工零件数如下(单位:个),某车间50名工人日加工零件数分组表,26,为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广

8、告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?” 1商品广告;2服务广告;3金融广告;4房地产广告;5招生招聘广告;6其他广告。,某城市居民关注广告类型的频数分布,某百货公司连续四十天的商品销售额如下(单位:万元),27,以此推断一年365天的销售额情况?,抽样分布,样本统计量的概率分布 例如:样本均值、比例、方差的分布 结果来自容量相同的所有可能样本 一种理论分布,28,29,【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差?,均值和方差,2.5,1.25,30, 现从总体中抽取n2

9、的简单随机样本,在重复抽样条件下,所有样本的均值如何分布?,共有42=16个样本:,31, 计算出各样本的均值,如下表,32,给出样本均值的抽样分布,33,式中:M为样本数目,n 为样本容量 比较及结论:1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n,所有均值的均值和方差,样本均值的分布与总体分布的比较,抽样分布, = 2.5 2 =1.25,总体分布,样本均值的抽样分布,不重复抽样 : 样本均值的方差则需要用修正系数(N-n/N-1)去修正样本均值的方差; 对于无限总体或有限总体当N很大时,不重复抽样可以按照重复抽样来处理; 如果原有总体是正态分布,那

10、么无论样本容量大小,样本均值的抽样分布均服从正态分布; 如果原有总体是非正态分布,则要看样本容量的大小而定。,35,抽样分布与总体分布的关系,中心极限定理(Central Limit Theorem),37,从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时(通常要求n30),样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,均值的抽样标准误差,是所有可能的样本均值的标准差,用于测度所有样本均值的离散程度,描述以样本均值推断总体均值的平均误差程度。 简单随机重复抽样下计算公式为:,练习,1、从均值为200,标准差为50的总体中,抽取n=100的简单随机样本,用样本均值估计总体均值: (1)样本均值的数学期望是多少? (2)样本均值的标准差是多少? (3)样本均值的抽样分布是什么? 2、假定总体共有1000个单位,均值为32,标准差为5。从中抽取一个容量为30的样本简单随机样本用于获取总体信息: (1)样本均值的数学期望是多少? (2)样本均值的标准差是多少?,200,5,32,0.91,正态分布函数的性质,图形是关于x=对称钟形曲线,且峰值在x= 处 均值和标准差 一旦确定,分布的具体形式也惟一确定 正态随机变量在特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论