版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于抽样与抽样估计第一张,PPT共一百三十二页,创作于2022年6月基本内容1、抽样估计的基本问题2、样本统计量的分布3、 参数估计的方法4、其它抽样组织形式下的参数估计5、统计软件 Excel 、SAS、SPSS在抽样 与参数估计中的应用第二张,PPT共一百三十二页,创作于2022年6月学习目标1.了解抽样和抽样分布的基本概念2.了解点估计的概念和估计量的优良标准3.掌握总体均值、总体比例和总体方差的区间估计4.掌握样本容量的确定原则和方法5.掌握运用统计软件Excel、SAS、SPSS进行抽样与参数估计方法第三张,PPT共一百三十二页,创作于2022年6月第一节 抽样估计的基本问题第四张,
2、PPT共一百三十二页,创作于2022年6月一、抽样估计的过程样本总体样本统计量如:样本均值、比例、方差总体均值、比例、方差等第五张,PPT共一百三十二页,创作于2022年6月二、抽样估计中几个基本概念第六张,PPT共一百三十二页,创作于2022年6月(一)总体与个体1.总体(Population):调查研究的事物或现象的全体2.个体(Item unit): 组成总体的每个元素3.总体单位数:总体中包含个体的数量,记为N4.总体的特性:当研究目的一定时,总体具有唯一确定性第七张,PPT共一百三十二页,创作于2022年6月(二)样本(Sample)1样本(Sample):从总体中所抽取的部分个体构
3、成的整体2样本容量(Sample size):样本中所包含个体的数量,记为n,当 n30,称为大样本 n30, 称为小样本3样本单位选取的原则:随机性原则4. 样本的特性:当样本单位数(n)一定的情况下,从总体中可以抽到很多个可能的样本,也即样本不是唯一确定的。第八张,PPT共一百三十二页,创作于2022年6月总体参数样本统计量及其计算公式总体平均数样本平均数总体比例 P样本比例 p= n1 /n总体方差样本方差总体标准差样本标准差(三)参数与统计量第九张,PPT共一百三十二页,创作于2022年6月(四)抽样框1、抽样框:包括全部抽样单位的名单框架。2、编制抽样框的意义:它是有效实施抽样的基础
4、,直接影响到抽样的随机性和抽样效果。3、抽样框的主要形式: (1)名单抽样框 (2)区域抽样框 (3)时间表抽样框 4、抽样框的要求:一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复也不遗漏。第十张,PPT共一百三十二页,创作于2022年6月(五)抽样误差 1、误差及其构成 在抽样调查中,调查资料与实际情况不一致,两者的偏离称为误差。第十一张,PPT共一百三十二页,创作于2022年6月2、抽样误差的概念及种类(1)抽样误差是指在没有登记误差和系统性误差的情况下,单纯由于抽样的随机性而产生的误差。(2)实际应用中,关于抽样误差,有三个密切联系而又有区别概念,即个别抽样误差、 平
5、均抽样误差、抽样极限误差。 个别抽样误差:个别抽样误差是指某一具体样本的估计值与总体参数的真实值之间的离差。实际抽样调查中,由于总体参数是未知的,因此,每次抽样的个别抽样误差是无法计算的。抽样调查中,所谓抽样误差可以计算和控制,并不是指个别抽样误差,而是指抽样平均误差和抽样极限误差。 第十二张,PPT共一百三十二页,创作于2022年6月抽样平均误差 抽样平均误差是由于抽样的随机性而产生的所有可能样本指标与总体指标之间的平均离差,也即所有可能样本指标的标准差。它。记为 和 ,其定义公式为:样本个数第十三张,PPT共一百三十二页,创作于2022年6月抽样极限误差 抽样极限误差是指一定概率下抽样误差
6、的可能范围,也称为允许误差。用表示抽样极限误差,则这一概念可以表述为如下不等式:第十四张,PPT共一百三十二页,创作于2022年6月三、抽样方法第十五张,PPT共一百三十二页,创作于2022年6月(一)重复抽样 重复抽样,也叫回置抽样,是指从总体的个单位中抽取一个容量为n的样本,每次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一个样本。 同一总体单位有可能被重复抽中; 每次都是从个总体单位中抽取; 次抽取就是次相互独立的随机试验。第十六张,PPT共一百三十二页,创作于2022年6月(二)不重复抽样 不重复抽样,也叫不回置抽样,是指抽中单位不再放回总体中,下一个样本单位只
7、能从余下的总体单位中抽取。 同一总体单位不可能被重复抽中. 每次抽取是在不同数目的总体单位中进行的 次抽取可看作是次互不独立的随机试验。 误差小于重复抽样 第十七张,PPT共一百三十二页,创作于2022年6月四、抽样的组织形式第十八张,PPT共一百三十二页,创作于2022年6月简单随机抽样分层抽样整群抽样等距抽样二阶抽样与多阶段抽样概率抽样方便抽样判断抽样配额抽样非概率抽样抽样方式第十九张,PPT共一百三十二页,创作于2022年6月(一)概率抽样的组织形式按随机原则选取样本单位,样本的代表性强。主要形式有: 1、简单随机抽样(纯随机抽样) 2、分层抽样(类型抽样) 3、等距抽样(机械抽样) 4
8、、整群抽样(成批抽样)第二十张,PPT共一百三十二页,创作于2022年6月1、任意抽样法 (便利抽样)从调查者方便出发所选取样本单位。简便易行,节省时间和费用,但调查所得样本的代表性小。适用于非正式的探测性调查,或调查前的准备工作。2、判断抽样法 是由调查人员根据经验判断选定样本的一种非随机抽样技术。一般采用“平均型”或“多数型”选样标准。在市场调查中,常用的典型调查、重点调查均属于判断抽样法的具体运用。3、配额抽样法按照一定的标准,分配样本数额,然后在规定数额内由调查人员任意抽选样本单位的一种非随机抽样技术。具体可分为:独立控制配额抽样和交叉控制的配额抽样 。(二)非随机抽样法 第二十一张,
9、PPT共一百三十二页,创作于2022年6月独立控制配额抽样收入阶层高:30中:44低:72合计:146年龄人数20-2930-4445-6465以上30523420合计146性别男:73女:73合计:146第二十二张,PPT共一百三十二页,创作于2022年6月交叉控制的配额抽样 收入阶层总计高中低性别男 女男 女男 女年龄20-2930-4445-6465以上4632 268 53 3 101295 540523420合计15 1522 2236 36146第二十三张,PPT共一百三十二页,创作于2022年6月五、抽样方案的设计第二十四张,PPT共一百三十二页,创作于2022年6月(一) 抽样
10、方案及其设计的基本准则 抽样方案是对整个抽样工作过程的全面安排和工作计划。科学可行的抽样方案是整个抽样推断工作得以顺利完成的保证。设计抽样方案应遵循以下原则:1、随机性原则2、抽样误差最小3、费用最少第二十五张,PPT共一百三十二页,创作于2022年6月 (二)抽样方案设计的主要内容 除了一般调查方案的内容外,主要还包括:编制抽样框确定抽样方法确定抽样组织方式确定样本容量 第二十六张,PPT共一百三十二页,创作于2022年6月第二节 抽样分布第二十七张,PPT共一百三十二页,创作于2022年6月一、抽样分布概述第二十八张,PPT共一百三十二页,创作于2022年6月(一)抽样分布的概念 (sam
11、pling distribution)1、抽样分布:样本统计量的概率分布,是一种理论分布。 例如,样本平均数抽样分布,样本方差、标准差的抽样分布,样本比例的分布等。2、 抽样分布反映了样本指标的分布特征,是抽样推断的重要依据。根据抽样分布的规律a、可揭示样本指标与总体指标之间的关系;b、估计抽样平均误差;c、说明抽样推断的可靠度。3、样本统计量分布的主要形式:正态分布、t分布、卡方分布、F分布等。 第二十九张,PPT共一百三十二页,创作于2022年6月(二)抽样分布的形成过程 (sampling distribution)总体计算样本统计量如:样本均值、比例、方差样本第三十张,PPT共一百三十
12、二页,创作于2022年6月二、不同样本统计量的抽样分布第三十一张,PPT共一百三十二页,创作于2022年6月(一)样本均值 的抽样分布 在选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布,称为样本均值 的抽样分布。 样本均值 的抽样与原有总体的分布和样本容量的大小有关。 第三十二张,PPT共一百三十二页,创作于2022年6月 = 50 =10X总体分布n = 4抽样分布xn =16(1)设总体XN(,2),按重复抽样方法从总体中随机抽取容量为n的样本,则样本均值x N(,2/n);不重复抽样时,1、总体方差已知,样本均值的分布。用图形表示如下:第三十三张,PPT共一百三十二页,
13、创作于2022年6月总体方差已知,样本均值的分布当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布(2)中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值近似服从正态分布,即 N(,2/n)。一个任意分布的总体x第三十四张,PPT共一百三十二页,创作于2022年6月2、总体方差未知,样本均值的抽样分布 设总XN (,2), 是其中的一个简单随机样本,样本均值为 ,样本标准差为S,则统计量: 第三十五张,PPT共一百三十二页,创作于2022年6月t 分布 t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分
14、布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 xt 分布与标准正态分布的比较t 分布标准正态分布t不同自由度的t分布标准正态分布t (df = 13)t (df = 5)z第三十六张,PPT共一百三十二页,创作于2022年6月样本均值的抽样分布 (例题分析)【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差第三十七张,PPT共一百三十二页,创作于2022年6月样本均值的抽样分布 (例题分析) 现从总体中抽取n2的简单随机样本,在重复抽样
15、条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)第三十八张,PPT共一百三十二页,创作于2022年6月样本均值的抽样分布 (例题分析) 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P ( x )1.53.04.03
16、.52.02.5第三十九张,PPT共一百三十二页,创作于2022年6月样本均值的分布与总体分布的比较 (例题分析) = 2.5 2 =1.25总体分布14230.1.2.3抽样分布P ( x )1.00.1.2.31.53.04.03.52.02.5x第四十张,PPT共一百三十二页,创作于2022年6月样本均值的抽样分布(例题分析)比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n第四十一张,PPT共一百三十二页,创作于2022年6月3、抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布样本分布第四十二张,
17、PPT共一百三十二页,创作于2022年6月(二)样本比例的抽样分布第四十三张,PPT共一百三十二页,创作于2022年6月(1)总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比(2)总体比例可表示为:(3)样本比例可表示为:1、比例(proportion)第四十四张,PPT共一百三十二页,创作于2022年6月(1)在选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布,称为样本比例的抽样分布。是一种理论概率分布(2)当样本容量很大时,样本比例的抽样分布可用正态分布近似 (3)样本比例的抽样分布是推断总体比例P的理论
18、基础2、样本比例的抽样分布(概念要点)第四十五张,PPT共一百三十二页,创作于2022年6月样本比例的抽样分布 当从一个总体中抽取一个容量为n的样本时,样本中具有某种特征的单位数n1服从二项分布,即n1 B(n,p) 且有:E( n1 )=np Var( n1 )=np(1-p)=npq 可以证明样本比例 也服从二项分布,即第四十六张,PPT共一百三十二页,创作于2022年6月样本比例的抽样分布 根据中心极限定理(Central Limit theorem),当 二项分布趋近于正态分布,所以,在大样本下,若np和n(1-p)皆大于5,样本比例近似服从正态分布: 不重复抽样时为:第四十七张,PP
19、T共一百三十二页,创作于2022年6月(三)样本方差、标准差的抽样分布第四十八张,PPT共一百三十二页,创作于2022年6月1、小样本下样本方差的抽样分布 设总体为 的正态分布,为来自总体的样本,则有:证明:标准正态变量平方和的分布第四十九张,PPT共一百三十二页,创作于2022年6月2、大样本下样本方差的抽样分布根据 的性质 ,则在大样本下: 趋于的正态分布。第五十张,PPT共一百三十二页,创作于2022年6月 大样本条件下,样本标准差S的分布近似于均值为 ,方差为 的正态分布,即: 3、大样本条件下样本标准差的分布第五十一张,PPT共一百三十二页,创作于2022年6月三、抽样平均误差的计算
20、第五十二张,PPT共一百三十二页,创作于2022年6月 根据抽样平均误差的概念和样本均值的分布,可得样本均值的抽样平均误差公式为:重复抽样:不重复抽样:(一)样本均值抽样平均误差的计算第五十三张,PPT共一百三十二页,创作于2022年6月 根据抽样平均误差的概念和样本比例的分布,可得样本比例的抽样平均误差公式为:重复抽样:不重复抽样:(二)样本比例抽样平均误差的计算第五十四张,PPT共一百三十二页,创作于2022年6月1、总体方差(或总体标准差)。其它条件不变的条件下,总体单位的差异程度大,抽样平均误差大。2、抽样数目。其它条件不变的条件下,抽样数目多,抽样平均误差小3、抽样方法。相同条件下,
21、重复抽样的抽样平均误差比不重复抽样的抽样平均误差大。4、抽样组织方式。由于不同抽样组织方式有不同的抽样误差,所以,在误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同。 (三)影响抽样平均误差的因素第五十五张,PPT共一百三十二页,创作于2022年6月第三节参数估计第五十六张,PPT共一百三十二页,创作于2022年6月一、参数估计概述第五十七张,PPT共一百三十二页,创作于2022年6月(一)统计估计及其类型统计估计: 研究由样本估计总体的未知分布或 分布中的未知参数2. 非参数估计:直接对总体未知分布的估计3. 参数估计: 总体分布类型已知,仅需对分布的 未知参数进行的估计第五十八
22、张,PPT共一百三十二页,创作于2022年6月估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等例如: 样本均值就是总体均值 的一个估计量参数用 表示,估计量用 表示估计值:估计参数时计算出来的统计量的具体值如果样本均值 x =80,则80就是的估计值(二)估计量与估计值 (estimator & estimated value)第五十九张,PPT共一百三十二页,创作于2022年6月(三)参数估计的方法矩估计法最大似然法估 计 方 法点 估 计区间估计第六十张,PPT共一百三十二页,创作于2022年6月二、总体参数的点估计 (point estimate)第六十一张,PPT共一
23、百三十二页,创作于2022年6月(一) 概念要点 点估计,也叫定值估计,就是直接以样本统计量来估计总体参数。当已知一个样本的观察值时便可得到总体参数的一个估计值 。 点估计的方法有矩估计法和极大似然估计法 点估计的优点是简单、具体明确。但由于样本的随机性,从一个样本得到的估计值往往不会恰好等于总体参数的真值,在很大程度上有一定的误差。而点估计本身无法说明抽样误差的大小,也无法说明估计结果的把握程度。第六十二张,PPT共一百三十二页,创作于2022年6月 1、均值:2、方差:3、比例: (m表示样本中具有某种特征的单位数) (二)点估计的基本公式第六十三张,PPT共一百三十二页,创作于2022年
24、6月(三)点估计的优良标准无偏性有效性一致性评价点估计的标准第六十四张,PPT共一百三十二页,创作于2022年6月1、无偏性(unbiasedness)P( )BA无偏有偏设是未知参数的一个点估计量,若满足 则称 是 的无偏估计量,否则称为有偏估计量第六十五张,PPT共一百三十二页,创作于2022年6月2、有效性(efficiency)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效 AB 的抽样分布 的抽样分布P( )第六十六张,PPT共一百三十二页,创作于2022年6月3、一致性(consistency)一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数
25、AB较小的样本容量较大的样本容量P( )第六十七张,PPT共一百三十二页,创作于2022年6月三、总体参数的区间估计 (interval estimate)第六十八张,PPT共一百三十二页,创作于2022年6月(一)概念要点 在点估计的基础上,根据样本统计量的分布,以一定的概率保证程度,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的。样本统计量 (点估计)置信区间置信下限置信上限第六十九张,PPT共一百三十二页,创作于2022年6月总体参数落在估计区间内的概率或把握程度,称为置信水平,表示为 (1 - 总体参数不在估计区间内的概率,成为显著性水平,表示为 常用的置信水平
26、值有 99%, 95%, 90%相应的 为0.01,0.05,0.10置信水平与显著性水平Level of Confidence 第七十张,PPT共一百三十二页,创作于2022年6月095% 的样本 1.96 1.9699% 的样本 -2.58 2.5890%的样本 -1.65 1.65样本统计量的标准化分布第七十一张,PPT共一百三十二页,创作于2022年6月置信区间及其影响因素 (confidence interval)1、一定概率条件下,总体参数所在的区间范围,称为参数估计的置信区间。2、影响区间宽度的因素: 总体数据的离散程度,用 来测度 样本容量, 置信水平 (1 - ),影响 z
27、的大小第七十二张,PPT共一百三十二页,创作于2022年6月总体参数的区间估计总体参数符号表示样本统计量均值比例方差第七十三张,PPT共一百三十二页,创作于2022年6月(一)总体均值的区间估计第七十四张,PPT共一百三十二页,创作于2022年6月1、总体均值的区间估计(正态总体且 已知或非正态总体、 未知、大样本)(1)假定条件总体服从正态分布,且方差() 已知如果不是正态分布,可由正态分布来近似 (n 30)(2)使用正态分布统计量 z(3)总体均值 在1- 置信水平下的置信区间为第七十五张,PPT共一百三十二页,创作于2022年6月总体均值的区间估计(例题分析)【 例 1】保险公司从投保
28、人中随机抽取36人,计算得36人的平均年龄 岁,已知投保人平均年龄近似服从正态分布,标准差为7.2岁,试求全体投保人平均年龄的置信水平为99%的置信区间 解:已知n=36, 1- = 99%,z/2=2.575。根据样本数据计算得:总体均值在1-置信水平下的置信区间为故全体投保人平均年龄的置信水平为99%的置信区间为36.41,52.59第七十六张,PPT共一百三十二页,创作于2022年6月总体均值的区间估计(例题分析)【 例2 】一家食品公司,每天大约生产袋装食品若干,按规定每袋的重量应为100g。为对产品质量进行检测,该企业质检部门采用抽样技术,每天抽取一定数量的食品,以分析每袋重量是否符
29、合质量要求。现从某一天生产的一批食品8000袋中随机抽取了25袋(不重复抽样),测得它们的重量如下表所示,已知产品重量服从正态分布,且总体方差为100g。试估计该批产品平均重量的置信区间,置信水平为95。 25袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3第七十七张,PPT共一百三十二页,创作于2022年6月总体均值的区间估计(例题分析)解:已知N(,102),n=25, 1-
30、= 95%,z/2=1.96。根据样本数据计算得: 总体均值在1-置信水平下的置信区间为该食品平均重量的置信区间为101.4459g109.2741g注:在不重复抽样条件下,置信区间取第七十八张,PPT共一百三十二页,创作于2022年6月总体均值的区间估计(例题分析)【例】一家保险公司收集到由36个投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间 36个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532第七十九张,PPT共一百三十二页,
31、创作于2022年6月总体均值的区间估计(例题分析)解:已知n=36, 1- = 90%,z/2=1.645。根据样本数据计算得: , 总体均值在1- 置信水平下的置信区间为投保人平均年龄的置信区间为37.37岁41.63岁第八十张,PPT共一百三十二页,创作于2022年6月2、总体均值的区间估计 (正态总体、方差未知、小样本)(1)假定条件总体服从正态分布,且方差() 未知小样本 (n 30)(2)使用 t 分布统计量:(3)总体均值 在1-置信水平下的置信区间为:第八十一张,PPT共一百三十二页,创作于2022年6月总体均值的区间估计(例题分析)【例】已知某种灯泡的寿命服从正态分布,现从一批
32、灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470第八十二张,PPT共一百三十二页,创作于2022年6月总体均值的区间估计(例题分析)解:已知N(,2),n=16, 1- = 95%,t/2=2.131 根据样本数据计算得: , 总体均值在1-置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时第八十三张,PPT共一百三十二页,创作于2022年6月(二)总体比例的区间估计
33、第八十四张,PPT共一百三十二页,创作于2022年6月总体比例的区间估计假定条件:大样本条件下,样本比例的抽样分布可以由正态分 布来近似使用正态分布统计量 z3. 总体比例在1-置信水平下的置信区间为第八十五张,PPT共一百三十二页,创作于2022年6月总体比例的区间估计(例题分析)【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知 n=100,p65% , 1- = 95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%74.35% 第八十六张,PPT共一百三十
34、二页,创作于2022年6月总体比例的区间估计(例题分析)【 例 】某企业共有职工1000人,企业准备实行一项改革,在职工中征求意见,采用不重复抽样方法,随机抽取200人作为样本,调查结果显示,由150人表示赞成这项改革,有50人表示反对。试以95的置信水平确定赞成改革的人数比例的置信区间 解:已知n=200,z/2=1.96,p75% 。根据样本数据计算得总体均值在1-置信水平下的置信区间为95的置信水平下估计赞成改革的人数比例的置信区间为69.63%80.37% 第八十七张,PPT共一百三十二页,创作于2022年6月(三)总体方差的区间估计第八十八张,PPT共一百三十二页,创作于2022年6
35、月总体方差的区间估计(概念要点)1.估计一个总体的方差或标准差2.假设总体服从正态分布总体方差 2 的点估计量为S2,且4. 总体方差在1- 置信水平下的置信区间为第八十九张,PPT共一百三十二页,创作于2022年6月总体方差的区间估计(图示) 2 21- 2 总体方差1- 的置信区间自由度为n-1的2第九十张,PPT共一百三十二页,创作于2022年6月总体方差的区间估计(例题分析)【例】 食品厂从生产的罐头中随机抽取15个称量其重量,得样本方差s2 =1.652(克2 ),设罐头重量服从正态分布,试求其方差的置信水平为90%的置信区间。解:已知n15,1-90% ,s2 =1.652 查卡方
36、分布表的:故总体方差的置信水平为90%的置信区间为1.61,5.8 第九十一张,PPT共一百三十二页,创作于2022年6月(四) 总体总量指标的估计第九十二张,PPT共一百三十二页,创作于2022年6月1、直接推断法点估计公式:(1) (2)区间估计:(1)(2)第九十三张,PPT共一百三十二页,创作于2022年6月2、修正系数法 就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。例如,某市房地局,年报工资总额3218.1万元。现抽查14个单位: 年报:415.03万元 多报:0.44万元 少报:1.47万元抵冲后 1.47-0.44=1.03(万元)第九十四张,
37、PPT共一百三十二页,创作于2022年6月四、样本容量的确定第九十五张,PPT共一百三十二页,创作于2022年6月(一)确定样本容量的基本原则 基本原则:在一定的调查费用下,做到抽样误差最小,或在一定的误差要求下,近来能够做到费用最省。 具体做法:先根据研究问题的性质和调查费用的多少确定允许误差 和必要的概率保证程度,然后根据历史资料或其它试点资料确定总体方差,并通过抽样极限误差的计算公式推导出必要的样本单位数。第九十六张,PPT共一百三十二页,创作于2022年6月估计总体均值时样本容量n为(二)估计总体均值时样本容量的确定 第九十七张,PPT共一百三十二页,创作于2022年6月估计总体均值时
38、样本容量的确定 (例题分析)【例】在某企业中采用简单随机抽样调查职工月平均奖金额,设职工月奖金额服从标准差为10元的正态分布,要求估计的绝对误差为3元,可靠度为95%,试问应抽多少职工? 第九十八张,PPT共一百三十二页,创作于2022年6月估计总体均值时样本容量的确定 (例题分析)解: 已知 =10,d=3, 1-=95%, z/2=1.96 则样本容量为:即应抽取43人作为样本 第九十九张,PPT共一百三十二页,创作于2022年6月根据比例区间估计公式可得样本容量n为(三)估计总体比例时样本容量的确定 第一百张,PPT共一百三十二页,创作于2022年6月估计总体比例时样本容量的确定 (例题
39、分析)【例】根据以往的生产统计,某种产品的合格率约为90%,现要求绝对误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本? 解:已知=90%,=0.05, z/2=1.96,d=5% 应抽取的样本容量为 应抽取139个产品作为样本第一百零一张,PPT共一百三十二页,创作于2022年6月 (四)影响样本容量的因素第一百零二张,PPT共一百三十二页,创作于2022年6月 (1)在同样条件下,不重复抽样比重复抽样要求的抽样单位数目少。但不重复抽样的抽样单位数目计算公式比较复杂。在实际工作中,一般当 n/N的抽样比 例很小时(小于5%),为了简化计算,虽然采用不重复抽样,也可用重复抽样计算公
40、式计算抽样单位数目。N(五)关于抽样单位数目的几点说明 (2)同一总体往往同时需要估计总体平均数和总体成数,对二者可以分别计算出各自抽样单位数目,为了防止抽样单位数目的不足,在实际工作中,往往根据抽样单位数目比较大的一个数目进行抽样,以满足共同要求第一百零三张,PPT共一百三十二页,创作于2022年6月第四节不同抽样方式下的抽样估计第一百零四张,PPT共一百三十二页,创作于2022年6月一、简单随机抽样(simple random sampling)第一百零五张,PPT共一百三十二页,创作于2022年6月1、简单随机抽样(概念要点)(1)事先不对总体做任何出处理,而是直接从总体中按随机原则取一
41、定数量的单位组成样本。 (2)抽取元素的具体方法有重复抽样和不重复抽样(3)特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便(4)局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率第一百零六张,PPT共一百三十二页,创作于2022年6月2、简单随机抽样(抽样方法)(1)编号(2)随机抽取样本单位 抽签法 利用随机数表取数法 电子计算机取数法。第一百零七张,PPT共一百三十二页,创作于2022年6月二、分层抽样(类型抽样(stratified sampling)第一百零八张,PPT共一百三十二页,创作于
42、2022年6月1、分层抽样(概念要点)(1)将抽样单位按某种特征或某种规则划分为不同的层(类),然后从不同的层(类)中独立、随机地抽取样本。(2)优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计第一百零九张,PPT共一百三十二页,创作于2022年6月 (3)分层抽样的分组标志,一般应选择与被研究现象有关的重要标志。通过分组,尽量缩小组内各单位标志值的差异,增大组间各单位标志值的差异,以便降低抽样误差。(4)分为比例分层抽样与不等比例分层抽样。差异程度较大的组应该多抽几个,而差异程度比较均匀的组可少抽几个,以便降低抽
43、样误差。(5)分层抽样适宜于由差异较大的单位所组成的总体。它将分组法与随机原则结合起来,减少了各组内标志值的差异程度,使各组都有抽取样本单位的机会,有利于提高样本的代表性,能得到比简单抽样更为准确的结果,因此在实际工作中应用较广泛。分层抽样(概念要点)第一百一十张,PPT共一百三十二页,创作于2022年6月2、分层抽样各层样本数目确定(1)分层比例抽样法:(2)分层最佳抽样法:(3)最低成本抽样法:第一百一十一张,PPT共一百三十二页,创作于2022年6月例:假定估计某种产品的潜在用户的每年平均支出,用户名单分为:多用、中等使用和少用三层,见如下表:层潜在用户(N)样本潜在用户(n)样本的平均
44、支出( )样本标准差(S)单位调查费用1、少用2、中等3、多用2000400020005010050¥1000¥1500¥2000¥100¥150¥200¥7¥10¥12合计8000200第一百一十二张,PPT共一百三十二页,创作于2022年6月层分层比例分层最佳最低成本123501005033100673910061合计200200200经计算,数目分配如下:第一百一十三张,PPT共一百三十二页,创作于2022年6月3、等比例分层抽样的估计(1)总体均值的估计 第一步 计算各层抽样平均数: 第三步 计算抽样平均误差 计算各组内方差:第二步 计算样本平均数第一百一十四张,PPT共一百三十二页,创作于2022年6月 计算各组内方差的平均数: 第四步 估计区间:等比例类型抽样的估计 样本平均数的抽样平均误差:重复抽样:不重复抽样:第一百一十五张,PPT共一百三十二页,创作于2022年6月(2)总体比例估计 第二步、计算抽样比例的平均误差第一步、计算样本比例其中:第三步、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 14164-2026石油天然气输送管用热轧宽钢带
- 网络与信息安全管理员-复习题含参考答案
- 项目管理(制造)费用开支统计表
- (辅导班)2026年新高三数学暑假讲义(基础班)第06讲 三角恒等变换(原卷版)
- 2025-2026学年浙江省温州市高考考前提分语文仿真卷含解析
- 【2026】辽宁省大连市事业单位考试综合应用能力(自然科学专技类C类)年复习策略精析
- 四川省遂宁市射洪中学2025-2026学年高一下学期期中考试语文试卷
- 【2026年】康复医学治疗技术(初级(士)107)专业知识卫生专业技术资格考试应考重点(解析版)
- 【广东省事业单位考试综合应用能力(自然科学专技类C类)应考难点解析】
- 【2026】高中英语届高考语法填空备考词汇(共221个)
- 《机床数控技术 第4版》课件全套 李郝林 第1-9章 概述、数控加工程序编制 -自由曲线及曲面的加工
- 古诗词诵读《李凭箜篌引》课件++2023-2024学年统编版高中语文选择性必修中册
- 教师与学生谈心谈话记录表
- JJG 693-2011可燃气体检测报警器
- 《基本乐理》课件-第五课 和弦
- 蜡烛变化实验报告单1
- 会务接待礼仪培训
- 光伏组件失效模式介绍课件
- 市场调查与统计知到章节答案智慧树2023年北京财贸职业学院
- DB42T 1144-2016燃气用不锈钢波纹软管安装及验收规范
- GB/T 14048.7-2016低压开关设备和控制设备第7-1部分:辅助器件铜导体的接线端子排
评论
0/150
提交评论