统计学:第6章 抽样基础_第1页
统计学:第6章 抽样基础_第2页
统计学:第6章 抽样基础_第3页
统计学:第6章 抽样基础_第4页
统计学:第6章 抽样基础_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 第第 6 章章 抽样基础抽样基础 6.1 抽样推断概述抽样推断概述 6.2 概率基础知识概率基础知识 6.3 抽样分布抽样分布 6.4 抽样误差抽样误差 6.5 抽样设计抽样设计 2 6.1 抽样推断抽样推断基本概念基本概念 一、抽样推断的定义一、抽样推断的定义 二、总体和样本二、总体和样本 三、三、总体参数和样本统计量总体参数和样本统计量 四四、重复抽样和不重复抽样重复抽样和不重复抽样 五、样本容量和样本数目五、样本容量和样本数目 六、抽样框六、抽样框 七、抽样误差七、抽样误差 3 一、抽样推断一、抽样推断 1、抽样是根据随机原则从调查总体中抽取部分、抽样是根据随机原则从调查总体中抽取部

2、分 单位进行观察,并根据其结果推断总体数量特征单位进行观察,并根据其结果推断总体数量特征 的一种非全面调查方式。的一种非全面调查方式。 n按随机原则抽样总体。保证了样本的代表性按随机原则抽样总体。保证了样本的代表性 n以样本估计总体。以样本估计总体。 n具有准确的估计区间和可靠性具有准确的估计区间和可靠性 4 2、抽样调查作用抽样调查作用 在实际中,抽样调查应用非常广泛:在实际中,抽样调查应用非常广泛: n适用于某些不必采用全面调查的现象。适用于某些不必采用全面调查的现象。 例如:市场购买力调查、人口流量调查、客户满意例如:市场购买力调查、人口流量调查、客户满意 度调查度调查 n适用于某些有破

3、坏性的调查。如:工业产品质量适用于某些有破坏性的调查。如:工业产品质量 调查调查 n对全面调查资料进行复核。对全面调查资料进行复核。如:人口普查之后的抽如:人口普查之后的抽 样调查样调查 n对要求资料信息及时性很强的现象进行调查。对要求资料信息及时性很强的现象进行调查。 如:产品验收检查、商品社会需求量调查如:产品验收检查、商品社会需求量调查 5 统计推断过程统计推断过程 6 二、总体和样本二、总体和样本 总体与总体参数总体与总体参数 n总体唯一性总体唯一性, ,不可知性不可知性 n总体单位数目用总体单位数目用 N n总体参数是研究者想要了解的总体的某种特征值总体参数是研究者想要了解的总体的某

4、种特征值, ,有均有均 值值( ( ) )、标准差、标准差( ( ) )、总体比例、总体比例( (P)P)等等, ,是是常数常数 样本与统计量样本与统计量 n从总体中抽取的一部分元素的集合从总体中抽取的一部分元素的集合 n构成样本的元素构成样本的元素 ( (个体个体) ) 的数目称为样本容量的数目称为样本容量, ,用用 n n样本的随机性不确定性样本的随机性不确定性 n样本统计量有样本均值样本统计量有样本均值( x)、标准差标准差(s)、比例比例(p)等等, ,根根 据样本数据计算出来的一个量据样本数据计算出来的一个量, ,是是随机变量随机变量 7 三、总体参数和样本统计量三、总体参数和样本统

5、计量 平均数:平均数: n 比例指标的标准差比例指标的标准差 )1 (PP n 比例指标的标准差比例指标的标准差 )1 (pps 8 四四、重复抽样和不重复抽样重复抽样和不重复抽样 根据抽样的方法分为根据抽样的方法分为 1、重复(置)抽样:从总体中随机抽取一个单、重复(置)抽样:从总体中随机抽取一个单 位后,把他放回去,再从总体中抽选。位后,把他放回去,再从总体中抽选。 每一次抽选同一单位有被重复抽中的可能每一次抽选同一单位有被重复抽中的可能 2、不重复(置)抽样:对已经抽取出来的样本、不重复(置)抽样:对已经抽取出来的样本 单位不再放回去,而从剩余的总体单位中抽单位不再放回去,而从剩余的总体

6、单位中抽 选。选。 同一单位不会有被重复抽中。同一单位不会有被重复抽中。 9 五五、样本容量与样本数目样本容量与样本数目 1、样本容量、样本容量(n ) ) :一个样本中所包含的个别单位数目:一个样本中所包含的个别单位数目 如:在研究居民消费水平时,随机抽取如:在研究居民消费水平时,随机抽取2000户来进行调查,户来进行调查, 这这2000户就构成一个样本,样本容量户就构成一个样本,样本容量=2000 n n 30称大样本,称大样本, n 32 中心极限定理中心极限定理 33 6.4 抽样误差(抽样误差(随机误差)随机误差) 由于估计依赖于样本数据,估计总是含有误差,因由于估计依赖于样本数据,

7、估计总是含有误差,因 此,对可能的误差的评价是必要的。此,对可能的误差的评价是必要的。 n登记性误差登记性误差 n代表性误差:代表性误差: 系统性误差、随机误差系统性误差、随机误差 一一. . 抽样误差抽样误差 二二. .抽样平均误差抽样平均误差( (抽样标准误差抽样标准误差) ) 三三. .抽样极限误差抽样极限误差 四、抽样误差的影响因素四、抽样误差的影响因素 34 1 1抽样误差抽样误差 抽样误差抽样误差具体的样本指标和总体指标之间的具体的样本指标和总体指标之间的 差异。差异。 是在遵循了随机原则的情况下,由于样本结是在遵循了随机原则的情况下,由于样本结 构与总体结构的不完全一致所产生的。

8、构与总体结构的不完全一致所产生的。 n抽样误差不可消除抽样误差不可消除 n每一次抽样的实际误差是无法计算的每一次抽样的实际误差是无法计算的 n实际中计算抽样平均误差和抽样极限误差实际中计算抽样平均误差和抽样极限误差 35 二二. .抽样平均误差抽样平均误差( (抽样标准误抽样标准误) ) 1、抽样平均误差抽样平均误差-反映样本指标与总体指标的平反映样本指标与总体指标的平 均误差程度。均误差程度。 n所有可能的样本指标的标准差,也称所有可能的样本指标的标准差,也称抽样标准误抽样标准误 n测度所有样本指标的离散程度测度所有样本指标的离散程度 n小于总体标准差小于总体标准差 计算公式计算公式 (与抽

9、样的方法有关)(与抽样的方法有关) 重复抽样重复抽样: 不重复抽样不重复抽样: 36 1、抽样极限误差抽样极限误差-指一定概率下样本统计量与指一定概率下样本统计量与 被估计总体参数离差的可能范围被估计总体参数离差的可能范围 三三. .抽样极限误差抽样极限误差 n 离差愈小表明估计的准确度愈高离差愈小表明估计的准确度愈高 n 估计误差超过一定的限度参数估计就会失去价值估计误差超过一定的限度参数估计就会失去价值 n 也不是误差愈小就是愈好的估计也不是误差愈小就是愈好的估计 37 估计粮食亩产量估计粮食亩产量600公斤,允许误差范公斤,允许误差范 围围6 公斤,就意味着如果公斤,就意味着如果 实际亩

10、产量在实际亩产量在594- - 606斤之间都应该认为估计是有效的。斤之间都应该认为估计是有效的。 估计区间(置信区间)估计区间(置信区间):594 606 误差率误差率=6/600=1% 估计精度估计精度=1-1%=99% 38 2. 极限误差标准化极限误差标准化 极限误差标准化极限误差标准化-极限误差与抽样标准误极限误差与抽样标准误 差的比值差的比值:-:-称称概率度(概率度(Z) xx x x Z PP P Pp Z 0)(ZE1 2 Z 可以证明可以证明: n 即变量即变量 Z 服从均值为服从均值为0, 方差等于方差等于1的标准正态布的标准正态布 Z= 1时时, , P(1)= 68.

11、27% Z= 2时时, , P(2)= 95.45% Z= 3时时, , P(3)= 99.73% 39 上述极限误差可以表示为: xx x 则有 xx xx pp pPp pp PpP 上式恒等于 40 正态分布函数正态分布函数 n正态分布函数正态分布函数 n标准正态分布函数标准正态分布函数 2 2 )( 2 1 2 1 )( x exf 2 2 1 2 1 )( x ex 41 标准正态分布图标准正态分布图 42 样本均值的抽样分布样本均值的抽样分布 样本均值的分布样本均值的分布 x 的的 取值取值 x 的的 个数个数 x 取值的取值的 概率概率(P) 1 1 1/16 1.5 2 2/1

12、6 2 3 3/16 2.5 4 4/16 3 3 3/16 3.5 2 2/16 4 1 1/16 的的 抽抽 样样 分分 布布 43 根据以上分布资料可以写出样本均值落在总体均值根据以上分布资料可以写出样本均值落在总体均值 的两侧任何一个误差范围内的概率的两侧任何一个误差范围内的概率P,P,例如例如: : 44 即即: 45 四四. . 影响抽样误差的因素影响抽样误差的因素 n总体数据的离散程度,总体数据的离散程度,用用 来测度来测度 n样本容量样本容量 n n置信水平置信水平 (1 - ),影响影响 Z 的大小的大小 n抽样方式与方法抽样方式与方法 46 6.5 抽样设计抽样设计 一、简

13、单随机抽样一、简单随机抽样 二、类型抽样(分层抽样)二、类型抽样(分层抽样) 三、等距抽样(机械抽样)三、等距抽样(机械抽样) 四、整群抽样四、整群抽样 47 一、简单随机抽样一、简单随机抽样 简单随机抽样又称纯随机抽样,它是完全遵循随机简单随机抽样又称纯随机抽样,它是完全遵循随机 原则,直接从总体各个个体中抽取样本个体,并原则,直接从总体各个个体中抽取样本个体,并 保证每个个体都有同等概率被抽中。保证每个个体都有同等概率被抽中。 常用抽签法、随机数表取数法、电子计算机取数常用抽签法、随机数表取数法、电子计算机取数 法等法等 n最符合随机原则,是其他抽样方法的基础最符合随机原则,是其他抽样方法

14、的基础 n要求有一个包含全部要求有一个包含全部N个单位的抽样框个单位的抽样框 n不能保证所抽的样本单位在总体中有较均匀的不能保证所抽的样本单位在总体中有较均匀的 分布分布 n当当N较大、数据差异程度较大的总体不宜使用较大、数据差异程度较大的总体不宜使用 48 二、类型抽样(分层抽样)二、类型抽样(分层抽样) 1 1、类型抽样:先按一定标志对总体各单、类型抽样:先按一定标志对总体各单 位进行分类,然后分别从每一类按随位进行分类,然后分别从每一类按随 机原则抽取一定单位构成样本机原则抽取一定单位构成样本。 如:农产量抽样按地区分类;如:农产量抽样按地区分类; 产品质量调查按加工车间分类产品质量调查

15、按加工车间分类. . n分组法与抽样原理的结合,可以提高样本的代分组法与抽样原理的结合,可以提高样本的代 表性表性 n能用较少的抽样单位获得较精确的推断结果能用较少的抽样单位获得较精确的推断结果 n缩小组内差异,扩大组间方差,提高抽样效果缩小组内差异,扩大组间方差,提高抽样效果 49 2、类型抽样统计量计算公式、类型抽样统计量计算公式 n1 n nx x ii 均值 n np p ii 比例 n ns s ii i 2 2 方差 类型抽样的抽样误差受组内方差大小的影响类型抽样的抽样误差受组内方差大小的影响 组内单位数 组内均值 : : i i n x 组内比例 : i p 组内方差: 2 i

16、s 50 分类抽样例题分类抽样例题 某乡粮食播种面积某乡粮食播种面积20000亩亩, ,现按平原和山现按平原和山 区面积比例抽取其中区面积比例抽取其中2%, ,求样本平均亩产量和抽样求样本平均亩产量和抽样 平均误差。平均误差。 全部面积全部面积 (亩)(亩)N 样本面积样本面积 (亩)(亩)n n 样本平均亩产样本平均亩产 (公斤)(公斤)xi 亩产标准差亩产标准差 (公斤)(公斤)s si i 平原平原 14000 280 560 80 山区山区 6000 120 350 150 合计合计 20000 400 497 106 51 52 三、等距抽样(机械抽样)三、等距抽样(机械抽样) 等距

17、抽样:先按某标志对总体各单位进行顺序排等距抽样:先按某标志对总体各单位进行顺序排 列,然后按固定间隔来抽取样本单位。列,然后按固定间隔来抽取样本单位。 n按有关标志抽取按有关标志抽取-误差按分层抽样方法计算误差按分层抽样方法计算 n按无关标志抽取按无关标志抽取-误差按简单随机抽样方法计算误差按简单随机抽样方法计算 如:农产量抽样调查按田间的地理顺序取样;如:农产量抽样调查按田间的地理顺序取样; 家计调查按街道的门牌号码抽取调查户家计调查按街道的门牌号码抽取调查户 n组织简便,易于实施组织简便,易于实施 n随机性只体现在第一个样本单位随机性只体现在第一个样本单位 n要注意避免抽样间隔与现象本身的周期性节奏重合,要注意避免抽样间隔与现象本身的周期性节奏重合, 破坏样本的代表性,引起系统性偏差或整体偏差破坏样本的代表性,引起系统性偏差或整体偏差 53 四、整群抽样四、整群抽样 整群抽样:将总体各单位划分若干群,然后整群抽样:将总体各单位划分若干群,然后 从其中抽取部分群,对中选群的所有单位从

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论