简单随机抽样_第1页
简单随机抽样_第2页
简单随机抽样_第3页
简单随机抽样_第4页
简单随机抽样_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第2章 简单随机抽样 2.1 定义和符号 2.2 简单估计量及其性质简单估计量及其性质 2.3 比率估计量及其性质估计量及其性质 2.4 回归估计量及其性质估计量及其性质 2.5 简单随机抽样的实施简单随机抽样的实施 简单随机抽样简单随机抽样 用于估计总体均值的统计量是样本均值。-两者 同形同构之意 直接从总体(而不是层之间的子总体)抽取单 元(而不是一群个体的大单元)- 单纯之意 在任何其他概率抽样方式或多或少包含简单随 机抽样的成分,如分层抽样在每层内部均采用 简单随机抽样,整群抽样以群为单位进行简单 随机抽样。 -基本之意 许多日常场合,采用的抓阄摇号等都是简单随 机抽样。-操纵简单之意

2、 2.1 定义和符号定义和符号 所讨论的总体是抽样总体(实查总体): (1)具体总体 (2)有限总体 (3) 与抽样框存在一一对应关系 单元:指构成抽样总体的抽样单元。 抽样单元并不总是等于个体, 有时可 能包括几个或很多个个体,个体为最 小的不可再分的单元 2.1 定义和符号定义和符号 书上,简单随机抽样三个等价定义: 设有限总体共有 N 个单元, 1. 一次整批取n各单元,使每个单元被抽中的概 率相等,任何n个单元被抽中的概率也相等 2. 逐个不放回抽取单元,每次抽取到尚未入群 的任何一个单元的概率都相等,直到抽足n个 单元为止 3. 抽取n 个单元的所有不同组合构造所有可能 的 个样本,

3、从这 个样本中随机抽取1个 样本,使每个样本被抽中的概率都等于 n N C n N C 1/ n N C 2.1 定义和符号定义和符号 简单随机抽样 设有限总体共有 N 个单元,从中抽取容 量为 n 个单元组成样本,使得每一个可 能的样本都有相同的概率被抽中,这种 抽样方法就是简单随机抽样(simple random sampling) 。 具体抽样时,通常是逐个抽取样本单元, 直到抽满n个单元为止。 简单随机抽样分为:有放回抽样和无放 回抽样(with/without replacement) 放回简单随机抽样在每次抽取样本单元 时,都将前一次抽取的样本单元放回总 体,因此,总体的结构不变,

4、抽样是 进行的,每个样本被抽中的概率 为1/N. 在不放回简单随机抽样中,每个被抽中 的单元不再放回总体,而是从总体剩下 的单元中进行抽样,因此,每次抽样时 总体中单元个数不同,抽样是不独立的, 但可以证明每个单元被抽中的概率仍然 为1/N。 2.1 定义和符号定义和符号 r-11 r-11211 P(r-1r =PA A .A =PA |A .AP A |AP A 11211 =. 121 r r NrNN NrNrNNN 前次未被抽中而第 次被抽中) () () () ( ) P(第一次未被抽中而第二次被抽中) 111 = 1 N NNN 111 22 =P A A =PA |AP A()

5、 () ( ) 2.1 定义和符号定义和符号 设总体有5个单元(1、2、3、4、5),按 放回简单随机抽样的方式抽取2个单元, 则所有可能的样本为 个 (考虑样本单元的顺序): 1,12,13,14,15,1 1,22,23,24,25,2 1,32,33,34,35,3 1,42,43,44,45,4 1,52,53,54,55,5 2 525 n N 例1:放回简单随机抽样 2.1 定义和符号定义和符号 设总体有5个单元(1、2、3、4、5),按 不放回简单随机抽样的方式抽取2个单元, 则所有可能的样本为 个 1,22,33,44,5 1,32,43,5 1,42,5 1,5 2 5 5

6、4 10 2 1 n N CC 例2. 不放回简单随机抽样 2.1 定义和符号定义和符号 简单随机抽样的抽取原则: (1)按随机原则取样; (2)每个抽样单元被抽中的概率都是已 知的或事先确定的; (3)每个抽样单元被抽中的概率都是相 等的 不放回简单随机抽样的样本量要受总体 大小的限制。在实际工作中,更多的 采用不放回简单随机抽样。 2.1 定义和符号定义和符号 - 约定大写表示总体 - 小写表示样本 12 1 1 N N i i YYY YY NN n yyy y n y n n i i 21 1 1 2.2 简单估计量及其性质简单估计量及其性质 总体均值 样本均值 总体均值 的简单估计量

7、 Y 12 1 1 n n i i yyy Yyy nn N N i i YYYYY 21 1 n n i i yyyy 21 1 总体总值 样本总值 总体总值的 简单估计量为1 n i i N YNyy n Y 简单估计量 2 22 1 1 11 N i i N SYY NN 2 2 1 1 n i i syy n 总体方差 样本方差 修正总体方差 修正样本方差 2 2 1 1 N i i YY N n i i yy n s 1 2 2 1 1 简单估计量 N i i Y NN A P 1 1 10或 i Y n i i y nn a p 1 1 10或 i y X Y X Y X Y R

8、N i i N i i 1 1 1 1 n i i n i i y y Rr x x 总体比例 (rate) 样本比例 总体比率 (ratio) 样本比率 简单估计量 某一类特征的单元占总体单元数中的比例P 总体中具有研究特征的单元总数 总体中具有研究特征的比例 总体比例P的估计为(比例估计化为均值估计) Y i i 1 0 ,第 个单元具有所考虑的特征; ,否则 1 N i i A N AYY PY 1 n a in i PpyyY 简单估计量 判断下面要估计的总体目标量分别属于什么 类型? 调查城市居民家庭平均用电量。 估计湖中鱼的数量。 估计居民家庭用于做饭菜及饮用的用水 量占家庭总用水

9、量的比重。 检测食盐中碘含量。 估计婴儿出生性别比。 简单估计量 例3. 设总体为0,1,3,5,6,计算总体均值 =3、总 体方差 和 ;给出全部 的样本 验证 及 。 2 5.2 2 6.5S 2n E yY 22 E sS 1010.5-2.50.5 2031.5-1.54.5 3052.5-0.512.5 4063018 5132-12 615308 7163.50.512.5 835412 9364.51.54.5 10 平均 565.52.50.5 306.5 方差1.95 样本编号单元1单元2样本均值 样本方差 yY 简单估计量 一、对总体均值的估计一、对总体均值的估计 引理2.

10、1: 从N个总体中抽取n个简单随机样 本,则总体中每个特定单元人样的概率为 n/N,两个特定单元人样的概率为 (1) (1) n n N N 简单估计量的性质简单估计量的性质 引理2.2:在简单随机抽样中,引入随机变量 则 1 0 i i i Y Y 如果 入 如果 不入 N n EE ii )()( 2 (1)(0) ii nNn PP NN 样 样 2.2 简单估计量及其性质简单估计量及其性质 )1 ( 1 1 )1 ()()()(),cov( 2 N n N n NN n N n N n EEE jijiji 1 ()(1; 2222; NN ii ii NN ii ii N i YNP

11、YNP Y YYYYNYNP YNYNP 2.2 简单估计量及其性质简单估计量及其性质 总体方差: 22 1 22 1 22 1 () 1 1 (2) 1 1 2 1 1 (1) 1 N i i N ii i SYY N YYYY N NPNPNP N NPP N 2.2 简单估计量及其性质简单估计量及其性质 例:某超市新开张一段时间之后,为改进销售 服务环境,欲调查附近几个小区居民到该超 市购物的满意度,该超市与附近几个小区的 居委会取得联系,在总体中按简单随机抽样 抽取了一个大小为=200人的样本,调查发现 对该超市购物环境表示满意或基本满意的居 民有130位,要估计对该超市购物环境持肯定

12、 态度居民的比例,并在置信度95%下,给出 估计的近似置信区间、极限绝对误差。假定 这时的抽样比可以忽略。 2.2 简单估计量及其性质简单估计量及其性质 95%近似置信区间为 58.37%,71.63% %65 200 130 n a p 11 0.65 0.350.0338 1200 1 f V ppq n 0338. 096. 165. 0 2.2 简单估计量及其性质简单估计量及其性质 (1) 1.96 pp n p 2.3 比率估计量及其性质估计量及其性质 主要变量的总体均值 的比率估计量: 主要变量的总体均值 Y 的比率估计量: 引理2.3:对于简单随机抽样,n较大时, 的期望为: R

13、r ( )( )( ) y Y xX E RE rER Y 1 y RRxN YyXX R RR YN YX R 例:设所有可能样本数为8个 不是无偏的 I 1111 2240.5 3250.4 4350.6 5360.5 6360.5 7480.5 86130.46 平均360.56 i y i x i R 31 86 ( )0.55770.5 i E RRR 2.3 比率估计量及其性质估计量及其性质 定理2.6:对于简单随机抽样,n较大时, 的期望为: 推论2.11:对于简单随机抽样,n较大时, 的期望为 RR Yy ()() RR E YE yXRY RR YNy ()() RR E Y

14、E NyNXRY 2.3 比率估计量及其性质估计量及其性质 引理2.4:对于简单随机抽样,n较大时, 的方差为: 其中, Rr 2 2 12 11 1 1 1222 1 ( )( )() (2) N f iinN X i f xxn X V RV rYRX SR S SR S 2222 11 11 11 1 1 1 () ,() ()() , yx x NN ixiNN ii N S yxiiNS S i SYYSXX SYYXX 2.3 比率估计量及其性质估计量及其性质 定理2.7:对于简单随机抽样,n较大时, 的方差为 推论2.12:对于简单随机抽样,n较大时, 的方差为 RR YNy R

15、R Yy 122 1 1 1 ()() N f RiinN i V YNYRX 12 1 1 1 ()() N f RiinN i V yYRX 2.3 比率估计量及其性质估计量及其性质 很难比较哪种方法好 2 2 12222 11 12222 22 ()()(2) ()()(2) f Ryxxn f X Ryxxn x VyX V RsR sR s VyX VRsRsR s 2 2 12222 1 12222 2 ()(2) ()(2) f Ryxxn f X Ryxxn x V YNsR sR s VYNsRsR s 2 2 1222 1 1 1222 1 2 ()(2) ()(2) f

16、yxxn X f yxxn x VRsR sR s VRsRsR s 两套公式 2.3 比率估计量及其性质估计量及其性质 2.5 简单随机抽样的实施方法 样本容量的确定原理 当n越接近于N,则抽样误差就越接近于零。公式 影响样本容量n的三个基本因素:总体规模N,目 标抽样误差 和总体方差S2 22 11 1 () nN f V YSS n 2 11 V Y nN S VY 未知 另一方面, 目标抽样误差 与总体方差S2有关 估计的精度水平, 误差限度(绝对误差限度d或相 对误差限度r)和置信度有关系: 即: 于是 影响样本容量n的因素:总体规模N,置信度 绝对误差限度d 和总体方差S2 VY

17、| |11 y Y d V YV Y PyYdP /2 /2 dd Z V Y ZV Y 2 22 /2 11d nN ZS 1 2.5 简单随机抽样的实施方法 例: 表: 例: 表: 2 22 /2 11d nN ZS 2 10000, 195%,0.25NS d0.140.100.040.03 n4995566964 10000, 195%,0.05Nd S200.090.160.210.240.25 n113624313356370 2.5 简单随机抽样的实施方法 例: 表: 不同抽样方式会影响样本容量 设计效应 一般地,不能得到有效信息的原因有: -抽样框存在缺陷 -受访者调查期间不在

18、 -访问员的疏失 -设计和管理上的缺陷(不总是可以完全避免) 2 195%,0.05,0.25dS N501005001000 n4479217278 2.5 简单随机抽样的实施方法 样本量的确定步骤: 确定估计的精度水平, 包括误差限度(绝对误 差限度d或相对误差限度r)和置信度 按照保守(样本容量宁大勿小),预估S2 -利用先前的调查结果和经验 -利用预调查结果 -利用同类或相似或有关的二手数据的结果 -利用某些理论上的结论(总体比例p(1-p)=0.25) -利用有经验的专家的判断 1 2.5 简单随机抽样的实施方法 最大绝对误差(绝对误差限 )或 最大相对误差(相对误差限 ) 相对误差

19、限度r 样本量: d r Pd 1Pr 1 2.5 简单随机抽样的实施方法 y Y d YY rdrY 2 2 2222 /2/2 () 111 rY d nNN ZSZS 3. 初始样本量n0计算: 4. 确定抽样方式, 调整样本容量, 设计效应 deff=任意抽样方式抽样方差/简单随机抽样的抽样方差 -简单随机抽样: deff=1 -分层抽样:deff1 - 效率低 -系统抽样:deff1 2 22 /2 1 0 1 / () d N ZS n 10 nndeff 2.5 简单随机抽样的实施方法 Deff (基什L. Kish提出 )的作用: - 评价抽样设计的一个依据, 如果deff1

20、- 比简单随机抽样的效率低 - 计算样本量 如多阶段抽样的 Deff大约在22.5之间。 n= n(deff) n为简单随机抽样所需样本量。 2.5 简单随机抽样的实施方法 放回简单随机抽样的deff为: 常用于复杂抽样样本量的确定;在一 定精度条件下,简单随机抽样所需的 样本量比较容易得到,复杂抽样的样 本量为, nN N NnSnN NnSN deff 1 )()( )() 1( 2 2 deffnn 2.5 简单随机抽样的实施方法 5. 判定回答率, 调整样本容量 6. 对分组数据分别计算样本量, 再相加得到总样 本容量。 7. 考虑权衡费用、时间、资源等。再计算样本量。 21 /nnr 2.5 简单随机抽样的实施

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论