抽样调查第2章 简单随机抽样_第1页
抽样调查第2章 简单随机抽样_第2页
抽样调查第2章 简单随机抽样_第3页
抽样调查第2章 简单随机抽样_第4页
抽样调查第2章 简单随机抽样_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、整理课件2.1 简单随机抽样的几个基本定理2.2 简单随机抽样的实现2.3 简单估值法2.4 区间估计与样本量的确定2.5 比估计2.6 差估计与回归估计整理课件简单随机抽样的含义定义与符号几个基本定理整理课件u“简单”的含义有关理论简单,抽样方式单纯、易操作u随机抽样放回有序、放回无序、 不放回有序、 不放回无序l放回无序、不放回有序通常没有使用价值;l“放回有序”又称“放回简单随机抽样(SRSWR)”,所有可能样本数量最多,但理论结果简单;l“不放回无序”又称“不放回简单随机抽样(SRSWOR)”,所有可能样本数量最少,操作最简单;l本书的简单随机抽样指的是SRSWOR.整理课件 从总体的

2、N个单元中,一次整批地抽取n个单元,使任何一个单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概率也都相等,这种抽样称为简单随机抽样。 按照从总体的N个单元抽取n个单元的所有可能不同组合构造所有可能的CNn个样本,从CNn个样本随机抽取1个,使每个样本被抽中的概率等于1/ CNn ,这种抽样成为简单随机抽样。 从一个单元数为N的总体中逐个抽取单元且无放回,每次都在所有尚未进入样本的单元中等概率地抽取直到n个单元抽完,这种抽样称为简单随机抽样。整理课件定义3定义2定义1整理课件u符号, 21NYYY有限总体,1 1NiiYNY总体均值niiyny11 样本均值u抽样的示性函数未被抽中个

3、单元第,被抽中个单元第iiiYiYiD0, 1指示了一个具体样本,21NDDDD整理课件u线性估计与非线性估计 不借助任何辅助变量,对总体进行直接估计,用样本特征的线性组合估计总体特征称为;而借助辅助变量,用样本特征的非线性组合表示总体特征,称为。u简单估计 对简单随机抽样的线性估计有“简单线性估计(Simple linear estimate)”之称,简称。yYyY为的为的如:SLE ,SLE整理课件 对简单随机抽样,有:NjijiNNnnDDPNiNnDPjii, 2 , 1,) 1() 1(1, 1, 2 , 1,1,Nn每一单元的入样概率为,) 1() 1(NNnn概率为任意两单元同时

4、入样的不独立与jiDD整理课件 对简单随机抽样,有:(),var()1,1,2,cov(,)1, ,1,2,(1)iiijnnnE DDinNNNnnD Dij i jnN NN 整理课件 ; 0)() 1 (YyE12121, ,1|( =1,2,)0,nNiNiiiy yyY YYYNMYM iNYYN设是来自总体的简单随机样本, 有界,即存在一个与 无关的数,使且则:;111)()2(22nOSNnyEY整理课件213231)2)(1()2)()() 3(nOYNNNnnNnNyENii221231432241) 3)(2)(1() 1)()(1( 3 ) 3)(2)(1(6) 16()

5、()()4(nOYNNNNnnNnNnYNNNNnnNnNnNyENiiNii.0较简洁了使定理形式不是本质条件,只是为Y整理课件有:一般情况下)0(Y;)() 1 (YyE22)1 (111)var()2(YYSfnSNnny其中称为整理课件抽签法统计软件抽样随机数法其它方法整理课件 做N个签,分别编上1到N号,完全均匀混合后,一次同时抽取n个签 ,或一次抽取一个签但不把这个签放回,接着抽第2个、第3个、,直到抽足n个为止。(1)实施较麻烦,N较大时更不实用;(2)等概率性很大程度依赖于抽样个体是否摇匀。整理课件例:某校为了解学生身体素质的基本情况,从全校学生总数N=1003人中抽选一个简单

6、随机样本n=100人进行体检。整理课件u使用随机数表6554738844766847931195846758376218032361056305424463447898093605602112266199624453454436447874092558056021132661996244765822578627634345607479596950724726956088693980456992933812575632362258695072472677938116610597788443296399166560829419256110391058488177603134313656983126

7、20032735161117563158258790随 机 数 表 是 数 字09随机排列而成的,这些数字在表中的一位数、两位数、三位数等随机出现并有相同的概率。例:从N=345的总体中抽取一个n=15的简单随机样本。整理课件u使用计算机随机数u使用随机数骰子92451580618243739067底视图底视图顶视图顶视图整理课件u永久随机数法 抽样者给总体的第i个个体赋予一个0,1上的随机数Ri,Ri与第i个个体永久对应,抽样设计时,确定好抽样比f,Ri30就会有不错的近似.总值Y与比例P的区间估计是何形式?整理课件例1 为合理调配电力资源,某市欲了解5万户居民日用电量.用简单随机抽样抽取了

8、300户进行调查,得到日用电量平均值为9.5kwh,样本方差为206.求用电量平均值的置信度为95%的区间估计.例2 某大学有1万名本科生,现欲估计暑假期间参加了各类英语培训的学生所占比例,随机抽取了200名学生调查,得到p=0.35,求全校参加培训学生比例P的置信度为95%的区间估计。整理课件u按绝对精度决定样本量给定绝对精度d,在置信度1-,要求 1|dYyP 1222/12222/1SuNdSun 2222/1dSuS2未知时,可用察往法、预查法、类推法获得整理课件u按相对精度决定样本量给定相对精度h,在置信度1-,要求 1hYYyP 1222/12222/1CuNhCun 2222/1

9、hCu在缺乏总体的相关信息时,应该考虑取最大的n整理课件u考虑费用决定样本量考虑调查费用,使“总损失”达到最小21011 SNnanFFF 12FaSn 整理课件例3(续社区居民食物消费问题)将35户看作预查,(1)为使平均每月每户用于食物的支出的估计值绝对误差不差过40元,估算尚需再调查多少户?(2)为使总人数的估计值绝对误差不超过50人,还需调查多少户?(3)为使人均月收入低于500的户数所占比例的估计值相对误差不超过10%,还需调查多少户?例4 某大城市进行计算机普及率调查,若从全市数百万户家庭中,简单随机地抽取n户进行调查,为了使普及率的绝对误差不超过2%,样本量n应取多大?若估计普及

10、率在0.10.2之间,样本量应取多大?普及率在0.10.2之间,要求相对误差不超过20%,n应取多大?整理课件比估计的应用背景 比估计的性质比估计与简单估计的比较抽样方案的设计效应整理课件u使用比估计的场合(1)所需估计目标值是两个数量指标之比(2)所需估计目标值与另一指标量关系密切,以后者为辅助变量可提高估计精度u比估计的一般提法NNXXXYYY,2121nnxxxyyy,2121XRYXYXYRXY或估计为辅助变量,为目标量,Rxyr估计可用样本比值 整理课件则有使)(无关的数存在与在简单随机抽样下,若定理), 2 , 1(| ,0 1NiMYMXMNii;1),cov()() 1 (nO

11、XxrRrE;,1 1)(1111)()2(2/31222NnfnOnORXYNXnfRrENiii其中.1)(11)(11) 3(1212nORXYNrxynENiiiniii整理课件;,) 1 (defYXryXRrR估计可用已知时的渐进无偏估计量是NiiiRNiiiRXYNnfyVRXYNXnfrMSE12122)(111)(,)(1111)()2(22121111(3) ( )() ,111()()1niiinRiiifv ryrxnXnfv yyrxnnu关于定理的几点说明2221=2yxxyfsr srsn整理课件例1 (1)用比估值法估计社区居民用于食物消费的支出,以每户人数作为

12、辅助变量. (2)用比估值法估计平均每月每户用于食物的支出。练习1 在20世纪90年代初的一项工资研究中,人们发现在IT行业,从业者现薪与起薪之间相关系数高达0.88.已知某IT行业474名员工平均起薪为17016.00元/年,现根据对员工简单随机抽取的100人现薪的调查结果,估计该企业员工的现薪平均水平.分别求出在简单估计条件和比估计条件下总体均值的95%的近似置信区间。2238482.50,18642.60,453189043.23,201430000,102802243.9yxyxyxsssY Y整理课件 估计总体的某个子总体的均值,但子总体数量未知u部分估计之比估值法NiiNiiXZR

13、11估计xzr 估计量为,100iiiYiZXi 当个体 属于子总体令,当个体 不属于子总体niiirxznxnfrv122)(1111)(例2(续例1) 估计人均收入低于500的居民户月平均食物支出.整理课件练习2 某地区对本地100家化肥生产企业尿素产量进行调查.已知去年总产量为2135吨,抽取10个企业调查今年产量,得到它们的平均产量为25吨,这些企业去年产量的平均值为22吨.用比估计法估计今年该地区化肥总产量.练习3 从某小区500户居民中抽出了20户,根据表中数据,估计平均文化支出,并比较比估计与简单估计的效率(已知全部家庭总支出平均为1600元).整理课件21)(YSnfyV222

14、1221)(111)(XYXYNiiiRSRSSRSnfRXYNnfyVYXXYSSSNiiiXYYYXXNS1)(11YXYXRCCSRSyVyV212)()(的条件为估计更差比估值法会使相关系数与相近而与值法较好;关系较密切时,用比估与较小而,21YXCCYXCYXX整理课件 对任一抽样方案,以该方案确定的总体均值(或总数)的估计量的均方偏差,与简单随机抽样简单估值法确定的估计量的均方偏差之比称为. 相应样本量的确定:)Deff(0 nn)()(DeffyVyVR如比估值法的设计效应为:续练习3:若将该样本看做预查样本,要使估计的相对误差不超过5%,采用简单估值法与比估值法各需调查多少家庭

15、?整理课件差估计回归估计整理课件u差估计的应用背景对样本亦有:)(0 xXbyyD假设Y与辅助变量X有线性关系,则XY10 xy10从而:)(1xXyY差估计量b0为一确定常数整理课件u差估计的性质)2(1)(22002xxyyDsbsbsnfyv其均方偏差为偏估计的无是均值估计在简单随机抽样下,差定理.1YyD)2(1)(22002XXYYDSbSbSnfyV均方偏差的一个无偏估计为:XYSnfyx1),cov(整理课件u回归估计的应用背景 始于Watson,以植物叶片重量为辅助变量,估计植物叶片面积XY10其估计量为程估计未知,将之看做回归方,11NiiNiiiXXYYXXB121)()(

16、假设Y与辅助变量X有线性关系:xy10对样本亦有:两式相减可得:)(1xXyY整理课件u回归估计的形式)(xXbyyLr即为回归估计代替以Bxxyyxxbniiniii121)()(整理课件u回归估计的性质,有:无关的常数为与时在简单随机抽样下,当定理),(0)(1212Nnxxnnii,1)(2nOBbENiiNiiiXXYYXXB121)()(其中整理课件,有:对总体均假定时在简单随机抽样下,当定理), 2 , 1,| ,|(0)(1312niMXMYxxniinii;1)() 1 (nOYyELr;1)1 (1)()2(2/3222nOSnfYyEYLr.1)1 ()()(21)3(2212nOSxxbyynEYniii)./(YXXYSSS其中整理课件;) 1 (的渐进无偏估计量是YyLr);1 (1)()()2(222YLrLrSnfYyEyMSE;)()(211)()3(12niiiLrxxbyynnfyv均方偏差的估计量u对定理的几点说明2211= (1) 2yf nsnn整理课件u回归估计的效率. )()(yVyVLr忽略近似误差有回归估计虽然有较小的均方偏差,但其值为近似无偏的;回归估计需调

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论