抽样调查第2章 简单随机抽样PPT课件_第1页
抽样调查第2章 简单随机抽样PPT课件_第2页
抽样调查第2章 简单随机抽样PPT课件_第3页
抽样调查第2章 简单随机抽样PPT课件_第4页
抽样调查第2章 简单随机抽样PPT课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精选,1,第二章简单随机抽样,2.1简单随机抽样的几个基本定理,2.2简单随机抽样的实现,2.3简单估值法,2.4区间估计与样本量的确定,2.5比估计,2.6差估计与回归估计,精选,2,简单随机抽样的含义,定义与符号,几个基本定理,2.1简单随机抽样的几个基本定理,精选,3,简单随机抽样的含义,“简单”的含义,有关理论简单,抽样方式单纯、易操作,随机抽样,放回有序、,放回无序、,不放回有序、,不放回无序,放回无序、不放回有序通常没有使用价值;,“放回有序”又称“放回简单随机抽样(SRSWR)”,所有可能样本数量最多,但理论结果简单;,“不放回无序”又称“不放回简单随机抽样(SRSWOR)”,所有可能样本数量最少,操作最简单;,本书的简单随机抽样指的是SRSWOR.,精选,4,定义与符号,定义3从总体的N个单元中,一次整批地抽取n个单元,使任何一个单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概率也都相等,这种抽样称为简单随机抽样。,定义2按照从总体的N个单元抽取n个单元的所有可能不同组合构造所有可能的CNn个样本,从CNn个样本随机抽取1个,使每个样本被抽中的概率等于1/CNn,这种抽样成为简单随机抽样。,定义1从一个单元数为N的总体中逐个抽取单元且无放回,每次都在所有尚未进入样本的单元中等概率地抽取直到n个单元抽完,这种抽样称为简单随机抽样。,精选,5,定义与符号,精选,6,定义与符号,符号,抽样的示性函数,精选,7,线性估计与非线性估计,定义与符号,不借助任何辅助变量,对总体进行直接估计,用样本特征的线性组合估计总体特征称为线性估计;而借助辅助变量,用样本特征的非线性组合表示总体特征,称为非线性估计。,简单估计,对简单随机抽样的线性估计有“简单线性估计(Simplelinearestimate)”之称,简称简单估计。,精选,8,几个基本定理,定理1对简单随机抽样,有:,精选,9,定理2对简单随机抽样,有:,几个基本定理,精选,10,定理3,几个基本定理,精选,11,几个基本定理,精选,12,几个基本定理,其中称1-f为有限总体校正系数(finitepopulationcorrectionfactor,fpc),精选,13,抽签法,统计软件抽样,随机数法,2.2简单随机抽样的实现,其它方法,精选,14,抽签法,做N个签,分别编上1到N号,完全均匀混合后,一次同时抽取n个签,或一次抽取一个签但不把这个签放回,接着抽第2个、第3个、,直到抽足n个为止。,缺点:,(1)实施较麻烦,N较大时更不实用;,(2)等概率性很大程度依赖于抽样个体是否摇匀。,精选,15,统计软件抽样,例:某校为了解学生身体素质的基本情况,从全校学生总数N=1003人中抽选一个简单随机样本n=100人进行体检。,开始抽样,精选,16,随机数法,使用随机数表,随机数表是数字09随机排列而成的,这些数字在表中的一位数、两位数、三位数等随机出现并有相同的概率。,例:从N=345的总体中抽取一个n=15的简单随机样本。,精选,17,随机数法,使用计算机随机数,开始抽样,使用随机数骰子,底视图,顶视图,精选,18,永久随机数法,抽样者给总体的第i个个体赋予一个0,1上的随机数Ri,Ri与第i个个体永久对应,抽样设计时,确定好抽样比f,Ri30就会有不错的近似.,总值Y与比例P的区间估计是何形式?,精选,37,区间估计,例1为合理调配电力资源,某市欲了解5万户居民日用电量.用简单随机抽样抽取了300户进行调查,得到日用电量平均值为9.5kwh,样本方差为206.求用电量平均值的置信度为95%的区间估计.,例2某大学有1万名本科生,现欲估计暑假期间参加了各类英语培训的学生所占比例,随机抽取了200名学生调查,得到p=0.35,求全校参加培训学生比例P的置信度为95%的区间估计。,精选,38,样本量的确定,按绝对精度决定样本量,给定绝对精度d,在置信度1-,要求,S2未知时,可用察往法、预查法、类推法获得,精选,39,样本量的确定,按相对精度决定样本量,给定相对精度h,在置信度1-,要求,在缺乏总体的相关信息时,应该考虑取最大的n,精选,40,样本量的确定,考虑费用决定样本量,考虑调查费用,使“总损失”达到最小,精选,41,样本量的确定,例3(续社区居民食物消费问题)将35户看作预查,(1)为使平均每月每户用于食物的支出的估计值绝对误差不差过40元,估算尚需再调查多少户?(2)为使总人数的估计值绝对误差不超过50人,还需调查多少户?(3)为使人均月收入低于500的户数所占比例的估计值相对误差不超过10%,还需调查多少户?,例4某大城市进行计算机普及率调查,若从全市数百万户家庭中,简单随机地抽取n户进行调查,为了使普及率的绝对误差不超过2%,样本量n应取多大?若估计普及率在0.10.2之间,样本量应取多大?普及率在0.10.2之间,要求相对误差不超过20%,n应取多大?,精选,42,比估计的应用背景,比估计的性质,比估计与简单估计的比较,2.5比估计,抽样方案的设计效应,精选,43,比估计的应用背景,使用比估计的场合,(1)所需估计目标值是两个数量指标之比,(2)所需估计目标值与另一指标量关系密切,以后者为辅助变量可提高估计精度,比估计的一般提法,精选,44,比估计的性质,精选,45,比估计的性质,关于定理的几点说明,精选,46,比估计的性质,例1(1)用比估值法估计社区居民用于食物消费的支出,以每户人数作为辅助变量.(2)用比估值法估计平均每月每户用于食物的支出。,练习1在20世纪90年代初的一项工资研究中,人们发现在IT行业,从业者现薪与起薪之间相关系数高达0.88.已知某IT行业474名员工平均起薪为17016.00元/年,现根据对员工简单随机抽取的100人现薪的调查结果,估计该企业员工的现薪平均水平.分别求出在简单估计条件和比估计条件下总体均值的95%的近似置信区间。,精选,47,比估计的性质,估计总体的某个子总体的均值,但子总体数量未知,部分估计之比估值法,例2(续例1)估计人均收入低于500的居民户月平均食物支出.,精选,48,比估计的性质,练习2某地区对本地100家化肥生产企业尿素产量进行调查.已知去年总产量为2135吨,抽取10个企业调查今年产量,得到它们的平均产量为25吨,这些企业去年产量的平均值为22吨.用比估计法估计今年该地区化肥总产量.,练习3从某小区500户居民中抽出了20户,根据表中数据,估计平均文化支出,并比较比估计与简单估计的效率(已知全部家庭总支出平均为1600元).,精选,49,比估计与简单估计的比较,精选,50,抽样方案的设计效应,对任一抽样方案,以该方案确定的总体均值(或总数)的估计量的均方偏差,与简单随机抽样简单估值法确定的估计量的均方偏差之比称为方案的设计效应.,相应样本量的确定:,如比估值法的设计效应为:,续练习3:若将该样本看做预查样本,要使估计的相对误差不超过5%,采用简单估值法与比估值法各需调查多少家庭?,精选,51,差估计,回归估计,2.6差估计与回归估计,精选,52,差估计,差估计的应用背景,对样本亦有:,假设Y与辅助变量X有线性关系,则,从而:,差估计量,b0为一确定常数,精选,53,差估计,差估计的性质,均方偏差的一个无偏估计为:,精选,54,回归估计,回归估计的应用背景,始于Watson,以植物叶片重量为辅助变量,估计植物叶片面积,假设Y与辅助变量X有线性关系:,对样本亦有:,两式相减可得:,精选,55,回归估计,回归估计的形式,精选,56,回归估计,回归估计的性质,精选,57,回归估计,精选,58,回归估计,对定理的几点说明,精选,59,回归估计,回归估计的效率,回归估计虽然有较小的均方偏差,但其值为近似无偏的;,回归估计需调查辅助变量X,时间、人力、物力会增加,计算量也大得多,因而实践上回归估计并非总是好的估值法;,精选,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论