抽样设计的理论与方法二_第1页
抽样设计的理论与方法二_第2页
抽样设计的理论与方法二_第3页
抽样设计的理论与方法二_第4页
抽样设计的理论与方法二_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样设计的理论与方法中国科学院数学与系统科学研究院1报告提纲首先简单介绍调查的基本概念和主要组成部分,以对抽样调查有个总体认识讲述抽样调查中的抽样设计,包括各种抽样设计与相应的估计方法以及辅助信息的利用,重点是简单随机抽样、分层抽样、整群抽样、系统抽样、多相抽样参考文献2一、调查的主要组成部分调查概述调查设计数据的收集方法调查问卷设计抽样方法抽样估计样本量的确定数据收集的实施数据处理数据发布与数据分析3调查概述调查指使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。调查的重要性。调查是认识客观世界的一种手段,通过调查获取信息,了解现状,进行管理决策和预测。调查的任务。科学地反映客观情况,为解决问题、制定政策或策略提供依据,调查是为决策服务。调查设计调查前准备调查的实施调查的分析与报告4调查设计调查目标的确定调查方法的选择抽样设计的有关问题调查中各种误差及其控制51、邮寄调查:被调查者在没有访员协助下完成问卷。2、人员面访:由调查人员协助完成问卷。3、电话访问:访员通过电话协助被调查者完成问卷。4、网络调查:调查者利用网络进行调查。数据的收集方法6调查问卷设计问卷的作用与设计原则问卷结构与问题类型问卷设计的技巧问卷的度量方法7问卷的开发程序向用户和调查对象咨询参考以前相同主题的问卷草拟问题审议、测试和修改问卷试点调查和问卷的定稿8抽样方法什么是抽样抽样是通过抽取总体中的部分单元,收集这些单元的信息,用来对总体进行推断的一种手段非概率抽样概率抽样9抽样估计抽样估计的基基本原理加权总体均值、比比例及总量的的简单估计辅助信息的使使用调查估计量的的抽样误差估估计10样本量的确定定影响样本量的的因素:估计值要求的的精度;提供供的经费能支支持多大的样样本;调查的的时间要求;;需要和能招招聘到多少调调查人员等。。11数据收集的实实施数据收集是调调查中收集每每一个被抽中中的单元个体数据据的过程。必要的公关工工作调查前的准备备数据收集过程程调查过程及调调查质量的控控制来自12数据处理数据处理的简简要过程1、全面核查查问卷上的数数据2、对问卷上上的回答进行行编码3、将数据录录入计算机4、详细审核核、插补5、进行离群群值的检测6、将数据储储存在数据库库中13数据处理数据处理的简简要过程1、全面核查查问卷上的数数据2、对问卷上上的回答进行行编码3、将数据录录入计算机4、详细审核核、插补5、进行离群群值的检测6、将数据储储存在数据库库中14数据发布与数数据分析调查报告统计表和统计计图数据分析保密和泄密控控制15抽样设计的理理论和方法抽样调查中的的一些基本概概念总体和样本:总体是指研研究对象的全全体`,它是是由研究对象象中的单元组组成的。总体体中单元的数数目称作总体体容量;样本本是指抽样时时按照抽样的的规则所抽中中的那部分单单元所组成的的集合。总体抽取样本推断总体样本16研究的目标参参数:总体总量、总总体均值、总总体比例的估估计及其相应应的方差估计计入样概率与抽抽样比入样概率是指指某个总体单单元被选入样样本的概率抽样比:指样样本量n与与总体的容容量N的比例例下面介绍主要要抽样方法与与相应的估计计方法:17(一)简单随随机抽样定义:设总体体中有N个单单元,不加条条件从中随机机抽取n个单单元为样本,,每个单元都都有同样的概概率被抽中的的抽样方法。。总体总量和总总体均值(1)与(2)18样本均值(3)总体均值和总总量的估计(4)(5)19估计量的方差差(6)而(7)估计量的方差差估计(8)(9)20简单随机抽样样的特点优点:(1)比较容容易理解和掌掌握;(2))抽样框不需需要其他辅助助信息;(3)理论上比比较成熟,有有现成的方差差估计公式。。缺点:(1)没有利利用辅助信息息;(2)样样本分散,面面访费用较高高;(3)有有可能抽到较较差的样本;;(4)抽选选大样本比较较费时21(二)分层抽抽样定义:在抽样样之前将总体体分为同质的的、互不重叠叠的若干子总总体,也称为为层。然后在在每一个层独独立地随机抽抽取样本。分层抽样示意意图22首先介绍分层层抽样的的一一些符号:用下标h表示示层的编号用分分别表示总总体和样本中中第h层第i个单元指标标值;用表表示示h层的层权权用表表示示h层的抽样样比分别表示h层层(总体)均均值与样本均均值;23分别为h层的的(层内)方方差和样本方方差下面介绍分层层抽样适用的的场合和优点点1)在调查中中不仅需要对对总体进行参参数估计,也也需要对层的的参数进行估估计。2)使样本更更具代表性。。3)便于组织织管理和数据据汇总4))对对不不同同层层可可以以按按照照不不同同情情况况和和条条件件,,具具体体采采用用不不同同的的抽抽样样方方法法。。5))分分层层抽抽样样可可以以提提高高估估计计量量的的精精度度估计计量量及及其其性性质质24总体体均均值值的的估估计计(10)对分分层层随随机机抽抽样样,,有有如如下下简简单单估估计计(11)总体体总总和和的的简简单单估估计计为为(12)无偏偏性性::如如果果层层的的估估计计具具有有无无偏偏性性,,分分层层的的总总体体总总量量和和总总体体均均值值的的估估计计具具有有无无偏偏性性。。对分层随随机抽样样,的的一一个无偏偏估计为为25(13)分层抽样样的缺点点:(1)对对抽样框框的要求求比较高高,必须须有分层层的辅助助信息;;(2)收收集或编编制抽样样框的费费用比较较高;(3)若若调查变变量与分分层的变变量不相相关,效效率可能能降低;;(4)估估计值的的计算比比简单随随机抽样样复杂26比估计和和回归估估计-利用辅助助信息比估计和和回归估估计主要要是利用用辅助变变量来提高估计计精度比估计及及其基本本性质如果之之间大致致呈正比比例关系系,采用用比估计计量对简单随随机抽样样,总体体均值和和总量的的比估计计量为(14)(15)有时候候,调调查的的目的的是要要估计计总体体与与的的比比值::27(16)对它的的估计计为(17)基本性性质对于简简单随随机抽抽样,,当样样本量量大时时28对于实实际问问题的的方差差估计计,仍仍用样样本估估计,,用(18)估计。。对分层层抽样样,比比估计计有分分别比比和联联合比比两种种形式式。回归估估计及及其基基本性性质对简单单随机机抽样样,总总体均均值的的回归归估计计定义义为(19)若回归归系数数设定定,则则回归归估计计为无无偏估估计,,且其其方差差估计可可表示示为(20)如回归归系数数为1,称称为差差估计计量。。29如回归估计计量采用样样本回归系系数(21)则总体均值值的回归估估计量为(22)基本性质::当样本量较较大时,将将相应的样样本估计量量代入上式式,得相应的样本本估计。对分层抽样样,有相应应的分别回回归估计和和联合回归归估计。30(三)与单元大小小成比例的的概率抽样样1、定义::根据单元元的大小不不同,入样样概率不同同的一种不不等概率抽抽样。如农农场的大小小不同,其其抽选概率率可以根据据面积大小小成比例,,也可以按按人数多少少成比例。。用英文的的字头简称称为PPS抽样。2、优缺点点:优点是是当研究的的变量与单单元大小有有关时,由由于使用了了辅助信息息,可以提提高抽样效效率。但缺缺点是对抽抽样框需要要有高质量量的抽样框框,成本较较高;对于于单元大小小不相关的的变量就不不适用;估估计量的抽抽样方差估估计比较复复杂。31pps抽样是是一种特殊的的不等概率抽抽样,对放回回地不等概率抽样,介介绍Hansen-Hurvitz估计量。若是是按按的的入样概概率进行的多多项抽样抽取的样本指指标值,相应应的值值为。。则总体总和的的估计(Hansen-Hurvitz估计)为(23)是无偏的,且且有方差估计计(24)对不放回地不不等概率抽样样,采用Horvitz-Thompson估计量32(四)整群抽抽样1、定义::由若干个有有联系的基本本单元组成的的集合称为群群,抽样时以以群为抽样单单元的抽样方方法就称为整整群抽样。整整群群抽样示意图图:黄色为总体红色为群白点为基本单单元整群抽样的优优点:(1)能大大大减低收集数数据的费用;;(2)当总总体单元自然形成的群群时,容易取取得抽样框,,抽样也更容容易;(3)当群内内单元差异大大,而不同群群之间的差异异小时,可以提高效率率。缺点:(1)若群内内个单元有趋趋同性,效率率将会降低;;(2)通常无法预先先知道总样本本量,因为不不知道群内有有多少单元;(3))方差估计比比简单随机抽抽样更为复杂杂可以综合利用用分层和整群群抽样技术,,采取分层整整群抽样,比如人体体尺寸调查,,采用分层提提高样本代表表性,采用整群抽样样,便于数据据的收集。34总体(五)多阶抽抽样定义:它是由由两个或更多多个连续的阶阶段抽取样本本的方法。多多阶阶抽样示意图图:第一阶样本最终样本35优点:(1)当群具具有同质性时时,多阶抽样样的效率高于于整群抽样;((2)样本的的分布比简单单随机抽样集集中,采用面访访可以节约时时间和费用;;(3)不需需要整个总体单单元的名录框框,只要群的的名录框和抽抽中群的单元名名录框。缺点:(1)效率不不如简单随机机抽样;(2)通常不能能提前知道最终的的样本量;((3)调查的的组织较整群群抽样复杂;((4)估计值值与抽样方差差的计算较为为复杂。36定义:又称等等距抽样,对对研究的总体体按一定的顺序排列,,每隔一定的的间隔抽取一一个单元的抽样方法。。抽选选方方法法::设设总总体体单单元元数数为为N,,要要抽抽n个个单单元元为样样本本,,先先计计算算抽抽样样间间隔隔k=N/n,,在在1到到k之之间间抽取取一一个个随随机机起起点点r,,则则被被抽抽中中单单元元的的顺顺序序位位置是是::r,,r+k,,r+2k,,……。。当N不不能能被被n整整除除时时,,采用用圆圆形形系系统统抽抽样样方方法法。。(六六))系系统统抽抽样样372、系系统统抽抽样样的的优优点点(1))没没有有抽抽样样框框时时可可代代替替简简单单随随机机抽抽样样方方法法简简单单;;((2))不不需需要要辅辅助助的的抽抽样样框框信信息息;;((3))样样本本的的分分布布比比较较好好;;估估计计值值容容易易计计算算。。3、系统抽样样的缺点(1)若抽样样间隔与总体体的某种周期期性变化一致致,会得一个个差的样本;;(2)不使使用辅助信息息使抽样效率率不高;(3)使用概念念框时,不能能预先知道样样本量;(4)没有一个个无偏的方差差估计量;((5)当N不不能被n整除除时会得到样样本量不同的的样本。我们国家的国国家统计局的的调查多采用用系统抽样,,它便于操作作。38定义:在同一一个抽样框内内,先抽一个个大样本,收集基本的信信息,然后在在这个大样本本中再抽一个子样本,,收集调查的的详细信息。。多相抽样示意意图:(七)多相抽抽样。。。。。。。。。。。。。第一相样本第二相样本。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。39优点:(1)利用了了第一相样本本的信息,能能显著提高估估计值的精度;((2)适用于于某些调查指指标的数据收收集费用特别高或或给被调查者者带来较重负负担的情况。。缺点:(1)整个调调查的时间要要长;(2))调查费用要要比较高;(3))调查的组织织比较复杂;;(4)估计计值和抽样误差的的计算会相当当复杂。40主要的抽样方方法,大致就就有上述几种种,在实际中采用哪哪种抽样设计计,要根据具具体情况,灵活掌握握,当然也可可以组合起来来使用。抽样方案和参参数估计是一一体的,所以以在抽样设计时要考考虑到后续的的数据处理。。41参考书目冯士雍,施施锡辁.抽抽样调调查-理论论、方法与与实践.上上海科学学技术出版版社,1996.冯士雍,倪倪加勋,邹邹国华.抽抽样调调查理论与与方法,中中国统统计出版,1998.加拿大统计计局《调查查技能》项项目组编,,中国国家家统计局《《调查技能能》项目组组译,冯士士雍(审校校).调查技能教教程,中国国统计出版版社,2002.赵民德,谢谢邦昌.探探索真相相,中国统统计出版,2001.胡健颖,孙孙山泽,抽抽样调查的的理论和方方法,北京京大学出版版社,2000.柯惠新,丁丁立宏,市市场调查与与分析,中中国统计出出版社,2000.梁小筠,祝祝大平.抽抽样调查的的方法和原原理,华东东师范大学学出版社,1994.42我的一些工工作:一、可靠性性方面1.DanYuandJunyang,Storagereliabilityevaluationofcomplexrepairablesystem,ProceedingofEastAsianSymposiumonStatistics,2002.11。2、杨军,于丹.一一种基基于可用度度的装备贮贮存模型及及其应用,系统工程程理理论论与与实实践践,2004.7。。3、、杨杨军军,于于丹丹.修修如如旧旧模模型型中中贮贮存存系系统统备备件件量量的的计计算算及及其其置置信信区区间,中中国国科科学学院院研研究究生生院院学学报报,2004.10。。4、、于于丹丹,杨杨军军.复复杂杂系系统统贮贮存存可可靠靠性性综综合合评评估估,中中国国电电子子学学会会论论文集集可可靠靠性性分分会会第第十十二二届届学学术术年年会会论论文文选选,2004.10。。435、、JunYang(speaker),DanYu.OnekindofCompositeRepairableModelanditsAvailabilityFiducialInference,TheJointMeetingofCSPSandIMS2005.7。。6、、杨杨军军,于于丹丹.一一种种可可修修系系统统贮贮存存模模型型及及其其可可用用度度Fiducial推推断断,系统统科科学学与与数数学学,2004年年接接受受。。7、、杨杨军军,冯冯士士雍雍,于于丹丹.可可修修系系统统的的一一种种复复合合贮贮存存模模型型及及其其可可用用度度估计计,工工程程数数学学学学报报,已已录录用用。。8、杨杨军,于丹丹

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论