抽样调查原理_第1页
抽样调查原理_第2页
抽样调查原理_第3页
抽样调查原理_第4页
抽样调查原理_第5页
已阅读5页,还剩130页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲 抽样调查原理 一、抽样调查的概念和作用 二、抽样中的几个基本概念 三、抽样调查方案设计 四、抽样组织形式 五、参数估计 走进 Internet,我们按 抽样调查 这个关键词进行搜索,让我们吃惊的是,几万条有关抽样调查的信息看得眼花缭乱,我们摘录部分如下: 1、国家统计局中国经济景气监测中心对北京、武汉、西安三城市的九百位常住居民进行的抽样问卷调查显示: -百分之二十九点五的人在受访时对目前的中国铁路客运服务满意,百分之五十六点七的人基本满意,满意者合计百分之八十六点二;百分之十三点八的人表示不满意。 -百分之二十九点三的人认为购票难; -百分之二十七点三的人认为服务态度还应该再提高; -百分之二十七点三的人认为某些路线乘车环境差强人意。 2、国家统计局城调总队在北京、广州等 10个城市开展的居民生活意向调查表明: -医疗卫生制度改革成为百姓关注的首要问题,关注率由 1996年的 47.92%上升为 87%。 -72%的人认为目前的医疗条件已经明显改善,病人可以自主选择医生,看病很方便。 -59.1%的人认为部分药品价格已经下降。医药管理制度的改革,已经使各种药品的价格控制在比较合适的水平。 -95.5%的人认为政府部门应当重视医药费及医疗费合理收取问题; -55.3%的人把医药费及医疗费的合理收取作为需要政府重视和解决的首要问题。 3、全景网络 2000年投资者盈亏情况调查 显示: -有 54.35%的被调查者赚了钱,只有 31.86%的被调查者亏了钱,另有 8.39%的被调查者不赔也不赚。 4、另据华夏证券上海分公司对 4万多客户全年交易数据的随机抽样调查显示: -2000年更是有 70%的中小散户赚了钱。两项统计都得出了趋势性一致的结论。 5、华中师范大学日前一项抽样调查显示: -只有 21%的学生能记得全部老师, 18.4%老师记得全部学生。另外, 53.5%的学生记得绝大部分老师, 34%的老师记得大部分学生。 -在师生彼此熟悉程度上,单方面认识老师的学生比例为62%,认为彼此认识但交流不多的占 34%。 -74%的学生和老师认为朋友式的师生关系是最合适的师生关系。 6、据上海市统计局城调队数据显示, 2000年本市居民比以往更加注重生活质量的提高。教育、文化、交通通信、保健、住宅、旅游、服务性消费等方面继续成为居民的消费热点,支出明显增加。 2000年末,本市居民人均居住面积达到 11.4平方米,比上年增加 .5平方米。在本市商品房的销售中,个人购房的比重达 93。而在被调查的 500户居民家庭中,一年中就有12.6居民家庭购买了商品房、二手房和部分产权房,这部分家庭户均购建房支出 3.7万元。其中,有 14.3居民家庭购买了商品房,户均购房支出 15.4万元。居民家庭购买上述住宅的户数比上年增长 2.3倍,比 1998年增长 30.5倍。 7、国家统计局农调总队对全国 30个省、自治区、直辖市的 800多个县、 6万多个农户、约 18万个农村劳动力进行了抽样调查。调查结果表明: 1999年中国农村劳动力从第一产业向第二、三产业转移速度又有所加快。 1999年中国农村有 6.4%的农村劳动力转移到二、三产业,而这一年中从非农产业返回到农业的劳动力占农村劳动力总数的 0.5%,增减相抵,净转移劳动力占农村劳动力总数的 5.9%,比上年上升了 0.4个百分点。目前中国农村劳动力从第一产业向二、三产业转移的特点是:在省内转移就业的比重大幅度上升;东部地区仍是转移的热点,向西部转移的人开始增加;小城镇吸纳转移劳动力比重上升;转移人员多为青壮年, 18至 40岁人员比重达 77.3%,其中 18至 30岁的比重为57.9%。 一、抽样调查的基本问题 (一)抽样调查的概念 抽样是人们对事物的认识、生活的体验、真理的追求,乃至科学试验、社会调查中最常用的一种方法。 例如医生为病人验血,检查病情; 居民到农贸市场购买大米,抓一把看看是否颗粒饱满; 炒菜中尝尝咸淡; 车辆乘务员检查车轮是否存在裂缝; 政府新政策出台前的民意测验等等,都是抽样调查的常见例子。 抽样的目的就是通过局部了解整体,一切先验知识都以抽样的经验为基础。 1、概念 抽样调查是一种非全面调查,是指按照随机原则,从调查对象中抽取一部分单位进行观察登记,据以计算样本指标,然后在一定把握程度上用样本指标推断总体指标的统计方法。 2、特点 随机性 按照随机原则抽取样本,这是抽样调查区别于其他非全面调查的特点。所谓随机原则,就是使总体每个单位都有同等机会被抽中的原则,或者说是不受主观意志决定抽中单位的原则。 推断性 在数量上以样本推断总体,这是抽样调查区别于其他调查方法的特点。根据大数定律的要求,按照随机原则抽取足够多的单位进行调查,样本各单位之间的差异相互抵消而趋于稳定,以其平均结果推断总体是完全可行的。 误差可控性 抽样调查是以样本推断总体,必然存在一定的误差。依据中心极限定理,在样本单位数足够多的条件下,无论总体的分布如何,此时产生的误差也趋于正态分布,因而可以利用正态分布通过有关资料事先计算出抽样误差的大小,并采取一定的方式把它控制在允许的范围之内,保证抽样推断结果达到一定的可靠程度。 (二)抽样调查的主要作用 1、优点 第一,省。与全面调查比较,抽样调查可以节省人力物力和财力,提高调查的经济效益。 第二,快。抽样调查节约调查时间,加快工作进程,提高调查的时效性。例如,瞬息万变的市场调查,收购季节的农产量调查,春运期间的客流调查等等,都可以抽样调查及时获得所需要的信息和资料。 第三,广。抽样调查可以增加调查项目,扩大调查范围 第四,准。科学设计和严格实施的抽样调查,能够获得精确、可靠的调查结果。 2、 作用 由于抽样调查所具有的优点,一般在如下场合中广泛使用; () .总体较大,而不需要了解每个单位的情况,只需要综合资料或粗分组资料时; ()从调查单位取得多项的资料,而每调查一个单位,要花较长的时间,较多的人力和物力时,一般采用抽样调查: ()总体各单位分布很广很散,交通不发达,做不到普查时; ()调查项目难度大,资料必须派人调查才能取得,而又不能一时训练出那么多人员时; ()调查单位一经调查,就会受到损坏或改变形态,也只采用抽样调查;如灯泡寿命;罐头质量调查等 ()抽样调查在普查中的运用: (三)抽样调查的理论基础 概率论中的大数法则的一系列定理为抽样理论其提供了数学基础。 ( 1)正态分布定理 当总体分布为正态分布时,无论样本单位数是多少,样本平均数都服从正态 ( 2)中心极限定理 当样本单位数足够大时,无论总体是否是正态分布,其样本平均数的分布趋近于正态分布。 (一)总体与样本 1、总体 所谓总体,就是我们要调查或认识的研究对象,是由所研究范围内具有某种共同性质的全体单位所组成集合体,通常用 “ N”来表示有限总体的单位数。对于一个特定的问题全及总体是唯一确定的。 二、抽样调查中几个基本概念 2、样本 在总体中,被抽取出来的那一部分单位,叫做样本总体,简称样本,样本单位是有限的。 通常用 “ n”来表示样本的大小。对于总体单位数 “ N”来说, n是很小的数。如果说对于一个问题,全及总体是唯一确定的,那么样本却随着抽样的不同而变化,一个总体可能抽取若干个样本,它不是唯一确定的,一个总体可能抽取样本数目与样本容量和抽取方法有关。 (二)总体参数与样本统计量 1、总体参数 根据总体各个单位的数量标志值或标志特征计算的,反映总体特征的综合指标为全及指标,指标是总体变量的函数,其指标数值是唯一确定的。所以称为总体参数。 (1) 总体平均数和标准差 不同性质的总体需要计算不同的参数,对于总体的变量标志如工资等,常用的参数有总体平均数和总体标准差 (或总体方差 2 )。 设总体变量的数为 则: nYYY . . .21 .NYY 2)( NYY (2)总体成数和标准差 对于总体中的品质标志,由于各单位的标志值不能用数量来表示。因此,总体参数常以成数指标 P来表示总体中具有某种性质的单位数在总体全部单位中所占的比重。以 Q表示不具有某种性质的单位数在总体中的比重。 设总体 N个单位, N1个单位具有某种性质, N0个单位不具有某种性质,且 N N1 N0 则有: NNP 1 NNQ 01 QP 我们通常把 “ 是 ” 的标志值表示为,而 “ 非 ” 的标志值表示为 0,那么成数 P可以视为( 0.1)分布的平均数,并求出相应的平均数、方差为: PNNNY 01 01)1()1()1(01 PPNPNPN(3)总体比率 (R)和标准差 总体中两个不同的总量指标或均值的比率。 XYXYR NRXYNiii122、样本统计量 根据样本数据计算的综合指标称为样本指标。又叫统计量。统计量决定于样本的单位标志值,是样本变量函数。统计量是用于估计总体参数的,因此与常用的总体参数相对应,有样本平均数、样本成数和样本方差等等,用小写字母 表示。 设样本变量的数值为 则: (1)样本平均数和标准差为: 2spy 和、nyyy .21、niiyny111)(2nyys (2)样本成数和标准差为: )1( ppspy(3) 样本比率 (r)和标准差 niiniixyxyr11 112nrxysniii总体参数的特点 : 指标所反映的总体范围是明确的,指标的计算方法是已知的,指标数值是唯一的,但调查前是未知的。因此,需要用抽样来估计它。 样本统计量的特点: 计算方法是确定的,但它的取值随不同的样本而发生变化。所以统计量一个随机变量,用它来作为参数的估计值,有的误差大些,有的小些,有的发生正误差,有的是负误差。情况各不相同。 (三)重复抽样与不重复抽样 从抽样方法来看,通常有重复抽样与不重复抽样两种; 1、重复抽样 重复抽样也称为重置抽样。设总体单位数为,而样本容量为 n,它是这样安排抽样的 :一次只从总体中抽一个单位,连续抽 n次,得 n个单位,构成一个样本。每次抽出一个单位把标志值登记下来后,即放回继续参加下一次抽选。这样,重复抽样的样本是由 n次连续抽取的结果组成的,每次结果是互相独立和彼此不影响,而且每次抽取都在相同的条件进行。因此,每一单位可能中选的机会在每一次都是相同的。 2、不重复抽样 不重复抽样又称不重置抽样。它从个单位总体中抽取 n个单位构成样本,样本是由每次抽一个单位,连续抽 n次构成的。但每次抽出一个单位后,不再放回参加下一次抽选。因此,不重复抽样连续抽 n次,实质上等于从总体中一次抽 n个单位构成样本。 (四)样本个数与样本容量 样本容量和样本个数是两个有联系但又完全不同的概念。 1、样本容量 样本容量是指一个样本所包含的单位数,一个样本应该包含多少单位最合适,是抽样设计必须认真考虑的问题。样本容量的大小要结合调查任务的要求以及总体标志变动度的大小综合考虑。 通常将样本单位数不少于 30个的样本称为大样本。社会经济统计的抽样调查多属于大样本调查。 2、样本个数 样本个数又称样本可能数目,是指从一个全及总体中可能抽取的样本个数。一个总体可能抽取多少样本,这和样本容量以及抽样方法等因素有关系。 抽样方法与样本个数的关系 ( 1) 考虑顺序的重复抽样 如果总体的大小为 N, 从中抽取容量为 n的样本 , 由于是重复连续独立抽样 , 第一次抽选有 N种可能 , 第 n次抽选仍有 N种可能 。 因此 ,可能样本数为 。 例如:从 N = 4个单位的总体中随机抽取 2个 , 分别求出可能组合的样本数及其演示图 。 解:若为重复抽样 , 则共有 4*4=16个可能样本数 , 其样本组合图如下: aa、 ab、 ac、 ad da、 db、 dc、 dd ca、 cb、 cc、 cd ba、 bb、 bc、 bd ( 2) 不考虑顺序的不重复抽样 由于不考虑顺序又不允许重复 , 其可能样本数为从 N个中抽取 n 个的组合数 , 根据排列组合的原理共有 种可能的样本数 。 如前例:若为不重复抽样 , 则共有 = 6个可能样本数 , 其样本组合演示图如下: nNC24Cbc、 bd ab、 ac、 ad cd ( 3) 不考虑顺序的重复抽样 一般地说 , 从 N个不同单位每次抽选个 的 允 许 重 复 的 组 合 数为 。 如前例:若为重复抽样,则共有 = 10个可能样本数,其样本组合图如下: nnNC 12124 Caa、 ab、 ac、 ad bb、 bc、 bd cc、 cd dd ( 4) 考虑顺序的不重复抽样 考虑顺序的不重复抽样 , 可以直观地看 , 第一次抽取时有 N种可能 , 第二次抽取时有 N-1种可能 , .第 n次抽取时有 N-n+1种可能 。 因此可能样本数为 ANn。 如前例:若为不重复抽样 , 则共有 A42=4!/2!=12个可能样本数 , 其样本组合演示图如下: 。 ab、 ac、 ad ba、 bc、 bd ca、 cb、 cd da、 db、 dc 在通常情况下,一般只用前面两种方式 (五)抽样框 抽样框是指调查范围内用来代表总体所有单位的名册或表列,是从中抽选样本单位的框架。 抽样框的编制要求 ( 1)名册必须完整,即每个可能要被调查的单位都必须包括在这份名单中,无一遗漏,即目标总体与抽样总体一一对应; ( 2)框中的每个单位必须相互独立; ( 3)框中每个单位必须毫无重复,不得出现两次或两次以上; ( 4)框中一定要尽可能多地收集和利用与调查标志有关的资料和辅助资料,尤其在等距抽样和分层抽样中按与调查标志比较紧密相关指标进行排队组成抽样框,然后使用辅助资料来改善抽样框,以便计算等距抽样的组距和分层的规模 。 ( 5)作框的资料为近三 -五年的平均资料,并说明制订日期和资料来源。 抽样框的具体形式 一览表(即名册或表列) 名册:一览表包括总体的全部单位及调查标志值部分组成; 表列:一览表由主要调查标志值和辅助调查标志值等部分组成。 地图 根据地图上的自然(或人工)的标识等将调查区域分成可以进行抽样的单位; 时间抽样框 按时间过程划分抽样单位的框架。 在抽样实践中,大量使用一览表式抽样框 不完备抽样框 ( A) O S 抽样框中的抽样总体小于抽样目标总体 S (B) L S 一个抽样单位对应两个以上总体单位 ( C) L O 抽样框中的抽样总体大于抽样目标总体 L ( D) S L 两个以上的抽样单位对应一个总体单位 解决办法: a.如果已知这些问题比其他误差要小,而且纠正花费太大的话,可以忽略。 b.重新定义总体一适应抽样框。如一个单位工资表中可能不包括新报到职工,但这些人数很少,可以将他们排除在外。 c.尽可能将丢失的单位找回来。 三、抽样调查方案设计 调查目的 调查对象和 调查单位 调查内容 抽样设计 调查组织实施 (一)调查目的 调查目的就是通过抽样调查需要解决什么问题。调查目的应根据上级领导掌握情况、制定决策的要求来确定的。 调查目的决定了调查对象、调查单位和调查内容,要使调查工作有的放矢,必须首先明确调查目的。 (二)调查对象与调查单位 调查对象就是抽样调查的总体。确定调查对象,是根据调查目的和任务,确定在什么范围内进行调查,也就是确定总体的范围或界限。 调查单位就是总体单位。确定调查单位,是在确定的调查总体内,以何为基本单位进行调查的取得数据或资料。 作为一个调查对象或总体应包括四个基本要素: ( 1) 自然属性 ( 自然人 、 法人 ) ( 2) 内在特征 ( 数量特征 、 品质属性 ) ( 3) 位置 ( 空间:北京 、 沈阳等 ) ( 4) 日期 ( 调查时间 ) (三)调查内容 调查内容就是所要调查的项目,也即说明总体单位的基本标志(数量标志和品质标志),它是调查方案的核心部分。 拟定调查项目应注意的问题: ( 1) 所选择的项目是调查目的任务所需要 ,并且能够取得确切资料的 。 ( 2) 每个项目应该有确切的涵义和统一的解释 。 ( 3) 各个调查项目之间尽可能做到相互联系 、彼此衔接 。 (四)抽样设计 抽样设计是整个抽样调查方案的关键部分 。 ( 1) 设计参数 这里主要包括总体的估计量的所要达到的精确程度 、 可靠程度和代表性误差 。 A.精确程度称为抽样极限误差 : B.可靠程度一般为置信度: 95%或 Z=1.96、 95.45%, 或 Z=2 zC.代表性误差参数 , 即样本指标与过去已掌握的总体同一指标的比值 , 通常不超过 3 -5 ( 97%-103%或 95 -105 ) 。 %100Yy( 2) 确定抽样组织形式和方法 根据调查目的和对象的特点科学地选择抽样组织形式和方法 , 尤其要将各种组织形式和方法综合运用 , 才能充分发挥抽样技术的优势

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论