抽样调查 计算题.ppt_第1页
抽样调查 计算题.ppt_第2页
抽样调查 计算题.ppt_第3页
抽样调查 计算题.ppt_第4页
抽样调查 计算题.ppt_第5页
已阅读5页,还剩151页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 .抽样调查,抽样调查的概念和作用抽样类型和抽样程序的概率抽样原理抽样误差抽样估计抽样量的确定假设检查,2 .抽样调查的概念和作用1 .概念抽样调查并非全面调查显然,抽样调查虽然不是全面调查,但其目的是获得反映整体情况的信息资料,也可以发挥全面调查的作用。 3、2 .特征按随机原则采样以随机原则为基础,整体各单位有机会同等提取。 修正整体抽样调查的目的是从样本中获得资料,再从数量上推定整体。 可以修正控制误差的其他调查方式有误差,但都不能修正。 4、3 .作用不能对现实进行全面调查,需要了解其全面情况(破坏性实验、产品寿命检查等)。 有些现象可以全面调查,但由于整体范围广、单位数多、原始记录

2、不足,很难进行全面调查(如房屋纠正调查)。 对人口普查资料(人口普查后的1个抽样调查等)进行检查和修改。 如果被调查整体中的单位无限多,事实上无法进行全面的调查,只能采样调查(例如河川、湖泊、海洋有多少鱼,大气和海洋的污染程度等)。 5、在我国,取样法广泛应用于各个领域。 目前,国家统订调查制度中包含的统订指标,采样方法得到的资料达到三分之一左右。 在城乡住户调查、农产品调查、价格统筹、市场调查等领域应用抽样调查已取得良好成果,在人口统筹、社会统筹、交通统筹、商业统筹等领域抽样调查也发挥着越来越重要的作用。 随着我国社会主义市场经济的发展,抽样调查的应用范围逐渐扩大,发挥的作用也越来越大。 6

3、、抽样调查的局限性:首先,由于整体结构的复杂性,通常不能提供整体各构成要素的资料。 其次,组织抽样调查必须遵守某些条件,受试者也有一定的限制。 反映国情国力的重要统一修订资料,仍需组织全面调查。 因此,必须大力推进和应用抽样调查,不能用抽样调查取代其他调查,根据资料的性质和调查对象,必须采用不同的统一调查形式。 7、4 .所谓几个基本概念全体(也称全体和全体),是由调查对象的全部单位构成的集合体。 有限整体:整体包含的单位数是有限的。 无限整体:整体包含的单位数是无限的。 总单元数(总容量)一般由n表示。 8、样本是以一定方式从整体中提取的一些单位的集合。 样本单位数(样本容量)一般用n表示。

4、 样本容量相对于总容量通常较小,即,n/N为小数,通常为百分之几或千,最大不大于1/3。 一般称为大样本时称为小样本。 9、整体指标(也称为残奥仪表值或整体值)整体平均数() 整体合成数(p )或比重。 现象有两种表现时,指其中一种表现的单位数所占的比重。 总体标准偏差() 总体标准偏差()、样本指数(也称为统一校正值或样本值)、样本平均值()样本标准偏差()、样本平均值()、样本平均值()、样本平均值()、样本平均值()、样本平均值()、样本平均值()。 当样本数据的数目为n时,一旦确定了样本平均,则仅n-1个数据可以自由取值,其中1个数据不能自由取值。 例如,如果样本数目n是5并且样本平均

5、数目是8,则可以从整体中自由选择最多四个。 任意选择3、9、6、5的话,最后的数量只能选择17,没有其他的选择。样本方差()、12、重复取样和不重复取样(也称为反向取样)一次从整体中随机地提取一个整体单位,经过调查登记遍及整体,参加下一抽选,来提取第n个样本单位。 由于每次提取样本单位时整体单位数不变,因此每个整体单位提取的可能性相同,提取的概率是1/N。 不重复采样(也称为不进行采样),即一次从整体中随机抽取一个整体单位,经过调查登记不进行整体的抽取,从侗下的整体单位中随机抽取下一个整体单位进行调查,抽取第n个采样单位。 通过这种采样方法,分配第一单位的机会是1/N,分配第二单位的机会是1/

6、(N-1 ),类似地,分配整体单位的机会不相等。 在实际调查中,多采用不重复的抽样。 14、采样类型和采样程序1 .采样类型、采样方法、概率采样、非概率采样、简单随机采样等间距采样全群采样多阶段采样PPS采样、偶发采样等概率取样指的是整体的各个个体被提取的机会相等的不均匀概率取样指的是整体的不同个体被提取的机会不相等。 在实践中,往往采用等概率采样,并且由于在校正采样值或采样误差时不使用权重,所以相对简单。 另外,简单随机采样简单随机采样(也称为简单随机采样、无限随机采样或完全随机采样)是对整体的每单位(个体)不加限制的采样。 完全随机抽取调查单位,而不进行整体分组、分类、排队等。 这是抽样调

7、查中最简单的组织形式。 抽样理论就是这样制作出来的。 17、简单随机抽样的具体方法直接抽样法是从整体中直接随机抽样调查的方法,该方法适用于小型整体。 抽签法是先给研究对象整体内的各单位编号,把编号写在纸上,搅拌后抽签。 此方法在整体单位数多时不应采用。18、随机数表一般通过校正或其它随机方法来产生。 使用时,先标上编号,决定位数,然后从表中的任意行、任意列、任意方向,遇到属于编号范围内的数字时作为样品单位,等待样品容量取得充分。 链接资料附表17.doc链接资料随机数表. doc,19,简单随机抽样适用情况:对整体单位数少、范围也有限的整体情况不太了解抽取的单位比较分散时,不会影响调查工作。

8、理论上,简单随机采样与随机原则最符合,是衡量其他采样方式采样效果的标准。 但是,在统一修订实践中的应用有一定的限制,在整体较大、范围较广的情况下请不要使用。 另外,20、等间距采样等间距采样(也称为系统采样或者机械采样)是按照一定的标识符来排列整体中的各单位后,每隔一定距离进行抽出整体的单位(个体)的采样方式。 21、根据作为排队时依据的标志,等间距采样按无关标志分为排队和相关标志两种。 无关标志是与调查项目无直接关系的标志。 例如,在调查员工的生活水平时,按员工姓氏的笔划排列。 /某学校有1300名学生,抽了130人进行健康状况调查。 现有的学号可用于从随机起点(110号中随机确定)每10号

9、(采样距离10 )提取一个。 22、相关标志是与调查项目有直接关系的标志。 例如,城市职工家庭的经济调查,一般按职工家庭的平均收入排列的农产量调查,一般按预计产量和过去3年的平均产量的高低排列等。但是,与排列无关标志不同,第一个样本的确定不是随机的起点,而是将样本的起点固定为半距离。 其目的是避免系统错误。 抽取23,例: 100人中10人进行调查。 首先,按照关联标志排列100人的编号,接着修正采样距离: 1001010最后,从半距离开始抽出,按每个采样距离抽出调查单位。 也就是说,编号为5、15、25、35、45、55、65、75、85、95的十个人构成样本。 24、排队后,根据抽选方法,

10、等间距采样可分为随机起点、等间距采样、半间距起点、等间距采样、对称等间距采样。 对于标志列对称等间距采样,是半距离起点的改善,是随机起点。 其方法:首先,用关联标志排列整体的各单位,计算采样距离K(KNn ),然后从1K数组的各单位中随机抽出1个单位(设r、r为随机起点、1rK )。 最后,对称等距离提取器以位于2Kr、2Kr、中的单位作为样本单位提取,直到满足n个单位。 当26和n是偶数时,r值可以通过顺序地以2、4和6的倍数的k值减去r值来直接计算每采样单位的排序。 即,r、2Kr、2Kr、4Kr、4Kr、27在n为奇数的情况下,采用先画中间后画两侧的方法,但区别了两侧提取的采样单位数为偶

11、数、5个采样单位、中间为3、两侧为2的情况。 中间样本通过将r的值从前面的第二单位加到2、4、6偶数编号k的值上来计算每个样本的顺序,然后通过将r值加到以中间样本数目为起点的奇数倍k值上来校正每个样本的顺序。 如上所述,每个样本单元的次序是r、2Kr、3K、3Kr、5Kr、28,其中提取两边的样本单元的数量是奇数、7个样本单元、中间是4,以及两边是3。 中间样本通过从前面的第二单位减去值2、4、6偶数编号k中的值r来校正每个样本的顺序,然后将r值与以中间样本数加1后的点为起点的奇数倍k值相加来计算每个样本的顺序。 如上例所示,每个样本单位的排名为r、2Kr、2Kr、4K、5Kr、5Kr、7Kr

12、、29,例如某乡有14个村,目前,我们使用对称等间距抽样从中抽出4个村进行农村家庭的经济收入状况调查。 相关资料如下表所示。 30、某乡2008年农村家庭经济收入状况、31、抽样距离: K1593243983 (人)决定了随机起点,即在03983中,抽取随机数,假设r=2000按以下顺序排列:2Kr2398320005966 第二个正在抽取的村庄是第五个。在2Kr2398320009966中,第三个正在抽取的村庄是第九个。如果是4Kr43983200013932,那么第四个正在抽取的村庄是第十二个。 32、此外,使用上述示例。 假设r=1000,那么累计人口中包含1000的村子就是提取中村,即

13、第二个村子就是第一个提取中村。 依次是:2Kr2398310006966,第二个要提取的村庄是6号;2Kr2398310008966,第三个要提取的村庄是7号;4Kr43983100014932,第四个要提取的村庄是13号。33、等间距采样具有简便、简单、估计的代表性等特征,但使用时必须注意在整体单位的标志值按一定顺序排列后是否有周期性变动。 等间距采样的间隔不得与周期变动幅度一致。 不一致的话会产生很大的误差。34、类型取样类型取样(也称为分级取样或分类取样)根据一定标志将整体分类为多个组(类),将每一组称为等级,在每一级进行纯随机取样或等距分析将工业企业分为冶金、电力、石油化工、煤炭、机械

14、、电子等部门后,由各部门随机抽取调查单位。 35、分组后抽取样本单位的具体方法有等比例抽样和不等比例抽样两种。 等比例取样是各组以相同比例提取样本的单位。 /某省有56个县(市),其中山区有16个,丘陵有16个,平原有24个。 现在,从中抽出14县(市)进行农产量调查。14560.25(25 ),山地16254,丘陵: 16254,平原: 24256。 不等比例采样是各组以不同的比例提取样本单位。 36、在实际工作中,类型抽样得到了广泛应用。 当整体的单位标志值差异较大时,使用类型采样更有效。 其优点之一是能够提高样品的代表性。 由于样品单位来自不同的群体,因此可以接近整体的分布情况,样品的代

15、表性有所提高。 第二,减少影响取样平均误差的总体方差。 全体分散有组间分散和组内分散两种。 因为从每种类型的组中提取样本单位对每种类型的组是全面调查,所以仅考虑组内方差而不是组间方差就可以。 37、组整体取样组整体取样是首先将整体用某个标志分成几组,将各组称为一个组,以组为单位简单地进行随机取样,对提取出的组进行全面调查的取样方式,例如知道某地区职工家庭的生活状况的,按居委会分组,对提升的小组(居委会)管辖的每个职工家庭进行调查登记。 38、理论上,在进行整个组的采样时,应尽量减小组与组之间的方差,减小采样的平均误差。 然而,实际上,群往往自然形成,难以人为地减小群间色散。 与简单随机采样相比

16、,如果调查单位相同,则组整体的采样由于调查单位相对集中,不能在整体上均匀分布,受随机性影响,因此其准确性比简单随机采样差。 与其他几种抽样调查形式相比,准确性也差。 其优点是费用比较节约。 39、多阶段抽样前介绍的4种抽样方式均为单阶段抽样,即可通过一次抽样确定抽样单位。 多阶段采样是将通过一次采样获得的样本作为整体再次进行随机采样,获得第二次采样,直接进行采样的方式。 例如,我国农产量调查采用五阶段抽样方式。 抽取省抽县、县抽乡、乡抽村、村抽区、区样本点,对样本点进行了实际实测的调查方法。 40、多阶段采样可以使样本单位相对集中,使组织更加容易,节省人力和费用。 在多阶段采样的各个阶段,由于

17、可以根据情况采用不同的采样方式,因此具有灵活方便的特点,广泛应用于我国的统一修订实践中。 41、PPS取样隐式地包括在多阶段取样中每单位的规模在每阶段取样中相同的假定假定。 例如,所述农业生产量调查在第一阶段提取县时,暗含各县规模相同的情况的第二阶段提取乡时,暗含各乡规模相同的情况以下类推。 但是问题在现实中是不一样的。 42、例如:假设某城市有100,000户居民,属于200个居委会。 从中抽取1000户居民构成样本进行调查。 采用两阶段抽样。 第一步是先从200个居委会中随机抽取20个居委会(这里包含各居委会规模相同的假设前提)。 第二步是从20个正在抽样的居民委员会中,每个居民委员会随机抽样50户居民。 43、另外,例如,在提取的居民委员会中,甲居委会有800户居民,乙居委会只有200户居民。 那么,拔出甲居委会居民的概率是(20/200)(50/800)1/160拔出乙居委会居民的概率是(20/200)(50/200)1/40这两个差别是4倍。 为了解决上述问题,发生了PPS取样。44、PP

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论