版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第五章 抽样(chu yn)第一节 抽样(chu yn)与抽样(chu yn)程序 共三十六页 虽然美国政治民意调查其信誉相当受到推崇,可是也出过大问题。 最早的美国选举是由Literary Digest从一九二零年起做预测,一直到一九三二年,虽然百分比并不太准,但并没有把当选人预测错! 可是到了一九三六年就出了状况。Digest雇用了一千多位受到很好训练的访谈员进行电话接头及通信调查,通信调查对象遍及四十二州的一千万选举人(全部(qunb)选举人的四分之一),其回收率约20%,其调查统计结果为:兰登约得57%的票,而罗斯福约得43%。选举的结果是罗斯福得62.5%选票,兰登得37.5%。
2、共三十六页此次预测错误的主要原因有:(1)抽样名册严重不当,所得样本大部分来自拥有电话及汽车的主人,当时有电话及汽车的美国人不多,故样本大多为中产阶级。(2)问卷在九月初寄出,选举在十一月十四日投票,因而不可能得知在最后时刻选举人的决定是否有所改变。(3)适逢(sh fn)美国不景气,投票行为两极化,工人及穷人大量投票给主张社会经济改革的罗斯福。(4)根据过去经验,问卷调查响应者及无响应者之政治观点有很大不同,此次问卷回收率只有20%(200万/1000万),因而其估计误差高达19%。该问卷没有对无响应者做深入了解是重大失策。 共三十六页一 关于(guny)抽样的几个概念 1 总体与个体 总体
3、与个体通常是共同定义的,总体是构成它的所有个体的集合;个体,也称之为元素,是构成总体的基本单位,也是收集信息的基本单位。研究总体和调查(dio ch)总体的区别: 研究总体是在理论上明确界定的个体的集合体;调查总体则是研究者实际抽取样本的个体的集合体。 共三十六页一 关于(guny)抽样的几个概念2 抽样与样本 抽样是一种选择调查对象的程序与方法,即从研究对象的总体中选择一部分个体作为代表加以(jiy)调查研究,然后用得到的结果推论和说明总体特征,这样由总体中选取一部分代表的过程就是抽样。所选取的这一部分代表称为样本。 共三十六页一 关于抽样(chu yn)的几个概念3 抽样单位与抽样框 抽样
4、单位是一次直接的抽样所使用的基本单位。个体与抽样单位有时是相同的,有时又是不相同的。 抽样单位往往是多层次的。 抽样框又称抽样范畴或抽样范围。是抽样时总体中所有抽样单位的名单。 在一次抽样中,抽样框的数目是与抽样单位的层次(cngc)相对应的。共三十六页3 抽样(chu yn)单位与抽样(chu yn)框调查福建省高校大学生对待台湾的态度抽样单位 抽样框 学校 华侨大学、厦门大学、福州大学等 学院 人文学院、材料(cilio)学院、管理学院等 系 公共管理系、中文系、法律系等共三十六页一 关于抽样的几个(j )概念4 参数值与统计值 参数值也称为总体值,是关于总体中某一变量的综合描述; 统计值
5、也称为样本值,是关于样本中某一变量的综合描述。 参数值是唯一的,不变的,往往是未知的;统计值则是变化的,它依赖于所抽样(chu yn)的样本。 用样本的统计值去预测总体的参数值。 共三十六页一 关于(guny)抽样的几个概念5 抽样误差 由于总体中的个体存在差异性,样本范围小于总体范围,当推论总体时,即在用样本的统计值去推论总体的参数值是,总会存在偏差,这种偏差就是抽样误差。 抽样误差是衡量样本代表性的标准,它主要(zhyo)取决于总体中个体的异质性和样本所含个体的多少。 共三十六页一 关于(guny)抽样的几个概念6 置信水平与置信区间置信水平是总体参数值落在样本统计值某一区间的概率;置信区
6、间是在某一置信水平下,样本统计值与总体参数值之间的误差(wch)范围。 共三十六页共三十六页 假使我们在市长选举前一天取得(qd)1500个选举人作为随机样本,而估计某甲可得52%选票,某乙可得48%选票。 但是样本估计值并不能分毫不差地估计真正总体值,因之某甲可获得52%选票可进而解释为:将有95%的机率获得52%加减3%的选票。这个3%就是抽样误差。也就是说,在100次有95次能够确信某甲获得之选票介于49%与55%之间,而某乙所获得之选票介于45%与51%之间。 共三十六页二 抽样调查(chu yn dio ch)的优越性 与普查相比,抽样调查具有以下优越性: 1 调查(dio ch)费
7、用低 2 速度快 3 应用范围广 4 可获得内容丰富的资料 5 准确性高 共三十六页三 抽样(chu yn)的程序 1 界定总体包括确定调查对象、调查内容、分析(fnx)单位、抽样框等。2 设计和抽取样本设计包括两个部分,一是确定样本所含个体数目即样本的大小,二是选择抽样的具体方法。然后,便实际进行抽样。 共三十六页三 抽样(chu yn)的程序3 对样本进行评估开始调查之前应对样本进行评估,评估样本的目的是初步检查样本对于总体的代表性,以免由于(yuy)前面步骤中的失误使样本偏差太大。 共三十六页第二节 概率(gil)抽样 概率抽样又称随机抽样,就是使总体内所有个体被抽入到样本内的概率相同。
8、由概率抽样得到的样本称为随机样本。 在以各种方式(fngsh)抽取的样本中,随机样本对于总体的代表性最高,它能避免抽样过程中的人为误差,能够确定抽样误差。 共三十六页一 简单(jindn)随机抽样 它是最基本的概率抽样,其他概率抽样都是由它派生出来的。 为了保证总体(zngt)中每一个个体被抽取到的机会完全相等,必须保证抽样框的充分性。 随机数字表 P430共三十六页二 等距抽样(chu yn)(系统抽样(chu yn)) 选择完整名单中每第K个要素组成样本。抽样距离(jl)的计算:K=N/n 避免周期性问题的出现。共三十六页三 分层抽样 分层随机抽样是先将总体按照某一种或几种特征分为几个子总
9、休,每个子总体称为一层,然后从每一层中抽取一个子样本,将这些子样本合在一起即为总体的样本。 分层的最终功能(gngnng)在于将总体分成几个同质的次级集合(次级集合间有异质性),然后再从每个次级集合中抽出适当数量的样本。 在实际应用中,分层随机抽样通常采用按比例分层,即要求各层子样本在总样本中所占比例与本层在总体中所占的比例相同。 共三十六页三 分层抽样优点:1 当一个总体内部分层明显时,分层随机抽样能够(nnggu)克服简单随机抽样和等距缺点,提高样本的代表性。2 可以提高总体参数估计的准确性3 可以在不同类别之间进行比较 共三十六页四 整群抽样(chu yn) 将总体按某种标准划分为一些子
10、群体,每个子群体作为一个抽样单位,用随机的办法从中抽取(chu q)若干子群,将抽出的子群中所有的个体合在一起作为总体的样本。 整群抽样使一些因抽样框的限制无法由简单随机抽样或分层抽样进行的抽样调查成为可能,从而扩大了抽样的应用范围。 共三十六页问题(wnt):调查大陆(dl)民众对待台湾的态度是采用分层抽样,还是整群抽样?共三十六页五 多阶段(jidun)抽样 例:欲在某区举行一次民意抽样调查,假设该区有四个街道:ABCD,分别(fnbi)拥有4万、6万、5万、5万共20万户家庭,拥有12、21、15、12共60个居委会,现从中随机抽取2000户(n=2000)作为调查对象,请说明抽样步骤。
11、 共三十六页五 多阶段(jidun)抽样抽样步骤1 采用比例(bl)分层抽样,确定每个街道应抽取的户数 因为2000/20万=A等待应抽取的户数/A街道户数 所以,A街道应抽取户数=(2000*A街道户数)/20万=2000*4/20=400户 同理,可得A:400,B:600,C:500,D500 共三十六页五 多阶段(jidun)抽样2 再采用(ciyng)比例分层抽样,确定每个街道应抽取的居委会数(假定共抽取20个居委会)20/60=A街道应抽取居委会数/A街道居委会数所以,A街道应抽取的居委会数=20*A街道居委会数/60=20*12/60=4得到A:4,B:7,C:5,D:4 共三十
12、六页五 多阶段(jidun)抽样3 计算(j sun)每个居委会抽取的户数因为A街道应抽取400户,A街道有4个居委会,每个居委会应抽取400/4=100户同理,B街道内:每个居委会抽取600/7=86户,C:500/5=100户,D:500/4=125户 共三十六页五 多阶段(jidun)抽样4 再采取简单随机抽样或等距抽样抽选出具体家庭问题(wnt),居委会大小未被考虑,居委会小的家庭被抽取的概率比较大。 共三十六页六 PPS抽样(chu yn)方法概率比例抽样大规模调查抽样设计使用的成熟的整群抽样形式。每个群被选取的概率与其(yq)大小成比例。共三十六页六 PPS抽样(chu yn)方法
13、共三十六页第三节 非概率(gil)抽样 一 偶遇抽样(chu yn) 又称方便抽样二 判断抽样 又称立意抽样或主观抽样三 定额抽样 又称配额抽样,与分层随机抽样相似四 滚雪球抽样 共三十六页第四节 样本(yngbn)大小 一 样本容量样本(yngbn)大小又称样本(yngbn)容量,指的是样本(yngbn)所含个体数量的多少。统计学上把样本容量小于30的称为小样本。 共三十六页共三十六页 抽样误差主要(zhyo)是与样本大小有关。样本越大抽样误差越小。依盖洛普民意调查社几十年的经验,抽样误差与样本数大小关系如下表: 样本数400015001000600400200100抽样误差2%3%4%5%
14、6%8%11%共三十六页二 影响(yngxing)样本容量的因素 影响样本代表性的误差,一类是随机误差,包括抽样误差;第二类是系统误差,主要是由于抽样方法的不科学、或问卷问法不合理所造成(zo chn)。如果采用严格的概率抽样,就可以消除系统误差,因此,样本大小与抽样误差密切相关。 共三十六页二 影响(yngxing)样本容量的因素具体影响因素:1 研究所要求的精确度2 总体规模3 总体内部的异质程度4 抽样方法(fngf)5 人力、物力、财力、时间 共三十六页内容摘要第五章 抽样。可是到了一九三六年就出了状况。选举的结果是罗斯福得62.5%选票,兰登得37.5%。研究总体是在理论上明确界定的个体的集合体。调查总体则是研究者实际抽取样本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论