社会调查研究抽样课件_第1页
社会调查研究抽样课件_第2页
社会调查研究抽样课件_第3页
社会调查研究抽样课件_第4页
社会调查研究抽样课件_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第六章抽样2023/7/142一、抽样的概念与作用二、概率抽样的原理与程序三、概率抽样方法四、非概率抽样方法五、样本规模与抽样误差2023/7/143一、抽样的概念与作用1、抽样的概念(1)个体:又称分析单位,是一项调查中所要研究的对象,是收集信息的基本单位。(2)总体:是构成它的所有个体的集合。用N表示。区分研究总体与调查总体(3)样本:是从总体中按一定方式抽取的一部分个体的集合。用n表示。2023/7/144(4)抽样:从总体中按一定方式选取样本的过程。(5)抽样单位:一次直接的抽样所使用的基本单位。(6)抽样框:又称抽样范围,一次直接抽样时总体中所有抽样单位的名单。2023/7/145(7)参数值(8)统计值是关于总体中某一变量的综合描述是关于样本中某一变量的综合描述用希腊字母表示用罗马字母表示理论值经验值不变的可变的未知的已知的2023/7/146(9)抽样误差:在用样本统计值去推论总体参数值时总会存在着偏差即抽样误差。(10)置信水平与置信区间:置信水平也叫置信度,是总体参数值落在样本统计值某一区间内的概率。这一区间称为置信区间。2023/7/1472、抽样的作用总体抽取样本样本推断总体2023/7/1481984年美国总统选举预测与实际结果比较里根蒙代尔《时代》64%36%《今日美国》63%37%《纽约时代周刊》61%39%《新闻周刊》59%41%《华盛顿邮报》57%43%哈里斯民意测验56%44%罗珀民意测验55%45%实际投票结果59%41%2023/7/1493、抽样的类型概率抽样:它是依据概率论的基本原理,按照等概率的原则进行的抽样。它能避免抽样过程的人为误差,较好的保证样本的代表性。非概率抽样:它是依据研究者的主观意愿或方便与否等因素来抽样。它不考虑抽样中的等概率原则,往往产生较大的误差,样本的代表性较差。2023/7/1410抽样方法概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样非概率抽样偶遇抽样判断抽样定额抽样雪球抽样2023/7/1411二、概率抽样的原理与程序1、抽样的基本原理同质性和异质性。随机抽取放回抽样与不放回抽样。2023/7/14122、抽样分布213是总体中各元素的观测值所形成的相对频次分布(百分比分布);分布通常是未知的;可以假定它服从某种分布。总体分布

总体2023/7/1414从总体中抽出一个容量为n的样本,由这n个观测值所形成的相对频次分布;也称经验分布;当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。样本分布

样本2023/7/1415在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频次分布;是一种理论分布;随机变量是样本统计量;样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本;是进行推断的理论基础,也是抽样推断科学性的重要依据。 抽样分布2023/7/1416抽样分布的形成过程

总体计算样本统计量如:样本均值、比例、方差样本2023/7/1417以样本均值的抽样分布为例218样本均值的抽样分布

【例】设一个总体,含有4个个体,即总体单位数N=4。4个个体分别为x1=1,x2=2,x3=3,x4=4

。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差2023/7/1419样本均值的抽样分布

现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)2023/7/1420样本均值的抽样分布计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P

(x)1.53.04.03.52.02.52023/7/1421x的分布趋于正态分布的过程2023/7/14223、抽样的程序(1)界定总体(2)制定抽样框(3)决定抽样方案(4)实际抽取样本(5)评估样本质量2023/7/1423三、概率抽样1、简单随机抽样又称纯随机抽样,是对总体中所有个体按完全符合随机原则的方法抽取样本,即抽样时不进行任何分组、排列,使总体中的所有个体都同样有被抽中的机会。2023/7/1424随机数字表是由计算机生成的由0-9组成的表。较大的随机数字表有美国兰德公司1955年编制出版的100万数字的表和肯德尔与史密斯1938年编制出版的10万数字表。2023/7/1425例:某单位有528人,欲随机抽取10人调查

1、确定抽样框,并将总体中所有个体按顺序编号。2、根据总体规模的位数来确定从随机数字表中选取几位数码。3、以总体规模为标准,对随机数字表中的数码逐一衡量取舍。4、根据样本规模的要求选出足够的数码个数。5、根据随机数字表中选中的数码,到抽样框中找相对应的个体。00-0405-0910-1415-1900010203040506070809105446315389859416114905219414172835717783409508299596754226628520540756694408161999326940700001584820641571767665905188508241411286106518771920652108062988166164556592023/7/1426简单随机抽样的特点:A.当总体中所含个体数目太多时,费时、工作繁杂、费用高。B.在构成总体的个体差异不大时比较有效,总体异质性高时误差较大。2023/7/14272、系统抽样又称等距抽样或机械抽样。它是把总体中的个体编号排序后,再计算出某种间隔,按照这个固定间隔抽取个体的号码来组成样本的方法。2023/7/1428操作步骤:A、将总体中的每个个体编号排列,制定抽样框。B、计算抽样距离。K=N/nC、在最前面k个个体中采用简单随机抽样法抽取一个样本(编号为A)作为等距抽样随机的起点。D、自A开始,每隔K个个体抽取一个个体,编号分别为A,A+K,A+2K,A+3K,…,A+(n-1)K。E、将这n个个体合起来即为该总体的样本。2023/7/1429例:设某大学有12000名学生,决定采用等距抽样法从中抽取200名学生。A、计算K=12000/200=60B、用简单随机抽样法在前60个学生中抽取第一个学生,设其序号为12。C、样本为第12、72、132…号学生。若第199个学生的号码是11952,第200个号码为13。2023/7/1430等距抽样的特点:易于实施,工作量少。样本在总体中分布更均匀,抽样误差小于或等于简单随机抽样。等距抽样的前提:总体随机排列。2023/7/14313、分层抽样又称类型抽样,它是先将总体中的所有个体按照某种特征或标志划分成若干类型或层次,然后在各个类型或层次中采用简单随机抽样或等距抽样法抽取一个子样本,最后将这些子样本合起来就是总体的样本。

2023/7/1432分层抽样的特点点:(1)当一个总体内部分层明显时,能克服简单随机抽样和等距抽样的缺点。(2)在不增加样本规模的前提下降低抽样误差,提高抽样精度。(3)有些研究不仅要了解总体的情况,还要了解某些类别的情况。2023/7/1433分层的标准以要分析和研究的主要变量或相关变量作为分层标准。以保证各层内部同质性性强、层间异质性强为原则。以那些有明显层次区分的变量作为分层变量。2023/7/1434

4、整群抽样

又称聚类抽样,是将总体按照某种标准划分为一些子群,每个子群作为一个抽样单位,用随机的办法从中抽取若干子群,将抽出的子群的所有个体合起来就是总体的样本。

2023/7/1435整群抽样与分层抽样的区别样本抽取方法不同。子群划分的原则不同。整群:群间同质性高,群内异质性高。分层:层间异质性高,层内同质性高。适用总体不同。整群:适用于界定不清的总体。分层:适用于界定分明的总体。2023/7/1436整群抽样的特点:(1)可以通过变换抽样单位扩大抽样范围。(2)节约成本。(3)样本分布不均匀,代表性较差。2023/7/1437总体

5、多段抽样:又称多级抽样,是按抽样单位的隶属关系,把抽样过程分为几个阶段进行。

2023/7/1438优点:节约成本,适用于范围大、单位多、结构复杂的调查对象。缺点:误差大。减小多阶段抽样误差的方法:相对增加开头阶段的样本数而适当减少最后阶段的样本数。2023/7/14396、pps抽样100000户居民,分属200个居委会。从中抽取1000户居民。方案:从200个居委会中随机抽取20个居委会;在被抽中的20个居委会中,每个居委会随机抽取50户居民。思考:若甲居委会有800户居民,乙居委会有200户居民。两个居委会的居民被抽中的概率相等吗?甲居委会居民被抽中的概率:20/200×50/800=1/160乙居委会居民被抽中的概率:20/200×50/200=1/40P(乙)=4P(甲)2023/7/1440PPS抽样:叫做“概率与元素的规模大小成比例的抽样”(samplingwithprobabilityproportionaltosize),适用于总体中元素大小不同,或元素在总体中的地位不同时。它是以阶段性的(或暂时的)不等概率换取最终的、总体的等概率。2023/7/1441从10个学校共20000人的总体中,抽取一个容量为800的样本。要求抽取8个学校,每个学校100人。(K=2500)学校人数累计人数编号

A100010001-1000B150025001001-2500C200045002501-4500D400085004501-8500E2000105008501-10500F30001350010501-13500G15001500013501-15000H15001650015001-16500I5001700016501-17000J30002000017001-200002023/7/1442PPS抽样的实质:第一个阶段,大的群被抽中的概率大,而小的群被抽中的概率小;第二个阶段,被抽中的大的群中的元素被抽中的概率显然小于被抽中的小的群中的元素。这一大一小,平衡了由于群的规模的不同带来的概率差异。2023/7/1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论