




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章 抽样设计,抽样设计,抽样的基本术语和程序非概率抽样概率抽样户内抽样与PPS抽样样本规模与抽样误差思考题,基本术语,总体(population): 母群 ,指抽样调查的研究对象,也就是企图瞭解之某未知现象,而它是可大可小的,实际存在的,而且是可记数的。可分为理论母群和实际母群。理论母群是指实际不存在,但理论上存在的母群,例如:研究掷骰子。实际母群通常是社会科学研究的对象,但是统计学是建立在理论母群之上,例如:推论统计 。 样本(sample):从母群里抽取部分的个体出来作为被调查的对象。 抽样(sampling):母群产生样本的过程。抽样单位(sampling unit):一次直接抽样所使用的基本单位。抽样框(sampling frame):抽样范围,一次直接抽样中抽样单位的名单。,统计值(statistic):测量样本所得之数值,用来指述样本某种特质的数值。 样本的特质:样本所具有的特征。例如:人的性别、体重、身高以及政党认同等等。 推论:由样本统计量来推估母群的特质。 参数值(parameter):总体制,母数,一种用来表示母群某一特质的数值。 母群的特质:母群所具有的特征。例如:平均身高、向心力等等。 误差:推论中所产生若干的错误(error)。而我们就是要试图在误差之下,统计量所推出之母群。抽样调查,所谓抽样调查,就是从调查对象的整体中选出一部分个体组成样本加以调查,然后用所得结果(统计值)推论和说明总体的特征(参数)。,界定总体,制定抽样框,决定抽样方案,实际抽取样本,评估样本质量,抽样程序,非概率抽样(nonprobability sampling),含义类型就近抽样(reliance on available subjects sampling):含义、例举、与随机抽样的比较、优缺点目标式或判断式抽样(purpostive or judgemental sampling):含义、优缺点、适应范围配额抽样(quota sampling):含义、具体方法、例举、优缺点滚雪球抽样(snowball sampling):含义、优缺点、例举优缺点适应范围,非概率抽样:含义,非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其它条件来抽取样本。,非概率抽样的优点,在很大情况下,严格的随机抽样几乎无法进行,例如调查对象的总体边界不清而无法制作抽样框。此外有些研究为了符合研究的目的,不得不按照需要从总体中抽取少数有代表性的个体作为样本。为了保证随机的原则,对抽样的操作过程要求严格,实施起来比较麻烦,费时费力,因此如果调查的目的仅是对问题的初步探索,获得研究的线索和提出假设,而不是由样本推论总体,采用随机抽样就不一定是必须的。综上:操作方便、省钱省力,统计上也远较概率抽样简单,而且若能对调查总体和调查对象有较好的了解,抽样也可获得相当的成功。,非概率抽样的缺点,非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其它条件来抽取样本。因而,其样本的代表性往往较小,误差有时相当大,而且这种误差又无法估计。(非概率抽样由于每个个体进入样本的概率是未知的,而且由于排除不了调查者的主观影响,因而无法说明样本是否重现了总体的结构,)用这样的样本推论总体是极不可靠的。,非概率抽样适用范围,适于探索性研究 在市场调研中:非概率抽样因其便捷、经济、无需抽样框等优点经常被采用。非概率抽样可以用于调查的设计开发、探索性研究,分析概率抽样调查结果等很多方面。例如,在调查的设计开发过程中,调查目标的系统陈述、问卷设计、问卷测试、试调查、抽样设计等环节采用非概率抽样能够便捷地收集被调查者的各种信息,有助于调研人员形成想法,拓展思路,得出结论。非概率抽样是具有特定应用价值的抽样方法。,就近抽样:含义,即偶遇抽样(accidental sampling)、方便抽样、自然抽样 研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。,就近抽样与随机抽样,相似点:都排除了主观因素的影响,纯粹依靠客观机遇来抽取对象。 不同点:偶遇抽样没有保证使总体中的每一个成员都具有同等的被抽中的概率。那些最先被碰到的、最容易见到的、最方便找的对象具有比其他对象大得多得机会被我们抽中。,就近抽样:例举,为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车的人选作调查对象; 在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读的读者进行调查;在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查;利用报刊杂志向读者进行调查;老师以他所教的班级的学生作为调查样本的调查等等。,就近抽样:优缺点,优点方便省力。缺点样本的代表性差,有很大的偶然性,我们不能依赖偶遇抽样得到的样本来推论总体。,目标式和判断式抽样,即主观抽样、立意抽样调查者根据研究的目标和自己主观的分析,来选择和确定调查对象的方法。研究者依据主观判断选取可以代表总体的个体作为样本。样本的代表性取决于研究者对总体的了解程度和判断能力。,判断抽样:优缺点,优点:可以充分发挥研究人员的主观能动作用,特别是当研究者对研究的总体情况比较熟悉,研究者的分析判断能力较强、研究方法与技术十分熟练、研究的经验比较丰富时,采用这种方法往往十分方便。缺点:样本的代表性难以判断,不能推论。,判断抽样:适用范围,它是“有目的的”选择样本。比如,在问卷设计阶段,为检验问题设计的是否得当,常有意地选择一些观点差异悬殊的人作为调查对象。又如,研究者专找那些偏离总体平均水平者作为调查对象,其目的是研究什么使他们发生偏离。它的作用在于发现问题,提出假设,而不在于对总体作出概括。多用于无法确定总体边界、或总体规模小、调查所涉及的范围较窄,或调查时间、人力等条件有限而难以进行大规模抽样的情况。在编制物价指数时,有关产品项目的选择和样本地区的决定等,常采用判断抽样。,配额抽样:定义,即定额抽样按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层(类)所占比例与他们在总体中所占比例一样。,定额抽样:具体方法,进行定额抽样时,研究者要尽可能的依据那些有可能影响研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例。然后依据这种划分以及各类成员的比例去选择调查对象,使样本中的成员在上述各种因素、各种特征方面的构成和在样本的比例尽量接近总体情形。例举,例假设某高校有2000名学生,其中男生占60,女生占40;文科学生和理科学生各占50;一年级学生占40,二年级、三年级、四年级学生分别占30、20和10。现要用定额抽样方法依上述三个变量抽取一个规模为100人的样本。依据总体的构成和样本规模,我们可得到下列定额表:,配额抽样方法的缺陷:,配额的框架必须十分精确。为了做到这一点,必须掌握最新的资料,但这是十分困难的。从某些特定的格子中选择样本时,可能会存在偏误。因为一个访员如果被要求与五位具有某些复杂特征的人面谈,他会本能地避免去访问要爬七层楼才能找受访者、破败的家庭和家养恶犬的人。,滚雪球抽样:定义,当我们无法了解总体情况时,可以从总体中的少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并询问他们知道的人。如同滚雪球一样,我们可以找到越来越多具有相同性质的群体成员。,滚雪球抽样:优缺点,缺点:如果总体不大,有时用不了几次就会接近饱和状况,即后来访问的人再介绍的都是已经访问过的人。但是很可能最后仍有许多个体无法找到,还有些个体因某些原因被提供者故意漏掉不提,这两者都可能具有某些值得注意的性质,因而可能产生偏误。优点:滚雪球抽样是在特定总体的成员难以找的时最适合的一种抽样方法。譬如对获得无家可归者、流动劳工及非法移民等的样本就十分适用。,概率抽样(probability sampling),含义简单随机抽样(simple random sampling) 系统抽样(systematic sampling)分层抽样(stratified sampling)整群抽样(cluster sampling)多阶段抽样(multistage sampling),随机抽样法,Random Sampling:总体中的每一个样本被选中的概率相等。概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。意义:每个研究个体有同等机会被选取成为样本(equal chance)。 1、随机样本:用随机方法选取之样本。 2、推论:描述统计 (全面性测量)、推论统计。,简单随机抽样,(Simple Random Sampling):按照等概率的原则,直接从含有N个元素的总体中抽取n个元素组成的样本(Nn)。,简单随机抽样的常见方法,乐透法/开奖法(Lottery):单纯的、不作假的随机抽样法。 乱数表(Random number table): 1、决定横列与纵行的交叉点。(横列:由左至右)ex.第2横列第4行是0 2、选取小于N的数列。 3、选取小于N的样本。 RDD随机拨号法(Random-digit dialing):通常是自己建档,但是因为成本问题,并非将全部key in,再使用模拟的方式,模拟扩大成电话资料库。Ex.凤山局码749跨行政区的局码然后可模拟出来用电脑抽样。,系统抽样,Systematic sample,等距抽样把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。,等距抽样:程序,1、排列: 1, 2, 3, 4, 5, 6, 7, 8,9, ,., 16263646.N2、K(抽样距离)=N(总体规模)/n(样本规模) 0, 1, 2, 3.,K抽号码 简单随机原则 6+K.6+(n-1)K,等距抽样:注意事项,总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。 1、递增或递减规律 2、样本在总体中的分布由某种循环性规律,且这种循环和抽样距离重合。,分层随机抽样:定义,(Stratified Random Sampling)分层抽样,类型抽样:先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。即把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。 “层间异质,层内同质”,配额抽样和分层抽样,联系:都依据某些特征对总体进行分层区别:本质上的差别1、二者的目的不同。定额抽样之所以分层分类,其目的在于要抽选出一个总体的“模拟物”,也就是说,定额抽样注重的是样本与总体在结构比例上的表面一致性。而分层抽样进行分层,一方面是要提高各层间的异质性与同层中的同质性,另一方面也是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减小。 2、抽样方法不同。定额抽样是通过主观的分析来确定和选择组成这种模拟物的成员。而分层抽样则是完全根据概率原则,排除主观因素,客观地、等概率地到各层中进行抽样,这与定额抽样中那种“按事先规定的条件,有目的地寻找”的做法是完全不同的。,分层抽样:两种方法,1、先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。 2、先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。,分层抽样:注意事项,分层标准以调查所要分析和研究的主要变量或相关的变量作为分层的标准。保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。那些有明显分层区分的变量作为分层变量。,分层的比例问题按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。,整群抽样,丛集抽样(Cluster Random Sampling)抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。,分层抽样与整群抽样的区别,分层抽样要求各子群体之间的差异较大,而子群体内部差异较小;整群抽样要求各子群体之间的差异较小,而子群体内部的差异性很大。换句话说,分层抽样是用代表不同子群体的子样本来代表总体中的群体分布;整群抽样是用子群体代表总体,再通过子群体内部样本的分布来反映总体样本的分布。1、层内异质。2、层间同质。,整群抽样:优缺点,优点:简便易行、节省费用,特别是在总体抽样框难以确定的情况下非常适合。缺点:样本分布比较集中、代表性相对较差。一般来说,类别相对较多、每一类中个体相对较少的做法效果较好。,多阶段随机抽样,(Multi-stage):多阶抽样(分段抽样): 按照元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。先从总体中随机抽取若干大群,然后再从这几个大群中抽取几个小群,这样一层层抽下来,直至抽到最基本的抽样元素为止。,类别与个体之间的平衡问题,各个抽样阶段中的子总体同质性程度各层子总体的人数研究所能提供的人力和经费,多阶段抽样:优缺点,适用于总体规模特别大,或者总体分布的范围特别广时。缺陷:每级抽样时都会产生误差措施:增加开头阶段的样本数,同时适当的减少最后阶段的样本数。,PPS抽样,概率比例抽样(sampling with probability proportionate size)概率与元素的规模大小成比例的抽样。Ex.风笑天,p144。,抽样案例:女教友抽样,多阶段抽样,pps抽样,等距抽样。第一阶段:选择教堂 1、抽样框:美国圣公会主教区年报列出的大约100个教堂以及每个教堂的教友人数。 2、n=500人,n1=25个教堂,每个教堂取20个女性。 3、K=200,000/25=8000 4、18,000选一随机起点,依次为基准,每次增加8,000,所选数字落在哪一教堂,即选哪一教堂。,教堂名单,教堂,教友人数,教友累计人数,教堂A,教堂B,教堂C,3,000,5,000,1,000,3,000,8,000,9,000,教堂M,20 0,000,编号,1-3,000,3,001-8,000,第二阶段:选择女教友,建抽样框。所选取的教堂的女教友名单系统抽样:1)每一教堂的女教友人数/20=K。前提是每个教堂的男女会员的比例相等。 2)K=入选的教堂的女教友总数/500。,户内抽样,Within-household sampling:从家庭户中随机抽取一位成年人作为访谈对象。每户中所有成年人都有同等的被选中的机会。Kish选择表,A式选择表,如果家庭户中18岁以上人口为,被抽选人的序号为,123456或以上,111111,B1式选择表,如果家庭户中18岁以上人口为,被抽选人的序号为,123456或以上,111122,如果家庭户中18岁以上人口为,如果家庭户中18岁以上人口为,如果家庭户中18岁以上人口为,如果家庭户中18岁以上人口为,B2式选择表,C式选择表,D式选择表,E1式选择表,被抽选人的序号为,被抽选人的序号为,被抽选人的序号为,被抽选人的序号为,123456或以上,123456或以上,123456或以上,123456或以上,111222,112233,123335,122344,E2式选择表,F式选择表,如果家庭户中18岁以上人口为,如果家庭户中18岁以上人口为,被抽选人的序号为,被抽选人的序号为,123456或以上,12
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 矿业工程设计合同标准范本
- 房地产开发招投标合同文书模板大全
- 专业数据采集与分析服务协议
- 农产品线上线下销售平台运营合作协议书
- 基于精准农业的土地利用规划协议
- 医疗器械经营许可协议
- 企业发票开具管理办法协议
- 商业经销代理合同书
- 供电系统运行维护合同模板
- 上海双方离婚合同书
- 劳务派遣劳务外包服务方案(技术方案)
- 第09章资本市场有效性理论及其实证分析
- 学校各功能室使用情况登记表
- 《商务分析方法与工具》课程教学大纲
- 模块化硬件设计方案
- 高中日语开学第一课导入课课件
- 气瓶检验员考试题
- 商户二次装修管理方案及管控要点概述
- 初中英语写作教学专题讲座
- 立志追梦圆梦!(航天员桂海潮班会)
- 反恐C-TPAT程序文件整套(通用)
评论
0/150
提交评论