社会调查研究方法2章.ppt_第1页
社会调查研究方法2章.ppt_第2页
社会调查研究方法2章.ppt_第3页
社会调查研究方法2章.ppt_第4页
社会调查研究方法2章.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,课程回顾,2,1.什么是社会调查研究方法:,社会研究方法之一,是通过向被访问者询问问题,收集资料,然后进行统计分析的社会研究方法。 特征:自觉的认识活动、直接的认识活动,有一整套的科学方法。,3,2.社会调查研究方法发展历史:,第一,古代的社会调查数千年前古埃及和古中国的人口统计,土地统计;主要是简单的观察,直接的访问,及有限的文献调查。 第二,近代的社会调查十七世纪末至二十世纪初从英法德开始的行政统计调查和社会问题调查。 第三,现代的社会调查从二十世纪初至现在欧美的研究性调查、民意调查和市场调查。,4,3.调查研究的分类,按调查对象的范围分类 普查、抽样调查、典型调查、个案调查、重点调查 按调查的目的 探索性研究、描述性研究、解释性研究,5,4.社会调查的一般程序,设计阶段:明确调查目的和内容,设计收集资料方法,设计抽样方案和调查问卷。 执行阶段:抽取调查对象,资料收集,资料处理,报告结果。 程序:调查设计实地抽样资料收集资料处理撰写报告,6,设计阶段,1、总体规划书面计划书,包括调查目的,调查内容、范围、调查经费预算、进度安排说明,形成调查工作流程表,这是标准化的调查程序。 2、抽样设计抽样方案 界定抽样框,确定样本规模,确定分阶段或分层抽样方法以及每一层的抽样方法,确定参数和误差的估计方法。 3、设计资料收集和处理方案 选择资料收集方式,设计调查问卷,设计资料处理方案。,7,调查方案的主要内容:,1.说明调查课题的目的和意义。 2.说明调查的内容,包括文献回顾。 3.说明调查范围和方法,时间和地点 。 4.调查对象,说明抽样方案。 5.测量,设计问卷。 6.资料收集方法,实验方法还是问卷方法。 7.说明调查人员的组成,组织结构及培训安排。 8.确定调查的时间进度和经费使用计划。,8,执行阶段,1.根据抽样方案实地抽取调查对象 2.确定调查对象,设计好测量工具,进入现场,收集资料。 3.对变量与编码,录入数据,清理数据。 4.调查报告,是对数据的说明,包括抽样、问卷、资料收集过程,数据编码说明,以及对数据信度、效度以及局限性分析。,9,第二章 抽样调查,重点:抽样方法,10,本章主要内容,第一节 抽样调查的概念及特点 第二节 抽样的术语与程序 第三节 概率抽样 第四节 非概率抽样 第五节 抽样误差与样本规模,11,第一节 抽样调查的概念及特点,一.抽样调查的概念 抽样调查就是从研究对象的总体中选择一部分代表加以调查研究,然后用所得的结果推论和说明总体特征,这种由总体中选取一部分代表的过程就是抽样,所选取的这一部分代表就称为样本. 选取样本的方法分为两大类: 非概率抽样,依据研究任务的要求和对调查对象的分析,主观地有意识地在研究对象的总体中进行选择。 概率抽样,按照随机原则选择样本,完全不带调查者的主观意识。,12,二.抽样调查的特点,1、调查对象是部分,不是全部; 2、调查样本是随机抽取,不是主观确定; 3、调查目的不是说明样本,而是推断总体; 4、随机抽样的误差可以计算和控制。 抽样调查与普查相比具有如下特点: 调查费用较低、 速度快、应用范围广、可获得内容丰富的资料。,13,三.抽样调查的理论依据,部分包含于整体之中,部分与整体有同样的特征、现象、关系及过程. 抽样调查的成功与否首先要求所选取的样本能够代表总体,即所抽取出来的样本的特征能够再现总体的结构,怎样能够保证呢?,14,第二节 抽样的术语与程序,一.抽样的基本术语 1.总体(population)总体通常与构成它的元素(element)共同定义,总体是构成它的所有元素的集合,而元素则是构成总体的最基本单位。总体中所包含元素的数目通常用大写字母 N 表示。 2.样本(Sample)样本就是从总体中按一定方式抽取出的一部分元素的集合,样本中的元素数目通常用小写字母 n 表示。,15,3.抽样(Sampling)抽样是指从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。 4.抽样单位(Sampling Unit)抽样单位就是一次直接的抽样所使用的基本单位,抽样单位有时与构成总体的元素是相同的。 5.抽样框(Sampling Frame)抽样框也叫抽样范围是指一次抽样时总体中所有抽样单位的名单。,16,二.抽样的基本程序,在总体中抽取一个样本时,总要尽可能地使样本具有代表性。如果样本的统计值近似总体的参数值,则这个样本可以称为一个代表性样本 (representative sample)。问题是怎样做才可以减少抽样的误差,求得一个有代表性的样本呢? 这就要依据下面的步骤:,17,1.设计抽样方案 2.界定调查总体 3.编制抽样框 4.选择抽样方法 5.实际抽取调查样本 6.评估样本质量,抽样的基本程序:,18,第三节 概率抽样,概率抽样是使总体内的所有个体具有相同的被抽入样本的概率,这样的样本被称为随机样本。随机抽样是由等概率地随机抽取的个体所组成,由于是以概率为依据,所以能避免抽样过程中的人为误差,保证样本的代表性。 在各种抽样方式中,随机样本的代表性最高。 概率抽样可以分为简单随机抽样、等距抽样、分层抽样、整群抽样、以及多阶段抽样。,19,一.简单随机抽样(Simple Random Sampling),1.内涵 简单随机抽样又称为纯随机抽样,它是最基本的概率抽样,其他概率抽样都可以看成是由他派生出来的. 简单随机抽样对总体中的所有个体按完全符合随机原则的特定方法抽取样本,抽样时不进行任何分组,排列,使总体中的任何个体都同样有被抽取的平等机会,对总体中的所有分子一视同仁,毫无例外.,20,2.方法:,总体小时 抓阄,抽签. 总体大时 随机数字表. 简单随机样本是概率抽样的理想类型,他从随机样本的抽取到对总体进行推断有一套健全的规则. 但是当总体所含个体的数目太多时采用这种方法不仅费事,工作繁杂,而且费用太高.此外当总体内分类明显时,这种抽样无法按类别特征自动分配样本数,若想保证样本的代表性,必须增大样本量,从而使整个工作的工作量增大.,21,二.等距抽样(Systematic Sampling),也叫系统抽样或机械抽样.它是简单随机抽样的一个变体,具体做法是: 1.将总量的所有个体按一定顺序排列. 2.计算抽样距离.距离是由总体数目与样本数目决定的.如果总体数为N,样本数为n,则抽样距离应是: N K= n 3.在K个个体中,用完全随机的方法抽取一个个体,设其所在的位置的序号为r. 4.自 K 开始,每隔K个抽取一个体,依次抽取的位置序号为r,r+k,r+2k,r+(n+1)k.,22,等距抽样与简单随机抽样一样,要对总体中所有个体进行顺序编号,要收集总体名单,但是,有时也可以不这样做.只要总体的排列顺序是随机的,就可依已排好的次序从中等距抽取样本,如用尺子,这样工作量较少,易于实施. 等距抽样与简单随机抽样相比,样本分布更为均匀,抽样误差更小,是一种更广泛应用的抽样方法. 注意: 等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差,降低样本的代表性. 等距抽样最适用于同质性较高的总体,当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差.在这种情况下应采用另一种抽样方法.,23,三.分层随机抽样(Stratified Sampling),分层随机抽样是将总体依照某一种或某几种特性分为几个子总体,每个子总体称为一层,然后从每一层中抽取一个子样本,将这些子样本合在一起即为总体的样本。 单位差异过大,对其分组,减少组内差异,在组内进行抽样就能够提高精度,增加样本的代表性。 主要要考虑的问题:样本量在各层的分布、层的划分、如何分层抽取样本。,24,样本量在各层的分布,按比例分层抽样;各层样本在总体中所占的比例与各层单位在总体中所占的比例完全相同。样本结构与总体结构相同。 比例不相同分层抽样; 第一,当某层的单位在总体中比例太小时,样本量太少,这是可使用较多抽样比,扩大该层样本量。 第二,当各层单位调查费用相等时,采用最有分配原则,层内单位标准差大的层,抽样比高。,25,大学教师分层抽样,职称 人数 百分比() 等比例分层样本 分层等距样本 正教授 253 25.3 25 25 副教授 375 37.5 38 37 讲师 108 10.8 11 11 助教 61 6.1 6 6 教辅 203 20.3 20 21 总计 1 000 100.O 100 100,26,层的划分,按什么变量分层? 理论上,按调查的目标变量分层,但是事前难了解,因此通常按与目标变量相关的辅助变量进行分层,常用的有:性别、职业、教育程度、收入、地域、民族、宗教等等。 分几层? 理论上越多越好,但不能多过n/2,还有调查费用的限制。,27,如何分层抽取样本,常见有两种: 比例分层:按等比例或者是不等比例计算每层的样本量。 分层等距:是适用于等比例分层抽样。,28,大学教师分层抽样,职称 人数 百分比() 等比例分层样本 分层等距样本 正教授 253 25.3 25 25 副教授 375 37.5 38 37 讲师 108 10.8 11 11 助教 61 6.1 6 6 教辅 203 20.3 20 21 总计 1 000 100.O 100 100,29,四.整群随机抽样(Cluster Sampling),将总体按照某种标准化分为一些子群体,每个子群体作为一个抽样单位,用随机的办法从中抽取若干子群,将抽出的子群中所有个体合在一起作为总体的样本. 整群抽样与分层抽样有相似之处,第一步都是按某种标准将总体划分为一些子群. 但是分层抽样是在所有子群中均抽取一个子样本,作为总体样本的一部分,而整群抽样是抽取若干子群,并将抽出的子群中全部个体作为样本,总体样本只分布在几个群中. 所以整群抽样的分群标准要求群间异质性低,群内异质性高.适用于界定不清的总体.,30,群的划分与规模,群的划分类型通常为自然群,即由行政或地域区划分的,比如学校、企业、省市等。 由调查人员划分群,则要注意: 群内的方差尽可能大,群间方差尽可能小,也就是群内各单位的差异尽可能地大,群与群之间差异尽可能小一些 样本规模不是常数,因此注意群的划分是主要群的规模大小相近,或者重新组合调整群的规模,31,五.多阶段抽样(Multistage Samlping),在整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,即不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法抽出最终样本.因最终样本的获取经过两次抽样,我们称之为二阶段抽样,同样地可进行三阶段,四阶段,即多阶段的抽样. 它通常在第一阶段使用严格的随机抽样方法,而从第二阶段起使用概率比例抽样,即根据每一群所含个体的多少分配样本名额.,32,按规模分层抽样,多阶抽样中,最初从总体中抽出的群,是初级抽样单位(primary sampling unit,psu)如果psu规模相等,就可以用简单抽样或等距抽样方法直接进行二阶抽样,这是二阶单位以等概率入样,样本规模是常数,也可适用更多阶抽样。 问题:如果群的规模不等,则多阶抽样的样本规模随即变动,而在抽样中必须做到等概率抽样,这个条件下如何保持抽取固定规模的样本? 方法有二:分层多阶段等概率抽样,pps抽样,33,分层多阶段等概率抽样,首先,将总体中规模不等的群,按照规模(或重要性)分层 然后,在不同阶段对不同层使用不同的抽样比。,34,按规模多层抽样举例,层 fa fb f 大群 1 1/400 1/400 中群 1/20 1/20 1/400 小群 1/400 1 1/400 f=fa*fb,35,PPS抽样,概率与规模成比例 (probability proportional to size,pps)方法:赋予规模不等的群与其规模成比例的入样概率,规模大的群以大概率入样,规模小的群以小概率入样,实现等概率抽样。 在多阶抽样中,使用pps方法,第一阶段以及中间各个阶段的抽样都是pps抽样,只是最后阶段才抽取固定数量的抽样单位。,36,某高校10个院系组成,每个系规模不等,利用pps抽取三系,在从中抽取50名学生,构成150人的样本,院系编码 学生 累计 代码区间 抽中代码 1 92 92 192 2 120 212 93212 100(等距法) 3 335 547 213547 4 143 690 548690 628(随机数) 5 442 1132 6911132 828(等距法) 6 121 1253 11331253 7 73 1326 12541236 1305(随机数) 8 447 1773 13271773 1556(等距法) 9 66 1839 17741839 10 345 2184 18402184 1874(随机数),37,第四节 非概率抽样,概率抽样与非概率抽样 概率抽样能够排除调查者的主观影响,抽选出较有代表性的样本,并能够确知和控制抽样误差的大小。 但是在很多情况下,这种严格的随机抽样很难进行,例如,由于调查对象的总体边界不清,无法编制随机抽样所应具备的抽样框,因而无法进行随机抽样。 有时调查的目的仅仅是对问题做出不同探索,获得研究的线索和提出假设,而不是有样本推论总体,在这种情况下一般代之以非概率抽样.,38,非概率抽样的特点,非概率抽样,操作方便,省钱省力,统计上也比概率抽样简单,而且能对调查总体和调查对象有较好的了解,抽样也可获得较大的成功. 但是非概率抽样由于排除不了调查者的主观影响,无法说明样本是否体现了总体的结构,所以,将非概率抽样的结论推论到总体时要极其慎重,否则就容易出现以偏概全的错误. 非概率抽样主要有偶遇抽样,判断抽样,定额抽样,滚雪球抽样等.,39,一.偶遇抽样(Accidental or Convenience Sampling),偶遇抽样是指研究者将其在一定时间内,一定环境里所能遇见或接触到的人均选入样本的方法.“街头拦人”。 由于是依据调查者的方便任意选取样本,也称为方便抽样. 偶遇抽样的优点是方便省力.但是样本的代表性差,又很大的偶然性.,40,二.判断抽样(Judgmental or Purposive Sampling),也称立意抽样,它是调查者根据研究目标和自己主观的判断来选择和确定调查对象的方法. 这种样本的代表性取决于研究者对总体的了解程度和判断能力,当总体规模小,所涉及的范围较窄时样本的代表性较好,当总体大范围广,代表性将显著降低. 作用在于发现问题,提出假设,而不在于对总体做出概括.,41,三.定额抽样(Quota Sampling ),又称作配额抽样,它与分层随机抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层所占的比例与它们在总体中所占的比例一样.但是不同的是分层抽样中各层子样本是随机抽取的,而定额抽样中各层的子样本是非随机抽取的. 定额抽样是以代表总体为目的的.因此必须对总体的性质有充分的了解.但是,一方面分层时只能考虑众多属性中的几种,另一方面,新的变化信息又不易得到,因此样本的代表性要受影响.,42,四.滚雪球抽样(Snowball Sampling),当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道那些符合条件的人,再去找越来越多具有相同性质的群体成员。,43,第五节 抽样误差与样本规模,一.抽样误差 (一)抽样误差的概念 抽样误差就是用样本值去估计总体值时所出现的误差.,44,误差的来源有多种,主要可分为两类,1.调查误差.或称为登记误差或工作误差,指在调查过程中,由于利率,整理资料工作中出现的差错,或被调查者回答问题与真实情况不符所造成的误差,或问题本身含糊等. 2代表性误差.指因样本不能代表总体所造成的误差,代表性误差也有两种表现:其一是偏差,指由于破坏了抽样的随机性而造成的误差.其二随机误差,只由于抽样的随机性以及用部分来代表全体而产生的代表性误差称为随机误差.,45,(二) 影响抽样误差的因素,1.样本单位数在其他条件不变的情况下,样本单位数越多,抽样误差就越小,反之,则越大. 2.总体各单位之间的差异程度在其他条件不变的情况下,某一变量的取值在总体各单位之间的差异越大,相对于这一变量的抽样误差越大,极端而言如果总体各单位关于一变量的取值完全相等,则相应的样本指标等于总体指标,抽样误差也就不存在了. 3.抽样方式采用不同方式抽出的样本对总体的代表性不同,在样本数不变的情况下,不重复抽样的抽样误差比重复抽样的抽样误差小,这几种形式的抽样误差一般又比整群抽样的误差小.,46,二样本规模,样本规模也称为样本容量,它指的是样本中所含个案的多少,确定样本规模也是每一项具体的社会研究所必须解决的问题之一。 统计学中通常以30为界,把样本分为大样本和小样本。 一般说来社会调查的样本数都在50-5000之间。,47,经验确定样本数的范围,总体规模(人) 样本比例(%) 100人以下 50%以上 50 1001000人 50%20% 50200 10005000人 30%10% 300500 500010000人 15%3% 750300 1万10万人 5%1% 5001000 10万人以上 1%以下 1000,48,作业(2):,1.社会调查分类哪些? 2.抽样程序是怎样? 3.概率抽样方法有哪些?具体解释说明。 4.非概率抽样方法有哪些?具体解释说明。,49,参考文献:,1郝大海.社会调查研究方法M.北京:中国人民大学出版社,2005 2艾尔巴比.社会研究方法M. 北京:第十版.华夏出版社,2005; 3袁方,王汉生.社会研究方法教程M. 北京:北京大学出版社,1997;,50,调研方案示例:,例一.越轨行为研究实地研究 贝克尔的研究是从观察入手,实现没有提出研究假设,但他是依据一定的理论设想去调查,然后通过归纳,概括和抽象提出一种理论假说, 例二.蒙汉通婚研究统计调查 蒙汉通婚研究则事先建立一个假设的因果模型,然后通过大样本的调查和统计分析来检验和修改这一理论模型, 这两个研究形成了鲜明的对比,他们反映出当前社会调查研究中两种最常用的调查方式,即实地研究与统计调查,通过对这两个调查研究方案的了解,读者可以把握社会调查研究设计的一些要点。,51,1.调查题目: 赤峰地区农牧民蒙族与族汉的通婚研究 调查目的;通过对影响蒙汉用婚的各种因素的分析,探寻民族通婚的一般模式,建立一种理论模型来说明中国的民族通婚问题,该研究对于认识目前的民族关系,制定民族政策有一定的现实意义,对于民族学,人口学,和社会学的理论建设也有一定的参考价值. 理论构架;本研究的基本设想是,影响蒙汉通婚的主要因素有六类:1,经济活动,2,居住特点3,人口迁移,4,语言文化,5,历史因素,6政策因素,其中后两种因素起独立的影响作用,通过对前四类因素的界定,分解和操作定义,筛选出10个影响民族通婚的变量:某一个民族在一个村的总户数的比重,居民的平均文化水平,户主的年龄,户主的文化水平,职业,户口类型,是否移民,掌握另一民族语言的能力,邻居中另一民族成员的多少,与另一民族成员的交友情况. 将这些自变量与因变量(民族通婚程度)联系起来,建立了一组研究假设和一个复杂的因果模型.,蒙汉通婚研究,52,2,研究类型:解释性研究,横剖研究,抽样调查 调查方式;统计调查为主,结合实地研究. 调查方法;问卷法为主,结合访谈法,观察法.资料分析方法;统计分析,(包括相关分析,回归分析和路径分析),结合理论分析. 3.调查范围;内蒙古赤峰地区 分析单位;家庭(户) 4 抽样方案;研究总体是赤峰地区的居民,根据地区特点选择4个有典型意义的旗(县),在这4个旗(县)中选择5个有代表性的乡,再在这5个县中,选择5个有代表性的乡,再在这5个乡中各选择2-3个村,共选出12个村,这12个村共3200户,从中随机抽选(每4户中选3户),2439户,在每户调查户主1人,共2439人. 5.调查内容; 户主的主要特征:自变量,各特征组的民族通婚程度,户主所在村,乡,旗的的历史状况与现状.民族政策的历史变化. 调查问卷,调查指标和项目是:户主的年龄,文化水平,职业变动,婚姻史,配偶情况,生育史,语言能力,社会交往,邻居情况,个人收入,个人对居住地的满意程度等等,他们是对自变量的测量,对每一指标或项目设计一个或几个问题来了解,以上是主要问卷,此外还设计两个辅助问卷,一个是了解家庭情况,另一个是了解迁移情况,在了解村,乡,旗的历史与现状时,是根据事先设计的调查提纲。,53,6.调查时间;1985年6月1985年8月 调查时点;1985年6月1日。在6月1日以后迁入的户主不再调查范围内,6月以后结婚的不做统计。 调查场所,直接进入家庭访问,填写问卷。 调查时间计划: 准备阶段;1985年2月1985年5月,查阅文献,到赤峰地区的政府有关部门了解情况,到调查地区实地初步考察,对问卷初稿进行试调查,以修订问卷, 调查阶段:1985年6月1985年8月每天访问4050户,60天完成。除在12个村进行问卷调查外,还需要考察者5个乡其他41个村的概况, 研究阶段;1985年9月1985年11月,资料整理,数据处理,输入计算机,汇总分析,打印统计表格,计算相关系数等。 总结与应用阶段;1985年12月1986年3月结合资料的统计分析和理论分析撰写调查研究报告。 7调查经费和物质手段(略) 8调查员的培训,组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论