版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、社会调查方法(4),宋月萍,新闻周刊6月22日公布的民调显示,在受访的1010名注册选民中,奥巴马获得了51的支持率,高出麦凯恩36的支持率15个百分点。 10月16日,有关美国总统大选的民意调查和民调分析机构指出,民主党候选人巴拉克奥巴马(Barack Obama)的支持率处于遥遥领先的地位,领先优势多达30个百分点。,第四讲 抽样原理与类型,第一节 抽样的基本问题,一、抽样及其相关的概念 (一)总体与元素 总体(population): 理论上要研究要素的特定合体。 构成它的所有元素的集合。 元素(element): 构成总体的最基本单位。 社会调查中,总体由社会中的某些个人组成,这些个人
2、便是构成总体的元素。 元素的同质性与异质性 目标总体vs调查总体 调查总体:从目标总体中去掉一部分无法接触的元素后的总体。,(二)样本(Sample) 从总体中按一定方式抽取出的一部分元素的集合。 (三)抽样(Sampling) 从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程。 (四)抽样单位(Sampling Unit) 一次直接的抽样所使用的基本单位。 抽样单位有时与构成总体的元素相同,有时不同。,(五)抽样框(Sampling Frame) 抽样框又称做抽样范围,指一次直接抽样时总体中所有抽样单位的名单。 因抽样单位发生变化 一份合格的抽样框中元素必须与号码一一
3、对应 穷尽性与互斥性,总体,抽样框,样本,(六)参数值与统计值 参数值(Parameter):又称总体值,关于总体中某一变量的综合描述,总体中所有元素的某种特征的综合数量表现。 统计值(Statistic):又称样本值,关于样本中某一变量的综合描述,是样本中所有元素的某种特征的综合数量表现。,二、抽样的作用,产品的销售量,就业状况,电视台的收视率,我国土地沙漠化问题非常严重,全国沙漠化土地面积已超过174000平方公里,并以每年3400平方公里的速度扩张。,你知道这些数据是怎么来的吗?,通过调查获得的。,怎么调查?,是对考察对象进行全面调查还是抽样调查?,妈妈:“儿子,帮妈妈买盒火柴去。” 妈
4、妈:“这次注意点,上次你买的火柴好多划不着。” 儿子高兴地跑回来。 孩子:“妈妈,这次的火柴全划得着,我每根都试过了。”,这个调查具有破坏性,不可能每根试过,不能展开全面调查。,通过对样本统计值的描述来准确的勾画出总体的面貌 抽样的优点 低成本,较不费时 比起研究整个总体而言,更便宜、方便 低误差 较好的结果 避免元素的灭绝 例如:火柴,第二节 抽样的类型与抽样程序,一、抽样类型,概率抽样(probability sampling):总体中每一个个体都有一个已知不为零的被选机会进入样本。(基于概率) 非概率抽样(nonprobability sampling):不按照概率均等原则,而是根据人们
5、的主观经验或其他条件来抽取样本 。(基于研究主观条件),二、抽样的一般程序 界定总体:对从中抽取样本的总体范围与界限作明确的界定。 制定抽样框:依据已经明确界定的总体范围,收集总体中所有全部抽样单位的名单 决定抽样方案:依据研究的目的和要求,具体决定采用哪种抽样方法。 实际抽取样本 : 评估样本质量:对样本的代表性、偏差等进行初步的检验和衡量。,三、抽样设计的原则 目的性原则:为调查服务 可行性原则:是否切实可行,易于执行 高效性原则:在调查结果的精确性和调查所需的费用之间寻求平衡,在规定的费用之内达到尽可能高的精确度。,第三节 抽样原理,要精确地描述大型总体时,需要进行概率抽样。 一、概率抽
6、样原理 (一)代表性与选择概率 代表性(representativeness):样本具有跟所从中挑选出来的总体相同的特征。 通过对样本的分析所得出来的描述和解释也同样适用于总体。 代表性给概化和推论统计提供了可能性。 在概率抽样下,代表性会更好。 如果总体中的每一个元素被抽取为样本的概率相同,那么从这个总体中抽取的样本,就具有对该总体的代表性。,概率抽样的优点: 可避免偏见 能够估计样本的精确度及代表性,(二)抽样分布 抽样分布:根据概率的原则而成立的理性分布,显示出从一个总体中不断抽取样本时,各种可能可能出现的样本统计值的分布情况。 以平均数抽样分布为例:,总体分布:掷一次骰子出现的点数,样
7、本均值,抽样分布:掷两次骰子的平均值的分布(样本扩大到2),抽样分布:掷两次骰子的平均,样本均值,中心极限定理:在一个含有N个元素,且平均数为,标准差为的总体中,抽取所有可能n个元素的样本,若用X1,X2 Xm分别表示这m个样本的平均数,那么样本平均数Xi的分布将是一个随n增大而越来越趋于具有平均数和标准差 的正态分布。 当n足够大时(通常假定大于30),无论总体的分布如何,其样本平均数所构成的分布都趋于正态分布。,总体分布,骰子,平均数的抽样分布是正态分布,因此样本平均数次数所占比例是可以求得的。 68.26%的样本平均数落在SE之间 SE为标准误 90%的样本平均数落在1.65SE之间 9
8、5%的样本平均数落在1.96SE之间 98%的样本平均数落在2.33SE之间 99%的样本平均数落在2.58SE之间 根据样本平均数对总体平均数进行推论,置信度(Confidence Level) 置信水平,指总体参数值落在样本统计值某一区间内的概率。反映的是抽样的可靠性程度。 置信度为95%,指总体参数值落在样本统计值的某一区间的概率。 置信区间(Confidence Interval) 指在一定的置信度下,样本统计值与总体参数值之间的相近程度,根据样本统计值,推算出总体参数可能存在的区间。反映抽样的精确性程度。 = X +KSE,置信度与置信区间相互关系,置信度低而置信区间精确,置信度高而
9、置信区间宽泛,二、样本规模与抽样误差 (一)样本规模及其计算 样本规模(Sample Size)样本容量,指样本中所含元素的多少。 统计学中,30以上为大样本,30以下为小样本。 社会调查中,至少不能少于100个元素 与要分析的变量有关,每个层次不得少于30,样本规模计算公式(简单随机抽样推论总体平均数): t 置信度所对应的临界值 总体的标准差 e 抽样误差(即标准误),简单随机抽样 推论平均数 (age income),推论比例 (gender crime),Generally,在95%的置信度条件下所需的样本规模,(二)影响样本规模确定的因素 总体的规模 抽样的精确性要求 总体的异质性程
10、度 调查者所拥有的经费、人力和时间,总体规模 总体越大时,要保证一定的精确度,样本也要增大。 样本规模的增加与总体规模不保持同等的增长速度。 在有关因素一定时,样本规模速度大大低于总体规模的增加,抽样的精确性要求 在其它条件一定的情况下,置信度要求越高,所要的样本规模越大 在其他条件一定的情况下,置信区间越小(精确性越高),则要求的样本规模越大,总体的异质性程度 在同质程度高的总体中抽样时,的样本规模小一些 在异质程度高的总体中抽样时,样本规模要大一些 异质的分布情况,对于AB两个选项,选择AB选项的样本各为50%,与分别为70%与30%时,所需要样本量不同,前者需样本量更大。,调查者所拥有的
11、经费、人力和时间 从实际出发,要求样本量越小越好 从样本的代表必、抽样精确性考虑,要求样本量越大越好 要在两者之间进行权衡,达到最高效,(三)样本规模与抽样误差 (无意识)抽样误差(Sampling Error,即标准误):随机误差,用样本统计值去估计总体参数值时所出现的误差,是由于抽样本身的随机性所引起的误差。 无论采用何种抽样方式,这种误差都不可避免。 取决总体的分布方差和抽样规模,非抽样误差(度量误差):指在整个调查过程中所产生的,在调查访问、回答、记录、填写、汇总、录入等工作中所出现的各种误差。 随着样本的增大而增大,抽样误差,非抽样误差,调查总误差,第四节 抽样方法,一、 非概率抽样
12、方法,一、偶遇抽样(Accidental or Convenience Sampling) 方便抽样、自然抽样 指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象 仅仅选择那些离得最近的、最容易找到的人作为调查对象 街头拦访等,无法保证总体中每一个成员都具有同等被抽中的概率 推论总体时存在危险 思考: 调查人大学生使用图书馆的习惯,在图书馆进行拦访,该抽样方式可能对结果产生什么影响? 对老年人主观幸福感进行调查,请居委会主任帮助联系,可能存在什么问题?,二、判断抽样(Judgemental of Purposive Sampling) 立意抽样、目的抽样 根据研究目的和自己的主
13、观分析来选择和确定调查对象。 典型调查 如无家可归者、街头行乞人员、染发者,可发挥研究人员主观能动作用 对研究人员要求较高 对研究的总体情况比较熟悉 分析判断能力较强 研究方法与技术十分熟练 研究经验比较丰富 仍然无法做总体推论,但可以进行类别比较,三、定额抽样(Quota Sampling) 配额抽样 尽可能地依据有可能影响研究变量的各种因素对总体分层,并找出具有各种不同特征的成员在总体中所占的比例 依据这种划分以及种类成员的比例去选择调查对象,使样本中的成员在上述各种因素、特征的构成和在样本中的比例尽量接近总体情形。,总体:2000人,男生60%,女生40%,文科理科各50%,一至四年级各
14、占40%、30%、20和10% 定额抽取规模为100的样本,目的在于抽选出一个总体的“模拟物” 通过主观分析来确定和选择组成这种模拟特的成员 事先规定的条件,有目的地寻找 含有“方便”的成分,调查者无意中根据自己的需要进行选择,四、雪球抽样(Snowball Sampling) 从总体中的少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人,再去找那些人并再询问他们知道的人。 经常用于实地研究 每个被访问的人都可能被要求介绍其他的人来参与调查 如同性恋调查、“小姐”生活状态调查,容易找到相同性质的群体成员 容易接近饱和状况 偏误大,代表性受到质疑,小结: 在某些场合,非概率抽样是一种
15、有用和便于进行抽样的方法。 在代表总体的准确性和精确度上存在危险 不能直接进行推广 需要进行概率抽样,二、概率抽样方法,概率抽样:按照概率原理进行,要求样本的抽取具有随机性。 总体中每一个成员都具有同等的被抽中的可能性。,简单随机抽样(Simple random sampling) 给抽样框内每一个抽样单位进行编号 准备号码库 随机抽取所需要数量的号码 借用随机数表 比较麻烦,费时,随机数表构成: 随机组成的5位数 以随机顺序排列N行N列 随机数表的使用 对总体中的所有元素编码 确定随机数需要几位数字(由总体规模决定,所抽取的随机数要求有可能涵盖所有元素,如总体为2000,共要4位数字) 随机
16、选定一个五位数为起点 随意确定选择顺序:上、下、左、右、对角 在所选 出的五位数中确定其中N位作为抽中元素号码,系统抽样(Systematic sampling) 系统化地选择完整名单中每第K个元素组成样本。 对抽样框内每一个抽样单位进行编号 确定抽样间距(如1000个人中抽取100人,每隔10抽一人)=总体大小 /样本大小 确定抽样起点,在间隔单位中随机选取一个起点 注意:元素排列不得具有周期性,全楼80户,抽取10户进行调查 抽样间隔为8 起始点为1,101,102,103108 201,202,203208 301,302,303308 1001, 1008,分层抽样(stratifie
17、d sampling) 对简单随机抽样和系统抽样的一种修正 减少抽样误差的因素: 大样本比小样本抽样误差小 同质总体比异质总体抽样误差小 把异质总体根据一定原则分为若干相对同质的次级总体 在次级总体中进行简单随机抽样或系统抽样 分层变量:性别、专业、年龄、地区,分层抽样需要注意的问题 一、分层标准: 以所要分析和研究的主要变量或相关变量作为分层标准; 以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量; 以那些已经有明显层次区分的变量作为分层变量。,分层需要注意的问题 二、分层的比例问题 按比例分层:按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法
18、。可得到一个与总体结构完全一样的样本。 不按比例分层:主要用于对不同层次的子总体进行专门研究或比较,如用于推断总体,需要进行加权处理。,整群抽样(cluster sampling) 以整群作为抽样单位(一个城市、一个社区) 只要该群(丛)被选中,则该群中的所有成员都进入随后的子样本。 适用于群内异质性较大、群间异质性较小的情况。 多级整群抽样:总体-次级总体-再次级总体 注意 效率高,受抽样框影响小 产生抽样误差的机会增多 尽量的多抽群, 减少群内元素,多阶段抽样(Multistage Sampling) 按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。 从总体到获得最终样本元素经过多个阶段抽样 适用于范围大、总体对象多的社会调查 误差较大,应相对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年新疆维吾尔自治区社区工作者招聘考试模拟试题及答案解析
- 江西应用科技学院《公司治理学》2025-2026学年期末试卷
- 长春职业技术大学《房屋建筑与装饰工程估价》2025-2026学年期末试卷
- 2026年平顶山市卫东区社区工作者招聘笔试模拟试题及答案解析
- 2026年河北省秦皇岛市社区工作者招聘笔试模拟试题及答案解析
- 2026年酒泉市肃州区社区工作者招聘笔试参考题库及答案解析
- 2026年长沙市天心区社区工作者招聘考试参考试题及答案解析
- 糖尿病饮食管理健康宣教
- 2026年昭通市昭阳区社区工作者招聘考试参考题库及答案解析
- 2026年佳木斯市前进区社区工作者招聘笔试参考题库及答案解析
- 2026年演出经纪人之《演出经纪实务》基础试题库及答案详解(历年真题)
- 2026版医疗保障基金使用监督管理条例实施细则解读课件
- 海南海南省纪委监委所属事业单位2025年招聘8名事业编制人员(第1号)笔试历年参考题库附带答案详解(5卷)
- 中国原子能工业有限公司招聘笔试题库2026
- 街道志愿者服务工作制度
- 广东江西稳派智慧上进教育联考2026届高三年级3月二轮复习阶段检测语文+答案
- 2026山东出版集团有限公司山东出版传媒股份有限公司招聘193人备考题库及完整答案详解【历年真题】
- 人教版2024-2025年九年级数学2年全国中考真题汇编 5.2 矩形、菱形与正方形 第3课时 正方形
- 2025年职业技能鉴定考试(科技咨询师)测试题及答案
- 【新教材】人美版(2024)小学4年级劳动下册项目二+任务三+活体蔬菜豌豆苗(教学课件)
- 《零碳办公建筑评价标准》
评论
0/150
提交评论