版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、中山大学资讯管理学院周旖 博士2012-11-15社会科学研究方法05. 定量与定性的抽样提 纲引言: 为什么要抽样社会科学研究:寻求关于社会的答案研究对象测量抽样对抽样样本的研究真的能够代表真实的、总体的情况吗引言: 为什么要抽样案例 北京社会抽样调查结果显示:十五岁为危险年龄 当前最受市民关注的社会热点问题仍聚焦物价 第二期中国妇女社会地位抽样调查主要数据报告(5) 当前社会十大问题抽样调查引言: 为什么要抽样2004年美国总统大选前夕所预测的民意调查结果引言: 为什么要抽样2001年美国“911”事件前后布什的支持率比较引言: 为什么要抽样结论:对研究对象进行抽样,进而只针对样本的测量,
2、其测量数据在某种程度上是与普遍事实相符的,可以代表总体的情况。社会科学既是一门艺术也是一门科学,而抽样则偏社会科学既是一门艺术也是一门科学,而抽样则偏向于科学,并且更具备技术化的特点。向于科学,并且更具备技术化的特点。非概率抽样概率抽样概率抽样的逻辑和技巧:本章的主要内容;严谨和精确的主题5.1 非概率抽样非概率抽样(nonprobability sampling) 抽取样本的方式并不依据概率理论。 作为一种定性的抽样方法,表现为选取个案。 适用情况: (1)对从中抽取样本的大群体或总体情况知之甚少; (2)大群体或总体数量庞大。 类型: 就近法 目标式或判断式抽样 滚雪球抽样 配额抽样 选择
3、线人5.1 非概率抽样非概率抽样(nonprobability sampling) 就近法 案例演示:http:/ 随意选择很方便就可取得的个案,并且会很轻易地得到一组相当不代表总体的样本。在可行性上具有合理性可以作为前测可以提供有益的见解切不可过度推论极冒险的方法5.1 非概率抽样非概率抽样(nonprobability sampling) 目标式或判断式抽样(purposive or judgmental sampling) 选择观察对象的方式是以个人的判断为基础: 研究者对研究对象总体构成的要素或研究目标有所认识。 适用情况:(1)选择特别能提供信息的独特个案;如:针对某本权威学术刊物的
4、内容,研究某学科的研究趋势的变化。(2)选取很难接近、特殊总体中的成员;如:研究农民工信息获取权利保障的情况。(3)需要确认特殊个案类型,以便深入研究。如:深入访谈学生的消费行为。是否最有效或者为最佳代表5.1 非概率抽样非概率抽样(nonprobability sampling) 滚雪球抽样(snowball sampling) 一种经常用于实地研究的非概率抽样方法,每个被访问者都可能被要求介绍其他人参与访谈: 适用情况:(1)研究社会关系网络,如岭南大学图书馆的赠书来源。(2)特定总体的成员难以寻找时,如研究吸毒。5.1 非概率抽样非概率抽样(nonprobability sampling
5、) 配额抽样(quota sampling) 一种根据预先了解的总体特征来选择样本的方法,能够保证样本的特征分布和所要研究的总体一样; 抽样实施示例建立全国性的配额样本 第一步:获得有关全国人口中,城市人口的比例、居住在东部地区人口的比例、男性人口的比例、各年龄阶层人口的比例、不同教育水平的比例等构成类型矩阵 第二步:根据研究目的,固定抽取的类别,按照各个类别相对于总体的比例,决定每一个类别要抽取的样本数目;强调样本的代表性体现出对所抽取的样本加权的思想,使抽取的样本能够合理地代表整个总体。抽取方法为随机抽取缺陷1:配额的框架必须十分精确,掌握最新的资料。缺陷2:随机抽取会存在误差5.1 非概
6、率抽样非概率抽样(nonprobability sampling) 配额抽样(quota sampling) 练习:假设全国人口的年龄分布为:30岁以下人口占25%,30-60岁人口占50%,60岁以上人口占25%;此外,各年龄阶段的性别比例为:30岁以下人口中的男性占60%,女性占40%;30-60岁人口中的男性占65%,女性占35%;60岁人口中的男性、女性比例各位50%。问题:如果要形成一个40人的样本,那么各年龄阶层各应该抽取男性和女性样本分别为多少?5.1 非概率抽样非概率抽样(nonprobability sampling) 选择线人(snowball sampling) 线人(i
7、nformants):对你所希望研究的社会现象相当熟悉的人,而且愿意告诉你他所知道的。 受访者:只提供关于自身的情况; 线人:提供关于研究对象的一切信息 Eg. 通过访问社工研究自闭症患儿与“受访者”区分5.2 概率抽样:逻辑与理论概率抽样(probability sampling) 根据概率理论来选择样本的方法的总称。通过保证总体中的每个要素都有一个已知的(非零)、被抽中的概率,概率抽样能够计算出有意识和无意识的抽样误差。 用途:从大的、已知总体中抽取有代表性的样本精确地、统计性地描述大型总体逻辑在同质性极高的特例群体里,一个个案就足以成为整个总体的样本。基本观念对总体进行有用的描述从总体中
8、抽样出来的样本必须包含总体的各种差异特征核心:随机抽样5.2 概率抽样:逻辑与理论概率抽样(probability sampling) 随机抽样: 任何要素都具有同等的、独立于任何其他事件被抽到的概率。Eg. 掷硬币 方法:随机数表或电脑程序(P524,P204) 随机数表使用方法举例:某社区图书馆计划调查社区用户的信息需求,计划从社区的95户家庭中随机抽取10户调查。 即使最仔细的抽样也不可能提供对总体的完全代表性,一定程度的抽样误差总是存在的。避免偏见可通过预测相关参数的抽样分布估测衡量标准:置信水平与置信区间。5.2 概率抽样:逻辑与理论总体与抽样框(sampling frame) 总体
9、所有要素的名单或是准名单表 样本的选择来源 一个样本的代表性直接依赖于抽样框代表总体要素的程度 举例:针对一个街区的调研 总体样本的初级抽样单位是街区内的所有街道 街区的名册可以成为一个抽样框 常见抽样框:街道户口登记名册、电信公司的电话簿、各机构的名册、产品目录、销售目录等等。根据样本所得的研究成果,只能代表组成抽样框的各个要素的集合。5.3概率抽样设计的类型简单随机抽样系统抽样分层抽样多级整群抽样5.3 概率抽样设计的类型简单随机抽样 最基本的抽样技术 方法:每一个代表着总体的单元都用一个数字来代替,然后在随机数字表中进行抽样选择 练习: 档案馆计划从馆藏的800盒民国档案中抽取60盒,调
10、查档案载体的破损情况。请利用随机数表进行抽样。单纯的简单随机抽样在实践中几乎不用!5.3 概率抽样设计的类型系统抽样 选择完整名单上每第K个要素组成样本的概率抽样方法 举例:抽查课堂考勤,在全班同学的名单中选择每5个人抽点一次 与简单随机抽样的方法相同,但是更为实用。 两个常用术语: 抽样间距(sampling interval):两个被选择要素间的标准距离。抽样间距=总体大小 / 样本大小 抽样比率(sample ratio):被选择要素与所有总体要素数量的比率。抽样比率=样本大小/ 总体大小注意的问题:名单中要素的排列方式很关键。第一个要素是随机产生的。5. 3 概率抽样设计的类型分层抽样
11、 在抽样之前先将总体要素分成相对同质性群体的过程。 降低抽样误差的程度,增进样本的代表性。 分层的功能:将总体分成几个同质的次级集合。为什么有这样的效果?降低误差的方法:(1)大样本(2)同质群次级集合的分层标准以及精确描述程度根据研究的需要而确定。5.3 概率抽样设计的类型分层抽样 分层抽样案例:调查某大学在校本科生课外活动内容,假设该大学有在校本科生15225人,计划抽样人数为1100人。 研究总体与抽样框架:总体为某大学全体在校本科生,抽样框架可来自学校教务处的学生名册。 分层:课外活动情况与年纪和性别有关,所以分层为:大一男生、大一女生、大二男生、大二女生、大三男生、大三女生、大四男生
12、、大四女生。 样本选择: 方法1:按照各个次级群体的相对比例,简单随机或系统抽样; 方法2:将所有学生按照次级群体排列,然后系统抽样。 样本修订:因为经费原因,只能发放1000份问卷再次使用系统抽样切不可简单随机抽样5.3 概率抽样设计的类型分层抽样 分层抽样练习案例:调查某大型医院医职人员的工作压力,已知该院共有医职人员520人,需抽样100人进行调研,医院人事部门可以提供一份按照入院工作时间排列的名单。 研究的总体和抽样框架是什么? 分层的标准是什么?职位人数百分比(%)行政人员152.88院内医师254.81院际医师254.81登记护士10019.23助理护士10019.23药剂师751
13、4.42值班人员509.62出纳人员7514.42维修人员305.77清洁人员254.81总计520100如何进行样本选择,,每个职位各能选出多少人?5.3 概率抽样设计的类型概率比例抽样、非比例抽样和加权法可以消除误差,但是不要求掌握。第一次分层抽样第二次分层抽样第三次分层抽样多级整群抽样 一种比较复杂的抽样技巧,需要一种重复两个基本的步骤:列表名册和抽样。 使用情况:无法获得总体要素名单。 必须考虑的两个问题:群的数量 & 群的规模 案例:对广东省大学生的就业情况进行调研第一步:获得广东省所有高校的名录http:/ 课后练习 目标:从枫树镇抽取一组240人的随机样本 已知条件:枫树
14、镇有55个区,每个区各有20条街区(提示:可以任选6个区,每个区任选4个街区),并假设你所抽取的第X区第Y街区有45户人家。 要求:写出每次抽样的步骤、抽样依据和抽得的区与街区的编号,并假设你所抽取的某个街区符合上述所说得“第X区第Y街区有45户人家”的要求,请详述在这一街区内抽样的方法和步骤,并写出所抽取的编号。 下次课上,抽取两个小组报告做作业的情况(需要做PPT详细叙述)5.3 概率抽样设计的类型决定样本数量的因素: 计划进行的资料分析的类型 根据研究的目标,样本必须达到的精确程度 总体的特征决定样本数量的方法: 方法1:有关总体所做的假设和针对随机抽样过程采用统计方法 方法2:经验法则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年导医对初次就诊者的全程心理引导
- AI在药品与医疗器械中的应用
- 2026年CNC加工噪声与粉尘防护培训
- 2026年项目估算与预测技术应用手册
- 矿山隧道凿岩机械 YT23D凿岩机使用范围及技术规格
- 2025湖南省中考物理真题(解析版)
- 2025陕西省中考语文真题(原卷版)
- 2026年学校办公经费精细化管理与审批流程
- 2026年岩土工程师职业发展手册
- 2026年医务科呼吸机临床应用培训总结
- 智能护理技术在手术室护理中的应用
- CRC培训管理制度
- 2024年高考(全国甲卷)英语 阅读七选五真题深层解析+三年真题+题型策略及练习(学生版+解析版)
- 2025至2030中国匹克球球拍行业项目调研及市场前景预测评估报告
- 水电建设工程质量监督检查大纲
- 煤矿新工人安全考试题库及答案解析
- GB/T 24460-2025太阳能光伏照明装置总技术规范
- 智库项目课题申报书
- 学堂在线医学英语词汇进阶(首医)作业单元测验答案
- 2025年山东卷政治参考答案及评分细则
- 地铁行业面试常见问题及答案
评论
0/150
提交评论