第五章大众传播学研究方法抽样_第1页
第五章大众传播学研究方法抽样_第2页
第五章大众传播学研究方法抽样_第3页
第五章大众传播学研究方法抽样_第4页
第五章大众传播学研究方法抽样_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第五章第五章 抽样抽样第一节第一节 抽样的基本抽样的基本概念概念第二节第二节 非概率抽样非概率抽样第三节第三节 概率抽样概率抽样2 抽样设计将要解决的是调查谁的问题,即抽样设计将要解决的是调查谁的问题,即如何挑选调查对象的问题。如何挑选调查对象的问题。 要解决包括选择哪一部分作为调查对象,要解决包括选择哪一部分作为调查对象,这部分应包含的个体有多少,用什么样的这部分应包含的个体有多少,用什么样的方法进行选择,以及所选出来这一部分调方法进行选择,以及所选出来这一部分调查对象与总体间的关系是什么等问题。查对象与总体间的关系是什么等问题。3 一、为什么需要抽样一、为什么需要抽样 普查普查45 抽样

2、调查起源于统计学,抽样调查起源于统计学,18951895年,挪威统年,挪威统计学家凯尔在国际统计学会计学家凯尔在国际统计学会(International Statistical Institute, International Statistical Institute, ISI)ISI)第五届大会上提出第五届大会上提出“用代表性样本方用代表性样本方法来代替全面调查法来代替全面调查”的建议,这一年被认的建议,这一年被认为是抽样调查历史的开端。为是抽样调查历史的开端。6 抽样抽样就是从一个总体中抽取部分个体或元就是从一个总体中抽取部分个体或元素组成样本的过程。素组成样本的过程。 原因:原因: 1

3、、节省研究经费和时间、节省研究经费和时间 2、提高研究者对研究过程的管理效率、提高研究者对研究过程的管理效率7抽样的假设:抽样的假设: 1、部分是含于整体之中;、部分是含于整体之中; 2、部分与整体具有相同的特征、规律、相、部分与整体具有相同的特征、规律、相互关系及变化过程;互关系及变化过程; 3、部分能够为研究者提供一个有关整体状、部分能够为研究者提供一个有关整体状态、态度、意见和行为更加清晰的脉络。态、态度、意见和行为更加清晰的脉络。8 抽样的目的抽样的目的获得具有代表性的样本获得具有代表性的样本 代表性意味着:代表性意味着: 1、样本和总体的分布系统相同、样本和总体的分布系统相同 2、总

4、体和样本的均值相同、总体和样本的均值相同 3、总体和样本里变量之间的关系相同、总体和样本里变量之间的关系相同9二、抽样的基本概念二、抽样的基本概念 (一)总体和元素(一)总体和元素 1、总体、总体 总体是研究中所涉及的所有个体的集合,它总体是研究中所涉及的所有个体的集合,它可以是一群人,一批文件,一些事件或观念。可以是一群人,一批文件,一些事件或观念。 2、元素、元素 构成总体的每一个个体就是元素。构成总体的每一个个体就是元素。 例如,研究我国媒体对艾滋病的报道,那么例如,研究我国媒体对艾滋病的报道,那么上万家媒体就成为本研究的总体,每一家具上万家媒体就成为本研究的总体,每一家具体的媒体是构成

5、总体的元素。体的媒体是构成总体的元素。10 确定研究的总体和元素,要依赖研究者个确定研究的总体和元素,要依赖研究者个人的判断。人的判断。 例如调查我国新闻工作者的职业意识,例如调查我国新闻工作者的职业意识,“新闻工作者新闻工作者”都包括哪些人?都包括哪些人?11 (二)样本(二)样本(sample) 按照一定方法,从总体抽取出的部分个体按照一定方法,从总体抽取出的部分个体就组成了就组成了样本样本,用它来代表总体。,用它来代表总体。 如果对总体中所有元素进行研究,称为普如果对总体中所有元素进行研究,称为普查查 (census)。)。12 如:上海地区记者生存状态调查总体限定为上海地区报纸、广播电

6、视、杂志的拥有记者证的一线采编人员,主要媒体单位包括SMG、文新集团、解放日报集团、第一财经日报、新民周刊、瞭望东方等上海主流媒体集团。被调查的200名记者以报纸平媒体记者为主要组成部分,占到样本总数的60.67%。因此本次调查样本偏向于报纸、杂志平面媒体记者。主要基于以下因素考虑:上海主流媒体中广播电视呈现一家独大的局面,文广集团是上海最大的广播电视集团,而竞争相对激烈的领域在于平面媒体。13 抽样框抽样框指的是包含总体所有元素的详细名单、指的是包含总体所有元素的详细名单、地图或其他形式的资料。可以分为名单抽样地图或其他形式的资料。可以分为名单抽样框、地图抽样框、时间抽样框等。框、地图抽样框

7、、时间抽样框等。 在抽样框中,每个元素都有自己的对应位置在抽样框中,每个元素都有自己的对应位置或顺序,通常通过编号来实现。或顺序,通常通过编号来实现。抽样框抽样框14第一节第一节 抽样的基本概念抽样的基本概念几个概念的区别几个概念的区别总体总体样本样本抽样框抽样框抽样抽样研究对象研究对象的总体的总体总体中抽出总体中抽出的成员的成员总体的列总体的列表名单表名单抽出样本抽出样本的过程的过程15假定要进行一项有关改革开放假定要进行一项有关改革开放30年来全国性报纸年来全国性报纸的广告内容方面的研究,试说明抽样过程的广告内容方面的研究,试说明抽样过程 为了简化问题,假定研究的主要目的是改革开放为了简化

8、问题,假定研究的主要目的是改革开放30年年来来人民日报人民日报、中国青年报中国青年报、光明日报光明日报三三份全国性报纸的广告规模、内容及形式等方面的变化;份全国性报纸的广告规模、内容及形式等方面的变化; 总体:总体:1978年年1月月1日至日至2007年年12月月31日在上述三份日在上述三份报纸上刊出的全部广告;报纸上刊出的全部广告; 抽样框:北京图书馆内可以查阅到的在此抽样框:北京图书馆内可以查阅到的在此30年期间上年期间上述三份报纸上的广告;述三份报纸上的广告; 抽样单位:报纸,可以按照等距抽样来进行;抽样单位:报纸,可以按照等距抽样来进行; 记录单位:每份报纸上各个版面各种类型的广告;记

9、录单位:每份报纸上各个版面各种类型的广告; 总体参数:各类报纸和版面上不同时期刊出的平均广总体参数:各类报纸和版面上不同时期刊出的平均广告条数、平均面积数、各种类型广告条数所占的比重、告条数、平均面积数、各种类型广告条数所占的比重、面积所占的比重等。面积所占的比重等。16(三)概率抽样和非概率抽样(三)概率抽样和非概率抽样 概率抽样概率抽样是根据随机原则进行的选择,每个是根据随机原则进行的选择,每个个体被选择的概率是已知的。它可以在抽样个体被选择的概率是已知的。它可以在抽样过程中避免人为因素造成的误差,还可以计过程中避免人为因素造成的误差,还可以计算出由样本推断总体时的抽样误差,因而其算出由样

10、本推断总体时的抽样误差,因而其样本能够推断总体;样本能够推断总体; 非概率抽样非概率抽样并不遵循随机原则,而是根据主并不遵循随机原则,而是根据主观意识在研究对象中进行的选择,它无法确观意识在研究对象中进行的选择,它无法确定每个个体被选中的概率是多少,无法计算定每个个体被选中的概率是多少,无法计算抽样误差,所以不能从样本推断总体。抽样误差,所以不能从样本推断总体。17(四)随机性(四)随机性 随机性随机性意味着没有任何已知的准则能够描意味着没有任何已知的准则能够描述事件或解释结果。述事件或解释结果。 随机不等于随意或随便,它是根据概率论随机不等于随意或随便,它是根据概率论的基本原理来确定样本,不

11、遵循任何已知的基本原理来确定样本,不遵循任何已知的确定的准则。的确定的准则。18三、抽样的原理三、抽样的原理 小样本、大样本小样本、大样本 为什么大样本能够代表总体?为什么大样本能够代表总体? 大数法则:总体中的每一个元素都包含着大数法则:总体中的每一个元素都包含着能够体现总体规律的稳定特征和不能体现能够体现总体规律的稳定特征和不能体现总体规律的偶然现象。总体规律的偶然现象。对某个元素来讲,对总体的结论可能不成对某个元素来讲,对总体的结论可能不成立;立;但当总体规模很大的时候,偶然现象可以但当总体规模很大的时候,偶然现象可以相互抵消,总体呈现出稳定特征。相互抵消,总体呈现出稳定特征。19 对大

12、样本进行统计分析所得出的并非是针对大样本进行统计分析所得出的并非是针对所有个体都适用的结论,而是估计一定对所有个体都适用的结论,而是估计一定概率机会下总体特征出现的可能性有多大,概率机会下总体特征出现的可能性有多大,个体所体现出的无规律的偶然性被限制在个体所体现出的无规律的偶然性被限制在“一定概率机会一定概率机会”这个前提之下。这个前提之下。2034标准常态曲线标准常态曲线21中心极限定理中心极限定理 当样本数量足够大的时候(如大于当样本数量足够大的时候(如大于30),),那么,无论总体的分布如何,其样本的平均那么,无论总体的分布如何,其样本的平均值所构成的分布都趋于正态分布。值所构成的分布都

13、趋于正态分布。 当无穷次地按照同一原则进行抽样时,虽然当无穷次地按照同一原则进行抽样时,虽然每次抽取出来的样本所包含的个体并不相同,每次抽取出来的样本所包含的个体并不相同,但是这些样本的均值的分布呈现正态分布,但是这些样本的均值的分布呈现正态分布,而且这个正态分布的中间位置(即样本的平而且这个正态分布的中间位置(即样本的平均值的平均值)就是总体的平均值。均值的平均值)就是总体的平均值。22四、抽样过程中的误差四、抽样过程中的误差 1、随机误差随机误差:不可控因素造成的误差,:不可控因素造成的误差,降低了个体被选入样本或被分析的机会。降低了个体被选入样本或被分析的机会。 案例:案例:文学摘要文学

14、摘要的厄运的厄运预测结果预测结果实际结果实际结果阿尔夫阿尔夫. .伦敦伦敦55%55%阿尔夫阿尔夫. .伦敦伦敦37%37%富兰克林富兰克林. .罗斯福罗斯福41%41%富兰克林富兰克林. .罗斯福罗斯福61%61%23文学摘要文学摘要为什么会出现为什么会出现这样严重的错误?这样严重的错误? 原因之一是抽样框和总体不原因之一是抽样框和总体不符:抽样框主要是根据电话符:抽样框主要是根据电话号码簿和汽车登记册建立的。号码簿和汽车登记册建立的。 另一个原因是由于回收率低另一个原因是由于回收率低引起的误差:总共寄出了一引起的误差:总共寄出了一百多万份问卷,但是返回的百多万份问卷,但是返回的问卷不足问卷

15、不足25%。24 2、抽样误差抽样误差:抽样误差是指在采用随机抽:抽样误差是指在采用随机抽样技术,由调查结果推算全体时,预先能样技术,由调查结果推算全体时,预先能算出来的误差。算出来的误差。 抽样误差会受到样本规模的影响:一般而抽样误差会受到样本规模的影响:一般而言,采用随机抽样时,样本规模愈大,抽言,采用随机抽样时,样本规模愈大,抽样误差愈小。样误差愈小。 抽样误差是衡量样本代表性强弱的标准。抽样误差是衡量样本代表性强弱的标准。25 样本规模样本规模是指抽样单位数,在随机抽样时是指抽样单位数,在随机抽样时必须确定必要的样本数。必须确定必要的样本数。样本数过多,浪费人力、物力、财力和样本数过多

16、,浪费人力、物力、财力和时间;时间;样本数过少,会影响调查结果的精确度,样本数过少,会影响调查结果的精确度,造成较大误差。造成较大误差。五、样本规模五、样本规模26影响样本规模的因素:影响样本规模的因素: (一)对精确性的要求(一)对精确性的要求 置信水平置信水平(confidence level):从样本推论:从样本推论总体时,我们有多大的信心确定样本会在总体时,我们有多大的信心确定样本会在可容忍误差内正确反映总体。可容忍误差内正确反映总体。 一般有一般有90%、95或或99置信水平。置信水平。 社会科学研究通常把置信水平定为社会科学研究通常把置信水平定为95。27 简单随机抽样中推论总体平

17、均数的样本规模计算公式为: 推论总体成数(或百分比)的样本规模计算公式为:222etn221epptn224etn 28简单随机抽样所需要的最小样本量简单随机抽样所需要的最小样本量抽样误抽样误差差()置信水平置信水平90%时的样时的样本规模本规模置信水平置信水平95时的时的样本规模样本规模置信水平置信水平99时的时的样本规模样本规模168069604166412170224014160375610671849442560010405272384666618926746229 (二)研究者的精力和经费(二)研究者的精力和经费 (三)总体的异质性程度(三)总体的异质性程度 总体异质性程度越高,需要

18、的样本量越大。总体异质性程度越高,需要的样本量越大。 (四)研究方法和研究目的(四)研究方法和研究目的 (五)数据分析里所涉及的变量数目(五)数据分析里所涉及的变量数目 一般来说,多变量数据分析比一元二元变一般来说,多变量数据分析比一元二元变量分析要求更大的样本规模。量分析要求更大的样本规模。30 我们能不能说我们能不能说“总体越大,样本规总体越大,样本规模越大模越大” ?31第二节第二节 非概率抽样非概率抽样 优点:优点:1.按一定的主观标准抽选样本,可以充分利按一定的主观标准抽选样本,可以充分利用已知资料。用已知资料。2.可以缩小抽样范围,节约调查时间、调查可以缩小抽样范围,节约调查时间、

19、调查人员和调查费用。人员和调查费用。 不足:不足:无法判断其误差,检查调查结果的准确性。无法判断其误差,检查调查结果的准确性。32一、偶遇抽样一、偶遇抽样(accidental or haphazard sampling) 或任意抽样、方便抽样:研究者把一定时间内或任意抽样、方便抽样:研究者把一定时间内一定环境里最容易接触到的人作为样本的方法,一定环境里最容易接触到的人作为样本的方法,如街头拦访、商业调查、试测。如街头拦访、商业调查、试测。 但是偶遇抽样不是随机的,但是偶遇抽样不是随机的, 结果偏差较大,可信程度结果偏差较大,可信程度 较低,没有足够代表性。较低,没有足够代表性。33 志愿者抽

20、样(志愿者抽样(volunteer sampling)34 志愿者抽样存在的问题:志愿者抽样存在的问题: 1、回收率低;、回收率低; 2、参加研究的志愿者往往更倾向于、参加研究的志愿者往往更倾向于“夸大夸大”真实情况。真实情况。35二、立意抽样(二、立意抽样(purposive sampling) 或目的抽样、判断抽样:指研究者根据特定或目的抽样、判断抽样:指研究者根据特定目的和主观判断而确定研究样本。目的和主观判断而确定研究样本。 适用情况:适用情况: 1、研究对象是那些难以接触的、特定总体、研究对象是那些难以接触的、特定总体中的个体中的个体 2、研究对象是独一无二的个案、研究对象是独一无二

21、的个案 3、研究者清楚地知道自己的目的是试图深、研究者清楚地知道自己的目的是试图深入了解某些特定类型的人群入了解某些特定类型的人群36 三、配额抽样(三、配额抽样(quota sampling ) 根据调查目的找出与研究目的关系密切的根据调查目的找出与研究目的关系密切的特性作为配额指标,抽样时保证样本中具特性作为配额指标,抽样时保证样本中具有某种特性的比例与总体中具有这种特性有某种特性的比例与总体中具有这种特性的比例一致。的比例一致。37 配额抽样法是在分层基础上进行的。配额抽样法是在分层基础上进行的。配额抽样法的基本步骤:配额抽样法的基本步骤: 1、选择控制特性作为分层标准选择控制特性作为分

22、层标准 2、分层、分层 3、确定各层样本额、确定各层样本额 4、配额指派、配额指派38 配额抽样根据其抽样方法可以分为: 1、独立控制配额抽样独立控制配额抽样,规定按独立的控制特征分配并抽取样本,即对调查对象只规定具有一定控制特征的样本抽取数目并规定配额,而不是规定具有两种或两种以上控制特征的样本抽取数目并规定配额。 2、非独立控制配额抽样非独立控制配额抽样,也称为相互控制的配额抽样或交叉控制配额抽样。是同时对具有两种或两种以上控制特征的每一个样本数目都作出具体的规定。39独立控制配额抽样案例独立控制配额抽样案例 一项研究要调查400名北京市区18-42岁的白领阶层对时尚的看法,配额的重要指标

23、是城区、性别、年龄、职业。根据已知的资料得知总体中这四个指标的大致比例,则400人的样本也应该与总体中各项指标的比例相一致:城区东城西城朝阳海淀宣武崇文合计50501001005050400性别男女400人200200年龄18-28岁29-35岁36-42岁400人100200100职业公务员企业管理公司行政事业单位大学生400人8060140804040非独立控制配额抽样非独立控制配额抽样 某大学有4000名学生,其中男生占60%,女生占40%,管理类和理工类学生各占50%,大一、大二、大三、大四的学生比例分别为40%、30%、20%和10%,现在要抽取500人进行调查,按非独立控制配额抽样

24、,其情况如下:男男女女管理类管理类理工类理工类管理类管理类理工类理工类年级年级一一 二二 三三 四四一一 二二 三三 四四一一 二二 三三 四四一一 二二 三三 四四人数人数60 45 30 1560 45 30 15 40 30 20 10 40 30 20 1041四、滚雪球抽样(四、滚雪球抽样(snowball sampling) 或网络抽样(network sampling ):是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象。 这种抽样中有些分子最后仍无法找到,有些分子被提供者漏而不提,两者都可能造成误差。

25、42第三节第三节 概率抽样概率抽样 优点:优点:1.排除了人为的干扰。排除了人为的干扰。2.能够计算调查结果的可靠程度。能够计算调查结果的可靠程度。 不足:不足:1.对所有调查样本都给予平等看待,难以体现对所有调查样本都给予平等看待,难以体现重点。重点。2.抽样范围广,所需时间长,参加调查的人员抽样范围广,所需时间长,参加调查的人员和费用多。和费用多。3.需要具有一定专业技术的专业人员进行抽样需要具有一定专业技术的专业人员进行抽样和资料分析。和资料分析。43概率抽样的基本程序概率抽样的基本程序 1、明确研究的目的,确定研究所要估计的、明确研究的目的,确定研究所要估计的主要总体参数;主要总体参数

26、; 2、确定研究总体和抽样单元;、确定研究总体和抽样单元; 3、确定和构造抽样框:、确定和构造抽样框: 在确定调查总体和抽样单位后,应将总体按在确定调查总体和抽样单位后,应将总体按照抽样单位划分为各部分,构成抽样框;照抽样单位划分为各部分,构成抽样框; 4、选择适当的抽样方法以及确定样本量的、选择适当的抽样方法以及确定样本量的大小;大小; 5、制定抽样方案的具体实施细节。、制定抽样方案的具体实施细节。44一、简单随机抽样(一、简单随机抽样(simple random sampling) 又称单纯随机抽样,是所有随机抽样方法中又称单纯随机抽样,是所有随机抽样方法中最简单的一种方法。最简单的一种方

27、法。 它按照随机的原则从调查总体中不加任何分它按照随机的原则从调查总体中不加任何分类、排序、分组等先行工作,直接从总体中类、排序、分组等先行工作,直接从总体中逐个抽取若干单位组成研究样本。逐个抽取若干单位组成研究样本。45 1、无放回的简单随机抽样、无放回的简单随机抽样 2、非常简单随机抽样、非常简单随机抽样 概率抽样是不是等概率抽样?概率抽样是不是等概率抽样?46抽样框抽样框 在进行随机抽样时,在进行随机抽样时,研究者首先要列出一研究者首先要列出一个包含所有元素的详个包含所有元素的详细名单,每个元素都细名单,每个元素都对应着一个独一无二对应着一个独一无二的、以数字表示的位的、以数字表示的位置

28、,这个名单就是抽置,这个名单就是抽样框。既没有遗漏,样框。既没有遗漏,也没有重复。也没有重复。47简单随机抽样的方法简单随机抽样的方法1、抽签法:当总体很小的时候,将抽样框、抽签法:当总体很小的时候,将抽样框中的中的N个元素编号,把每个元素的号码写个元素编号,把每个元素的号码写在签上,将签充分的混合,随机不放回的在签上,将签充分的混合,随机不放回的抽取直至样本规模符合要求。抽取直至样本规模符合要求。2、随机数表法:从随机数表上的任意位置、随机数表法:从随机数表上的任意位置开始,横向或纵向地连续选择数字,每个开始,横向或纵向地连续选择数字,每个数字所代表的那个元素就被选入样本。数字所代表的那个元

29、素就被选入样本。3、计算机模拟法;、计算机模拟法;4、使用统计软件直接抽取、使用统计软件直接抽取4849 二、系统抽样(二、系统抽样(systematic sampling) 又称等距抽样、机械抽样,就是先将总体各元素按一定标准排序编号,再根据样本规模确定抽样间隔,然后随机确定以某个元素为起点,每隔若干个元素抽取一个,直到抽取元素符合样本规模的要求。 抽样间距 = 总体规模 样本规模50先按某种顺序给800名观众编号, 然后随机确定起点为12, K=80010=80,则样本包括编号为 12,92,172,252,332,412,492,572,652,732的十个人。例:使用系统抽样从例:使用

30、系统抽样从800名观众中抽取名观众中抽取10名名作为调查对象作为调查对象51 1、媒介内容分析:、媒介内容分析: 构成周抽样构成周抽样 2、系统抽样有可能造成抽样误差。、系统抽样有可能造成抽样误差。 如抽样框里的如抽样框里的800800个元素按收入高低排序:个元素按收入高低排序: 1212,9292,172172,252252,332332,412412,492492,572572,652652,732732 7575,155 155 ,235 235 ,315 315 ,395395,475475,555555,635635,715715,795795 因此,抽样框里的元素要不要按照某种顺序

31、因此,抽样框里的元素要不要按照某种顺序排列,要看这种顺序是否影响了研究变量。排列,要看这种顺序是否影响了研究变量。 3 3、避开抽样框里的元素排列周期、避开抽样框里的元素排列周期52 三、分层抽样三、分层抽样 也称分类抽样,方法是将总体按照某些重要也称分类抽样,方法是将总体按照某些重要的指标分成若干个互不重叠、穷尽的层次,的指标分成若干个互不重叠、穷尽的层次,使总体中的每一个单位都属于且只属于一个使总体中的每一个单位都属于且只属于一个层次,然后在每一层内分别进行简单随机抽层次,然后在每一层内分别进行简单随机抽样或系统抽样,将各层所抽取出的子样本组样或系统抽样,将各层所抽取出的子样本组成总的研究

32、样本。成总的研究样本。53小学或以下小学或以下10%初中初中20% 大专以上大专以上30%高中或中专高中或中专40%大专以上大专以上3000人人N1高中或中专高中或中专4000人人N2初中初中2000人人N3小学或以下小学或以下1000人人N430n140n220n310n4总体总体N=10000样本样本n=100人人某电视台需要了解某个电视节目的受众接受程度,以观众某电视台需要了解某个电视节目的受众接受程度,以观众受教育程度为标志,划为四个层次:小学及以下、初中、受教育程度为标志,划为四个层次:小学及以下、初中、高中或中专、大专及以上分别取样,合并成样本。高中或中专、大专及以上分别取样,合并

33、成样本。54 分层抽样的优点:分层抽样的优点: 1 1、降低抽样误差:分层抽样可以避免样本、降低抽样误差:分层抽样可以避免样本差异过大导致的抽样分布不准确。差异过大导致的抽样分布不准确。 2 2、了解不同层的情况、了解不同层的情况 当具备某些特征的个体在总体里所占比例当具备某些特征的个体在总体里所占比例比较少,而这些特征又可能会影响最终的比较少,而这些特征又可能会影响最终的研究结果时,研究者往往采用分层抽样。研究结果时,研究者往往采用分层抽样。55 如研究我国新闻工作者的职业意识。如研究我国新闻工作者的职业意识。 研究者希望能够发现新闻工作者的地理位置研究者希望能够发现新闻工作者的地理位置和他

34、们的报道风格、收入水平、教育程度等和他们的报道风格、收入水平、教育程度等因素之间的关系。因素之间的关系。 东部大城市的新闻工作者要多过于西部,如东部大城市的新闻工作者要多过于西部,如果进行简单随机抽样,西部的入样概率低于果进行简单随机抽样,西部的入样概率低于东部。东部。 因此首先得按照地理位置(东南西北)和每因此首先得按照地理位置(东南西北)和每个省的国民生产总值(高中低)将全国个省的国民生产总值(高中低)将全国3131个个省划分为省划分为1212组,然后在每一组里进行随机抽组,然后在每一组里进行随机抽样,最后的样本才能够体现不同地理位置、样,最后的样本才能够体现不同地理位置、不同经济发达程度

35、地区的新闻工作者的特征。不同经济发达程度地区的新闻工作者的特征。56在实际操作中,使用分层随机抽样应注意以下在实际操作中,使用分层随机抽样应注意以下几点:几点: 1 1、分层的标志必须可以把总体分隔为相互排分层的标志必须可以把总体分隔为相互排斥的层次,而层间不能交叉重叠;斥的层次,而层间不能交叉重叠; 2、各层之间差异大,但层内差异小;、各层之间差异大,但层内差异小; 3、各层单位数目和比例必须能够获得;、各层单位数目和比例必须能够获得; 4、分层的层次数量不宜太多。、分层的层次数量不宜太多。57分层抽样与配额抽样分层抽样与配额抽样 相同点:相同点: 都是事先对总体中所有单位按其属性、特征都是

36、事先对总体中所有单位按其属性、特征进行分类,这些属性、特征我们称之为进行分类,这些属性、特征我们称之为“控控制特征制特征”; 不同点:不同点: 分层抽样是按随机原则在层内抽选样本(简分层抽样是按随机原则在层内抽选样本(简单随机抽样单随机抽样&系统抽样),配额抽样则是由系统抽样),配额抽样则是由调查人员在配额内主观判断选定样本(偶遇调查人员在配额内主观判断选定样本(偶遇抽样抽样&立意抽样)。立意抽样)。58 当研究者的抽样框不完整,研究对象在地当研究者的抽样框不完整,研究对象在地理位置上过于分散,而研究经费有限时,理位置上过于分散,而研究经费有限时,研究者如何抽样?研究者如何抽样

37、?59 四、整群抽样(四、整群抽样(cluster sampling) 或群集抽样,是先将总体划分为若干个群集,或群集抽样,是先将总体划分为若干个群集,然后以简单随机抽样的方法选取部分群集作然后以简单随机抽样的方法选取部分群集作为调查样本,对群集内各个单位进行调查的为调查样本,对群集内各个单位进行调查的一种随机抽样方法。一种随机抽样方法。 优点:优点: 1.可以通过转换抽样单位扩大抽样的应用范围可以通过转换抽样单位扩大抽样的应用范围 2.可节省人力、财力可节省人力、财力60总体群数总体群数R=16 样本群数样本群数r=4 样本容量样本容量ABCDEFGHIJKLMNOPLHPDhlpdnnnn

38、n(一)单级整群抽样(一)单级整群抽样611 1、定义、定义 又称多阶抽样、多级抽样或分段抽样,它是又称多阶抽样、多级抽样或分段抽样,它是按抽样元素的隶属关系或层次关系,把抽样按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。过程分为几个阶段进行。 调查对象总体庞大,分布广泛时采用。调查对象总体庞大,分布广泛时采用。 如:全国如:全国省省市市区(简单随机抽样)区(简单随机抽样)(二)多级整群抽样(二)多级整群抽样622、多级整群抽样的步骤、多级整群抽样的步骤 以大群为单位编制抽样框以大群为单位编制抽样框 抽取若干大群抽取若干大群 以小群为单位给每个大群编制抽样框以小群为单位给每个大群

39、编制抽样框 分别从每个大群中抽取小群分别从每个大群中抽取小群 根据需要重复根据需要重复3、4步骤步骤 得到基本元素,构成研究样本得到基本元素,构成研究样本63多级整群抽样案例多级整群抽样案例共有共有50个村个村270人人200人人180人人170人人160人人 190人人 110人人 180人人 210人人200人人170人人190人人210人人20人人20人人20人人20人人总体总体N=10000样本样本n=100110人人20人人64案例案例 调查背景:为了解普通居民对某种新节目的接受程调查背景:为了解普通居民对某种新节目的接受程度,需要在一个城市中抽选度,需要在一个城市中抽选100010

40、00户居民开展调查,户居民开展调查,在每户居民中,选择在每户居民中,选择1 1名家庭成员作为受访者。名家庭成员作为受访者。 总体抽样设计:由于一个城市中居民的户数可能多总体抽样设计:由于一个城市中居民的户数可能多达数百万,除了一些大型的市场研究机构和国家统达数百万,除了一些大型的市场研究机构和国家统计部门之外,大多数企业都不具有这样庞大的居民计部门之外,大多数企业都不具有这样庞大的居民户名单。这种情况决定了抽样设计只能采取多阶段户名单。这种情况决定了抽样设计只能采取多阶段抽选的方式。抽选的方式。 根据调查要求,抽样分为两个阶段进行,第一阶段根据调查要求,抽样分为两个阶段进行,第一阶段是从全市的

41、居委会名单中抽选出是从全市的居委会名单中抽选出5050个样本居委会,个样本居委会,第二阶段是从每个被选中的居委会中,抽选出第二阶段是从每个被选中的居委会中,抽选出2020户户居民。居民。651 1、对居委会的抽选、对居委会的抽选 从统计或者民政部门,我们可以获得一个城市的居委会名单。将居委会编上序号后,用计算机产生随机数的方法,可以简单地抽选出所需要的50个居委会。2 2、在居委会中的抽样、在居委会中的抽样 在选定了居委会之后,对居民户的抽选将使用居委会地图来进行操作。此时,需要派出一些抽样员,到各居委会绘制居民户的分布图居民户的分布图,抽样员需要了解居委会的实际位置、实际覆盖范围,并计算每一

42、幢楼中实际的居住户数。然后,抽样员根据样本量的要求,采用系统抽样或者其他方法,抽选出每个居委会的20户,作为最终访问的样本。 663 3、确定受访者、确定受访者 访问员根据抽样员选定的样本户,进行入户访问。以谁为实际的被调查者,是抽样设计中最后一个问题。 如果调查内容涉及的是受访户的家庭情况,则对受访者的选择可以根据成员在家庭生活中的地位确定,例如,可以选择收视时间最长的人、收入最高的人、实际负责购买决策的人等等。 673、多级整群抽样的误差:、多级整群抽样的误差:每级抽样都会有误差,故误差较大。每级抽样都会有误差,故误差较大。群集之间的差异越大,则整群抽样的误差越大。群集之间的差异越大,则整群抽样的误差越大。68 当对某市的新闻工作者进行调查时,研究者当对某市的新闻工作者进行调查时,研究者需要从全市需要从全市1010家新闻单位中抽取具体的人,家新闻单位中抽取具体的人,一个有两千职工的电视台与一个只有四十人一个有两千职工的电视台与一个只有四十人的杂志社所占的地位,显然是很不一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论