新闻传播学量化研究方法3.pptx_第1页
新闻传播学量化研究方法3.pptx_第2页
新闻传播学量化研究方法3.pptx_第3页
新闻传播学量化研究方法3.pptx_第4页
新闻传播学量化研究方法3.pptx_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

新闻传播学量化研究方法 第三讲 抽样,2,同学报告 老师点评,Zhu & He的论文是如何提出假设的? 2. 论文涉及到哪些范式理论概念变量测量 3.PCI、PNI、PPI这些概念是如何被定义的? (nominal & operational definitions),3,什么叫抽样/sampling?,通过科学的方法,从总体(population)中抽取样本(sample) 完美的抽样应该使样本继承总体的主要特征,样本:6个球 大:中:小1:2:3 红:黄:蓝1:1:1,抽样,4,抽样的几个基本概念,总体/总体量:有待抽样的所有对象,e.g.全国的电视观众、所有的微博用户 个体:总体中的单个成员,e.g.电话号码为88888888的家庭、名为“李刚”的博友 样本/样本规模:被抽中的调查对象,e.g. 研究腐女的小组抽中了100名深大女生 抽烟框:抽样的时候所使用的“花名册”,里面包括了总体的全部名单 e.g.深大教务处提供的学生名单,新浪微博提供的用户名单 样本的统计值:根据样本计算出来的值,e.g.中国互联网信息中心CNNIC 调查的6万个样本,平均上网时长为18.3个小时/周 总体参数:根据样本统计值推断出来的总体数值,e.g.CNNIC根据样本推算出 中国网民平均每周上网时间为18.3%个小时 置信度:从样本统计值推算总体参数的时候,可能出现误差的概率 抽样误差:从样本统计值推算总体参数的时候,可能出现误差的范围,5,以CNNIC报告解读总体、个体、样本、抽样框等概念:,6,抽样的几个基本概念之样本统计值、总体参数,总体参数:根据总体中所有单位的数据计算出来的指标 (总体均值、总体比例、总体方差,等等) 它往往是未知的(除非在人口普查和总统大选中才会有确切值) 所以,一般我们用样本统计值去推断总体参数 这种推断,必然存在误差(即,抽样误差) 如果抽样方法不科学,甚至有可能出现非常大的误差 1936年美国总统大学,最终结果是罗斯福:兰登62%:38%,样本统计值:根据样本中各单位的数值计算出来的 (样本均值、样本比例、样本方差,等等) 1936年文学文摘调查240万美国人 罗斯福:兰登43%:57%,7,抽样的几个基本概念之置信度、抽样误差,抽样就是试图“用一滴水折射出太阳的光芒” 在以小样本推断大总体的时候,必然存在误差 幸运的是,我们可以根统计学上的正态分布钟形曲线,估计出误差范围 以及出现此误差的相应概率,即置信度/置信水平/confidence level 一般我们希望置信水平能够达到95%以上 通俗而言,就是,如果对总体进行100次抽样,有95次以上得到的数据都是在这个范围内 不同的置信度 对应着不同的误差范围 置信水平越高,误差范围越大,8,举例阐释上述概念之央视春晚收视率调查,自中央电视台春节联欢晚会播出后的20时30分起,截至24时零分,通过电话共成功访问了分布在全国各地406个区县的2034个家庭,其中1872个家庭收看了春节联欢晚会;经数据加权后推算出,2009年除夕夜,在全国收看电视的家庭中,有95.6%的家庭收看了中央电视台春节联欢晚会。在收看过晚会节目的家庭中,81.1%的受访者认为今年中央电视台春节联欢晚会办得“好”。,1.这项调查的总体是 2009年除夕晚上所有的电视观众 2.全国各地406个区县的2034个家庭是这项调查的 样本 3.这项调查使用的抽样框是 全国各地家庭的电话号码 4.“81.1%的受访者认为春晚办得好”是这项调查获得的样本统计值 。基于这个数据, 我们可以进行推算出全国电视观众对春节晚会的评价,也就是总体参数值。,9,举例阐释上述概念之零点调查,零点公司在2009对北京、上海、广州、武汉、成都、沈阳、西安7个城市以及浙江绍兴诸暨、福建福州长乐、辽宁锦州北宁、河北石家庄辛集、湖南岳阳临湘、四川成都彭州、陕西咸阳兴平7个小城镇总计3038名16 -60岁常住居民进行入户访问,进行了“居民生活质量指数调查”。调查发现医疗改革问题是2009年度中国城镇居民关注的首要问题,提及率为34.8%1.01%。近六成居民乐观期待新医改方案的功效,同时,也有近四成人认为新医改方案依然难以解决看病就医难的问题。,1. 这项调查的总体是2009年全国的城镇居民。 2. 7个城市和7个小城镇的3038名常住居民是这项调查的样本。 3. 零点报告中出现的“1.01%”是这项调查的 抽样误差 。 4.“医疗改革问题是2009年度中国城镇居民关注的首要问题(提及率为34.8%)”是这项调查获得的样本统计值。基于此, 我们推算出全国城镇居民对医疗改革问题的关注度为34.8%1.01% ,也就是总体参数值。,10,问卷调查中的误差,调查是一门“误差”的艺术,11,如何控制误差?,误差类型 控制方法,访员故意误差 欺骗 监督,诱导被调查者 证实,访员非故意误差 访员特征 选择和训练访员,误解 实习和角色训练,疲劳 休息或调整,受访者故意误差 撒谎 确保匿名和保密、激励 证实检查、“第三者”技巧,不回应 确保匿名和保密、激励 证实检查、“第三者”技巧,受访者非故意误差 误解 周密设计的问卷,猜测 直接性的问题,注意力减弱 周密设计的问卷,干扰 给出“不知道”选项,疲劳 调整量表中的正反秩序,提示语,12,如何计算调查最终的回答率?,假设你要通过电话调查网民对淘宝商城事件的看法 你们共打出1000个不是空号的电话 有800人接了电话 其中,400人是网民且完成全部问卷(成功访问,I) 50名虽然是网民但中途中止(中断数,P) 100虽然是网民但拒绝访问(拒绝数,R) 50名虽然是网民但总是不能过来接电话(未能接触,NC) 200人虽然接听的电话,但不是网民(无效样本) 150个电话没有人接听(可能是不在家,也可能这个住宅无人居住) 50个电话是忙音 请问:最终的回答率应该是多少?,13,如何计算调查最终的回答率?,以下几个选项,哪个回答率计算最准确 1.回答率800(接受访问)/1000(样本总量) 2.回答率400(成功访问)/1000(样本总量) 3.回答率400(成功访问)/800(接受访问)-200(非网民) 4.回答率400(成功访问)/(1000-150-50-200) 5.回答率400(成功访问)+200(非网民)/1000(样本总量) ,课堂练习: 请罗列公式,计算出此次访问的最终回答率(response rate),14,如何计算调查最终的回答率?,尽管上述计算方法常见于调查报告中,却都不够准确 根据APPOR的RR3计算公式, RR3=I/(I+P+R+NC+eU) 其中I是成功数,P是访问中断数,R是拒绝数,NC是未能接触数 eU是身份不明者中合格者之估计数,回答率,400,400+50+100+50+,400+50+100+50,400+50+100+50+200,(150+50),15,抽样的一般程序,界定总体的范围,选择抽样方法,制定合适的抽样框,实施抽样,对样本进行调查,以CNNIC的网民调查为例,1.界定总体:全中国6岁以上居民 2.选择抽样方法:简单随机抽样 3.制定抽样框:根据中国各地电话号码 的规律制定随机生成电话号码的规则 4.实施抽样:使用CATI(电脑辅助电话调查)系统随机拨打电话,共计6万样本 6.对样本实施调查:使用CATI系统访问6万个样本,16,传播学研究可能用到的抽样方法总图谱,随机抽样并非随意抽样 它与非随机抽样的区别: 随机抽样中,总体的成员被选为样本的概率已知 比如掷骰子,每一面出现几率是1/6 而非随机抽样中,总体的成员抽中的概率未知 比如街头访问,抓到谁就是谁 无规律可言,无概率可言,17,非随机抽样之便利抽样,convenience sampling 顾名思义,怎么方便怎么来 常见于街头拦截访问 实施地点多为交通要道、住宅区、商业区等人口稠密地带 其利与弊都非常鲜明 定量研究中基本不推荐使用,18,非随机抽样之判断抽样,judgment sampling 在对总体的特征有较充分了解的基础上 抽取那些最能代表总体的单位 常用于小组座谈或深入访谈的抽样 比如研究AV的小组 基于对身边同学的了解 认为哪一类同学更有可能看AV片(囧!) 然后,按照这类同学的特征 抽取十几个样本,分别做深入访谈 或者集中做焦点小组,19,非随机抽样之推荐抽样,referral sampling 又名“滚雪球”抽样 最开始只有很少数的样本 对他们实施调查之后 请被访者推荐几个符合要求的样本 依此类推,最后获得较大的样本量 一般用于调查比较隐私的话题 或者比较难接近的群体 比如,研究在深韩国人的媒介使用的小组 最初只认识少数韩国留学生 通过他们推荐,慢慢辐射到更多的样本,20,quota sampling 是最有技术含量的非随机抽样 如果实施得当 所得到的样本被随机抽样样本的质量更高 根据总体的关键特征(如性别、年龄、教育程度、家庭收入、居住地等等) 来确立各类被访者的配额 然后“按图索骥”找到符合要求的人进行访问 哪怕就是自己身边的人,只要符合条件 就可以作为样本,你绝对想不到的! 美国民意调查机构 只需要调查1000个民众 就能准确预测总统选举结果 而他们所使用的方法 就是配额抽样,非随机抽样之配额抽样,22,配额抽样也有可能犯错,1948年美国总统大选,Gallup等多家调查公司使用配额抽样 在选举前一个月公布“杜威将领先杜鲁门515”,并决定没有必要再进行进一步的调查 而事实上,投票结果显示:杜鲁门领先杜威4.4%,错在哪里? 配额抽样只决定了各类人群的数量,而在这类中具体调查哪些,则由调查员自行决定。因此,调查员较多地选择了那些素质更高更愿意合作的人(更可能是亲共和党/杜威人士) 调查的结束得过早,杜鲁门后来居上(龟兔赛跑_); 调查忽略了“骑墙派”(主意未定,处于观望状态的人); 支持杜鲁门的人投票踊跃;支持杜威的人投票率低。 美国民调机构从中吸取教训,从那以后,在总统选举调查中基本没有出过错误,23,课堂练习:他们用了哪种非随机抽样方法?,央视索福瑞打通电话后问:“请问您是哪个年龄段的人?是20岁以下、21-35岁、36岁-50岁、还是50岁以上?”如果被访者回答:“我是50岁以上”,访问员就说:“我们已经对和这个年龄段的人进行了足够的调查,不需要再进一步向您提问,谢谢您的合作。” 下课时间,在文科楼门口派发问卷 某报要做70年代专题,记者把采访问卷从QQ上发给10名70年代的朋友,再由他们每人发给下10名 研究翻墙的小组打算寻找大学文化以上的人进行深入访谈,24,随机抽样之简单随机抽样,抽签法(抓阄法):虽然很直接,但操作性较差 如果要在深大上万师生中抽样,就要做上万个签!,随机数表法:首先给总体的成员分配一个序号 然后在随机数表取任一起点 然后按照一定的规则选取符合要求的数字,计算机抽取:SPSS等统计软件可自行产生随机数,完成抽样 如何用SPSS产生随机数 链接,25,使用随机数表进行简单随机抽样,课堂练习:在学号130同学中抽样,总体(N)30,要抽取样本(n)6人,随 机 数 表,几乎所有涉及到抽样的与统计的书 的附录里面都会提供随机数表 如果你手头没有这样的书籍 可以上网百度或google一下 “随机数表” 打印出来备用,26,随机抽样法之分层抽样法,Stratified sampling: 把总体按照一定的原则分成若干个子总体(层) 然后在每个层内进行抽样 如果要在某大学传播学院共计1000名的全部同学中随机抽取100名,广告系(300人),新闻系(200人),网新系(100人),某大学传播学院学生(N1000人),可以采用两种方法: 1.等比例分层抽样:该层单位越多,则抽取的样本就越多 ni/Ni=n/N 广告系样本/300100/1000,应该抽取30人 2. 不等比例分层抽样:各层单位数相差悬殊或某层内个体差异悬殊 对单位数少、个体差异悬殊的层多抽一点,所以网新抽取样本10人,传播系(200人),27,2009年深圳常驻人口结构,28,深圳各区以各社区家庭户为基数的样本结构(2008年数据),30,抽样标准改变后对结果的影响(王老师CATI调查数据),按人口样本分配:特区内每期145人,占36.25% 特区外每期255,占63.75%。 按户数样本分配:特区内每期229,占57.25% 特区外每期171人,占42.75%。 样本结构变化引起调查结果的变化:,31,各报周到达率比较,32,随机抽样法之整群抽样法,Cluster sampling: 把总体分解为几个群 抽样的时候直接抽取群 然后对抽群中的所有单位都进行调查。 如果要对深圳居民的媒介使用情况进行调查(N1200万) 一步法:先对612社区进行整群随机抽样(抽30个) 然后,再对这30个社区的居民进行普查 二步法:先对612社区进行整群随机抽样(抽30个) 然后,在这30个社区中随机抽取一定数量的住宅楼 然后,对该住宅楼的所有家庭进行普查,33,随机抽样法之系统抽样法,Systematic sampling:使用最广泛的随机抽样方法 经济有效、简易、方便 操作方法:将总体中的单位按某种顺序排列 在规定的范围内随机抽取起始单位 然后按一定规则确定其它样本单位,最常用的系统抽样方法:等距抽样 全班70名同学,按照学号排序,要抽取10人 则间距k=N/n =70/10=7 随机选一个学号,每隔7个抽一名同学,直到抽满10人,内容分析最经常使用系统抽样法 比如,要研究深圳早八点的新闻内容 可以抽这周的星期一、下周的星期二、再下周的星期三的报纸 一起组成内容分析的样本,34,课堂练习:他们用了哪种随机抽样法,1.调查腾讯QQ群的用户情况,先随机抽取300个QQ群,然后,对群中的所有成员都进行在线访问 2.研究深大高清点播论坛的发帖情况,先在论坛首页随机选取一个帖子作为起点,然后每隔10个帖子,抽取一个帖子,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论