统计学-02统计调查.ppt_第1页
统计学-02统计调查.ppt_第2页
统计学-02统计调查.ppt_第3页
统计学-02统计调查.ppt_第4页
统计学-02统计调查.ppt_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学,从数据到结论,第二章统计调查,获取数据,数据是如何获取的?,我们每个同学的户籍信息 大家对加薪的态度信息 研究珠海市GDP发展情况 我国一二三产业结构变化情况 某种肥料的对植物生长的促进效果 某种药物对某种疾病的治疗效果,2.0 数据是怎样得到的?,可从报纸、电视、互联网、年鉴等方面看到各种数据 并且从这些数据可以提取对自己有用的信息。 这些间接得到的(并非自己收集的)数据都是二手数据。,2.0 数据是怎样得到的?,获得第一手数据要困难得多 某方便面企业每年至少花三四千万元来收集和分析数据 调查其产品及竞争者在市场中的状况、各种类型消费者对其产品的态度、收集各地方的经济交通等信息等等,2.0 数据是怎样得到的?,他们如同间谍,收集各种情报 他们很舍得在这方面花钱。因为市场信息数据是企业生存所必需的,绝不是可有可无的。,2.0 数据是怎样得到的?,在自然的未被控制的条件下观测到的数据,称为观测数据(observational data)。 在人工干预和操作情况下收集的数据就称为试验数据(experimental data)。 同学们自己可以举出大量的观测数据和试验数据的例子,2.1 统计调查概述,2.1.1 统计调查的意义 2.1.2 统计调查工作的要求 准确性 及时性,2.1 统计调查概述,2.1.3 统计调查方案的设计 1 确定调查目的 2 确定调查对象(总体)和调查单位 3 确定调查内容(调查表) 4 确定调查时间 5 调查的组织实施,以全国第六次人口普查为例,2.2 统计调查的组织方式和方法,2.2.1 统计调查的分类 按调查对象的范围 全面调查 非全面调查 按调查时间的连续性 经常性调查(适用于时期现象) 一次性调查(适用于时点现象),统 计 调 查 的 种 类 分 类 标 志 被研究总体的范围 调查登记的时间 调查资料的来源 全面调查 连续调查 直接调查 全面报表 不连续调查 凭证调查 普 查 派员调查 非全面调查 问卷调查 抽样调查 重点调查 典型调查,2.2 统计调查的组织方式和方法,2.2.2 统计调查的组织方式 1 统计报表 按国家统一规定的表式,统一的指标项 目,统一的报送时间,自下而上逐级定期提供基本统计资料的一种调查方法。 特点:统一性、全面性、周期性、相对可靠性,2.2 统计调查的组织方式和方法,2.2.2 统计调查的组织方式 2 普查 专门组织的、一般用来调查属于一定时点上的社会经济现象数量的全面调查。 特点:周期性的一次性调查、全面、系统,末尾为“0”的年份进行人口普查; 末尾为“6”的年份进行农业普查; 末尾为“3”和“8”的年份进行经济普查,2.2 统计调查的组织方式和方法,2.2.2 统计调查的组织方式 3 重点调查 是一种非全面调查,它是对所要调查的现象总体的全部单位中选择一部分重点单位进行调查。 特点:客观性、范围比较小的全面调查,总体中有重点单位,了解基本情况,2.2 统计调查的组织方式和方法,2.2.2 统计调查的组织方式 4 典型调查 是根据调查的目的任务,对所研究的现象总体进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。 特点:主观性、划类选典,2.2 统计调查的组织方式和方法,2.2.2 统计调查的组织方式 5 抽样调查 是一种非全面调查,它是按照随机原则从总体中抽取部分调查单位进行观察用以推算总体数量特征的一种调查方式。 特点:代表性调查、随机原则;估计总体;误差可控,优越性:经济性、时效性、准确性、灵活性,抽样调查,在抽取样本时,如果总体中的每一个体都有同等机会被选到样本中,这种抽样称为简单随机抽样(simple random sampling), 而这样得到的样本则称为随机样本(random sample)。,抽样调查,如果总体是一锅八宝粥,随机样本则是充分搅拌后的八宝粥中的任意一勺 该勺中的八宝粥的成分比例应该和整个一锅粥类似 搅拌越充分,样本的代表性也越好,抽样调查,一勺八宝粥中的成分比例和整锅不尽相同,可能稍微多些或稍微少些。这是很正常的,因为样本的特征不一定和总体完全一样 这种差异不是错误,而是必然会出现的抽样误差(sampling error)。,抽样调查,抽样调查中,人们因为种种原因没有对调查做出反映,这种误差称为未响应误差(nonresponse error)。 一些人因为各种原因回答时并没有真实反映他们的观点,这称为响应误差(response error)。,抽样调查,和抽样误差不一样,未响应误差和响应误差都会影响对真实世界的了解 应该在设计调查方案时和进行调查过程中尽量避免,大街上派发问卷的调查方式是? A 简单调查 B 随机抽样调查 C 典型调查 D 重点调查,2.2 统计调查的组织方式和方法,2.2.3 统计调查方法 直接观察法(库存盘点) 采访法(人口普查) 报告法(统计报表制度) 实验调查法,2.2 统计调查的组织方式和方法,2.2.3 统计调查方法实验调查法 实验组和对照组 喝柑橘汁抵抗坏血病的发生? 仿制产品会不会影响正品的销售?,数据的来源直接来源,直接来源,普查,统计调查方式,统计报表,重点调查,典型调查,抽样调查,选择适合调查方式的方法,2.3 问卷设计,2.3.1 问卷的结构 封面语 指导语 问题与答案 编码,2.3 问卷设计,2.3.2 提问题的格式 填空式 二项式或者否定式 多项式 矩阵式 直线式 序列式,提问形式和类型,1. 开放性问答题 开放性问答题是指所提出的问题并不列出所有可能的答案,而是由被访者自由作答。 例如:“您没有去看病的原因是什么?”,优点,激发自由思维,阐明应答者的观点,引出建议,故能收集到生动的资料,应答者之间的一些较细微的差异也可能反映出来,甚至得到意外发现。 特别适宜作探索性研究时。,缺点,需花较多时间和精力,应答者必须找到适当词语表达。 开放式问题要求应答者有较高的文化程度。 由于许多人不习惯或不乐意用文字表达自己的看法,往往导致应答率低。 开放式问题往往无法归类编码,难以建立有意义的变量作统计分析。,2. 封闭性问答题,是指已事先设计了各种可能的答案、被访者只要从中选定一个或几个现成答案的提问方式。 您的文化程度是: 0=文盲 1=小学 2=初中 3=高中/中专 4=大专 5=大学 6=大学以上,优点,便于回答、节省时间 可以将不相干的回答减少到最低程度 利于提高调查表的回收率和有效率 易于进行各种统计处理和分析,缺点:,是被访者只能在规定的范围内回答,可能无法反映其他各种真实的想法; 它的设计比较困难,一旦设计有缺陷,被访者就可能无法正确回答问题,从而影响调查质量; 对有些人,答案给了他们猜测和随便选答的机会; 有时容易发生笔误。,3半封闭性问答题,是上述两种问题的折中,虽然提供选择,应答者还可以创造自己的答案。 如你最多求助于哪一类人员(请只选一项): =家庭服务协调者 =医院的社会工作者 社区精神病医生 其他(请详述 ),优点: 如果确切的选择忽略了,答案也能提供;如果“其他”类型很多,则提示所提供回答的选择项目可能不够充足。 缺点: “其他”类提供信息很少,应答者常选择提供的几种答案,较少创造自己的观点。,2.3 问卷设计,2.3.3 问卷设计的原则和注意事项 主题明确 结构合理,逻辑性强 通俗易懂 方便性原则,调查表制定时应考虑的问题,1调查表说明要简单明了,打动人心 调查表的说明关系到调查的质量与效果,一般要用委婉、感人的语气,说明调查的目的、意义,尤其是要让被调查者觉得调查对自己有作用和意义,或者能够帮助别人,激发他们助人为乐的积极性。,2避免用不确切的词,一些副词和形容词,如“很久”、“经常”、“一些”等,各人理解往往不同,在调查表设计中应避免或减少使用。 例如,“您是否经常生病?” “您上月生了几次病?”或者“最近半年内您生了几次病?”。 “您在哪儿出生?” “您在哪个地方出生(请注明省、市或县)”,3避免提断定性问题,例如,“您一天抽多少支烟?”这种问题即为断定性问题,被调查者如果根本不抽烟,就会造成无法回答。 正确的处理办法是在此问题前加一条“过滤”性问题。如“您抽烟吗?”。如果回答“是”,可继续提问,否则就终止提问。,4避免引导性提问,引导性提问指所提出的问题暗示出研究者的观点和见解,有使被访者跟着这种倾向回答的可能。 例如,“有人认为被动吸烟会导致肺癌,您同意吗?”。 0=不同意 2=不知道 3=同意 “被动吸烟会导致肺癌”。 0=不同意 2=不知道 3=同意,5避免令被访者难堪和禁忌的敏感问题,包括各地风俗和民族习惯中忌讳的问题、涉及个人利害关系的问题、个人隐私问题等。 例如,“您是否离婚?您家有多少存款?,处理方法:,敏感问题调查法 释疑法:即在问题前面写一段消除顾虑的文字,或在调查表引言中写明替被调查者严格保密,并说明将采取的保密措施。 假定法:用一个假定条件句作前提,然后再询问被访者的看法。 转移法:把本应由被访者根据自己的实际情况回答的问题,转移到由被访者根据他人的情况来阐述自己的想法。,6避免提笼统、抽象或不确切的问题,容易误解的概念应明确限定。 例如,年龄有虚岁、实岁; 收入是仅指工资,还是包括奖金、补贴、其他收入、实物发放折款收入在内; 家庭人口有常住人口和生活费开支在一起的人口。,7避免一问多答的问题,一个项目最好只问一个要点,一个项目中如果包含过多询问内容,会使被访者无从回答,给统计处理也带来困难。 例如,“您的父母是知识分子吗? “您的父亲的文化程度是? “您的母亲的文化程度是?,8表中每一问题均有明确的目的,对于每一个问题,必须明确为什么要提出这一问题,这一信息将用来做什么样的分析,如何编码和分析。,9最大限度地保证信息质量,问题的表达和顺序有利于启发被调查者(应答者),问题要使人感兴趣,并易于回忆,要避免那些难以回答、浪费时间、使人感到窘迫的问题。,10要做到文字简洁、问题流畅,注意与应答者中文化程度最低者的沟通技术。 一个问题转到另一问题时,注意逻辑关系、用词和语气,如从一般到个别、容易到困难等。,11. 调查表的长度,许多专家认为恰当长度的问卷在面谈中执行的时间不超过半小时。 只应该询问那些与研究问题或与假设相关的事物,不应该询问无关的问题。 问题的书写,取决于你希望研究的问题所能覆盖的范围。,中华牙膏调查问卷(部分),1、你用过中华牌牙膏吗? 是( )否( ) (二项选择法) 2、你认为中华牌牙膏怎么样? 很好()好( )较好( ) 一般( )差( ) 3、你所用过的牙膏有哪些? a 洁银( ) b 两面针( ) c 黑妹( ) d 中华 ( ) e 黑人( ) f 佳洁士 ( ) g 高露洁( ) h 雕牌 ( ) (2、3题多项选择法),4、评分标准 很好10分 好 8分 较好 6分 一般 4分 差 2分 请按以上的评分标准给第三题中列出的牙膏质量评定分数,分数填入括号内。 (赋值选择法) 5、你对我厂生产的中华牌牙膏有什么意见? 。 (自由回答法),提问,2.问卷结构特点 问答由一个问题顺势转入下一个问题;由一个主题转到另一个主题。不要有跳跃而导致回答的无方向性。 建议:从一般问题到特殊问题。,提问,“南方周末中国内地人物创富榜”读者调查问卷 1.您对中国的民营企业家的总体评价是 A.正面评价 B.负面评价 C.感受不大 2.如果您的评价是正面的,主要原因是 A.民营企业为从业者提供了工作机会和报酬 B.民营企业对国家经济发展的贡献大 C.民营企业对社会责任有所担当,扮演了企业公民的角色 D.其他,提问,3.如果您的评价是负面的,主要原因是 A.民营企业获取财富方法的正当性存在疑问 B.民营企业支配财富方面存在问题 C.民营企业没有积极承担社会责任 D.其他 4.您感受过民营企业对社会(包括您本人)的贡献吗? A.是 B.否 5.您是通过什么途径感受到民营企业对社会贡献的? A.本人直接受益 B.大众传媒 C.周围人口碑相传 D.其他,提问,盖洛普组织总结提问的目的有如下5种: (1)找出回答者是否觉察到这一结果; (2)获得关于结果的一般感觉; (3)获得该结果指定部分的答案; (4)获得反映回答者观点的理由; (5)找出持有这些观点的强烈程度;,提问,例: 1.你是否知道合肥和徐州之间要修条高速公路的计划? 知道/不知道 2.你是否同意合肥和徐州之间修条高速公路? 强烈同意、同意、无所谓、不同意、强烈不同意 3.你认为高速公路会对当地环境产生影响吗? 有/没有 4.如果反对,那你反对的理由是: (a)已经有一条可用的主干道 (b)合肥和徐州之间运量不足 (c)高速公路会损坏美丽的乡村风景 (d)道路会破坏历史文物 (e)其他,请指定,提问,5你准备用下列哪一种行动来支持你的观点? (a)给地区人大代表写信 (b)给新闻单位写信 (c)在政府召开的公众听证会上发言 (d)在网上发表呼吁文章进行调查 (e)其他,请指定,提问,提问的措辞 提问的措辞在诱导出有代表性回答中是非常重要的。一个有偏差的或诱导性提问将偏离给定的回答。 在问卷设计中发现的偏差主要有: (1)把两个或两个以上问题表达为一个; (2)问题中含有含糊或不熟悉的单词; (3)用软化难度或方向的词开始的提问; (4)包含条件或假设条款; (5)包含对回答者一个或多个指令的提问;,调查中的偏差,调查的偏差:抽样误差和非抽样误差 非抽样误差的来源: 1.涵盖误差:指由于在抽样框或样本中出现了涵盖不全、过度涵盖、重复以及错误的分类而导致估计的偏倚。 2.计量误差:指对一个问题所做的记录与它的真值不同,可能是由于被调查者和调查者对问题的误解、收集数据方式不同或测量工具而造成的。 3.处理误差:可能发生在数据编码、数据录入、审核及插补等步骤中。,调查中的偏差,4.无反应误差 在抽样调查中,我们希望能取得所要求的全部样本单位的数据或特征记录,但在实践中,常有部分单位的调查结果会因多种原因而出现空缺,即常称的无反应现象。 调查中无反应的原因 (1)调查对象联络不上,已经搬走 (2)被调查者不能胜任或无能力 (3)调查期间人不在 (4)拒绝合作 (5)丢失调查表,调查中的偏差,案例 Literary Digest杂志自第一次世界大战以来一直进行总统预测,而且每次都预测准了。 1936年美国总统选举前,Literary Digest杂志发出了1000万张调查问卷。回收到240万张,预测共和党候选人兰登(London)和民主党候选人罗斯福(Roosevelt)的得票比例是57:43,预测是根据240万张的民意调查回单作出的。 但实际选举结果是罗斯福赢得了这场选举,他与兰登得票比例是62 :38。,调查中的偏差,分析出现预测错误的原因: 第一.选取样本的方式不是随机的,它主要是从电话号码簿和各种俱乐部会员名册上去选取的,这些人大多是有钱人,他们支持共和党候选人兰登; 第二. 有760万张问卷无反应,在没有寄回的人中支持共和党和支持民主党人的比例一般与寄回来的240万答卷中的支持比例不一样,例如该杂志向芝加哥地区三分之一的登记选民发了调查问卷,有20%的被询问者作了回答,其中一半以上支持兰登,但实际选举的结果是在芝加哥地区是2 : 1有利于罗斯福。,调查中的偏差,在1936年美国总统选举的预测中,美国舆论统计学家盖洛普获得成功。他所领导的研究所等三家民意测验机构,只调查了比文学文摘少得多的选民,预测候选人罗斯福的投票率为54%。其抽样方法是他在从事新闻工作中发展起来的,采用派调查员亲自访问调查,事先将各个地区不同类型与不同人数的对象定额分配给每一个调查员,然后分头在全国范围内进行。他为了取得良好的测定效果,按照以接近数字的准确程度算出来的比例,从特定的各种类别的人中,选出三千个样本代表全国各个阶层人口的特征。,调查中的偏差,由于无反应(等于改变了原先随机抽取的样本)而造成的偏差叫“无反应偏差”。在调查中我们要尽量减少这种偏差。 为解决无反应问题,常用的处理方法有: 多次调查 对调查结果进行估算 在无回答者中抽取随机子样本调查 波利兹方案:是一种对于获得有回答的概率之间的差别,并相应地 对其加权的方法。 对无回答者的替代,汽油销售的调查,本次调查由国家汽油代理商组织,希望更多地了解消费者购买汽油时的期望。所有信息都会被保密。表格填好后请返回给我们。 1. 姓名和住址 2. 年龄和性别 3. 婚姻状况 4. 年龄状况:21岁以下 21-40岁 40-60岁 60岁以上,汽油销售的调查,5. 大多数汽油是由您购买的还是您的妻子购买的? 6. 去年您买了多少汽油? 5000升以上 5000-10000升 10000-2000升 20000升以上 7. 您的汽油油箱容积多大? 8.在您选购汽油时,价格的重要度如何?,汽油销售的调查,9. 请您尽可能充分地陈述什么原因使得您购买一种品牌的汽油而不买另一种? 10. 您喜欢秒覅提供礼物的加油站,是不是? 11. 当您用车执行公务时,您将获赠的礼物或者赠券留给自己,还是交给您的雇主? 12.您买年行驶的历程是长是短? 谢谢您的合作。,大学生逃课现象的分析,“必修课选逃,选修课必逃”,如今像这样的话语在大学校园中极为流行。时下大学生逃课成了一种比较普遍的现象,对各高校来说这可是一个不容忽视的问题,它会影响到学校教学质量和学生专业知识的提高。正常的教学秩序会促进校风的建设,同时也可为学生的学习创造一个良好的环境。经历了“黑色”六月,千辛万苦,好不容易迈进梦寐以求的大学校园,背负着父母殷切希望的大学生本应珍惜学习机会,努力学习。可他们为什么要逃课呢?,大学生逃课现象的分析,调查目的 确定对象(总体、总体单位)样本 确定调查内容变量 逃课的频率 逃课的原因 逃课做什么,逃课后的活动

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论