调查分析师《调查概论》课件_第1页
调查分析师《调查概论》课件_第2页
调查分析师《调查概论》课件_第3页
调查分析师《调查概论》课件_第4页
调查分析师《调查概论》课件_第5页
已阅读5页,还剩536页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

欢迎使用《调查概论》多媒体软件!1欢迎学习《调查概论》!学习测试学习还是测试?请按键!2学习内容第一章调查导论第二章调查设计第三章数据的收集方法第四章调查问卷设计第五章抽样方法第六章抽样估计第七章样本量的确定第八章数据收集的实施第九章数据处理第十章数据发布与数据分析退出学习31-1引言什么是调查?调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。调查的重要性。调查是认识客观世界的一种手段,通过调查获取信息,对于了解现状,进行管理决策和探索未来发展均具有重要意义。调查的任务。科学地反映客观情况,为解决问题、制定政策或策略提供依据,调查是为决策服务。51-2调查的步骤调查的计划和设计——调查前的准备——调查的实施——调查结果的分析与报告。调查设计调查前准备调查的实施调查的分析与报告61-3调查的分类调查可以从不同角度进行分类:一、按调查内容和性质来划分,可分为有关部门组织的专项调查、市场调查和科学研究调查等。按内容和性质划分市场调查科研调查专项调查7三、从调查是否重复来划分,可分为一次性调查和经常性调查。按是否重复划分一次性调查经常性调查9调查重要性案例分析

为了说明调查的重要性,现举国外两个市场调查的例子:一、上世纪八十年代,美国著名的科达公司为了改善其平稳的销售状况,进行了一项市场调查,通过调查发现,业余的摄影爱好者,由于不熟悉摄影技术,大约每年要损坏20亿张底片,这一调查研究导致了科研人员研究开发新的产品,从而一种Kodacdisc相机问世,这种相机大大减少了焦距不准和暴光不足的问题,该产品1982年投产以后成为科达公司历史上最成功的新产品之一。10

二、上世纪五、六十年代美国盖洛普公司曾经作过一项美国汽车需求情况的调查,发现很多家庭希望小型省油的汽车,但当时并没有引起美国汽车制造商的重视,仍把研发重点放在生产豪华的车型,结果到了七、八十年代,在世界汽车市场中,日本的中小型汽车获得了很大的份额,连美国本国也大量进口日本汽车,这才引起美国的重视。而汽车的研发到投产需要一个较长的时间,使美国的汽车业失去了一个很好的机遇。这个例子从反面说明了调查信息的重要性。11第二章调查设计第一节调查目标的确定第二节调查方法的选择第三节抽样设计的有关问题第四节调查中各种误差及其控制2-22-32-42-1132-1调查目标的确定一、明确信息需求:首先要弄清为什么要作这一项调查?调查的基本问题是什么?要把调查的目的搞清楚。二、数据的使用者和数据的用途:为了进一步明确调查目的,还要了解谁是数据的使用者,获得的信息主要用在什么地方?三、确定调查的指标和调查对象:解决向谁作调查和调查什么内容的问题。142-2调查方法的选择。一、采用全面调查还是抽样调查。全面调查——从总体的所有的单元中收集信息。抽样调查——从总体的一部分单元中收集信息来对总体进行估计。153、电话访问:访员通过电话协助被调查者完成问卷。4、网络调查:调查者利用网络进行调查。数据收集的基本方法1、自填式:被调查者在没有访员协助下完成问卷。2、人员面访:由调查人员协助完成问卷。172-3抽样设计的有关问题一、确定目标总体与调查总体。要使调查总体与目标总体尽可能一致。目标总体:就是希望从中获取信息的总体。调查总体:即实际调查所覆盖的总体,在抽样调查中称作被抽样的总体,通过抽样框来体现。18二、抽样框

(一)什么是抽样框?抽样框是包括全部总体单元的一个框架,用来进行抽样,它是辨别和联系总体单元的工具。应包括以下部分或全部内容:1、识别资料,如姓名、企业名称等。2、联系资料,用来与总体单元进行联系,如地址或电话号码等。3、辅助资料,它有助于改进抽样设计。19(三)、抽样框的优良准则:理想的抽样框是其中每一个单元与目标总体的单元一一对应,不要有遗漏或重复,并具有辅助信息可以利用。具体有以下一些标准:1、关联性。2、准确性。3、时效性。4、费用。5、使用标准的概念、定义和方法。21(四)几种有缺陷的抽样框及补救方法

1、不完全涵盖。即抽样框遗漏了一些总体单元。

2、过涵盖。抽样框中包含了不属于目标总体的单元,或是空白单元。

3、重复。抽样框中某些单元不止出现一次。

4、分类错误。补救方法:1、若问题不严重可忽略不计;2、重新定义总体,使与抽样框一致;3、改正抽样框。222-4调查中各种误差误差抽样误差非抽样误差抽样框误差计量误差无回答误差处理误差23二、非抽样误差是指除了抽样误差以外,调查活动过程中所产生的各种误差。它包括:(一)抽样框误差;(二)计量误差;(三)无回答误差;(四)处理误差。25本章结束继续往下返回本章另选章节26第三章数据收集的方法第一节自填问卷调查第二节派员访问调查第三节电话调查第四节其他的调查方法第五节各种数据收集方法的比较3-13-33-43-53-227自填问卷调查的缺点:1、回答率通常低于访员协助式方法。2、当问卷比较复杂时,通常就不如调查员在场的效果好。3、自填方法对被调查者的负担比较大。4、问卷返回可能比较慢,需要的时间比较长。5、不适用于文化水平比较低的调查总体。293-2派员访问调查一、特点:这是调查员与被调查者面对面进行的一种调查方式,调查结果在很大程度上取决于调查员的素质、能力和经验。二、优点:1、回答率比较高。2、可以使用比较复杂的问卷。3、通过调查员的观察和询问,及时解决被调查者的疑难问题可使调查数据比较准确。三、缺点:1、面访调查的费用比较高。2、调查的时间比较长。3、某些特殊群体的访问成功率比较低。4、实施调查过程中的质量控制比较困难。5、对调查人员的要求比较高,有时一时难以在所在地区招聘到足够的、合格的调查人员。303-3电话调查优点:1、时效快;2、费用低;3、可能访问到不容易直接调查对象;4、与邮寄调查相比,可以及时处理疑难问题;5、易于控制实施的质量;6、用计算机作辅助工具十分方便。缺点:1、难以包括全部单元2、受时间限制;3、容易受到语音障碍;4、回答率比访问调查要低313-4其他调查方法本书介绍了三种方法:直接观察法小组座谈法网络调查其他调查方法32直接观察法由调查员在现场对被调查者的情况直接观察、记录以取得有关信息的一种调查方法。33(一)直接观察法的优点

优点:1、直观性和可靠性;2、不受语言或人际交往的影响;3、简便易行,比较灵活。34(二)直接观察法的缺点缺点:1、有时需要特殊的调查人员或工具费用比较高。2、观察对象有局限性;3、观察结果容易受观察者的影响;4、有些现象观察的结果缺乏统计意义。35小组座谈法小组座谈法是采用小型座谈会的形式,从调查对象中挑选一组有代表性的人,在主持人的组织下,就某个专题进行讨论,以获得有关问题的深入了解。36(一)小组座谈法的优缺点优点:1、收集资料快、效率高;2、取得信息比较广泛深入;3、方式灵活;4、可进行科学监测。缺点:1、对主持人的要求比较高;2、回答的结果没有统一格式;3、有时间和内容的局限性。37网络调查网络调查调查可以分为电子邮件调查和网页调查,都是通过计算机的网络来进行。优点:1、成本低、范围广、速度快。2、交互性好,能够实现问卷的多样化设计。3、为各种调查提供了丰富的抽样框。4、有更好的质量控制。缺点:1、目前网络还不够普及,调查有局限性。2、回答率低。3、回答的真实性不能保证。4、被调查者的身份验证有很大困难。383-5各种数据收集方法的比较要根据费用、时间、回答率和总体特征等各种因素来选择数据收集的方法。简单归纳如下:自填方法面访电话访问费用低高中时间较长平均较短回答率低高中偏高总体特征的要求被调查者文化程度要高对一些特殊人群有困难调查对象必须有电话39本章结束继续往下返回本章另选章节40第四章调查问卷设计第一节引言第二节问卷结构与问题类型第三节问卷设计的技巧第四节问卷的度量方法4-14-24-34-4414-1问卷的作用与设计原则问卷的作用:1、问卷是规范调查访问内容和行动的一种工具。2、通过问卷易于对资料进行分析和统计处理。问卷设计的原则:1、效度(准确性)。2、信度(可靠性)。3、需要与可能。4、效率原则。42问卷的开发程序向用户和调查对象咨询参考以前相同主题的问卷草拟问题审议、测试和修改问卷试点调查和问卷的定稿434-2问卷的结构与问题的类型一、问卷的结构:1、开头部分:包括标题和说明词。2、正文部分:调查所需要的问题。3、调查情况的记录。二、问卷中问题的类型:1、开放式问题。2、封闭式问题。44开放式问题是不向被调查者提供选项,由被调查者用自己的语言来回答问题。可用于问卷的开发测试,这对制订问卷措辞和选项都很重要,同时也为封闭式的问题提供补充。优点:使被调查者有机会自我表达或详细描述。缺点:1、从被调查者来说要求更高,回答不容易。2、对调查机构来说,在面访中记录回答过程也比较困难。在归纳编码中也容易出错,从而产生误差。45封闭式问题问卷中问题列出若干个可能的答案供被调查者进行选择。每个答案称为一个选项,要求被调查者在这些选项中,选择一个(或几个)作为回答。

优点:1、被调查者能更快更容易地回答问题。2、选项是按设计者的意图制定,能集中反映问题的核心所在。3、容易进行编码、录入,也便于统计处理。

缺点:1、确定选项有时比较难,设计不周会给被调查者带来困难。2、可能使研究的问题过于简单化。选项不适合被调查者时会降低回答的可靠性。46三、封闭式问题的主要类型二项选择问题:用于把被调查者分成两个对立的组。例:在本年度中您是否购买过自己使用的电脑?请您在合适的选项打勾(1)是

(2)否47多项选择中的单选和多选问题:即选项多于两个,如果只能选择其中一个,称为单选问题,如果可选择多个答案,就称为多选问题。

例:我购买这品牌电脑的原因是:(1)价格便宜(2)质量好(3)售后服务好(4)功能多(5)该品牌有名48排序问题:被调查者要根据问题中的提示将所有回答选项进行排序。

例:下面列出了寻找工作的一些途径。请按有效性的大小进行排序,在您认为最有效的方法标上“1”,其次有效为“2”,以次类推。

[]邮寄“个人简历”

[]在报纸或杂志上登广告

[]在政府就业中心登记

[]与朋友商量

[]与雇主直接联系

[]其他(请注明)49等级评定问题:要求被调查者对选项进行评级,或对某个问题发表意见。例:如要求顾客对服务的满意程度进行打分,从“1”到“10”,“1”代表“非常不满意”,“10”代表“非常满意”。等级的划分也可以少一些,上例可以改为:您对我们提供的服务满意程度如何(请打勾)

[]非常满意

[]满意

[]不满意

[]非常不满意50配对比较问题:配对比较是将评价的项目进行两两对比的形式,在每一对之间进行比较,在市场调查中应用比较普遍。例:请比较下列每一对不同品牌的洗发液,哪一种您更喜欢使用?(每对中只选一个打勾)(1)海飞丝潘婷(2)潘婷飘柔(3)飘柔威娜宝(4)威娜宝花王(5)花王海飞丝514-3问卷设计的技巧一、调查问题的措辞准则(一)措辞要简单明确例:您是否经常看电视?

(“经常”的概念不明确)

建议改为:您每天平均看多少分钟的电视?

(这样就比较清楚一些)52(二)对普通的被调查者要少用用专业术语例:在一项关于计算机应用的调查中“您对哪个ISP的服务比较满意?”

(对于计算机还不太熟悉的人可能不知道ISP是网络服务供应商的简称)

如果改为“您对哪个网络服务供应商的服务比较满意?”就比较清楚。53(三)确保问题适用例:您目前的职业是什么?

(该问题并不适用所有被调查者)这个问题应该放在一个筛选问题后,如:您目前是否有职业?对回答“是”的人,再提出上述问题。54(四)问题要尽量具体“您的收入是多少?”

(这是一个通常调查的内容,乍一看似乎很简单,但有以下问题:首先,“您的”含义不清,它是指被调查者个人还是家庭;其次,要调查那一段时期的收入?第三,“收入”的含义也不清。)一种改进的提问方式是:“去年,在交税之前,您全家各种来源的总收入是多少?”55(五)要避免意义双关的问题

一个问题中包括了两个问题,被称作意义双关的问题,例如某商店一项调查:“您对购物环境和价格是否满意?”

(这里购物环境和价格是两个问题)应把一个问题改为两个问题:“您对购物的环境是否满意?”“您对价格是否满意?”56(六)避免引导性问题

引导性问题是指会使被调查者选择某一特定的答案时具有倾向性,例如:“消费者普遍认为××牌的电冰箱好,您的印象如何?”

(引导性问题会导致调查结论产生偏差)改进方法:在调查问卷中应使用中性词句。57(七)对于一些需要客观计量的问题,问卷的的设计必须使每一个被调查者的理解是一致的。(八)对于需要回忆的问题,回忆的时间不应太长。此外,还有一些需要注意的问题:58二、敏感性问题的问卷设计敏感性问题是指所要调查的问题涉及到被调查者的隐私或不愿公开如实回答的问题。(一)敏感性问题的措辞方法:1、释疑法;2、假定法;3、转移法。4、具体数字模糊法。59(二)随机化回答方法由美国统计学家沃纳提出,具体的做法是:要调查的敏感性问题,列出正反两个问题。如调查考试作弊问题,就作成两种卡片:1、我在考试中作了弊2、我在考试中没有作弊然后由被调查者随机抽取一张来回答“是”或“否,由于调查员并不知道被调查者在回答那一个问题,因而起到了保密的作用。604-4问卷中的度量方法(一)四种度量水平:(由低到高)

列名水平(定类尺度):最粗略的度量,将客观事物按其质的特性进行分类。如男、女性别。

顺序水平(定序尺度):可将事物按等级或顺序进行排列。如大、中、小等。

间隔水平(定距尺度):通常用数字表示,并能计算不同类型之间的差别大小。

比率水平(定比尺度):最高的度量水平,除具有上述特性外,还可以计算度量值的比率。61(二)关于态度的度量方法(量表)简单的态度度量:如“同意和不同意”分类度量:简单度量的扩展,如分为非常好、好、一般、不好和非常不好五级。李克特量表:是由一组反映态度的问题组成,每个态度按强弱程度分为若干等级,进行打分最后予以加总。语意差别量表:是由一系列两极相反的形容词组成的评价体系组成。62关于态度的度量方法(量表)(续)斯塔普尔量表:是语意差别量表的改进,它使用一个形容词,并用数字来反映强度标准,等级分为十个。图示量表:用几何图形来度量,这种方法具有比较直观的特点。项目间比较量表:这种方法是对两个或两个以上项目给出一个总分,要求被调查者在项目之间根据重要性进行划分。63本章结束继续往下返回本章另选章节64第五章抽样方法第一节引言第二节非概率抽样第三节概率抽样5-15-25-3655-1引言一、什么是抽样:抽样是通过抽取总体中的部分单元,收集这些单元的信息,用来对总体进行推断的一种手段。英文中有一句话形象地说明抽样的必要性:

“Youdon’thavetoeatthewholeoxtoknowthatitistough”

——SamuelJohnson

(意思是说:你不需要吃掉整只公牛才知道公牛的肉是咬不动的)66抽样调查非概率抽样:采用非随机的方法从总体中抽选单元概率抽样:基于随机的原则从总体中抽取单元67二、抽样调查中的一些基本概念

(一)总体和样本:总体是指研究对象的全体`,它是由研究对象中的单元组成的。总体中包含单元的数目称作总体容量(或大小);样本是指抽样时按照抽样的规则所抽中的那部分单元所组成的集合。总体样本抽取样本推断总体68(二)参数、估计量和估计值反映总体特征的指标通常称为参数,如总体平均数、总体总量和总体比例等。估计量是样本观察值的函数,用它来对总体参数进行估计。根据估计量从具体样本得到的结果称作估计值。(三)入样概率与抽样比入样概率是指某个总体单元被选入样本的概率;抽样比是指样本量n与总体的容量N的比例,通常用f表示。即69(四)抽样分布:是指估计量的分布。也就是说,如果按照一定的样本容量和一定的抽样方式反复抽取样本,每个样本可以计算一个估计值,这些估计值形成的分布,就是抽样分布。(五)抽样方差和抽样标准误:也就是估计量的方差和标准差。它表示某个抽样方案,抽样结果的离差大小,方差和标准差愈小,表明估计值接近参数。70(六)精确性和精度:精确性是指在抽样中反复抽样,其结果的差别大小。差别越小,其精确性越高。因此同样也可以用抽样方差来表示精确性。精度则是一个相对的指标,它是抽样方差或标准差与相应的待估参数之比。相对方差相对标准误

71(七)抽样效率与设计效果:在样本容量相同的情况下,抽样方差越小表明抽样效率越高。设计效果是设计方案的方差与简单随机抽样的方差之比。设计效果通常用英文字母Deff表示:Deff=725-2

非概率抽样一、非概率抽样及其优缺点(一)非概率抽样是用非随机的方法抽选样本。(二)优点:1、快速简便;2、费用相对比较低;3、不需要任何抽样框;4、对探索性研究和调查设计的开发很有用。(三)缺点:1、不能对总体进行推断;2、由于不知总体单元的入样概率,故不能计算估计值的抽样误差。73二、非概率抽样的各种方法(一)随意抽样。样本单元的抽选以随意的方式进行。如街道拦截访问。(二)志愿者抽样。被调查者都是自愿参与调查。如网上问卷,自愿回答。(三)判断抽样。由专家有目的地挑选“有代表性”的样本进行调查。如典型调查。74(四)配额抽样。从总体的各个子总体中选取特定数量的样本单元组成样本。如市场调查中,规定男女消费者的样本各多少。(五)滚雪球抽样。适合于总体中某种较为稀少的特殊子总体而又缺少完整的抽样框。抽样时通过已知的少数个体获得信息逐渐扩大。755-3概率抽样一、概率抽样及其优缺点(一)概率抽样是从总体中随机抽选样本单元,被抽中的单元既不取决于调查人员的愿望,也不取决于被被调查者的态度。其次每一个单元都有一定的概率被抽中。(二)优点:可以对总体进行推断,并能计算估计值的抽样误差。(三)缺点:相对于非概率抽样,设计比较复杂,而且费用也比较高。76二、概率抽样的几种主要抽样方法

(一)简单随机抽样1、定义:设总体中有N个单元,不加条件从中随机抽取n个单元为样本,每个单元都有同样的概率被抽中的抽样方法。2、优点:(1)比较容易理解和掌握;(2)抽样框不需要其他辅助信息;(3)理论上比较成熟,有现成的方差估计公式。3、缺点:(1)没有利用辅助信息;(2)样本分散,面访费用较高;(3)有可能抽到较差的样本;(4)抽选大样本比较费时。77(二)系统抽样1、定义:又称等距抽样,对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个单元的抽样方法。抽选方法:设总体单元数为N,要抽n个单元为样本,先计算抽样间隔k=N/n,在1到k之间抽取一个随机起点r,则被抽中单元的顺序位置是:r,r+k,r+2k,…。78

圆形系统抽样方法:当N不能被n整除时,用圆形系统抽样法可以避免出现样本量可能不一致的情况。把总体单元假想排列在一个圆上,取k=N/n最接近的整数,作为间隔,然后在1到N之间,抽取随机起点r,则被抽中的单元顺序号为:r,r+k,r+2k,……r+(n-1)k。如果第j个单元使得r+(j-1)k>N,则取单元r+(j-1)k-N。如:N=55,n=9,就取k=6,在1到55之间取一个随机起点。例如r=42,则被抽中的单元是42,48,54,5,11,17,23,29和35。792、系统抽样的优点(1)没有抽样框时可代替简单随机抽样方法简单;(2)不需要辅助的抽样框信息;(3)样本的分布比较好;估计值容易计算。

3、系统抽样的缺点(1)若抽样间隔与总体的某种周期性变化一致,会得一个差的样本;(2)不使用辅助信息使抽样效率不高;(3)使用概念框时,不能预先知道样本量;(4)没有一个无偏的方差估计量;(5)当N不能被n整除时会得到样本量不同的样本。804、对称等距抽样。系统抽样的抽样误差与总体单元的排列顺序有关,当其排列的顺序与调查变量有关时,这时的估计值与起点的位置有关。采用对称等距抽样,是为了消除由于起点引起的偏差。塞蒂(Sethi)方法:[r+2jk,2(j+1)k-r+1],j=0,1,2,辛(Singh)方法:[r+jk,(N-jk)-r+1],j=0,1,2,…81系统抽样示意图:普通直线等距抽样起点r塞蒂对称等距抽样辛对称等距抽样r+k起点对称点起点对称点r+2kr+3k82(三)与单元大小成比例的概率抽样1、定义:根据单元的大小不同,入样概率不同的一种不等概率抽样。如农场的大小不同,其抽选概率可以根据面积大小成比例,也可以按人数多少成比例。用英文的字头简称为PPS抽样。2、优缺点:优点是当研究的变量与单元大小有关时,由于使用了辅助信息,可以提高抽样效率。但缺点是对抽样框需要有高质量的抽样框,成本较高;对于单元大小不相关的变量就不适用;估计量的抽样方差估计比较复杂。833、抽样方法:随机有放回的PPS抽样和系统PPS抽样。两种方法都要先对总体中每个单元的大小进行累计,假定累计数为M,然后确定每个单元相应的代码范围。当采用随机有放回方法时,在1到M中抽取一个随机数r,r所在代码区间的所属单元即为入样单元,重复上述步骤,直到抽得n个单元为止;当采用系统PPS抽样时,需要计算一个抽样间隔k=M/n,然后,先在1到k中抽取一个随机数r,则与代码r+k,r+2k,…所在范围相对应的单元为样本单元。单元A单元B单元A比单元B大9倍,因此单元A的入样概率也要比单元B大9倍84(四)整群抽样1、定义:由若干个有联系的基本单元组成的集合称为群,抽样时以群为抽样单元的抽样方法就称为整群抽样。整群抽样示意图:黄色为总体红色为群白点为基本单元852、整群抽样的优点:(1)能大大减低收集数据的费用;(2)当总体单元自然形成的群时,容易取得抽样框,抽样也更容易;(3)当群内单元差异大,而不同群之间的差异小时,可以提高效率。3、缺点:(1)若群内个单元有趋同性,效率将会降低;(2)通常无法预先知道总样本量,因为不知道群内有多少单元;(3)方差估计比简单随机抽样更为复杂。86(五)分层抽样(1)定义:在抽样之前将总体分为同质的、互不重叠的若干子总体,也称为层。然后在每一个层独立地随机抽取样本。分层抽样示意图:872、优点:(1)由于性质相同的单元分在同一层,层内差异缩小,可以提高抽样效率;(2)可以得到各层子总体的估计;(3)操作与管理方便;(4)能避免得到一个“差”的样本。3、缺点:(1)对抽样框的要求比较高,必须有分层的辅助信息;(2)收集或编制抽样框的费用比较高;(3)若调查变量与分层的变量不相关,效率可能降低;(4)估计值的计算比简单随机抽样复杂。88(六)多阶抽样1、定义:它是由两个或更多个连续的阶段抽取样本的方法。多阶抽样示意图:总体第一阶样本最终样本892、优点:(1)当群具有同质性时,多阶抽样的效率高于整群抽样;(2)样本的分布比简单随机抽样集中,采用面访可以节约时间和费用;(3)不需要整个总体单元的名录框,只要群的名录框和抽中群的单元名录框。3、缺点:(1)效率不如简单随机抽样;(2)通常不能提前知道最终的样本量;(3)调查的组织较整群抽样复杂;(4)估计值与抽样方差的计算较为复杂。90(七)多相抽样1、定义:在同一个抽样框内,先抽一个大样本,收集基本的信息,然后在这个大样本中再抽一个子样本,收集调查的详细信息。多相抽样示意图:。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。第一相样本第二相样本912、优点:(1)利用了第一相样本的信息,能显著提高估计值的精度;(2)适用于某些调查指标的数据收集费用特别高或给被调查者带来较重负担的情况。3、缺点:(1)整个调查的时间要长;(2)调查费用要比较高;(3)调查的组织比较复杂;(4)估计值和抽样误差的计算会相当复杂。92三、抽样设计中需要考虑的问题(一)首先要考虑使用概率抽样还是非概率抽样。(二)采用概率抽样时,抽样方法的选择。要根据具备抽样框的情况、是否具有丰富的辅助信息、总体单元的特征和分布情况、是否要进行“域”估计以及调查费用等各种因素加以考虑。(三)重复性抽样调查需要考虑的问题,是否固定样本及样本的轮换等93本章结束继续往下返回本章另选章节94第六章抽样估计第一节抽样估计的基本原理第二节加权第三节总体均值、比例及总量的简单估计第四节辅助信息的使用第五节调查估计量的抽样误差估计6-16-26-36-46-5956-1抽样估计的基本原理一、抽样估计是统计学中参数估计的应用,它是根据对样本的观察结果来估计推断总体的某些特征。二、抽样分布指估计量的分布,如对总体均值的估计,以样本均值为估计量,每次抽取容量为n的样本,可以计算一个均值,如果把所有可能的样本都抽出来,其值的频数分布就是样本均值的次数分布。96三、大数定律和中心极限定理大数定律是用样本估计总体的理论基础。其直观含义是随机事件的规律性是在大量观察中才能显露出来,随着观察次数的增加,随机影响将相互抵消而使规律具有稳定的性质。如随着样本的增大样本均值会与总体均值接近。中心极限定理是进行区间估计的理论基础。它证明了不论总体服从什么分布,只要方差有限,在观察值足够多时,估计量的分布就趋向正态分布。97四、置信区间和置信概率之间的关系估计分为点估计和区间估计。置信区间和置信概率之间的关系是区间估计的基础。它反映了对估计值被包含在一定范围内的概率。置信上限置信下限986-2加权一、等概率加权估计的第一步是给每个样本单元或回答单元赋予一个权数,设计权数是样本单元入样概率的倒数。如果是等概率抽样,其设计权数相同,称作是自加权设计。在估计均值时只须用样本均值估计总体均值,在估计总值时仅仅需要将样本总值乘上一个倍数即可。99例1:(等概率抽样)一个由N=1000人的总体,划分为两层,第一层为男性

,第二层为女性,,从中抽取一个样本量为n=250的样本,抽样比将样本等比例分配给各层。两层的抽样比都等于1/4.因此,100二、不等概率抽样设计加权当采用不等概率抽样时,正确使用权数显得尤为重要。下面举一个例子:层总体大小样本量城市N城=1000n城=200农村N农=100n农=50各层权数是单元入样概率的倒数:101三、对无回答的权数调整这里主要是指单元无回答的情况,最常用的办法是是假定回答的单元也代表无回答单元,此时无回答的设计权数需在回答单元之间重新分配,通常的做法是乘以一个无回答调整因子。无回答调整因子=因此,调整的权数为:102无回答权术调整的例子层总体大小样本量回答数城市N1=1000n1=200nr,1=150农村N2=100n2=50nr,2=40各层的设计权数:Wd,1=5Wd,2=2无回答调整因子:城市为n1/nr,2=1.33农村为n2/nr,2=1.25最终权数:Wnr,1=5×1.33,Wnr,2=2×1.25=2.5103总体均值6-3总体均值、比例及总量的简单估计数据类型定量数据定性数据参数类型总体总值总体比例一、数据类型和参数类型104二、等概率设计的估计例:在总体为100个人中,等概率抽取20人的样本,在调查结果的数据文件中,每个单元的权术均为5,这20人中有8个是男性,20人的年龄之和为720,要求计算总体中男性的比例和总体的平均年龄。解:如果忽略权数采用权数计算其结果相同

105三、不等概率抽样设计(例)层权数农场类型收入(元)15.67C7500015.67L1500015.67C12500015.67C6700015.67L8000015.67C40000216.5C30000216.5C14000216.5L48000216.5C22000106表中的代码:层1——平原,层2——山区农场类型:C——作物,L——家畜。于是可估计:家畜农场总数:家畜农场比例:家畜农场的总收入:1076-4辅助信息的使用一、事后分层分层抽样可以提高抽样效率,但需要有分层的抽样框。但如果抽样框没有分层的信息,而能从其他方面获得分层信息,那么可以在数据收集以后进行事后分层。二、比率估计当目标变量与一个已知的辅助变量之间存在相关关系时,采用比率估计也可以提高抽样效率。设目标变量Y,辅助变量X,样本比率r=x/y,则或1086-5调查估计量的抽样误差估计一、抽样方差及其估计(一)影响抽样方差大小的因素:1、样本量与总体的大小2、总体指标的变异程度3、抽样设计4、使用的估计量5、无回答的情况109(二)抽样方差的估计抽样方差是总体变异的函数总体方差是:总体方差的估计是:抽样方差的公式是:110二、抽样误差的其他度量1、估计量的标准差,也称标准误。它是抽样方差的平方根,通常用于估计量的区间估计。2、估计量的变异系数。它是估计值的标准差与估计值本身之比。当待估的某个指标的真值为0时,就不能用这个度量。111三、误差限与置信区间这是抽样调查区间估计的方法,构造的理论依据是中心极限定理。估计量和真值之间的误差:超过1.65倍标准差的概率为0.1(对应于90%的置信区间)超过1.96倍标准差的概率为0.05(对应于95%的置信区间)112四、复杂抽样设计的方差估计复杂抽样设计的方差估计相当困难,有一种方法是进行重复抽样。在一个样本量为n的复杂抽样中,改为抽取k个独立样本,每个样本的样本量为n/k,对每一个样本计算所研究的指标值,然后加以平均。估计值和方差分别为:113本章结束继续往下返回本章另选章节114第七章样本量的确定第一节引言第二节精度与样本量第三节样本量的公式及确定样本量的其他限制第四节分层抽样样本量的分配7-17-37-27-41157-1引言一、为什么要确定样本量?由于样本量直接影响到调查的费用、完成调查所需要的时间、所需调查人员的数量以及其他一些现场操作的限制条件。二、影响样本量的因素:估计值要求的精度;提供的经费能支持多大的样本;调查的时间要求;需要和能招聘到多少调查人员等。1167-2精度与样本量一、精度的表示方法1、用抽样方差或抽样误差来表示,方差越小精度越高;2、用置信度和误差限来表示,以t表示一个任意的估计量,σ为估计标准误,一定置信度的误差限为(t±Zσ)其中Z值与置信度相对应。1173、一定置信度下用相对数表示精度其中:1-α为置信度或可靠性1-称做估计精度118二、确定精度需要考虑的因素1、允许多大的误差限?2、是否需要对调查总体中的子总体进行估计?3、与调查估计值有关的抽样方差有多大?4、要在精度和费用之间进行平衡。119三、影响精度的因素1、总体的变异程度2、总体大小3、样本设计和估计量4、调查的回答率1207-3样本量的公式

及确定样本量的其他限制一、简单随机抽样,估计均值。给定误差限为e和与置信水平相联系的Z,其所需样本量的公式为:121二、简单随机抽样,给定估计比例P的精度为e。由于比例的方差于是计算样本量的公式变为:122三、回答率小于100%时,计算样本量的步骤:1、计算初始样本量2、根据总体大小进行调整3、采用设计效果进行调整4、根据无回答再次进行调整r为预计回答率123四、确定样本量的一个例子某杂志调查读者综合满意度的估计值,总体N=2500,要求误差限为0.1,置信度为95%,使用简单随机抽样,预计回答率为r=0.65,事先没有读者满意度的估计值,则应抽取多少户做样本?124第一步:计算初始样本量由于事先关于P的估计,为留有余地取P=0.5,初始样本量为:第二步:根据总体大小调整125第三步:根据抽样设计效果来调整样本量在这个例子中采用简单随机抽样,因此设计效果B=1,第四步:根据无回答进行调整在这个例子中预计回答率为65%,因此126五、确定样本量时的其他限制1、费用。最终确定样本量必须考虑可获得的经费,得到经费的保证。2、时间。样本量还需要和允许的时间保持一致。因此,最终样本量要在精度、费用和时间之间进行协调和平衡。1277-4分层抽样样本量的分配一、分配准则

1、总样本量固定先确定样本量n,然后一某种方式分配到个层,设第h层的分配系数为则:2、给定变异系数C和计算样本总量128其公式为:其中:是第h层的单元总数是第h层的总体方差估计将代入公式,就可以得到各层样本量的公式。129二、分层抽样样本分配方法1、比例分配。即是与N成比例分配。该层的规模越大,分配到的样本单元也越多。即2、与Y成比例分配。即与该层总值与总体总值之间的比例大小来分配。1303、与N的平方根成比例分配。即分配系数等于该层总体大小的平方根与所有层总体大小平方根的总和之比:4、与Y的平方根成比例分配。1315、最优分配。既还要考虑各层的费用大小和层内方差大小。6、奈曼分配。是抽样方差达到最小的一种分配方法。1327、方差相等时的最优分配。133本章结束继续往下返回本章另选章节134第八章数据收集的实施第一节引言第二节必要的公关工作第三节调查前的准备第四节数据收集过程第五节调查过程及调查质量的控制8-18-28-38-48-51358-1引言数据收集是调查中收集每一个被抽中的单元个体数据的过程。调查过程包括下列活动:1、与被调查者建立密切融洽的关系;2、熟悉并使用调查问卷;3、处理尴尬和敏感的情况;4、控制调查文件;5、对数据的预审核;6、对预审核中的问题进行回访;7、质量控制。1368-2必要的公关工作一、调查的宣传活动。大型调查应包括:1、通过报纸、电台等媒体发布公告;为媒体提供报道和发言人;2、在公共场所张贴海报;3、给有关部门写信,以获得支持。二、与被调查者建立联系1、致被调查者的信;2、编写调查宣传手册和机构介绍手册。1378-3调查前的准备一、编写手册:包括访员手册和督导手册(一)访员手册。内容包括:1、一般信息(如调查的目的等)2、简介(如何与被调查者接触等)3、问卷说明4、问卷的审核与整理5、单个样本单元的管理6、作业管理7、问题与答案138(二)督导手册。内容包括:1、招聘和培训调查人员2、向调查人员分配任务3、根据预定的质量目标、经费开支和时间进行监控4、后勤服务5、被调查者的安全和隐私保护6、特殊情况下代替调查人员进行数据收集139二、调查人员的招聘和培训(一)调查人员的招聘。应明确调查人员的素质要求。教育程度、社交技能、组织能力和当地语言的流利程度都是需要考虑的重要因素。对于面访人员还要注意以下素质要求:1、诚实与认真;2、责任心要强;3、要有调查的兴趣和信心;4、对调查的对象有一定的了解;5、健康的体魄。140(二)调查人员的培训。它是正确理解调查概念和统一行动的保证。培训内容包括:1、进行思想教育和素质教育;2、由调查设计者作简要介绍;3、仔细阅读问卷;4、其他知识准备,如政策法规等。培训的方式有:1、自学;2、课堂培训;3、模拟访问;4、实习访问。141三、编制名录和寻踪(一)编制名录编制名录是对总体单元建立一个清单,当多级抽样时,只要各级抽样单元的名录和最后一级的总体单元名录。(二)寻踪寻踪的目的是:1、对样本单元进行定位;2、更新抽样框中单元的基本识别信息;3、确认样本单元是否仍在调查范围内。1428-4数据收集过程一、规定访员的任务,并与被调查者接触(一)访员的职责1、确保信息是是从正确的样本单元处收集的;2、确保样本涵盖的完整性;3、准确、完整地收集信息;4、尽量减少记录和数据录入的错误;5、遵守安全程序、保证数据的安全性。143(二)调查前和被调查者接触1、安排时间:每天要作多少个调查应做到心中有数。2、调查情况记载:调查人员应该在问卷的空白处记载调查情况的必要说明。3、预约:调查人员应该准备一个笔记本,记录约会的安排。144(三)安排访问注意事项1、与调查对象联系时,要掌握好时间,避免过早或过晚。2、首次访问时经常会遇到被调查者没有时间,调查人员需要与其协商另外安排一个方便的时间,或留下一个电话号码,另行约定调查时间。3、当被调查者不在时,不能简单放弃,一般至少进行三次尝试。145(四)自我介绍介绍内容包括:1、访员的姓名和调查组织机构名称;2、调查名称和目的;3、数据的用途(表明调查的重要性);4、数据收集的权威性;5、对数据安全性和保密性的保证。146(五)消除被调查者的顾虑被调查者的主要顾虑和相应的办法:1、你为什么挑选我?调查人员应对随机抽样的方法进行说明。2、谁将看到我的资料?你们将怎样使用我的回答?调查人员应向被调查者说明调查只应用汇总资料,并对个人的资料保密。3、我现在没有时间。这时应告诉需要的时间或建议另选时间。147二、有效访问关键和提问方式(一)有效访问的关键:1、信心:调查人员必须相信自己的能力;2、倾听技巧:耐心听取被调查者的话,如果认为被调查者没有把握好问题,应把这个问题重复一遍。3、投入:应注意被调查者的表现。4、语言表达:吐字清楚,中等语速。148(二)提问方式1、严格按问卷的措辞提问;2、按问题给定的顺序提问;3、每一个问题都应该问及;4、按正面方式提问;5、对问题之间的停顿加以解释;6、重复被误解或曲解的问题;7、特别关注跳转模式;8、对被调查者提供信息持中立态度。149三、追问技巧要既深入、客观而又不至于诱导产生偏差,常用的方法有:1、重复提问,解释时用手册提供的定义2、用中性的语言追问3、启发式的帮助被调查者回忆4、利用适当的停顿或沉默5、鼓励被调查者使他们放心回答150四、调查中的记录对于开放式的问题需要做记录,记录中应注意:1、在访问期间随时记录(不要补记)2、使用被调查者自己的语言(记原话)3、不要对被调查者的语言进行改动4、记录与问题有关的全部内容5、记录所有的追问语和对应的回答6、边记录边重复所记录的答案151五、结束访问结束访问的最后一步是保证所有的必需的信息都已收集完整,并已作了清楚的记录。礼貌地对被调查者提供信息表示感谢是非常重要的,同时也应该尽量回答被调查者仍然可能存在的关于调查的疑问。1528-5调查过程及调查质量的监控一、数据收集质量的监控1、严格管理调查人员2、检查(或现场检查)已完成的问卷3、严格的文档控制4、对调查员的询问。数据收集结束时向调查员询问访问情况,可以揭示问卷中存在的许多问题。153二、调查人员的作业管理在调查过程中调查人员要定期向督导报告调查进度,并在已调查的问卷上注明:1、全部完成(全部调查过程已结束)2、部分完成(回答了关键问题,但不完整)3、没有完成(应该列出具体的原因,如拒访、不在家、不在样本范围内等)154三、运作情况的监控在运作过程中计算一些指标解决率=已解决的样本单元数样本单元总数回答率=回答单元的数量范围内已解决单元数+未解决单元数155四、数据收集的指导方针1、调查员是成功收集数据的关键因素2、对所有的数据收集实施控制程序3、保证数据传输处理的安全4、调查机构中设立联系人以便被调查者询问和联系5、所有的样本单元使用统一的数据收集程序6、贯彻一套管理信息系统来跟踪质量和开支等156本章结束继续往下另选章节返回本章157第九章数据处理第一节引言第二节编码第三节数据录入第四节审核第五节插补第六节离群值的检测和处理第七节其他数据处理有关问题9-19-39-29-49-59-69-71589-1引言数据处理的简要过程1、全面核查问卷上的数据2、对问卷上的回答进行编码3、将数据录入计算机4、详细审核5、进行离群值的检测6、将数据储存在数据库中1599-2编码编码是给问题的每一项答案赋予一个数值代码,以便于数据录入和进一步处理一、预先编码对问卷预先编码可以节省大量的时间和费用,但它只适用于封闭式的问题,对开放式的问题,无法预先知道被调查者的回答。二、编码可以分为手工编码和自动编码手工编码要对编码员进行培训,自动编码需要有自动编码系统的软件。1609-3数据录入一、数据录入是将回答转化成可机读的形式。可以提高录入效率的方法有:1、采用计算机辅助数据收集方法2、对纸张式问卷进行光电扫描3、对纸张式问卷进行预先编码二、控制和减少录入差错的方法1、审核方法2、双机录入

1619-4审核一、审核及其分类审核是应用各种检查规则来辨别缺失、无效或不一致等造成数据的潜在错误。1、有效性审核:审核回答是否正确2、一致性审核:不同问题之间关系是否正确3、分布审核:数据分布是否合理162二、审核的时间(一)数据收集时的审核包括:1、调查人员在调查过程中进行;2、在调查结束后进行;3、由督导进行;4、在数据处理过程中进行。(二)数据收集后的审核最全面和最复杂的审核一般是在数据收集后进行,或是在数据录入之后作为一个独立的审核和插补环节进行。163三、选择性审核(一)选择性审核的理由:审核过程中,要使每一条审核记录都非常完美,就要化很多的时间和费用,因此需要在两者之间进行权衡。为了避免化过多的时间和经费审核那些影响不大的数据,建议进行选择性审核。164(二)选择性审核方法1、自上而下法:按数据影响大小进行排列,有重点地审核;2、聚集法:找出可疑的域估计,分别检查该域中各个加权后的数据;3、画图法:把数据画成图形确定可疑值;4、问卷打分法:根据重要性进行打分。165(三)选择性审核的优缺点优点:1、节省费用且不降低数据质量;2、把重点放在影响较大的记录上,从而提高数据质量;3、缩短处理时间,加快进度,从而提高时效性;4、减少回访比例,减轻被调查者回答负担。缺点:1、从个体单位看,对数据质量重视较少;2、对于较小的估计域,与全部审核相比,非抽样误差可能会增大;3、可能会有各方面的阻力,认为数据缺乏可信;4、数据可能存在不一致性。166四、手工审核与自动审核的比较手工审核或自动审核哪一种更合适取决于多种因素。审核规则越复杂,手工审核就越困难,也越容易出错。另一方面,对某些调查(如纸张式调查)要求在收集数据的同时进行自动审核。影响选择手工审核或自动审核的其他因素包括是否需要进行监督访问或跟踪审核167五、审核的限制审核工作有以下限制条件:1、可利用的资源(时间、经费和人力);2、可利用的计算机硬件和软件;3、被调查者的负担;4、数据的用途;5、与插补的协调。168在手工审核的条件下,作好审核工作应该:1、规定审核遵循的具体规则和发现问题的处理原则;2、对审核工作的人员进行培训;3、建立对审核人员的监督检查机制;4、制定评估审核工作对原始数据的影响的方案。169在自动审核的条件下,把审核工作作好应该:1、规定审核应遵循的具体规则;2、建立执行审核工作的计算机系统;3、编制实现审核的程序;4、验证、测试程序;5、结合数据来运行程序。1709-5插补插补就是解决在审核过程中辨别出来的数据缺失、无效与不一致等问题的过程。插补要改变一些回答,并对审核过程中发现所有有缺失信息的记录进行补充或替代,确保得出内在一致的记录。171一、插补方法1、推理插补2、均值插补3、比率/回归插补4、序贯热平台插补5、最近邻值插补每一种插补方法都有确定性和随机性两种方法。172(一)推理插补对缺失或不一致的数据通过推断确定例:三项开支的总和是100,前两项的开支分别是60和40,而第三项开支空着未填,应该是多少呢?

根据逻辑关系,可以推断为0。173(二)均值插补对缺失或不一致的值用插补类的均值来代替。例:在一份住房调查的问卷中公寓月租金的值缺失。则利用同一插补类中正确填报租金的问卷计算其平均值来替代缺失值。同一插补类可以由居住在同一地区,同类型的住房组成。174(三)比率或回归插补是使用辅助信息及其他记录中的有效回答建立一个比率或回归模型进行推断插补。比例插补模型:其中:是研究变量第i个单元值是辅助变量的第i个单元值的插补值:175(四)热平台插补热平台插补是使用同一次调查中插补类的供者记录信息来替代相似的受者记录中的缺失数据。热平台插补的两种主要类型是序贯热平台插补和随机热平台插补。序贯热平台插补方法是按照某种顺序排列来处理的,其缺点之一是当插补类的记录较少时,会导致一个供者的多次使用。176(五)冷平台插补冷平台插补是使用其他资料中的供者来进行插补,经常使用的是前期调查或普查中的数据,冷平台插补也同样可以分为确定性和随机性两种类型。任何用于定量数据的确定性插补都能加上随机残差变为随机性插补。177二、确定那些值需要插补费里吉和霍尔特提出以下三条插补准则:1、应该通过变更尽可能少的数据项,使每一条记录都满足审核的要求;2、尽可能地保持数据文档的原始频数结构;3、插补规则的确定,不是参考其他任何规定,而是由相应的审核规则导出。178三、供者插补问题下面是开发一个供者插补系统时需要考虑的一些问题:1、怎样为受者找到供者记录?2、是不是每个受者记录中所有项目都应该用同一个供者来插补?3、一个供者记录能用来插补多个受者记录吗?4、受者找不到合适的供者时怎么办?5、该项调查是要处理定性数据还是定量数据?179四、插补后数据的方差估计插补方法为缺失数据生成一个单一的插补值,这会在一定程度上扭曲插补变量的原始分布。因此应尽量避免因插补而引起的方差的人为低估,从而引起检验中出现虚假的显著性。估计量的方差包括两个分量:抽样方差和插补方差。随机插补方法的一个好处是给插补后的数据集加进一些噪声。180五、插补的准则1、插补得到的记录应该和审核有问题的记录非常相似;2、好的插补会为给评估留下审查的线索,并使插补的记录具有内部一致性;3、插补得到的记录应该满足所有审核规则;4、插补值应标明,插补的方法和使用的资料也应标明;5、仔细选择插补的方法;6、插补方法应减少无回答偏差,并保持变量之间的关系;7、插补系统应考虑周全并进行调试;8、插补系统应能处理各种缺失和不一致的项目;9、对于供者插补方法插补得到的记录应尽可能与选中的供者相似。181六、插补方法的评估评估插补工作最关心的指标就是对调查估计值的偏差和产生的插补方差。最低要求应该对插补过程进行监督以便能告诉数据的用户做了多少插补工作和在哪些地方进行了插补。对插补的地方和插补的方法应做详细记录。1829-6离群值的检测和处理一、离群值的检测离群值是通过测量它们和数据中心的相对距离来辨认的。定义相对距离为(其中m和s是数据的集中和离散的度量)如果大于预先确定的偏离值,该观察值就被认为是一个离群值。离群值183二、离群值的处理离群值处理的目的是在不引入较大偏差的前提下尽量减少离群值对估计量抽样误差的影响。处理离群值的方法主要有:(一)改变数值;(二)调整权数;(三)使用稳健估计量。1849-7其他数据处理有关问题一、生成结果与创建数据库数据储存的两种主要格式:平面文件和数据库。平面文件容易从一种平台转到另一种平台,并能用不同的表格软件读取,但大多数统计软件要求数据按一定的格式储存,因此较好的选择是对调查结果生成一个平面文件,同时生成几种不同的数据库文件。185二、自动化处理和手工处理由于计算机的发展,使用自动化处理数据成为可能。一般情况下,在处理大量信息时,计算机的功能是人力远不能及的,能从各方面提高效率和数据质量。自动化处理也有些不足:1、必须有详细说明和开发一套程序。2、必须对操作人员进行培训。3、自动编码、审核等不能利用人的经验。186本章结束返回本章另选章节继续往下187第十章数据发布与数据分析第一节引言第二节调查报告的撰写第三节统计表和统计图第四节数据分析第五节保密和泄密控制10-110-210-310-410-518810-1引言一、数据分析和数据发布在很大程度上影响着人们对调查中所有前期过程的评价。二、数据发布是指通过各种媒介将调查数据向用户公开。数据发布有多种形式。三、调查报告是统计部门或其他调查组织者通过对某事进行调查,经过分析研究而形成的一种报告形式。四、调查成果还体现在各种数据产品产出中,如:统计图、统计表以及根据数据进行的专题性分析报告。

18910-2调查报告的撰写一、调查报告写作的基本要求调查报告不同于一般的学术论文,它的特点是以调查的资料为基础,通过分析研究,得出客观的结论。要注意:第一,要实事求是,用事实说话;第二,要熟悉调查领域的业务和有关方针政策;第三,观点和数据要结合运用。190二、调查报告的写作步骤(一)构思。是对客观事物从感性认识到理性认识的过程。(二)选材。对调查数据要运用得法,用资料说明观点,作到观点与数据资料的统一。(三)初稿和最后顶稿。在初稿的基础上征求意见,最后予以定稿。191三、主报告的结构。

是重要的调查产品之一,通常有以下内容:(一)标题页。应简单明了,高度概括,具有较强的吸引力。一般有单标题和双标题两种。例:《2002年全国电视观众抽样调查分析报告》《北京人的梦中家园——北京居民住宅择向的调查报告》192(二)目录这一项对于比较长的调查报告是必需的,它有助于用户很快找到所需要的信息。(三)表格和插图清单该项一般也是必需的,许多用户要求将调查结果用图表等可视化形式来表示,同时也便于与其他来源的数据进行比较。193(四)报告主体是报告的核心部分,决定整个报告的质量,通常以文字为主,插入适当的图表所使用的语言应尽可能简洁明了。报告的形式多样,一个最大的挑战就是如何抓住读者的注意力。报告的内容要结合调查目的的需要,能充分反映主题。194(五)其他内容报告中还可以包括:引言、要点、目的、结论、建议、参考书目、附录和联系办法等其他内容。这些内容并不是每一个调查报告所必须的,但要根据不同的需要列出上述有关的内容,可以使调查报告的内容更加充实和完备。195四、调查报告写作指南(一)报告要有针对性:1、必须调查的目的,有的放矢;2、明确阅读对象。(二)新颖性:应抓住新动向、新发现,提出新观点,形成新结论,为科学决策提供依据。(三)可读性:要观点鲜明、安排有序、行文流畅。(四)公正性:不应回避问题。19610-3统计表和统计图一、统计表统计表是显示统计数据的基本工具。常用统计表的形式有:(一)普通统计表。由四个主要部分组成,即表头、行标题、列标题和数字。

XXXXXXXXX表头列标题行标题填写数字197(二)频数分布表在整理原始数据过程中,按不同对象进行分类,计算不同类别中对象出现的次数,就形成频数分布表。某班40名学生考试成绩成绩人数比例60分以下50.125(12.5%)60到80以下200.500(50%)80分以上150.375(37.5)合计401(100%)分类频数频率198(三)二维列联表也叫交互分析表或交叉表,它可以看成是分类的频数表,用来表示和分析两个变量之间的关系。某产品性别和使用情况(人数)性别不熟悉熟悉合计男100100200女150250400合计250350600199二、统计图统计图可以直观地显示数据,它能集中数据的相对模式,反映数据的分布形状、结构和数量的级别等。(一)饼形图:用来反映总体的结构例:某城市调查家庭对住房满意程度的调查1、非常不满意;2、不满意;3、一般;4、满意;5、非常满意200(二)柱形图柱形图中每个长条代表同一现象在不同地点或不同时间的数值。例:我国第一至第六个五年计划的基建投资额(单位:百亿元)201(三)折线图揭示在一段时间内的趋势与运动例:将上例中柱形图的数据作折线图如下:20210-4数据分析一、描述性的数据分析(一)数据的分布所谓数据的分布是指数据的规律性。对于定性数据,经常要计算的有:1、频数及其分布。2、比例。总体中个部分的比重用%表示。3、百分比。如人口出生率、死亡率等。4、比率。不同类别之间的数量之比。203(二)集中趋势的计量对于定量数据,通常要计算的有:1、均值。即算术平均,以变量的总和除以数量的个数。2、中位数。是一组数据按数值大小排序后,位置在中间的数值。3、众数。是出现频率最高的哪个数值。204(三)数据离散程度的度量即反映数据的差异程度,除了以前讨论过的统计量抽样方差和标准差外,离散趋势的度量还有:1、极差。又称全距,是数据最大值与最小值之差。这个度量容易受极端值的影响。2、四分位数间距。它给出了中间50%的极差,可以较少受极端值的影响。205二、推断性数据分析推断性数据分析是根据概率抽样所收集的数据来推断总体的特征。所使用的方法有:置信区间、假设检验、方差分析和线性回归等。(一)置信区间。在抽样估计一节已做了介绍,可以复习一下,此处从略。206(二)假设检验假设检验就是检验样本数据是否支持有关对总体某个陈述的过程。假设检验由四部分组成:1、原假设。是对要检验总体参数的陈述。2、备择假设。与原假设相左,通常是希望它成立的关于总体的一个命题。3、检验统计量。依据样本计算的一个值,用来检验关于总体的假设。4、显著性水平。通常是一个小概率,用α表示,是错误拒绝原假设的最大容许概率。207假设检验的一个例子一项健康调查,通过随机抽样收集数据,希望检验“总体超重”这样一个假设。即平均重量大于100公斤。假设检验是:检验统计量是大样本服从正态分布拒绝域是Z>1.645,如果调查结果得到:则计算结果Z=1.4<1.645,不能拒绝原假设208三、更高级的推断性数据分析在调查数据分析中常用的方法有:(一)方差分析:通过一组观察值审查多个均值之间的差异。(二)线性模型:研究一个因变量和另一个(或多个)自变量之间的线性关系。(三)卡方检验:用于分析定性数据变量之间的相依性。(四)时间序列分析:用于解释变量为时间的那一类数据209四、数据分析的准则和数据质量报告(一)数据分析的准则1、回顾以前相同问题的研究和了解现有主题;2、采用问题导向而不是数据导向;3、做因果关系结论时必须小心谨慎;4、小心对待中长期趋势的讨论;5、对抽样数据分析,要考虑抽样设计;6、分析来自其他来源数据时,要注意数据质量210(二)数据质量报告在任何调查中,数据质量评估都是一个重要的步骤,应该记录在主报告中,或写一份单独的数据质量报告。如抽样调查,应介绍抽样设计,这可以帮助数据用户对调查结果进行解释和使用。质量控制贯穿与整个调查过程,,发现问题应予记录,对最终数据应加以验证。21110-5保密和泄密控制一、调查中的泄密(一)泄密的两种主要类型:1、身份泄密。某项调查结果与被调查者联系起来;2、归属泄密。经常发生在普查中。(二)泄密按严重程度划分成不同类型:1、自我推断;2、窥及他人;3、牵连推断;4、直接推断;5、剩余推断;6、精确推断;7、近似推断。(以上列举并非完全互斥)212二、保密技术(一)表格数据的保护有泄密危险的数格称敏感数格,处理的方法有:1、限制法。通过合并和隐藏数格来保密。2、扰乱法。通过系统舍入、随机舍入和有控制的随机舍入来保密。(二)对公用微型数据文件的保护对可识别某单元的直接识别符必须删除。213本书学习结束!另选章节返回本章退出学习214测试练习第一章导论第二章调查设计第三章数据的收集方法第四章调查问卷设计第五章抽样方法第六章抽样估计第七章样本量的确定第八章数据收集的实施第九章数据处理第十章数据发布与数据分析215第一章调查导论一、单项选择题二、多项选择题三、名词解释题四、简答题五、论述题216Ⅰ(一)、单项选择题1、某公司总经理从媒体的报道中发现,该公司在市场销售中,其占有的份额在减少,他需要采取的措施首先应该是:A、增加投入,扩大生产。B、改进技术,增加产品的技术含量。C、进行市场调查,了解份额减少的原因。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论