统计学原理第二章统计数据收集.ppt_第1页
统计学原理第二章统计数据收集.ppt_第2页
统计学原理第二章统计数据收集.ppt_第3页
统计学原理第二章统计数据收集.ppt_第4页
统计学原理第二章统计数据收集.ppt_第5页
已阅读5页,还剩158页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,统计数据是统计分析的基础和前提,准确、及时、有效地进行统计数据的收集是统计活动的起点,科学的、规范的数据收集方法是统计学研究的重要内容之一。,第二章 统计数据收集,2.1 统计数据的来源 2.2 统计调查设计 2.3 统计数据质量,2.1 统计数据的来源,从统计数据的观测登记方式和统计数据本身的属性来看,统计数据存在着两种不同的来源: 专门组织的统计调查 科学实验和生产试验的观测数据,从使用者的角度看,统计数据存在两种不同的来源。 一是直接的来源,使用者所应用是由自己亲自观测登记获得的统计数据,属于第一手的统计数据,称为初级数据; 二是间接的来源,使用者所应用是由他人观测登记获得的统计数据,属于第二手的统计数据,称为次级数据。,任何第二手统计数据都是来源于他人观测登记所获得的第一手统计数据。归根到底,专门组织的统计调查,科学试验和生产实验的观测数据是统计数据的来源所在,是第一性的,决定着统计数据的质量。,间接来源 (1)各类专业期刊、报纸、书籍所提供的文献资料 (2) 统计部门和各级政府部门公布的资料:定期发布的统计公报,定期出版的统计年鉴以及未公开出版的统计数据 (3)各类经济信息中心、信息咨询机构、专业调查机构、各行业协会和联合会提供的市场信息和行业发展的数据情报。,(4)各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料 (5) 互联网或图书馆查阅到的有关资料 (6) 业务资料,如与业务经营活动有关的各种单据、记录;经营活动过程中的各种统计报表;各种财务、会计核算和分析资料,统计数据的来源,从观测登记方式看,从使用者的角度看,统计数据的来源,科学试验、生产实验和交易活动,统计调查、试验、实验和 交易活动,(直接的统计数据),别人调查或登记的数据,(间接的统计数据),专门组织的统计调查,二手数据的优点:搜集方便、数据采集快、采集成本低 二手数据的缺点:相关性、可信度、时效性,2.1 统计数据的来源,一手数据:经济现象的数据、人的行为数据、生产经营活动数据 一手数据的特点:搜集成本高、准确性、相关性、可信度、时效性,2.1 统计数据的来源,2.1.1 统计调查 2.1.2 数据的搜集方法,2.1.1 统计调查 统计数据调查的主要方法有普查、抽样调查和统计报表。 我国政府统计调查工作是“以必要的周期性普查为基础,经常性的抽样调查为主体,重点调查、科学推断等为补充的多种方法综合运用的国家统计调查方法体系。” 国务院1994年42号文,1普查 普查(Census)是为了特定目的而专门组织的一次性或周期性的全面调查,调查在某一标准时间上的社会经济现象的总量。,总体单位,调查单位,普 查,对全部单位进行的调查。,普查具有以下特点: (1)普查是一种全面调查。 (2)普查是一种一次性或周期性的调查。 (3)普查是一种调查在某一标准时间上的社会经济现象总量的调查。,(1)普查是一种全面调查。 需耗费大量人力、物力和时间,成本较高。 普查往往需要临时征用大量调查人员,同时进行大规模的实地调查登记和数据处理工作,由于调查人员专业素质参差不齐,调查任务过于繁重,调查时间比较紧张,普查容易导致各类登记性误差。 不存在由部分样本推断总体参数的估计误差。,我国的普查 1994年方案 人口 农业 工业 第三产业 基本单位 普查年份 0 7 3 5 1,6 (尾数),我国的普查 1994年方案 人口 农业 工业 第三产业 基本单位 普查年份 0 7 3 5 1,6 (尾数) 建筑业 2003年方案 人口 农业 经济普查 普查年份 0 6 3,8 (尾数),第二次全国基本单位普查办法是为搞好2001年进行第二次全国基本单位普查,特制定的办法。普查的目的是摸清我国各类单位的底数,掌握全国基本单位的组织形式、经济构成、规模结构和生产要素的配置以及行业分布、地区分布等情况,逐步建立和完善覆盖全国的部门间相互衔接、互为补充、信息共享且能动态更新的基本单位名录库系统,为规范市场秩序、加强社会监管、调整经济结构、优化产业政策、规划城乡建设等提供基础信息,并为开展其他普查和各类抽样调查奠定基础。,(3)普查是一种调查在某一标准时间上的社会经济现象总量的调查。 根据国家普查项目和周期安排的有关规定,国务院决定于2010年开展第六次全国人口普查。此次人口普查标准时点为11月1日零时,人口普查主要调查人口和住户的基本情况,内容包括:性别、年龄、民族、受教育程度、行业、职业、迁移流动、社会保障、婚姻生育、死亡、住房情况等。人口普查的对象是在中华人民共和国(不包括香港、澳门和台湾地区)境内居住的自然人。 2011年4月28日,国家统计局局长马建堂发布2010年第六次人口普查登记(已上报户口)的全国总人口为:1 339 724 852人。,普查的目的: 在于搜集那些不能够或不适宜用其它统计调查方式搜集的统计数据,以搞清重要的国情、国力,为经常性的抽样调查提供抽样框和其它辅助数据。,抽样框(Sampling Frame) 进行抽样调查时抽取样本的有序数据库。 为了降低抽样调查的系统性偏误,抽样框数据与总体的客观存在应尽量保持一致。抽样框的原始数据只能来自于对总体的全面调查,借助周期性的普查来不断更新抽样框数据,是科学地实施抽样调查的基本要求。,2抽样调查 抽样调查(Sampling Survey)是根据随机原则和具体的抽样技术的要求,从总体中抽取部分个体构成样本,并依据样本信息推断总体数量特征的非全面调查。,总体单位,调查单位,抽样调查,按随机原则抽取部分单位进行的调查。,(1)抽样调查是一种按照随机原则抽取样本的调查。 (2)抽样调查是一种可以事先估计和控制抽样误差的调查。 (3)抽样调查是一种非全面调查。抽样调查仅对总体中部分被随机抽中的个体进行登记,因此可以显著地提高调查的时效性,降低调查的人力、物力、财力投入,抽样调查是一种经济的调查方法。,(4)抽样调查是一种准确性高的调查。 基于抽样调查的随机原则,可以事先估计和控制抽样误差;同时抽样调查仅对总体中被随机抽中的个体进行调查,调查工作量大幅减少,可以运用具备丰富经验的专业人员,在相对充裕的调查时间里,高质量地进行数据采集和数据处理,有效地降低调查的登记性误差。所以,抽样调查是对普查等统计调查中存在的登记性误差进行检查和校正的主要方法。,(5)抽样调查是一种具有广泛适用性的调查。 抽样调查可以用于破坏性检验场合的调查和推断。对于具有破坏性的调查,例如对一些产品的使用寿命、抗压、防震等能力的检验,以及对一次性使用物品的检验等,只有采用非全面调查方法。 抽样调查可以用于较大规模总体或无限总体的调查和抽样。在总体单位数无限或虽然有限却无法一一观察的情况下,要研究总体的数量特征,就难以进行全面调查,而只能以抽样调查方法推断总体。,抽样调查可以用于检查和补充全面调查数据。 抽样调查可以用于企业的全面质量控制。,自1953年起,我国政府统计部门相继成立了全国农产量调查总队和各省、市、自治区农产量调查队。1982年以后,我国又设立了全国城市抽样调查队和企业调查队,最近又组建全国的抽样调查局系统。已经形成了一个自上而下的全国抽样调查网络体系。,3统计报表 统计报表(Statistical Report Forms)是指按照统一的表式,统一的报送时间和报送程序,自上而下统一布置,自下而上逐级上报,逐级汇总,提供基本统计数据的统计调查方式。 统计报表分为国家正式报表和企业内部报表。国家正式报表是指按照国家有关法规规定,由统计主管部门正式核准的,所有单位和公民都必须依法填写和报送的统计报表。企业内部报表是现代企业管理信息采集和经营决策分析的重要工具之一,由企业按照内部核算要求和填报国家正式报表需要,自行制定,自我管理。,【课后作业】 搜集某一统计报表,了解报表结构,报表填报指南。,4重点调查 重点调查是在调查对象中选择一部分重点单位所进行的一种非全面调查。 所谓重点单位是指在总体中举足轻重的那些单位,这些单位的数目不能太多,但这些单位的标志值之和却占总体标志总量的绝大比重,通过对这些重点单位的调查,就可以了解总体的基本情况。但是,重点调查不能推断总体。,总体单位,调查单位,重点调查,对重点单位(个数不多,但其标志量占标志总量比重较大的单位)进行的调查。,重点调查的应用条件是在总体中必须客观存在这样的重点单位,从而可以通过对总体内少量重点单位的调查,来实现对总体基本情况的了解,达到进行统计调查的目的。 重点调查的意义就在于当总体内客观存在重点单位时,我们能够利用较少的费用和较短的时间,通过对少量重点单位的统计调查,来获得能够反映总体全貌的数量特征的基本资料。,5.典型调查 典型调查就是根据调查目的和调查对象的特点从调查对象中有意识地选取若干有代表性的单位(即典型单位)进行的调查方法。,总体单位,调查单位,典型调查,有意识地选择部分典型单位进行的调查。,5典型调查 典型单位根据调查的目的不同,一般有三种不同选取办法。 一是近似地估算总体的数值,可采用“划类选典”方法。 二是了解总体的一般数量表现,可采用“择中选典”方法。 三是研究成功的经验或失败的教训,可采用“优劣选典”方法。,调查单位是根据调查的目的,在对调查对象进行全面分析的基础上有意识地选择出来的。调查资料不能推断总体。 在一定条件下可用“划类选典”和“择中选典”的典型调查的资料补充全面调查的不足。典型调查为非概率抽样,不能计算抽样误差。,2.1.2 数据的搜集方法 数据的搜集方法一般可以归纳为询问调查和观察实验两大类。 1询问调查 询问调查是调查者与被调查者通过某种方式和某种工具进行信息交流,以采集和登记调查数据的方法。,询问调查可以分为以下几类: (1)访问调查。 (2)电话调查。 (3)邮寄调查。 (4)计算机辅助调查(网络调查)。 (5)座谈会调查。,(1)访问调查:又称为入户调查,或派员调查。是专门派出调查人员,前往被调查对象所在地,直接进行的面对面的信息交流和当场登记的一种调查方法。,【访问调查】 激励参与意识 现场释疑 适用于对识字率低的群体 问卷结构可复杂 周期较短 成本较高【培训费用,工资,小礼品,交通费用】 不适用于敏感性问题的调查,(2)电话调查:调查人员通过电话与被调查人员进行的信息交流和数据登记的一种调查方法。,【电话调查】 速度快 适用于样本单位分散的情形 成本低 有利于调查督导 计算机辅助电话调查CATI(Computer Assisted Telephone Interview) 必须有电话 时间不能太长 问卷需要简单 不利于激发参与意识,2012-03-02(ZHOUWUWan),(3)邮寄调查:是指通过邮政系统邮寄,以及大众传播媒介发布、专门场所派发和部门单位内部系统分发等方式将标准化的调查表递送至被调查对象,由被调查对象按照填表说明自行填写,然后按照要求寄回到指定的调查数据回收地址,或投放到指定的调查数据回收场所,以实现数据采集的一种调查方法。,【邮寄调查】或称【自填式】 问卷结构要严谨,有清楚的说明 要求被调查者具有一定的文化素养 被调查者可方便地作答【时间,资料,压力】 调查成本较低 返回率较低【放弃,丢失,遗忘】 周期较长,计算机辅助调查:是指采用计算机技术进行问卷设计、样本抽取、调查登记、数据录入和数据处理的一种调查方法,多用于与现代信息技术相结合的场合。例如电话自动应答调查系统、网络调查系统和短信调查系统等。,座谈会调查:是通过召集一组被调查者集中进行面对面的信息交流和当场登记的一种调查方法。 座谈会所召集的被调查者一般为有针对性的特征人群,例如某方面专业人士、某领域专家学者,某行业实际工作人员,某产品直接消费者或使用者,等等。 座谈会调查可以用于问卷的预调查。,2观察和实验 (1)观察法。 (2)实验法。,观察法:是调查者单方面观察、采集信息的一种数据搜集方法。例如: 超速检测 路口摄像头:交通路口车流量信息采集 超市监控:超市里消费者购买行为数据采集,实验法:是在特定的实验环境下,对参与实验调查的被调查对象进行实验测量,以取得所需信息的一种数据搜集方法,例如用拍卖实验研究消费者对有机食品的支付意愿等。,2.1.2 数据的搜集方法,【实验法】 (1)不同饲料对牲畜增重的影响 (2) 不同元素结合后产生的变化; (3) 水分、温度对农作物产量的影响 (4) 新药的疗效 (5) 军事学上的应用:英国海军为了印证缺乏柑橘类水果是否是导致长期在海上工作的税收患坏血病的原因。,【实验法】,实验组(Experiment Group)与对照组(Control Group) 随机原则与自愿原则 匹配 双盲法 心理问题1924-1933 道德问题 案例:现场试验帮助A公司胜诉 参考:贾俊平主编统计学(27-31页),2012-03-02(ZHOUWUShangWu),【数据搜集方法的选择】 抽样框中的有关信息(目标总体特征,比如地域是否分散等,被调查者文化程度等) 调查访问的内容(难易程度,是否为敏感性问题等) 有形辅助物的使用 实施调查的资源(经费、调查员、调查设备、时间限制) 管理与控制(电话录音) 质量要求,搜集数据不同方法特点归纳,量表( Scale )与问卷(Questionnaire),2.2 统计调查设计,2.2.1 统计调查方案设计 2.2.2 问卷设计 2.2.3敏感问题的随机化处理,2.2.1 统计调查方案设计 统计调查是一项复杂细致的系统工程,为了统一认识、统一内容、统一方法、统一步调,必须事先编制一个科学的统计调查方案。,统计调查方案一般包括以下几方面的内容: 1调查任务和目的 2调查对象、调查单位和填报单位 3调查项目和调查指标 4调查时间 5调查方法 6调查误差的控制方法 7调查数据的汇总处理方法 8调查表和调查问卷设计 9制定调查工作的组织实施计划,1调查任务和目的 调查任务和目的是统计调查的依据。 调查目的决定着调查的对象、内容和方法。,以第五次全国人口普查办法为例 第一条 为了科学地制定国民经济和社会发展战略与规划,制定人口政策,统筹安排人民的物质和文化生活,实现人口与资源、环境的协调发展,国务院决定于2000年进行第五次全国人口普查。根据中华人民共和国统计法,制定本办法。,住宅销售价格调查方案 调查任务和目的 调查目的:全面了解和掌握相关城市新建住宅和二手住宅销售价格及其变动情况,为做好国民经济核算和房地产市场调控工作、满足社会公众需要提供基础统计信息。 调查任务:按月调查和收集相关城市新建住宅和二手住宅销售价格、面积、金额等相关基础资料并计算价格指数。,2调查对象、调查单位和填报单位 调查对象和调查单位的确定取决于调查任务和目的。 调查对象与统计总体相联系;调查单位与总体单位相联系。 填报单位(又称报告单位)是负责向上级报告调查内容、提交统计资料的单位。,调查对象、调查单位、填报单位 调查城市包括直辖市、省会城市、自治区首府城市(不含拉萨市)和计划单列市(共35个),以及唐山、秦皇岛、包头、丹东、锦州、吉林、牡丹江、无锡、扬州、徐州、温州、金华、蚌埠、安庆、泉州、九江、赣州、烟台、济宁、洛阳、平顶山、宜昌、襄樊、岳阳、常德、惠州、湛江、韶关、桂林、北海、三亚、泸州、南充、遵义、大理等城市(以下简称“其他35个城市”)。,第五次全国人口普查办法 第六条 人口普查的对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人(全体为调查对象,每一公民为调查单位)。 第八条 人口普查以户为单位进行登记。户分为家庭户和集体户。(填报单位),调查单位与填报单位有时是一致的,有时不一致。,3调查项目和调查指标 调查项目就是调查中所要登记的调查单位的标志及其它有关情况。确定调查项目的依据是事先设计好的统计指标。确定调查项目时应注意的主要问题还有以下几点。 (1)资料搜集的可行性。 (2)项目和指标解释的一致性。 (3)保证项目和指标之间的衔接性。 (4)保证项目和指标动态可比性。,调查指标、调查项目 调查指标:城市的新建住宅(含保障性住房、商品住宅以及各基本分类)和二手住宅环比、同比、定基价格指数。,调查项目: (1) 新建住宅交易的网签数据内容,主要包括:住宅所在项目(楼盘)名称、项目地址、幢zhung 号、总层数、所在层数、住宅结构、建筑面积、成交总价(合同金额)、签约时间等。 (2) 二手住宅销售价格的调查内容为:成交住宅所在小区或社区名称、位置、住宅类型、住宅所在区域、住宅所在地段、本月销售面积、本月销售金额、样本住宅上月销售单价、样本住宅本月销售单价等。,4调查时间 一是调查资料所属的时间。如果所要调查的是时期现象,就要明确规定搜集从什么时间开始到什么时间结束的资料;如果所要调查的是时点现象,就要明确规定统一的标准时点。 二是调查工作的期限。指的是调查工作开始和结束的具体时间要求。,第五次全国人口普查办法 第三条 2000年11月1日零时,为第五次全国人口普查登记的标准时间。 第十九条 人口普查的现场登记工作,从2000年11月1日开始到11月10日以前结束。,5调查方法 根据调查任务的要求,调查对象的特点,调查人员业务水平和专业经验,选用合适的方法进行调查。 可选的调查方法有普查、抽样调查、统计报表、重点调查、典型调查。 在具体的调查方法确定之后,需要制定调查误差控制方法、数据处理方法,提出明确的调查经费概算,组织人员培训,设置调查机构等。,6调查误差的控制方法 根据所采用的不同统计调查方法,对于调查中可能出现的误差,相应地采取不同的调查误差控制方法,以提高统计调查资料的质量和可比性。,对于全面调查,一般可以用抽样数据来控制全面调查中出现的登记性误差。对于抽样调查,可通过科学地确定必需的样本容量等方法来实现对抽样误差的有效控制。,第二十三条 普查登记的个人资料不得作为行政管理和表彰、处罚的依据。 第二十四条 人口普查机构和各级普查工作人员,对各户申报的情况,必须保守秘密,不得向人口普查机构以外的任何单位和个人提供或者泄露。严禁公开个人和家庭的登记资料。,第二十六条 普查登记结束后,普查指导员应当组织普查员按照规定的方法进行全面复查,发现差错,经核实后,予以改正 复查工作在2000年11月15日以前完成。,第二十七条 复查工作完成后,全国抽取千分之零点一五的人口进行事后质量抽查。事后质量抽查由国务院人口普查办公室统一组织进行。抽查人员不得在原来参加普查的普查区进行质量抽查工作。质量抽查工作在2000年11月30日以前完成。事后质量抽查结果只作为评价全国人口普查登记质量的依据,不用于评价地方人口普查的工作质量。,7调查数据的汇总处理方法 首先是制定调查数据的汇总方法。大多采用分级汇总与超级汇总相结合的方式。 其次是制定调查数据的处理方法。大型的统计调查可以通过编制专用的调查资料汇总和数据处理软件来保证这一工作的质量和效率。,需要制定各项调查指标的计算口径和计算方法,调查数据的处理方法单位、小数点,保证调查数据在时间上和空间上的可比性。 抽样调查时,需要对样本容量计算,抽样估计量推断和抽样误差计算的具体方法给予统一规定。,第三十三条 人口普查机构对普查的几项主要数字,先进行快速汇总。省、自治区、直辖市人民政府人口普查领导小组办公室将汇总结果于2000年12月31日以前报送国务院人口普查办公室。国家统计局和国务院人口普查办公室于2001年1月31日以前发布公报。,第三十四条 人口普查表经复查后,由编码员在编码指导员的指导下,按照统一规定的标准,集中在县级进行编码。,编码资料经全面复核、验收合格后,方可交付录入。 编码工作于2001年4月30日以前完成。 第三十五条 人口普查表短表、长表,以调查小区为单位分别装入不同的包装袋。死亡人口调查表以普查区为单位装入相应的包装袋。 第三十六条 人口普查资料由人口普查机构负责进行电子计算机数据处理。汇总程序由国务院人口普查办公室统一下发。,8调查表和调查问卷设计 把确定的调查项目按照一定顺序排列在表格上,就形成了调查表。,第九条 人口普查表分为普查表短表和普查表长表两种形式,普查表由国务院第五次全国人口普查领导小组办公室(以下简称国务院人口普查办公室)设计。普查表长表根据国家规定的办法,抽出百分之十的户填报;普查表短表由其余的户填报。,调查问卷设计主要研究问卷设计,调查资料的数量化处理、调查数据的标准化处理,以及敏感问题的随机化处理等方面的问题。,9制定调查工作的组织实施计划 在统计调查实施计划中,除了以上介绍的方面外,还包括: 调查工作的组织领导机构的设置和职能 调查人员的培训和组织 统计调查的宣传教育 文件印刷 调查经费的管理,第十五条 各级宣传部门和新闻媒体,在人口普查登记前后,应当积极做好人口普查的宣传工作,动员群众参与人口普查。 第二十八条 人口普查的登记工作,由普查员承担,普查指导员负有对普查员的工作进行指导、检查的责任。基层干部和群众积极分子应当积极协助普查员作好登记工作。 第二十九条 普查员和普查指导员应当由具有初中以上文化水平、热心社会公益事业、身体健康、责任心强、能够胜任人口普查工作的人员担任。,2.2.2 问卷设计,1.问卷结构 2.封闭性问题及备选答案 3.问题排列,1问卷结构 问卷结构由问卷的开始,主体和结束三个部分组成。 (1)问卷的开始部分主要包括识别信息,问候语和填写说明三项内容。 (2)问卷的主体部分是调查问卷的核心内容,包括所有封闭性问题及其备择答案,和开放性问题。 (3)问卷的结束部分一般由被调查者的背景数据构成。,(1)问卷的开始部分主要包括识别信息,问候语和填写说明三项内容。 识别信息一般由问卷标题、问卷编号、调查者及被调查姓名、地址、电话等基本信息组成、用于问卷的识别,便于问卷数据的检验、核对、校正,以及有效进行相关的后续调查。 问候语的内容包括简要介绍调查者的情况,调查的目的和意义,对被调查者合作的感谢。有的问卷还要告知被调查者填写问卷后的信息反馈、报酬和奖励等情况。问候语一定要亲切、自然、诚恳,文字表述必须简洁清晰。问候语,的目的是消除被调查者的疑惑和顾虑,争取被调查者的认可和认同,积极主动地参与和配合问卷调查。 填写说明的目的是介绍正确填写问卷的方法。例如,对于问题类型的说明和识别,对于封闭性问题中单选题和多选题的回答方式,对于开放性问题的回答方法等。,(2)问卷的主体部分是调查问卷的核心内容,包括所有封闭性问题及其备择答案,和开放性问题。,(3)问卷的结束部分 一般由被调查者的背景数据构成。例如被调查者的性别、年龄、收入状态、受教育水平、职业类别、家庭人口、居住地区等,以便按照研究目的进行分类比较分析。被调查者的背景数据放在问卷的结束部分提出,是一种消除被调查者顾虑的设计技巧,以避免被调查者在没有对问卷进行全面了解情况下,就从自我保护的潜意识出发,排斥问卷调查,拒绝回答问卷,或提供虚假的回答。,2封闭性问题及备选答案 问卷的主体由若干问题组成,其中主要形式为封闭性问题。封闭性问题及备选答案的设计是问卷设计的核心内容。 (1)封闭性问题的表达要准确,内容要完整。一般可以按照6W原则检查。即按照Who(谁),Where(何处),When(何时),Why(为什么),What(是什么),How(如何)六个方面来判断。,避免提一般性的问题(表达不够准确) 一般性问题对实际调查工作并无指导意义 例如:“您对某百货商场的印象如何?”这样的问题过于笼统,很难达到预期效果,可具体提问:“您认为某百货商场商品品种是否齐全、营业时间是否恰当、服务态度怎样?”等。,避免用不确切的词(表达不够准确) 例如“普通”、“经常”、“些”等,以及些形容词,如“美丽”等。这些词语,各人理解往往不同,在问卷设计中应避免或减少使用。例如:“你是否经常购买洗发液?”回答者不知经常是指一周、一个月还是一年,可以改问:“你上月共购买了几瓶洗发液?”,避免使用含糊不清的句子(表达不够准确) 例如:“你最近是出门旅游,还是休息?”,出门旅游也是休息的一种形式,它和休息并不存在选择关系,正确的问法是:“你最近是出门旅游,还是在家休息?”,(2)封闭性问题备择答案要不重不漏。即保证封闭性问题备择答案的完备性和周延性。 (3)封闭性问题必须使用中性语言和陈述句式。 要力求杜绝任何可能干扰被调查者的价值判断和真实状态的表述,不应包含任何的情绪和倾向,不能使用任何具有感情色彩和价值判断的表述,也不能使用否定句,反问句,感叹句等,可能引发某种暗示和诱导效应的封闭性问题构造方式。,例如:您反对这项规定吗? (1)是 (2)否 (3)其他 您认为该饮料太甜了吗? (1)太甜 (2)适中 (3)不够甜,您对这项规定的态度 (1)赞成 (2)反对 (3)弃权 您认为该饮料的甜度 (1)太甜 (2)适中 (3)不够甜,避免引导性提问 如果提出的问题不是“执中”的,而是暗示出调查者的观点和见解,力求使回答者跟着这种倾向回答,这种提问就是“引导性提问”。 例如:“消费者普遍认为XX牌子的冰箱好,你的印象如何?” 引导性提问会导致两个不良后果:一是被调查者不加思考就同意所引导问题中暗示的结论;,二是由于引导性提问大多是引用权威或大多数人的态度,被调查者考虑到这个结论既然已经是普遍的结论,就会产生心理上的顺向反应。此外,对于一些敏感性问题,在引导性提问下,不敢表达其他想法等。因此,这种提问是调查的大忌,常常会引出和事实相反的结论。,(4)封闭性问题的表述要简洁、通俗。为了提高问卷的回答率和数据的准确性,封闭性问题表述要简洁,真正做到一目了然。同时,封闭性问题表述应通俗易懂,尽量避免专业词汇,提高问卷的适用性。,问卷设计应注意的几个问题,问句要具体 一个问句最好只问一个要点,一个问句中如果包含过多询问内容,会使回答者无从答起,给统计处理也带来困难。 例如:“您为何不看电影而看电视”?这个问题包含了“您为何不看电影?”“您为何要看电视?”和“什么原因使您改看电视?”等。防止出现此类问题的办法是分离语句中的提问部分,使得一个语句只问一个要点。,(5)封闭性问题的敏感性问题的处理。在一般问卷调查中必须避免任何的敏感性问题,以免造成被调查者顾虑或反感,影响到整个问卷调查的质量。敏感性问题的调查必须通过专门的调查技术,对敏感问题进行随机化处理之后,专项组织进行,方可以取得可信的调查数据。,(6)问句要考虑到时间性 时间过久的问题易使人遗忘。 如:“您去年家庭的生活费支出是多少?用于食品、衣服分别为多少?”除非被调查者连续记帐,否则很难回答出来。一般可问:“您家上月生活费支出是多少?”显然,这样缩小时间范围可使问题回忆起来较容易,答案也比较准确。,问题设计,直接性问题、间接性问题和假设性问题 直接性问题是指在问卷中能够通过直接提问方式得到答案的问题。直接性问题通常给回答者一个明确的范围,所问的是个人基本情况或意见,比如,“您的年龄”、“您的职业”、“您最喜欢的洗发水是什么牌子的?”等,这些都可获得明确的答案。这种提问对统计分析比较方便,但遇到一些窘迫性问题时,采用这种提问方式,可能无法得到所需要的答案。,问题设计,间接性问题是指那些不宜于直接回答,而采用间接地提问方式得到所需答案的问题。通常是指那些被调查者因对所需回答的问题产生顾虑,不敢或不愿真实地表达意见的问题。调查者不应为得到直接的结果而强迫被调查者,使他们感到不愉快或难堪。这时,如果采用间接回答方式,使被调查者认为很多意见已被其他调查者提出来了,他所要做的只不过是对这些意见加以评价罢了,这样,就能排除调查者和被调查者之间的某些障碍,使被调查者有可能对已得到的结论提出自己不带掩饰的意见。,问题设计,例如,“您认为妇女的权力是否应该得到保障?”大多数人都会回答,“是”或“不是”。而实际情况则表明许多人对妇女权力有着不同的看法。如果改问: “A:有人认为妇女权力应该得到保障的问题应该得到重视。” “B:另一部分人认为妇女权力问题并不一定需要特别提出。”,您认为哪些看法更为正确? 对A种看法的意见: 完全同意;有保留的同意;不同意。 对B种看法的意见: 完全同意;有保留的同意;3不同意。,例如:“有人认为目前的电视广告过多,您的看法如何?”,问题设计,假设性问题是通过假设某一情景或现象存在而向被调查者提出的问题。例如:“如果在购买汽车和住宅中您只能选择一种,您可能会选择哪种?”这个语句属于假设性提问。,3问题排列 (1)问题的排列应具有层次性和逻辑性,符合人们思维习惯。前后相继的问题具有内在联系,反映事物的因果关系,和递进的思维层次。,(2)“过滤”性问卷设计的问题排列。“过滤”性问卷设计要求问题排列构成逻辑的树状结构。 例:某一项数码产品问卷调查采用了“过滤”性问卷设计。第一个问题是: “您在近2年内购买了 笔记本电脑 数码摄像机 数码相机,1.若三种产品都没有购买,调查到此结束。 2.若选中了其中一项,调查便继续进行。,2.1假设选中了数码相机,接下来是一组有关数码相机的品牌、认知途径、功能档次、附属设备、主观评价的问题。其中有一项可能是“您购买了照片打印机吗?”,“您购买了照片打印机吗?” 1.若是尚未购买,会出现一个问题“您准备在一年内添置一台照片打印机吗?” 2.如果您已经购买了照片打印机,接下来的是一组有关照片打印机品牌、认知途径、功能档次、主要耗材、主观评价的问题,其中可以进行继续深化的分支问题调查,例如有关照片打印机主要耗材的使用数量、品牌选择、购买方式等问题。,如果你在最初的三个备选中选了两项或三项,那么一项产品的问题结束之后,会接着开始第二项,依次再进行第三项的调查。,(3)问题的排列应先易后难。 将简单、容易、直观的问题放在问卷的前面,提高被调查者的兴趣,使被调查者比较容易地进入答题角色,顺利完成问卷中所有问题的回答。,(4)开放性问题的排列。 开放性问题属于非标准化问题,其数据需要调查人员事后进行人工分类整理,才能进行数据分析。开放性问题的排列要从属于封闭性问题,有关全局性的开放性问题放在整个问卷主体部分的末尾;相对某类具体封闭性问题的开放性问题,放在这类封闭性问题的末尾。,2.2.3 敏感问题的随机化处理 所谓敏感问题是指一些涉及个人隐私问题,有关违规违约,违反社会道德规范,影响个人利益和人际关系的一些问题。 例如:家庭收入水平、考试作弊现象、偷逃税款行为、吸毒问题、对领导和同事的个人评估等等。,敏感问题的随机化处理是使这类调查中的回答在随机状态下进行,调查者无法识别具体被调查者的个体信息,不能得到被调查者对于敏感问题的倾向和回答。但是,可以计算出该总体中对于所调查的敏感问题次数分布的估计量。在敏感问题的随机化处理下,被调查者个人真实状况得到完全屏蔽,使被调查者打消了顾虑,能够真实地回答问卷调查中的敏感问题,从而随机化处理的问卷调查可以获得普通调查方法无法取得的敏感问题数据。,敏感问题的随机化处理的基本形式为沃纳(Warner)于1965年提出的沃纳模型。 沃纳模型在进行调查之前需要准备好N个备择答案,并将这N个备择答案分为“对”和“不对”两类,具体形式可以两类不同的卡片、彩球等。其中“对”的备择答案数目为 个,“不对”的备择答案数目为 个。,被调查者当场随机抽取其中一个,然后针对具体的敏感问题和抽中的备择答案回答“是”或“不是”。由于调查人员不知道被调查者随机抽取的备择答案为“对”还是“不对”,不可能仅凭回答“是”或“不是”得知被调查者的具体情况,以此来保护被调查者的利益,激励被调查者如实回答。,设所调查的总体中A类特征人数的比重为A ,非A类特征人数的比重为 1- A ,样本容量为 n,回答“是”的人数为n1 ;随机抽取的备择答案中为“对”的比重为P 。则有,回答“是”的人数比例为 可由上式解出总体中A类特征人数的比重A的估计量的计算公式,2012-03-07(zhousanshangwu),【课后作业】 设计问卷并实施,2.3统计数据质量,2.3.1 统计数据的误差种类 数据的误差是指统计数据与客观事实之间的差距。可以分为登记性误差和代表性误差两类 1登记性误差 登记性误差是指在调查过程中由于调查者和被调查者的人为原因形成的误差。,例如,调查者的人为原因主要有总体界定错误、调查单位缺失、计量和测量误差、舍入误差、记录失误、抄录错误、汇总差错;被调查者的人为原因主要有有意识地提供虚假数据、无意识地提供有误数据。从理论上说登记性误差属于可以消除的误差。,代表性误差,调查员误差 调查员粗心、诱导、能力极限 登记性误差解决办法:遴选调查员,调查员的培训,监督控制【电话录音】、督导员的培训,中国的人口统计数据: 公元2年(汉元始二年) 59594978人 公元754年(唐天宝十三载) 52880488人 公元1122年(宋宣和四年) 46734784人 公元1281年(元至元十八年)58830000人 公元1578年(明万历六年) 60692856人 公元1711年(清康熙五十年)24621324人 公元1741年(清乾隆六年) 143411559人 公元1763年(清乾隆二十八年)204209828人 公元1790年(清乾隆五十二年)301487115人 公元1835年(清道光十五年)401767053人,“有五六丁之户,仅一人缴纳钱粮,或有九丁、十丁,亦仅二三人缴纳钱粮”,康熙五十一年定“滋生人丁永不加赋”,30年间增加近5倍!,登记性误差,2代表性误差。 代表性误差是指利用样本数据推断总体参数时产生的误差。分为随机性误差和系统性误差。 (1)随机性误差(抽样误差)是由于随机性原因形成的代表性误差,它是服从于某一概率分布的随机变量。随机性误差是不可以消除的误差,只要利用样本数据推断总体参数,就必然存在着随机性误差。随机性误差的取值随着样本容量的增大而减小。,总体比率的估计【产品质量检验】 抽样误差的影响因素【样本容量、总体变异程度】 解决方法:增大样本容量,(2)系统性误差是由于非随机性原因形成的代表性误差。主要原因有抽样框过于陈旧导致的抽样框偏误、非随机样本、无回答问题、辅助数据偏误等。系统性误差属于代表性误差,也是在利用样本数据推断总体参数时产生的误差,但是系统性误差不会随着样本容量的增大而减小,不能通过增大样本容量来实现对系统性误差的控制。,辅助数据是指在主体数据处理中具有辅助作用的数据。不构成数据处理的主要实体,但有助于提高数据处理精度。如在遥感数据输入地理信息系统的过程中,需要对遥感数据进行有效地分类,在分类过程中借助地理信息系统中的辅助数据(如该地区高程数据、地面坡度数据、地表坡向数据及土地利用数据等)的支持,可改善遥感数据的分类精度,以达到地理信息系统中数据处理的精度要求。,代表性误差,(2) 系统性误差 非随机样本 回答误差【理解误差、记忆误差(随机性)、有意识误差(系统性)】 减小有意识误差的方法:随机化、保密、法制化 无回答误差 辅助数据偏误【青年人时尚用品调查】,代表性误差,(2)系统性误差 无回答误差 原因:拒绝接受、不在家、地址写错、搬家、遗忘或丢失 随机性:无回答与调查的内容无关 问卷丢失,没有时间接受调查 解决办法:加大样本量 系统性:【调查收入】 【调查居民对公共交通的看法】 解决办法:再抽取一个样本,2012-03-05(zhouyi3-4),关于电视收视率的调查,您经常看电视节目吗? (1) 从来不看 (2) 偶尔看 (3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论