谈统计与抽样调查的几个问题_第1页
谈统计与抽样调查的几个问题_第2页
谈统计与抽样调查的几个问题_第3页
谈统计与抽样调查的几个问题_第4页
谈统计与抽样调查的几个问题_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

谈统计与抽样调查的几个问题,一、引言,戒烟是很容易的事,我就戒过一千次了。-马克.吐温做统计是很容易的事,我就做过成千上万次了。-张勇我们每个人都做统计成千上万次了。问题是如何做好统计,反映宏观经济状况四大重要经济指标:,经济发展:GDP物价:CPI,PPI就业:失业率vs就业率国际收支:进出口额问题?,统计与调查的关系,如何理解统计?statistics统计资料与统计学统计学:收集数据和分析数据调查:收集数据和简单分析统计工作?,数据挖掘与大数据,这是21世纪引人注意的概念这是与统计相关的概念存在的问题?,抽样调查是一种调查,调查的生命周期(阶段):调查计划设计和开发操作与实施(包括发布)调查评估,抽样调查的发展,历史当前的理论与方法实际中存在的主要问题统计与说谎-国内外,对统计数字的看法,越多越好?有好?无好?谎言,糟糕透顶的谎言,统计数字,信仰不能取代数字,数据胜过自封的专家数字不会说谎,但说谎的人会想出办法用统计骗人很容易,但不用统计骗人更容易,要问的几个基本问题,谁说的?他是如何知道的?遗漏了什么?是否有人偷换了概念?这个资料有意义吗?然后再去探讨具体的问题,简述,什么是抽样调查?什么是统计学意义上的抽样调查?概率抽样抽样调查应用中的几个问题抽样调查不神秘,我们的生活中经常用到抽样调查抽样调查科技含量较高正式的社会经济调查,国外用得好,大家提抽样方法中的问题,样本的代表性问题-抽样方法数字准确的问题-样本量敏感性问题无回答(包括拒答)满足分级管理需要多目标抽样样本轮换,调查的责任,原始数据是编造的假数据,一个统计人员却不知道或装不知道,在那里加班加点认真分析计算,又得到了一些数据。据此数据进行决策,结果如何?反之,原始数据为真,却发布为假数据。据此数据进行分析和决策,结果又如何?(杯具),调查数据的真实,敢-中国的过去和现在,美国大选例子能理论科学才能做保证理论科学与实际工作之间的联系Theorybasedonpracticeandservesforpractice提高统计能力和统计数据质量,二、对抽样调查的认识,加拿大提出的概念调查就是使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中搜集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。抽样调查Survey普查Census,(一)抽样调查分类,1.非概率抽样随意抽样志愿者抽样判断抽样配额抽样修正的概率抽样,2.概率抽样(统计学中的抽样),简单随机抽样(SRS)系统抽样(SYS)与大小成比例的概率(PPS)抽样整群抽样(CLU)分层抽样(STR)多阶抽样多相抽样,为什么要有不同的组织方式或方法?,资源有限:人财物时间资源消耗:普查概率抽样调查非概率抽样调查,(二)抽样调查的步骤,调查目标的系统陈述;抽样框的选择;抽样方法的确定;问卷设计;数据收集;数据编码和录入;审核与插补;估计;数据分析和调查结果的表述;数据发布;文档。,步骤全吗?,基本全了可以增加吗?公关,宣传编制计算机处理程序,中国的统计调查方案,(一)调查的目的和任务(二)调查对象、调查单位和报告单位(三)调查项目和调查表(四)调查的时间标准和空间标准(五)组织计划,考虑普查和抽样调查的几个重要因素,费用时效总体大小小区域估计属性的多少调查误差特殊要求-破坏性调查,资源限制等其他因素-抽样框更新等,这几个因素重要吗?,在尊重科技的外国?在中国?在中国什么最重要?,普查与抽样调查之间的联系,普查是抽样调查的特例抽样比是100%抽样调查是特殊的普查对样本总体的普查,(三)调查误差,抽样误差-可以根据概率分布计算非抽样误差-主要为三类:抽样框(总体)误差,无回答误差,计量误差。数据处理误差普查和抽样调查的误差-哪个准?对“准”的认识-从测量一张纸的长度说起-点估计和区间估计,实际调查中的误差,误差总是存在的。实际误差是无法计算的,只能通过样本估计。非抽样误差抽样误差哪种误差大?哪种误差可以控制?,调查数据的质量,过程质量控制和管理事后数据评估(分析合理性)这与产品质量控制和管理的原理完全相同!,评价估计量的标准,无偏性一致性有效性,抽样误差,极限误差相对误差r用到标准差,它由方差得到。95%的置信度,z=1.96样本量变异系数:0.025,0.05,0.075,样本代表性的问题,抽样调查不谈这个概念,为什么?因为是根据概率分布抽取的,并根据概率分布进行推断。抽样调查中强调精度,与什么有关?样本量,三、样本量的确定,不是多多益善-美国大选也不是总体越大,样本量也相应越大对较小的总体,抽样无太大优点样本量是科学计算出来的,不是主观确定的!,(一)影响样本量的主要因素,1抽样推断的可靠程度(置信度)2总体标志变异程度(方差)3极限误差或相对误差的大小4抽样方法与组织方式的不同其他-经费,访员,时间,物资,回答率等,精度及其影响因素,1总体的变异程度2总体大小(下表解释)3样本设计和估计量4调查的回答率上面推断的可靠程度,就是置信度,一般人为取95%极限误差或相对误差的大小是人为确定的这里不考虑其他因素,确定样本量后,要根据其他因素的限制,适当调整置信度或控制误差,用简单随机抽样估计比例P,在置信度为95%、误差限为0.05时所需要的样本量(P=0.5),加拿大的结果,四、中国抽样调查中常用的抽样方法,对称等距抽样PPS系统抽样MPPS系统抽样区分等距抽样与系统抽样,五、抽样框的问题,有几种抽样框?名录框地域框-农作物调查概念框多样框,六、抽样调查实际中的问题,敏感性问题无回答(包括拒答)满足分级管理需要多目标抽样样本轮换,敏感性问题,重视问卷设计加强问卷设计的力量加强调查实施的技巧采用科学推断方法对无法得到的数据或准确数据就不要调查,无回答(包括拒答),与敏感性问题有相似性对问卷的要求很高如果问卷设计无偏,则可根据回答率进行调整。否则,美国Motel调查中使用的一种解决方法,可供参考。,调查满足多层次需要的问题,增加管理环节增加样本量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论