统计研究的程序与数据搜集方法PPT课件.pptx_第1页
统计研究的程序与数据搜集方法PPT课件.pptx_第2页
统计研究的程序与数据搜集方法PPT课件.pptx_第3页
统计研究的程序与数据搜集方法PPT课件.pptx_第4页
统计研究的程序与数据搜集方法PPT课件.pptx_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计研究的程序与数据搜集方法 第二讲 2020 3 19 1 大纲 统计研究的程序数据搜集方法原始数据的搜集方法次级数据的搜集方法调查误差 2020 3 19 2 统计研究的程序 统计资料为一个总体还是样本 推断统计 统计调查与数据搜集 数据组织与整理datacleaning 统计列表 图示 描述统计分析 为样本 有关总体的结论 2020 3 19 3 数据搜集方法 数据是统计分析的基础什么是数据搜集 根据统计研究的目的和要求 有组织 有计划地向调查对象搜集原始资料和次级资料数据来源 2020 3 19 4 原始数据的搜集方法 全面调查随机抽样调查非随机抽样调查 2020 3 19 5 全面调查 统计报表制度 定期统计报表制度 严格的报告制度按照国家统一规定的各项要求 自下而上地定期向国家和主管部门报送基本统计资料优点能保证统计资料的全面性和连续性能保证统计资料的统一性和及时性能满足各级部门对统计资料的需要缺点 统计报表过多会增加基层负担有可能由于虚报瞒报而影响统计资料质量 2020 3 19 6 全面调查 普查 普查 指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查由于需要大量的人力 物力和财力 不宜经常进行我国经济普查2004年第一次全国经济普查 将工业普查 第三产业普查和基本单位普查三项专项经济普查合并我国人口普查1953年1964年1982年1990年2000年2010年 2020 3 19 7 讨论 中国GDP数据及其可信性 GDP三种表现形态价值形态 生产法所有常住单位的增加值之和 总产出 中间投入将国民经济各行业的增加值相加收入形态 收入法所有常住和非常住单位的初次分配收入之和 劳动者报酬 生产税净额 固定资产折旧 营业盈余产品形态 支出法最终使用的货物和服务减去进口货物和服务 最终消费支出 资本形成总额 货物和服务净出口 2020 3 19 8 GDP的计算方法 我国在GDP年度核算中同时采用这三种方法进行核算 互相验证统计资料统计局系统的统计资料 如各行业生产 固定资产投资 劳动报酬 价格 住户收支统计资料其他有关部门的统计资料 如交通运输 货物和服务进出口 国际收支统计资料 行政管理资料 包括财政决算 工商管理资料等第三部分是会计决算资料 包括银行 保险 航空运输 铁路运输 邮电通信系统的会计决算资料等统计资料在越来越多的领域采用抽样调查方法和为避免中间层次干扰的超级汇总法 2020 3 19 9 随机抽样调查 抽样调查是一种非全面调查抽样推断的理论基础是概率论根据随机原则推算总体特征 又称概率抽样特点 随机原则选样 样本单位的抽取不受主观及其他系统性因素的影响 每个总体单位被抽中的机会均等能够保证样本对总体的代表性 即样本单位和总体具有相同的概率分布调查目的是从数量上推算总体数量特征和数量表现 它可以到全面调查的作用 2020 3 19 10 随机抽样调查 优点 能用较少的人力 物力和时间达到全面调查的目的调查资料的准确性较高 受人为干扰的可能性较小抽样误差可以事先计算并控制成熟的数学理论支持 抽样理论 抽样设计 2020 3 19 11 随机抽样方式 简单随机抽样每个个体被抽中的机会相等选择一个受试对象对其他元素没有影响使用随机数表 抽签等方式可以应用Excel中的随机函数rand 根据样本框安排随机样本样本框 抽样过程中抽取样本的所有抽样单位的名单从全体学生中 直接抽取200名学生作为样本 那么 全体学生的名单 花名册 就是这次抽样的样本框 2020 3 19 12 认识Excel Excel概况例 在编号为001 100的学生中随机抽取学会查看Excel的帮助文件Rand函数Int函数随机编号的生成 int rand 100 1自学 text函数 据说是Excel中最难的一个函数 2020 3 19 13 随机抽样方式 等距抽样 又称机械抽样或系统抽样常用于电话调查例如 从一个学生人数为200人的总体中抽取容量为20的样本 将学生的学号排序 假定随机选取学号起点4 然后从总体中选取样点的学号为第4 第14 第24 类型抽样 又称分层抽样把总体按照某种分类标准分为若干群组 这些群组满足互斥性 完备性 和相似性要求 然后在组中按照同样的比例随机选取样本特点 代表性高 抽样误差低例如 调查对象按来自东 中 西部三个层次 然后从每个阶层中随机抽取 2020 3 19 14 随机抽样方式 整群抽样 又称聚类抽样先对总体分类 然后用简单随机抽样选类 最后对选中的类作普查或简单随机抽样调查较为有效例如 按照家庭 宿舍楼或街区来抽取调查对象 对抽到的家庭 宿舍楼或街区再作全面或随机调查 2020 3 19 15 非概率抽样 不按照概率均等的原则 而是根据人们的主观经验或其它条件来抽取样本缺点 由于调查者的主观决策影响抽样的整个过程 因而不能保证样本是否重现了总体的分布结构 样本的代表性往往较小 用这样的样本推论总体是极不可靠的 误差有时相当大 而且这种误差又无法估计和控制 2020 3 19 16 非概率抽样 优点 很多情况下 严格的随机抽样几乎无法进行例如调查对象的总体边界不清而无法制作或提供抽样框 有些研究为了符合研究的目的 不得不按照需要从总体中抽取少数有代表性的个体作为样本 随机抽样的操作过程要求严格 实施起来比较麻烦 费时费力 如果调查的目的仅是对问题的初步探索 获得研究的线索和提出假设 而不是由样本推论总体 采用随机抽样就不一定是必须的总之 操作方便 省钱省力 统计上也远较概率抽样简单 而且若能对调查总体和调查对象有较好的了解 抽样也可获得相当的成功 2020 3 19 17 非概率抽样方式 典型调查在对调查对象有一定了解的基础上 有意识地选择个别或少数有代表性的单位进行调查的一种非全面调查典型单位指在数量表现上具有普遍意义和代表性的总体单位 可以用来推断总体的数量重点调查在被调查总体中选出一部分重点单位进行调查 这些单位数目不多 但其标志值在总体标志总量中占有较大比重 能反映总体的基本情况能以较少的投入和较快的速度了解总体基本情况及变动趋势 但只适用于客观存在着重点单位的情况对大型钢铁企业的调查可以了解全国钢铁的生产情况对35个大中型城市的物价调查可以了解全国的物价状况 2020 3 19 18 非概率抽样方式 就近抽样 偶遇抽样 方便抽样 自然抽样 是指研究者根据现实情况 以自己方便的形式抽取偶然遇到的人作为调查对象 或者仅仅选择那些离得最近的 最容易找到的人作为调查对象例 为了调查某市的交通情况 研究者到离他们最近的公共汽车站 对正在那里等车的进行访问在街口拦住过往行人进行调查 在图书馆阅览室对当时正在阅读的读者进行调查 在商店门口 展览大厅 电影院等公众场所向进出往来的顾客 观众进行的调查 利用报刊杂志向读者进行调查 老师以他所教的班级的学生作为调查样本的调查等等 2020 3 19 19 非概率抽样方式 目标式和判断式抽样 主观抽样 立意抽样 调查者根据研究的目标和自己主观的分析 来选择和确定调查对象的方法 研究者依据主观判断选取可以代表总体的个体作为样本样本的代表性取决于研究者对总体的了解程度和判断能力 例如 在编制物价指数时 有关产品项目的选择和样本地区的决定等 常采用判断抽样 2020 3 19 20 非概率抽样方式 滚雪球抽样当无法了解总体情况时 可以从总体中的少数成员入手 对他们进行调查 向他们询问还知道哪些符合条件的人 再去找那些人并询问他们知道的人像滚雪球一样 找到越来越多具有相同性质的成员例如 要研究退休老人的生活 可以到公园去结识几位散步老人 再通过他们结识其朋友但是这种方法偏误也很大会存在什么样的偏误 最适合于特定总体的成员难以寻找的情况无家可归者 流动劳工及非法移民 不良嗜好人群 2020 3 19 21 非概率抽样方式 配额抽样 定额抽样 与分层抽样中的比例抽样相似 也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层 然后在各层中抽样 样本中各层 类 所占比例与他们在总体中所占比例一样研究者要尽可能依据那些有可能影响研究变量的各种因素来对总体分层 并找出具有各种不同特征的成员在总体中所占的比例依据这种划分以及各类成员的比例去选择调查对象 使样本中的成员在上述各种因素 各种特征方面的构成尽量接近总体 2020 3 19 22 配额抽样与分层抽样 分层和配额的计算公式本质上相同分层和配额的标准不同分层指标的选择通常不用个人特征 如年龄 性别等 而是采用 群体 特征 如职业 地区等 配额抽样一般采用年龄 性别等个体特征分组之后的抽样方法不同分层抽样 随机抽样配额抽样 完全由调查员决定 2020 3 19 23 次级资料搜集 统计资料汇编刊物 各种统计年鉴 调查报告 统计摘要 网上电子资源有用的统计信息网站 中华人民共和国国家统计局 中国统计数据 2020 3 19 24 有用的数据库 1 国研网数据库 2020 3 19 25 有用的数据库 2 中经网http 162 105 138 185 90 scorpio aspx main aspx width 1014 height 708特点 以宏观数据为主 包含国家一级 31个省以及200多个市的数据 与国研网的统计数据库类似统计项目没有国研网多但是有些指标年份跨度更大适合统一检索 2020 3 19 26 有用的数据库 3 统计局数据库http 219 235 129 58 indicatorYearQuery do特点 最近几年刚出的 还在完善中可以对统计局出版的年鉴数据进行统一检索4 年鉴 2020 3 19 27 有用的数据库 5 中国咨讯行搜数网以中国的数据为主 也包括部分海外数据搜数网收集数据的类型包括国家综合统计数据 行业统计数据 省市统计数据 省市行业统计数据用户通过全文检索或路径索引的方式 查找目标统计信息 并可以下载EXCEL格式的统计表格时间跨度为1949年至2008年 2020 3 19 28 有用的数据库 CNKI 中国知网 中国统计年鉴数据库 2020 3 19 29 有用的数据库 英文数据库 2020 3 19 30 我最近常用的数据搜索 CNKI 中国知网 中国经济社会发展统计数据库 2020 3 19 31 我最近常用的数据搜索 经济学院资料室 CEIC中国经济数据库历史数据可追朔至1952年国家 省 地级市以及县级数据详细全面的行业数据只能在经院机房查询 下载流量控制为每天2000条 天 2020 3 19 32 我最近常用的数据搜索 人大经济论坛http www pinggu org bbs 会有一些经济学书籍 年鉴 软件的下载计量经济学与统计区计量经济学 统计学 软件 数据等经济学相关问题交流统计软件交流经济领域相关数据交流中心数据挖掘讨论与交流练习 用搜数和知网搜一下玉树近几年的GDP数据 2020 3 19 33 调查误差 登记误差 调查过程中 工作的不准确所造成的误差偶然性登记误差 登记人态度问题 系统误差 测量工具 误差总是偏大或偏小 代表性误差 非全面调查所固有的 2020 3 19 34 特别介绍 ISSS北京大学中国社会科学调查中心 中国家庭动态跟踪调查项目 ChineseFamilyPanelStudies CFPS 跟踪搜集个体 家庭 社区三个层次的数据 反应中国社会 经济 人口 教育和健康变迁设立北京大学CFPS校长研究基金专项资助中国健康与养老追踪调查 ChinaHealthandRetirementLongitudinalStudy CHARLS 收集能够代表年龄在45岁以上 包括45岁 的中国居民的数据 样本规模大约为10 000户 17 000人每两年追踪一次 2020 3 19 35 登记误差 偶然性登记误差调查人员责任心不强 技术不高所造成的观察 测量 计算错误 笔误 错填 遗漏 以及被调查者回答有误 理解有误特点 一般不具有倾向性 即在数量不会偏向某一方 理论上它可以用某种方法加以消除系统误差具有明显的倾向性 在数量上往往偏向某一方 又称偏差有意误差 故意虚报 瞒报 假报 编造 有意歪曲事实非主观原因所引起的误差 测量工具的不准 调查方式安排不当 2020 3 19 36 代表性误差 产生原因抽取样本时没有遵循随机原则个别或部分单位不能完全反映总体的性质样本容量不足由部分单位数值来推断总体数值所产生的误差它不可以消除 但通常可以事先计算 并能将它控制在一定的范围内 2020 3 19 37 调查误差的案例讨论 使用非概率抽样方法进行的调查可能由于访问时的样本偏倚而出现误差案例1 1936年美国大选民调 文摘 的失利与盖洛普公司的胜出案例2 1948年美国大选民调盖洛普公司的与密歇根的调查研究中心的胜出 2020 3 19 38 1936年大选 1936年 罗斯福的第一任总统任期届满 共和党候选人 堪萨斯州州长AlfredLandon与其竞选总统为了预测大选结果 文摘 杂志 LiteraryDigest 发出了1000万张模拟选票 收回237 6万张预测兰登将以57 对43 的压倒性优势获胜但选举的结果却是罗斯福以62 对38 的优势击败兰登民意调查尽管样本容量很大 240万 但是样本选择的偏倚仍导致预测失败 该杂志的可信度大大降低 最终走向了破产 2020 3 19 39 1936年大选 与此同时 乔治 盖洛普在1936年的大选预测中首先使用运用定额抽样方法 即按照总体单位的多个特征将总体分层 安排每个层次的样本数额 利用一个约5万人的样本 准确预测出罗斯福将获胜 2020 3 19 40 LiteracyDigest的问题 调查对象大多数是从电话簿和俱乐部的花名册上选择 样本的代表性受到影响当时只有1 4的家庭拥有电话 而且拥有电话的绝大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论