数据的收集与整理.ppt_第1页
数据的收集与整理.ppt_第2页
数据的收集与整理.ppt_第3页
数据的收集与整理.ppt_第4页
数据的收集与整理.ppt_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计工作的三个中心阶段 统计调查 统计整理 统计分析 有组织 有计划地搜集资料 要求 准确 完整 及时 对调查资料去伪存真 去粗取精 科学分类 浓缩简化 描述性分析推断分析 决策分析 要求 定性定量结合 数据来源DataSources 数据 来源 直接来源 间接来源 试验 出版物 或者网上 问卷调查 观察 1数据的收集 主要包含如下三方面的内容 统计调查方案的设计统计调查方法统计调查的组织形式 1 1数据的来源原始数据和次级数据 1 2统计调查统计调查是统计资料收集的主要形式 是统计工作过程的第一阶段 重要性 统计调查是整个统计认识活动的基础 决定着统计认识过程及其结果的成败 常用的统计数据来源 美国经济分析局www bea doc gov美国人口普查局www census gov美联储经济数据库www stls frb org fred中国国家统计局上海市统计局www stats 世界银行www worldbank org国际货币基金组织www imf orgOECDwww oecd org 返回 统计调查方案的设计 组织调查之前统计调查方案的设计内容 1 明确调查目的 为什么调查 2 确定调查对象和调查单位 调查谁 3 确定调查项目 调查什么 4 调查表与问卷设计5 确定调查时间和调查期限6 制定调查的组织实施计划 统计调查方案 用来指导整个调查工作的纲领性文件 是统计设计在统计调查阶段的具体化 返回 统计调查方法 现场观察法 报告法 访谈法 被调查者受调查者的强制与约束 调查者与被调查者平等合作 问卷法 实验采集法 现场观察法 调查者 强制 约束 报告法 访问调查 调查者 被调查者 平等合作 返回 主要指非政府性统计机构或个人所从事的对人的主观意见的调查工作 也称作民意调查或民意测验 调查问卷的基本格式 说明词 解释调查意义 表达感激之情等 主题问句 被调查者基本情况 调查项目 作业记录 时间 操作者等 问卷调查 容易控制 但不易全面 调查问卷的问题类型 容易造成人际关系紧张 不易控制 但内容丰富 您认为吸烟有哪些害处 危害自身健康 影响他人健康 浪费钱财 容易引起火灾 破坏家庭团结 其他 问卷设计的基本要求 问题的提出要紧扣主题 问句和标准答案要易于理解和回答 先易后难 先封闭后开放 先基本问题后派生问题 以不超过20分钟为宜 问卷设计QuestionnaireDesign 问卷的长度 QuestionnaireLength 尽可能简短 只保留调查所必须的关键问题调查方式 ModeofResponse 面谈回答率较高 费用较高电话访问居中信函调查回答率较低 费用较低问题设计 FormulatingQuestions 语言简明易懂 避免含糊其词考虑完备而避免重复 您是否吸烟 如果选 则跳过2 3题 吸烟 不吸 您每天大约吸多少支烟 5支以下 5 10支 10 15支 15 20 20 25支 25支以上 您的吸烟历史大约有多长 1年以下 1 5年 5 10年 10年以上 您是否认为吸烟有害健康 请写出理由 调查单位中吸烟人所占比例 吸烟人群日吸烟数量情况 吸烟人群吸烟历史情况 调查对象对吸烟的看法 返回 按调查单位的范围大小分为 按调查时间是否连续分为 按调查的组织方式不同分为 统计调查的种类 统计调查的组织形式 由政府部门组织 采用统一的表格 自上而下布置 自下而上报告 任务 搜集国民经济和社会发展基本情况的资料 为制订国民经济和社会发展计划和检查计划执行情况服务 优点 概念 统计报表制度 statisticalreportforms 能保证统计资料的全面性和统一性能保证统计资料的连续性和及时性能满足各级部门对统计资料的需要 缺点 普查 census 特点 工作量大 时间性强 需要大量人力和财力 特别领域 专门组织 一次性 全面性 任务 搜集重要的国情国力和资源状况的全面资料 为政府制定规划 方针政策提供依据 概念 指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查建立专门机构 配备专门人员调查 利用基层单位原始记录和核算资料发表调查 原则 规定统一的标准时点 规定统一的普查期限 规定调查的项目和指标 重点调查 keypointsurvey 概念 在总体中选择个别或部分重点单位进行调查 任务 及时了解总体基本情况 为主管部门指导工作服务 方式 一次性调查 专门设计和备配人员现场调查 重点单位指在总体中有举足轻重地位的单位 其标志值在总体标志总量中占有绝大比重 经常性调查 同报表制度结合 用统计报表调查 能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料 只适用于客观存在重点单位的情况 特点 典型调查 modelsurvey 概念 在全面分析的基础上 有意识地选择代表性的典型单位进行现场调查 任务 为研究某种特殊的社会经济问题 搜集详细的第一手资料 借以认识事物的本质特征 因果关系 变化趋势 为理论和政策性问题研究提供依据 作用 适宜于研究处于萌芽状态事物和倾向性问题 一定条件下能估计总体指标数值 可以补充全面调查的不足 方法 解剖麻雀 划类选典 抽样调查 samplingsurvey 特点 1 随机抽样 按照随机原则从总体种选择样本 2以样本指标 统计量 为依据 推断总体参数或进行假设检验 3抽样误差可以事先计算并加以控制 作用 在自然科学和社会科学中具有广泛应用不可能全面调查的 无限总体 破坏性实验 不必要全面调查的 经济性 抽样调查的组织方式 1简单随机抽样 2分层抽样 3系统抽样 4整群抽样 总体单位 调查单位 统计调查的组织方式 总体单位 调查单位 报表制度 可以全面调查 但通常是调查限定规模以上的总体单位 统计调查的组织方式 总体单位 调查单位 普查 统计调查的组织方式 对全部单位进行调查 总体单位 调查单位 重点调查 只调查重点单位 单位数不多但其标志量占标志总量比重较大的单位 统计调查的组织方式 总体单位 调查单位 典型调查 对典型单位进行调查 典型单位的选择并不一定按规模 统计调查的组织方式 总体单位 调查单位 抽样调查 按随机原则选择调查单位 各单位被选中的机会相同 统计调查的组织方式 我国统计调查方法体系改革的目标模式是 建立以周期性普查为基础 以经常性的抽样调查为主体 以必要的统计报表 重点调查和科学的推断为辅助手段的调查方法体系模式 2数据的整理 数据整理的内容数据的审定 数据的分组 统计资料汇总 编制统计表 统计图 审核原始资料 数据审定的目的 保证资料的准确性 尽可能地缩小调查误差 数据的审定 登记误差 代表性误差 登记误差 由于调查过程中各有关环节失误造成的代表性误差 由于非全面调查的部分单位不能反映总体的性质造成的 统计分组的作用 总体经过分组 能够突出组与组之间的差异而抽象掉组内各单位之间的差异 使数据变得条理化 便于进一步分析研究 划分社会经济现象的类型反映社会经济现象的内部结构和比例关系揭示社会经济现象之间的相互依存关系 数据分组 统计分组的作用 作用1 划分现象的类型社会经济现象中存在复杂多样的类型 不同类型的现象具有不同的特点和发展规律 作用2 揭示现象内部结构对现象分组后的数据可以反映现象内部结构的特点 结合时间的推移进行分析 可以认识现象发展变化的规律性 统计分组的作用 例 上海市按GDP计算的三次产业结构 1980年1990年1996年1997年GDP100100100100第一产业3 24 32 52 3第二产业75 763 854 552 2第三产业21 131 943 045 5 2005年1000 948 650 5 统计分组的作用 作用3 分析现象之间的依存关系社会经济现象之间存在着广泛的相互联系和制约关系 其中比较广泛和紧密的一种联系就是现象之间的依存关系 研究现象之间依存关系的方法很多 如相关与回归分析法 指数因素分析法 分组分析法等 其中统计分组分析法是最基本的方法 是其他分析方法的基础 例 中国农民家庭按收入分组的恩格尔系数 1984年 按收入分组 元 200 300 400 500 600 800 1000恩格尔系数 64 960 256 754 450 549 943 6 选择分组标志 确定分组体系 总体单位归类 科学性 组间差异大 组内差异小 完备性和互斥性 每个单位均能且只能归到某个组中 统计分组的程序与原则 统计分组的种类 根据分组标志的个数分类 简单分组 仅按照一个标志进行分组复合分组 按照两个或两个以上的标志进行层叠分组分组体系 一系列相互联系相互补充的标志进行多种分组根据分组标志的性质分类 品质标志分组 如上市公司的行业分类 学生的成绩评定数量标志分组 分类 3次数分布 同时具备 变量数列的编制 例 己知某车间有24名工人 他们的日产量 件 分别是 20 23 20 24 23 21 22 25 26 20 21 21 22 22 23 22 22 24 25 21 22 21 24 23 要求根据以上资料编制变量数列 编制结果如下 变量数列的编制 变量值变动区间的长度相等 变量值变动区间的长度不完全相等 相关概念 某地区100个百货商店月销售额与流通费用情况 上组限U 下组限L 如 组距d U L 100 50 50 万元 如 组中值x U L 2 100 200 2 150 万元 编制等距数列 适用于总体单位的标志值变动比较均匀的情况 编制步骤 编制等距数列 变量数列中的组距数列编制比较复杂 下面主要研究它 1 组数的确定经验法则 一般分为5 7组 组数尽可能取奇数 避免偶数Sturges rule 分组组数 2 组距的确定R Xmax Xmini R m 小数进一 3 组限和组中值的确定 确定组限的原则 上组限不在内 原则 计算组中值的作用 编制等距数列 例 江浦县苗圃对110株树苗的高度进行测量 单位 厘米 数据如下 编制次数分布表 1541331161288510010515011897110131119103931081001111301041351131221151039010811412787127108112100117121105136123108899413982113110109118115126106108115133114119104147134117119911371011071121211251038911012212312412511511312885113143801021329612983142112120107108111100971111311091459313598142127106110101116110123 第一步 先将110个数据排序 找出最大值154和最小值80 这个数列的全距R 154 80 74厘米 第二步 根据斯透奇斯规则确定组数 m 1 3 322 lg110 7 78 再根据组数与组距的关系确定组距 i R m 74 7 78 9 51 厘米 根据以上的计算结果 组数定为8组 组距定为10厘米 第三步 根据所定组数和组距确定组限 第一组下组限定为80 第一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论