统计数据的采集.ppt_第1页
统计数据的采集.ppt_第2页
统计数据的采集.ppt_第3页
统计数据的采集.ppt_第4页
统计数据的采集.ppt_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计数据的采集 本章主要内容 一 统计调查的概念二 统计调查的基本原则三 统计调查的组织形式四 统计调查的方法五 调查方案与问卷设计六 调查误差 这是本章的基本内容 统计工作的过程分为 统计调查 统计整理和统计分析 第一节统计调查的概念和基本原则 统计调查是指根据统计研究的目的 有组织有计划地搜集统计资料的过程 统计资料就是数据和相关的文字资料 统计调查的基本原则 要实事求是 如实反映情况 准确性原则 要及时反映 及时预报 及时性原则 要数字与情况相结合 完整性原则 人有多大胆 地有多大产 统计数据的真实性 1958年9月 天津市新立村人民公社把40亩稻谷移到1 04亩地中 谎报亩产已达到12万斤 并称稻子上可以坐人 让人参观 这是登上稻子垛坐在上面的女社员 其喜笑颜开的表情让人不可思议 叶盘祺摄 第二节统计调查方式 统计调查方式 普查 抽样调查 统计报表 一 普查 census 为特定目的专门组织的非经常性全面调查通常是一次性或周期性的一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄如 人口普查 经济普查 工业普查 第三产业普查 全国耕地普查等等 我国历次人口普查资料普查年份总人口 单位 万人 195359435196469458198210081819901133682000126583 增长的真快 普查真重要 就是支出太高了 时间步骤 2004年12月底前准备 2005年1月至5月填报 2月至8月数据处理和上报 9月至年底数据评估和发布 9月至2006年上半年为资料开发应用 工作总结和评比表彰阶段普查对象经济普查的对象是中华人民共和国境内从事第二 第三产业活动的全部法人单位 产业活动单位和个体经营户 介绍第一次经济普查 二 抽样调查 samplingsurvey 抽样调查 随机抽样调查 概率抽样 非随机抽样调查 重点抽样典型抽样任意抽样配额抽样 简单随机抽样类型抽样等距抽样整群抽样多阶段抽样 注意各种方法的特点 简单随机抽样类型抽样 分层随机抽样 等距抽样整群抽样多阶段抽样 1 随机抽样调查 概率抽样调查 1 简单随机抽样 例 用随机数表法从某企业5000名工人中随机抽取1000人进行问卷调查 首先 编制抽样框 即编制5000名工人名单 并依次编号 其次 选用一个4位数的随机数表作为抽样工具 再次 用随即方法在随机数表上抽取任意列 任意行的4个数字为第一个号码 如0518 则第518号工人成为第一个样本最后 在随机数表上 按照确定规则从上到下 或从左到右 或隔行隔列等 进行抽取号码 直到抽满1000名工人 方法有 直接抽样法 抓阄法 随机数表法 2 类型抽样 分层随机抽样 方法 先将总体各单位按一定标准分成若干类型 层次 然后 根据各类型 或层次 包含的抽样单位数与总体数的比例 确定从各类型中抽取样本单位的数量 最后 按照简单随机抽样方法从各类型 或层次 进行抽取例 要了解某市800个私营企业的生产经营情况 决定采取类型随机抽样方法抽取100个企业作为样本 其做法是 1 将这800个企业按照产业 也可按照行业 规模 利税 分成3个类型 假定第一产业80个 第二产业320个 第三产业400个 2 按各类型企业在总体中比重确定该类企业抽取样本的数量 其中第一 二 三产业分别占10 40 50 则相应分别抽取10个 40个 50个样本 3 采用简单随机抽样方法在各类中抽取 3 等距随机抽样 方法 先编制抽样框 将各抽样单位按照一定标志排列编号 然后用总体单位除以样本单位数求得抽样间隔 并在第一抽样间隔内随机抽取一个号码作为第1个样本 最后 按抽样间隔等距抽样例 采取等距随机抽样方法从某乡3000户农民中抽取150户作为样本调查农民收入情况 方法是 1 将3000户农民按行政村或自然村编号1 3000 2 求得抽样间隔3000 150 20 3 在第一个间隔1 20号内随机抽取一个号码为第一个样本 假定为6 4 按间隔等距抽样 则26 46 66 直到抽出150个样本 4 整群抽样 方法 先将总体各单位安照一定标准分成许多群体 并将每个群体看作一个抽样单位 然后按照随机原则在这些群体中抽出若干个群体作为样本 最后 对样本群体中的每个单位逐个进行调查 例 某中学1200个学生 分为6个年级24个班 如果采取整群随机抽样方法调查该校学生健康状况 其做法是 1 将学生按照班级分为24个群体 每个班为一个抽样单位 2 按照简单随机抽样方法从24个班里抽出6个班作为样本 3 对抽出的6个班逐个体检 5 多阶段抽样 方法 1 先将总体各单位按照一定标志分为若干群体 作为1级单位 2 将1级单位分成若干小群体 作为抽样2级单位 依次类推可分出3 4级单位 3 按照随机原则 先在第1级单位中抽出若干群体作为第1级样本 然后在第一级中抽出第2级样本 依此类推可抽出第3 4级样本 4 对最后抽出的样本单位逐个调查 多阶段抽样例 假定某县20个乡镇 平均每个乡镇10个行政村 每个行政村10个自然村 每个自然村50户 则全县共200个行政村 2000个自然村 10万户 现决定对该县计划生育状况按户做千分之五的抽样调查 共抽取500户 做法如下 1 确定抽样单位 根据该县的4个层次 即乡镇 行政村 自然村 户 应采取4阶段抽样 乡镇为第一级单位 行政村为第2级单位 自然村为第3级单位 户为第4级单位 2 从县抽乡镇从乡镇抽行政村 从行政村抽出自然村 从自然村抽出户 重点抽样 只对总体中为数不多但影响颇大 标志值在总体中所占比重颇大 的重点单位调查典型抽样 挑选若干有代表性的单位进行研究 任意抽样 随意抽取调查单位进行调查 与随机抽样不同不保证每个单位相等的入选机会 配额抽样 对总体作若干分类和样本容量既定情况下 按照配额从总体各部分进行抽取调查单位 见课本23页例 2 非随机抽样调查 三 定期统计报表 1 统计调查方式之一2 过去曾经是我国主要的数据收集方式3 按照国家有关法规的规定 自上而下地统一布置 自下而上地逐级提供基本统计数据4 有各种各样的类型 基本统计报表 专业统计报表 日报 旬报 月报 季报 年报等 电讯报和邮寄报等 直接观察法采访法报告法通讯法实验调查法网上调查法 第三节统计资料的搜集方法 第三节统计资料搜集方法 统计资料搜集方法 采访法 观察 网上调查法 报告法 1 调查者与被调查者通过面对面地交谈而获得资料2 分为标准式访问和非标准式访问 标准式访问通常按事先设计好的问卷进行 非标准式访问事先一般不制作问卷电话调查 1 调查者利用电话与被调查者进行语言交流以获得信息 2 时效快 成本低 3 问题的数量不宜过多 一 采访法 二 通讯法 也称邮寄问卷调查是一种标准化调查调查者与被调查者没有直接的语言交流 信息的传递依赖于问卷通过某种方式将调查表或问卷送至某调查者手中 由被调查者填写 然后将问卷寄回指定收集点问卷或表格的发放方式有邮寄 宣传媒介传送 专门场所分发三种 三 网上调查法 通过互联网进行统计调查 优点 1 组织简便 费用低廉 2 调查时间短 3 可扩大调查时间 缺点 只限于网上用户 保密性和可信度低 实例 四 报告法 被调查者按调查机关同意颁发的调查方案按时向上级汇报相关资料的调查方法 特点 一般针对机关团体和企事业单位 不针对个人有强制性节省人力 物力 财力 五 观察法 1 就调查对象的行动和意识 调查人员边观察边记录以收集所需信息2 调查人员不是强行介入3 能够在被调查者不察觉的情况下获得资料4 花费较多人力 物力 财力 六 实验法 experimentalmethod 1 在设定的特殊实验场所 特殊状态下 对调查对象进行实验以获得所需资料2 有室内实验法和市场实验法 第四节调查方案与问卷设计 一 调查方案的意义1 调查方案 是指关于统计调查完整的工作计划 2 为什么要制定调查方案 二 调查方案的基本内容1 调查目的 为什么作这次调查 2 调查对象 调查单位和报告单位 向谁调查 3 调查项目和调查表 调查什么 4 调查时间和地点 什么时间地点 5 调查的方式 方法 如何调查 6 调查工作的组织实施计划 谁负责 谁出钱 资料归谁 调查方案关系到整个调查是否能成功 要认真设计 注意第2点的区别 牙膏用户市场调查方案设计 为了了解牙膏在市场上的信用情况和销量情况 以及目前市场用户喜欢什么样的牙膏 其他牙膏比中华牙膏优越之处在哪里 调查目的 调查对象 所有牙膏用户 调查单位 每一位牙膏用户 报告单位 调查员 调查项目及调查问卷见附表 调查时间 2005年8月1日 15日 调查地点 各大商场牙膏销售柜台前 调查方式 随机抽样调查 调查方法 采访法 此项调查由牙膏厂市场部组织领导和宣传 由暨南大学学生协助调查 预算经费为30 000元 结果只作为厂家进行生产设计的参考 不公开发表 调查工作的组织实施计划 问卷设计 主题明确词语简明准确不设问而不答的问题注意问项排列顺序注意调查对象的特点请专家参与设计问卷讲究调查技术 调查技术1 自由回答法2 二项选择法3 多项选择法4 赋值选择法5 空位填答法6 等级定位法7 排序顺位法8 比较选择法9 连线配合法 各种调查技术可以灵活搭配使用 牙膏调查问卷 部分 1 你用过中华牌牙膏吗 是 否 二项选择法 2 你认为中华牌牙膏怎么样 很好 好 较好 一般 差 3 你所用过的牙膏有哪些 a洁银 b两面针 c黑妹 d中华 e黑人 f佳洁士 g高露洁 h雕牌 3题多项选择法 4 评分标准很好10分好8分较好6分一般4分差2分请按以上的评分标准给第三题中列出的牙膏质量评定分数 分数填入括号内 赋值选择法 5 你对我厂生产的中华牌牙膏有什么意见 自由回答法 代表性误差 抽样框误差 回答误差 无回答误差 调查员误差 工作误差 调查误差 第五节调查误差 抽样误差 代表性误差 由于抽样的随机性所带来的误差所有样本可能的结果与总体真值之间的平均性差异影响抽样误差的大小的因素样本量的大小总体的变异性 非抽样误差 工作误差 相对抽样误差而言除抽样误差之外的 由于其他原因造成的样本观察结果与总体真值之间的差异存在于所有的调查之中概率抽样 非概率抽样 全面性调查有抽样框误差 回答误差 无回答误差 调查员误差 测量误差 调查误差的控制 抽样误差可计算和控制非抽样误差的控制调查方案设计调查员的挑选调查员的培训督导员的调查专业水平调查过程控制调查结果进行检验 评估现场调查人员进行奖惩的制度调查资料的审核 本章的重点是统计调查的种类 难点是调查单位与报告单位的区别 重点调查与典型调查的区别 思考 1 拟调查一个鱼塘的鱼总数量 1 试用什么方法作调查 不准抽干鱼塘的水 2 试用该方法计算该鱼塘的鱼总数量 2 某家用电器生产厂家想通过市场调查了解以下问题 企业产品的知名度 产品的市场占有率 用户对产品质量的评价及满意度 请你设计出一份调查方案 你认为这项调查采取哪些方法比较合适 设计出一份调查问卷 第三章统计数据的整理与显示 第一节统计整理的意义和程序 一 统计整理的意义二 统计整理的程序 统计整理是承上启下的过程 是统计调查的继续也是统计分析的基础 统计整理 根据统计研究的目的 对调查所得原始材料进行科学分组与汇总和对以往的材料进行再加工 统计整理最后的结果就是形成各种统计表格和统计图 统计整理的意义 是统计调查的继续 是统计分析的基础 统计整理的程序 对搜集到的资料进行全面的审核 确保符合研究目的要求和准确无误选择整理的指标 并进行划类分组将分组资料进行汇总编制统计表和统计图 第二节统计资料的审核 一 审查资料的完整性和及时性完整性 检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全及时性 检查填报单位是否按时报送了有关 二 审查资料的正确性数据是否真实反映客观实际情况内容是否符合实际数据是否有错误计算是否正确等 准确的资料是进行正确统计分析的关键 三 历史资料的审核应审查资料的可靠性程度 指标含义 所属时间 计算方法等 对不能满足现在要求 有缺漏或有疑问的资料 要进行有科学依据的推算 弥补和订正 四 资料审核后的订正对可以肯定的一般错误 代为更正 并通知原报单位 对可疑数据或无法代为更正的错误 要求原单位复查更正如果所发现错误在其他上报单位也可能发生时 应通知其他单位 对严重错误 应发还重填 并查明错误原因 第三节统计分组 一 统计分组的含义二 统计分组的作用三 统计分组的种类四 分组标志的选择五 组数 组距 组限 组中值 一 统计分组的含义 统计分组 指根据社会经济现象的特点和统计研究的任务 按某个标志 或几个标志 把总体分成若干部分的科学分类 没有统计分组就没有科学的统计统计分组的关键 1 选择分组标志 使组间差异大 组内差异小2 划分各组界限 二 统计分组的作用 划分社会经济现象的不同类型揭示社会现象的内部结构分析社会现象之间的依存关系 划分社会不同类型 揭示社会经济现象的内部结构 我国出口商品构成 划分社会现象的依存关系 三 统计分组的种类 按分组的作用或目的不同分为 类型分组 结构分组和分析分组按分组标志多少 分为 简单分组 复合分组和并列分组 按分组标志的性质分为品质分组和数量分组 四 分组标志的选择 1 分组标志 是指将总体划分为性质不同的组的标准或依据 2 分组标志选择的要求 要符合统计研究的目的和要求必须选择最主要的标志作为分组依据要考虑社会经济现象所处的具体历史条件 五 组数 组距 组限 组中值 组数 即将总体分为几组 组数的确定分下面两种情况 一 品质分组的组数由两个因素决定 1 事物本身的属性特征2 统计研究的要求 二 数量分组的组数和组距 1 组数由两个因素决定 总体的全距R组距 classwidth 全距R 最大标志值 最小标志值组距 各组最大标志值 上限 各组最小标志值 下限 在等距分组的条件下 组数等于全距除以组距 2 组数 组距确定的斯特杰斯经验公式 适用条件 1 近似正态分布2 现象特性适合等距分组 组限 指每组两端数值 分为上限和下限 上限 每组的终点数值 最大值 下限 每组的起点数值 最小值 组限的形式 与变量的特点有关 重合式和不重合式 1 重合式 指相邻两组中 前一组的上限和后一组的下限数值重合 一般用于连续型变量 组距 上限 下限例如 身高1 60m 1 70m 1 70 1 80m 1 80 1 90m 所谓重合只是形式上相重 实际上两组没重合 一般采用 含下限不含上限 原则处理 组限 2 不重合式指前一组的上限与后一组的下限 两值紧密相连而不相重复 一般用于离散型变量 组距 下组下限 本组下限 本组上限 前组上限例 人口普查时 按照家庭人口数分组 1 2 3 4 5 6 7和7以上 组中值 组中值 各组上下限的中点值 代表组内各标志值的一般水平 重合式组限时 组距 上限 下限组中值 上限 下限 2 下限 组距 2 上限 组距 2不重合式组限时 组距 下组下限 本组下限 本组上限 前组上限组中值 本组下限 下一组下限 2 本组下限 组距 2 下组下限 组距 2组距式分组中 第一组开口 多少以下 组中值 上限 相邻组组距 2最后一组开口 多少以上 组中值 下限 相邻组组距 2 第四节统计汇总 一 统计汇总 即在统计分组的基础上 将统计资料归并到各组中去 并计算各组和总体的合计数 包括单位总数和标志总量 的工作过程 二 统计汇总的形式 1 逐级汇总2 集中汇总3 汇审汇编4 综合汇总三 统计汇总的技术1 手工汇总2 电子计算机汇总 第五节分布数列 分布数列 也称次数分布或次数分配 指反映总体单位在各组分布状况的一系列数字 分布数列组成要素 1 组的名称2 各组次数 也称频数 或频率 分布数列的分类 按分组标志品质数列变量数列分布钟形分布数列正态分布数偏态分布左偏分布列按次数分布特征右偏分布U形分布数列J形分布数列J形倒J形按分组形式单项式数列组距式数列等距数列异距数列 按分组标志不同分为品质数列和变量数列 1 品质分布数列例 2 变量数列例 按照分组形式不同分为单项式数列和组距式数列 1 单项式数列 各组由一个具体的变量值 单项 来表示的数列 单项式分组一般适用于离散型变量且变量变动范围不大的场合 例 己知某车间有24名工人 他们的日产量 件 分别是 20 23 20 24 23 21 22 25 26 20 21 21 22 22 23 22 22 24 25 21 22 21 24 23 要求根据以上资料编制变量数列 单项分组举例 编制结果如下 2 组距式分组 组距式分组是以变量值变动的一定范围 区间 作为一组 区间的距离就是组距 这样的分组所形成的变量分配数列叫组距式变量数列 简称组距数列 每一组变量值中 其最小值称为下限 最大值称为上限 对于连续型变量或者变动范围较大的离散型变量 适宜采用组距式分组 等距数列不等距数列 按次数分布不同分为钟型分布数列U型分布数列 J型分布数列 钟型分布 特征是 两头小 中间大 即靠近中间的变量值分布的次数多 靠近两端的变量值分布的次数少 其形状宛如一口古钟 U型分布 特征是靠近中间的变量值分布的次数少 靠近两端的变量值分布的次数多 其形状宛如英文字母U 如 人口死亡率 J型分布 特征是次数随着变量值的增大而增多或随变量值的增大而减少 其形状宛如英文大写字母J 简单分布数列的编制 1 品质分布数列的编制 方法 只需将品质标志的表现一一排列出来 然后汇总出每一种标志表现出现的次数即可 如下例 2 变量分布数列的编制 第一步 将原始资料按数值大小依次排列 第二步 确定变量的类型和分组方法 单变量分组或组距分组 第三步 确定组数和组距 当组数确定后 组距可计算得到 组距 全距 组数全距 最大变量值 最小变量值 第四步 确定组限 第一组的下限要小于或等于最小变量值 最后一组的上限要大于最大变量值 第五步 汇总出各组的单位数 注意 离散型变量各组单位数的汇总方法 计算频率 并编制统计表 步骤为 简单次数分布图的编制 1 单项式数列次数分布图以变量为横轴 以次数为纵轴 绘制曲线图 2 组距式数列次数分布图 1 等距数列 2 不等距

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论