统计数据的收集和整理.ppt_第1页
统计数据的收集和整理.ppt_第2页
统计数据的收集和整理.ppt_第3页
统计数据的收集和整理.ppt_第4页
统计数据的收集和整理.ppt_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章统计数据的收集和整理 第一节 统计数据的收集第二节 统计分组第三节 次数分布及其显示 学习目的 了解统计工作的两个重要步骤 即数据收集和整理的基本思想和方法 重难点 统计调查的种类 普查 重点调查 典型调查的方法 调查方案和问卷 统计分组方法 分布数列的相关概念和编制方法 统计图的绘制 第一节统计数据的收集 一 数据来源二 统计调查设计三 统计调查种类四 调查方法五 统计调查误差 一 数据来源 从统计数据本身的来源看 统计数据都来源于直接的调查或实验 从使用者的角度看 统计数据主要来源于两种渠道 直接的调查和科学实验 直接数据或一手数据 别人调查或实验的数据 间接数据或二手数据 实验法是在所设定的特殊实验场所 特殊状态下 对研究对象进行实验以获取数据资料的方法 直接调查法包括直接观察法 访问法 问卷法 电脑辅助调查法等 指直接从各调查单位收集的用来反映个体特征的数据资料 统计调查是整个统计认识活动的基础 决定着统计认识过程及其结果的成败 二 统计调查设计 调查方案设计 调查方案的内容 1 调查目的 1 调查要达到的具体目标回答 为什么调查 调查之前必须明确 2 调查对象 调查单位 报告单位 调查对象 调查研究的总体或调查范围调查单位 需要对之进行调查的单位 可以是调查对象的全部单位 全面调查 也可以是调查对象中的一部分单位 非全面调查 回答 向谁调查 第五次全国人口普查办法 第六条规定 人口普查的对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人 第七条规定 人口普查 采用按常住人口登记的原则 每个人必须在常住地进行登记 一个人只能在一个地方登记 人口普查以户为单位进行登记 以家庭成员关系为主的人口 居住一处共同生活的作为一个家庭户 单身居住独自生活的 也作为一个家庭户 相互之间没有家庭成员关系 集体居住在单位内集体宿舍及其他住所 共同生活的人口 作为集体户 集体户以一个居住房间为一户进行普查登记 报告单位是负责向上级报告资料的单位 注意 调查单位与报告单位的区别 调查目的 了解武汉市国有工业企业经营效益状况调查对象 武汉市国有工业企业调查单位 武汉市每一家国有工业企业填报单位 武汉市每一家国有工业企业 调查目的 了解武汉市私家车使用状况调查对象 武汉市私家车调查单位 武汉市每一辆私家车填报单位 武汉市每一个私家车主 3 确定调查项目 拟订调查表 即调查哪些内容 调查项目是调查的具体内容 即要登记哪些标志 它可以是调查单位的数量特征 如一个人的年龄 收入 一个企业的职工人数 产值 可以是调查单位的某种属性特征如一个人的性别 职业 一个企业的经济类型等 调查表是用于登记调查数据的一种表格 调查表一般分为一览表和单一表 把许多调查单位和相应的项目按次序登记在一张表格里 这便于汇总 但缺点是分不开 故调查深度不够 将一个调查单位的项目登记在一张表或一种卡片上 这便于容纳较多的项目 且便于整理 分类 缺点是繁琐 第五次全国人口普查表共有 普查表短表 普查表长表 死亡人口调查表和暂住人口调查表 一 姓名 二 与户主关系 三 性别 四 年龄 五 民族 六 户口登记状况 七 户口性质 八 出生地 九 何时来本乡镇街道居住 十 从何地来本乡镇街道居住 十一 迁出地类型 十二 迁移原因 十三 五年前常住地 十四 是否识字 十五 受教育程度 十六 学业完成情况 十七 是否有工作 十八 工作时间 十九 行业 二十 职业 二十一 未工作者状况 二十二 未工作者主要生活来源 二十三 婚姻状况 二十四 初婚年月 二十五 生育子女数 二十六 1999 11 1 2000 10 31的生育状况 普查表长表 按人填报的项目 普查表长表 按户填报的项目 第一部分 一 户编号 二 户别 三 本户普查登记人数 四 本户户籍人口中外出不满半年人数 五 本户户籍人口中外出半年以上人数 六 暂住本乡 镇 街道 离开户口登记地不满半年人数 七 本户1999 11 1 2000 10 31出生人数 八 本户1999 11 1 2000 10 31死亡人数 第二部分 九 本户住房间数 十 本户住房建筑面积 十一 住房用途 十二 本住房中是否有其他合住户 十三 住房建成时间 十四 建筑层数 十五 住宅外墙墙体材料 十六 住房内有无厨房 十七 主要炊事燃料 十八 是否饮用自来水 十九 住房内有无洗澡设施 二十 住房内有无厕所 二十一 住房来源 H21 二十二 购建住房费用 二十三 月租房费用 4 调查时间和调查工作的期限 1 调查时间 调查资料所属的时间2 工作期限 调查工作的起止时间例如 第六次人口普查规定的标准时间是 2010年11月1日0时 并要求在 2010年11月1日至10日完成普查的登记工作 2010年11月1日0时就是调查时间 2010年11月1日至10日就是调查期限 5 制定调查的组织实施计划 1 调查工作完成的期限和工作进度 2 确定调查的方式与汇总的方法 3 组织领导 4 调查前的其他准备工作 统计调查方案的内容 调查对象和调查单位 调查项目和调查表 调查时间和期限 调查目的 调查工作的组织实施计划 按调查单位的范围大小分为 三 统计调查的种类 按调查时间是否连续分为 按调查的组织方式不同分为 指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查 特点 普查 统计调查的组织方式 作用 局限 由于需要大量的人力 物力和财力 不宜经常进行 普查 普查应注意的问题 统一规定调查资料所属的标准时点 正确选择普查时期 普查范围和期限 普查项目的确定 标准时点 二 统计报表制度 1 概念和特点 统计报表是按国家统一规定的表式 统一的指标项目 统一的报送时间 自下而上定期提供统计资料的一种报告制度 特点 统一性 全面性 可靠性 统计报表制度 优点 局限 按实施范围分为 国家统计报表部门统计报表地方统计报表 2 统计报表的种类 按填报单位分为 基层统计报表综合统计报表 按报送方式分为 电讯统计报表邮寄统计报表 按报送周期长短不同分为 4 统计报表的资料来源 1 原始记录 2 统计台账 表式 报表的具体形式 填表说明填报范围分类目录指标解释 按照随机原则从调查对象中抽取一部分样本单位进行调查 再用样本资料推断把握总体的数量特征的一种非全面调查组织方式 抽样调查 指样本单位的抽取不受主观因素及其他系统性因素的影响 每个总体单位都有均等的被抽中机会 特点 优点 统计调查的组织方式 抽样调查研究SamplingStudy 为什么要抽样 1 涉及破坏受试对象质量控制2 取得精确可靠的结果3 实际情况的约束时间 成本等 抽样调查方法第五章介绍 为了解总体基本情况 在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式 作用 局限 能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料 只适用于客观存在着重点单位的情况不能推断 重点调查 这些单位数目不多 但其标志值在总体标志总量中占有较大比重 能反映总体的基本情况 统计调查的组织方式 重点调查应注意的问题 一般不能由重点单位的调查结果从数量上推断总体 重点单位的确定 3 典型调查 特点 能取得详细的资料 能取得代表性较高的资料 调查方式灵活 先对总体进行分析 然后有意识地选取若干具有典型意义的或具有代表性的单位进行非全面调查 方法 1 解剖麻雀式 的典型调查 直接对个别典型单位进行调查 2 划类选典式 的典型调查 在分类的基础上 选择一部分典型单位调查 作用 了解事物的一般情况和发展规律 补充和验证全面调查的不足 典型调查应注意的问题 典型单位的选择 根据不同的选典方法来反映总体的情况 庭院深深空几许 五 统计调查误差 抽样误差即指随机误差 这是抽样调查固有的误差 是无法避免的 六 次级资料的收集 常用的统计数据来源 中国统计年鉴 中国统计摘要 中国统计信息网 国家统计局网站 常用的统计数据来源 美国经济分析局http www bea doc gov美国人口普查局http www census gov美国劳工统计局http stats bls gov美联储经济数据库http www stls frb org fred美国联邦统计http www fedstats gov世界银行http www worldbank org国际货币基金组织http www imf orgOECDhttp www oecd org 第二节统计分组 一 统计整理的意义和步骤二 统计分组的方法 制定统计整理方案 对原始资料进行审核 数据处理 分组和汇总 制作统计表或统计图 统计整理的步骤 总体经过分组 能够突出组与组之间的差异而抽象掉组内各单位之间的差异 使数据变得条理化 便于进一步分析研究 对个体是 合 对总体是 分 两层含义 统计分组有什么作用 1 划分现象的类型 男人 女人 婴儿 青年 老人 2 揭示现象的内部结构 3 分析现象间的依存关系 身高与体重有关系吗 哇 咦 十五 期间某地区国内生产总值构成 某乡某种农作物的耕作深度与收获率的关系 要根据研究问题的目的和要求来选择 要选择最能反映被研究现象本质特征的标志 要结合现象所处的具体历史条件或经济条件来选择 1 分组标志的选择 统计分组的关键 选择分组标志和划定各组界限 品质标志分组 反映事物属性差异 2 分组的种类 按标志的表现形式不同有 按存款种类分组活期存款定期存款 关键 选择分组标志 数量标志分组 反映事物数量差异 工人按月工资分组 元 1000 20002000 30003000 4000 关键 选择分组标志和划定各组数量界限 工人平均日产量 件 56789 单项式分组 一个变量值对应一组 组距式分组 把整个变量值依次划分为几个区间 一个区间对应一组 按数量标志进行分组 可能有两种情况 对于离散变量 如果变量值的变动幅度小 就可以一个变量值对应一组 如居民家庭按儿童数或人口数分组 均可采用单项式分组 如果变量值的变动幅度很大 变量值的个数很多 则把整个变量值依次划分为几个区间 进行组距式分组 对于连续变量 由于不能一一列举其变量值 只能采用组距式的分组方式 且相邻的组限必须重叠 如以总产值 商品销售额 劳动生产率 工资等为标志进行分组 就只能是相邻组限重叠的组距式分组 按分组标志的多少有 简单分组 按一个标志对总体进行分组 按存款性质分组企业存款储蓄存款财政性存款 再如 人口性别分组 人口年龄分组等 复合分组 按两个或两个以上标志对总体进行分组 存款同时按其性质及期限分组企业存款活期定期储蓄存款活期定期财政性存款活期定期 复合分组的特点 1 总体选择两个或两个以上标志进行重叠分组 可以从几个不同角度了解总体内部的差别和关系 研究问题更全面 更深入 2 复合分组的组数随分组标志的增加而成倍增加 因而在采用复合分组时 选择的分组标志的数量要适量 并且要考虑只有在总体包括的单位数较多时 才宜于采用复合分组 我国工业企业复合分组表 各分组标志并列使用 各分组标志交叉结合使用 平行分组体系 对教师的分类 按性别分类 男性 女性 按职称分类 按年龄分类 高级 中级 初级 青年 中年 共计7组2 3 2 复合分组体系 按性别分类 按职称分类 按年龄分类 男 女 高级 中级 初级 青年 中年 共计12组2 3 2 对教师的分类 第三节次数分布及其显示 一 分布数列的定义及种类二 变量数列的编制三 累计次数与累计频率四 统计图 分布数列包括两个要素 一是总体按某标志所分的组 二是各组所占有的总体单位数 意义 分配数列是统计分组结果的主要表现形式 也是统计分析的一种重要方法 它可以表明总体单位在各组的分布特征 结构状况 并在这个基础上来进一步研究标志的构成 平均水平及其变动规律性 各组的单位数叫次数 频数 记为f 各组的单位数与总体单位总数之比叫频率 记为 组别 变量 次数 频数 频率 分类 品质标志的频数分布 表3 1中国人口受教育程度 练习中国名人榜100强 表3 2中国名人30强职业 运动员演员运动员演员歌手导演演员歌手演员演员 演员演员歌手演员演员运动员运动员导演演员演员 演员组合组合演员歌手歌手演员演员歌手导演 表3 2中国名人30强职业 职业 运动员演员歌手导演组合 合计 划记 频数 415632 30 单项数列 指每个组值只用一个具体的变量值表现的数列 同时具备 变量数列的编制 例 己知某车间有24名工人 他们的日产量 件 分别是 20 23 20 24 23 21 22 25 26 20 21 21 22 22 23 22 22 24 25 21 22 21 24 23 要求根据以上资料编制变量数列 编制结果如下 变量值变动区间的长度相等 变量值变动区间的长度不完全相等 相关概念 组距的上限 下限都齐全的叫闭口组 在闭口组中 组距 上限 下限 编制组距数列时 为了避免出现空组 同时又能使个别极大或极小的数据不至于无组可归 常使用 xx以上 或 xx以下 这种不确定具体组限的组 称为开口组 在开口组中 某地区100个百货商店月销售额与流通费用情况 上限U 下限L 如 组距d U L 100 50 50 万元 如 组中值x U L 2 100 200 2 150 万元 编制等距数列 适用于总体单位的标志值变动比较均匀的情况 实例 己知某地区某年50个商店商品销售额的资料如下 单位 百万元 7 412 629 02 012 47 014 817 515 018 218 715 512 826 017 38 314 712 03 56 825 019 36 44 011 98 513 214 517 115 613 44 59 520 015 76 011 423 014 216 721 016 013 610 013 95 05 810 516 322 0要求编制组距数列 编制步骤 求变异全距 确定组距及组数 R 组距 d 组数 m 编制等距数列 计算组数 组数不宜过多 也不宜太少 上例中 取d 5 则有 编制等距数列 确定组限 计算次数 编制结果 5 5 5 2 2 5 25 25 5 2 27 5 练习 现有10名工人日产量资料 件 45 46 52 56 58 60 62 64 69 70 全距 70 45 25 等距 组数3 组距10 同限 练习 现有10名工人日产量资料 件 45 46 52 56 58 60 62 64 69 70 累计次数 频率 从变量值低的组开始 将各组次数 频率 逐次向变量值高的组累计 说明某一组上限以下各组的累计次数 频率 从变量值高的组开始 将各组次数 频率 逐次向变量值低的组累计 说明某一组下限以上各组的累计次数 频率 例 中国体育代表团在雅典奥运会上获金牌的项目 1 条形图 Barchart 是用宽度相同的条形的高度或长短来表示数据变动的图形 一般用于对单值数列的描述 2 饼形图 Piechart 是用圆形及圆内扇形的面积来表示数之大小的图形 研究结构性问题 3 直方图 histogram 用矩形面积来表示频数分布的图形 一般适用于组距数列 直方图和条形图的区别 条形图 条形的宽度表示类别 是固定的且无实际意义 用长度来反映频数 直方图 条形的宽度表示各组的组距 有实际意义 用长度来表示频数 由于分组数据具有连续性 直方图各矩形连续排列 而条形图分开排列 直方图 条形图 频率直方图 表汽车销售频数分布表 图汽车销售频数分布图 20406080 10066 733 3 4 折线图 Frequencypolygon 在直方图的基础上 把直方图顶部的中点 组中值 用直线联结起来 它与直方图所围面积相等 见课本P39图2 3 曲线图 当变量的取值非常多 变量数列的组数无限增多时 折线便趋于一条平滑的曲线 这是一种概括描述变量数列分布特征的理论曲线 5 茎叶图既能给出数据的分布状况 又能给出每一个原始数据 由 茎 和 叶 两部分组成 树茎 405060708090 树叶 5622368900111123346889901112223334444555577788999990000112222334445566666880022335 某班学生成绩茎叶图 6 象形图 是用形象直观并且与显示内容相似的物体来表示统计指标数值的一种图形 三 次数分布的主要类型 钟型分布 对称型 对称分布 中间变量值分布的次数最多 两侧变量值分布的次数随着与中间变量值距离的增大而渐次减少 并且围绕中心变量值两侧呈对称分布 正态分布 Y Y 右偏型 上偏型 左偏型 下偏型 X X 偏态分布曲线 或称偏态曲线 U型分布 J型分布 J型分配曲线 U型分配曲线 J J 双峰曲线 本章小结 1 统计数据搜集研究的起点 统计数据来源于两个渠道 一是调查 通过调查收集到的是原始数据 而数二是源于已经存在的数据 即二手数据或间接数据 2 统计调查的方法有普查 重点调查 典型调查和抽样调查 分别适用于不同研究目的的需要 3 统计分组是统计整理的关键环节 统计分组的关键是选择格局研究目的选择分组标志 4 次数分布是分组以后 形成的按一定顺序排列总体单位的分布 可以采用统计表或统计图显示 一 名词解释 二 简答题 普查统计分组变量数列 1 统计调查方案的内容有哪些 2 重点调查和典型调查是如何选取调查单位的 3 什么是统计分组 它有哪些作用 练习题 三 判断题 1 全面调查和非全面调查是根据调查结果所得到的资料是否全面来划分的 2 对某市去年下岗职工生活状况进行调查 要求在一个月内报送调查结果 所规定的一个月时间是调查时间 3 采用重点调查搜集资料时 选择的调查单位是标志值较大的单位 4 重点调查与抽样调查的目的是一致的 即都是通过部分单位的调查 来达到对总体数量特征的认识 5 当调查项目较多时 可以选择一览表 6 全面调查包括普查和统计报表 7 统计分组的关键是确定组限和组距 8 统计分组的关键是分组标志的选择和划分分组界限 其核心问题是分组标志的选择 9 要了解现象随时间不断变化的完整过程 宜采用全面调查 10 调查时间是调查工作所需的时间 11 调查方案的首要问题是确定调查对象 12 在进行统计分组时 总体中的任何一个单位有可能同时归属于两个或两个以上的组 四 选择题 1 对一批商品进行质量检验 最适宜采用的方法 A 全面调查B 抽样调查C 典型调查D 重点调查 2 下列调查中 调查单位与填报单位一致的是 A 企业设备调查B 人口普查C 农村耕地调查D 工业企业现状调查 3 抽样调查的主要目的是 A 计算和控制抽样误差B 推断总体总量C 对调查单位作深入研究D 广泛运用数学方法 4 下述各项调查中属于全面调查的是 A 对某种连续生产的产品质量进行检验B 某地区对工业企业设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论