




已阅读5页,还剩122页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章统计数据的搜集整理和显示 主要内容 2 1统计数据的搜集2 2调查数据的整理2 3频数分布2 4数据显示 统计数据搜集的概念 概念 统计数据搜集是根据统计研究预定的目的和任务 运用科学的调查方法与手段 有计划 有组织地向客观实际采集数据的过程 直接向调查对象搜集反映调查单位的统计资料 根据研究目的 搜集已经加工 整理过的 说明总体现象的资料 从统计工作过程的阶段性看 统计数据的搜集处于统计工作过程的基础阶段 原始资料 二手资料 方式 意义 1 统计数据搜集的理论方法 统计调查方案的设计 1 确定调查的目的 为什么调查 why 2 确定调查对象和调查单位 向谁调查 Who 3 确定调查项目 调查什么 what 4 调查表格和问卷的设计 怎么调查 How 5 确定调查时间 什么时候调查 when 6 确定调查的组合实施计划 方案设计用来指导整个调查工作的纲领性文件 是统计设计在统计调查阶段的具体化 具体内容包括 确定调查的目的解决为什么 why 调查 例如 去股票市场调查 确定调查对象 调查单位和填报单位解决向谁 who 调查 由谁来具体提供资料 调查对象 指需要调查的现象总体 该总体是由性质相同的许多调查单位组成的 调查单位 指所要调查的具体单位 它是进进调查登记的标志的承担者 可以是人 企事业单位 物报告单位 填报单位 负责向上报告调查内容 提交统计资料的单位 报告单位一般在行政上 经济上具有一定的独立性 例1 调查福建省乡镇企业经营状况 调查对象 全省所有的乡镇企业 调查单位 每个乡镇企业 填报单位 每个乡镇企业 例2 调查目的是为了掌握全国炼钢设备情况调查对象 全国所有炼钢设备 调查单位 每台炼钢设备 填报单位 具有炼钢设备的每个冶金企业 确定调查项目解决向调查单位调查什么 what 调查项目是指总体要用哪些指标来反映 以及这些指标要怎样落实到总体单位的标志上 调查项目就是调查中所要登记的调查单位的特征 即调查单位所承担的基本标志 它由一系列品质标志和数量标志构成 调查表格和问卷的设计 how 调查表 各调查项目按照一定的顺序排列的表格 调查表主要有两种形式 一览表 把许多调查单位填写在一张表上单一表 每个调查单位填写一份 可容纳较多标志 一般用于调查项目较多的场合问卷 是根据调查目的 在调查对象中随机选择或有意识地确定调查单位 以文字或表格形式了解被调查者的意见被调查者自愿 自由地回答问卷中所提出的问题 确定调查时间 when 调查时间有两种涵义 即调查资料所属时间和调查工作期限 调查时间是指调查资料所属的时间 时点现象 规定标准时刻 时期现象 规定现象的起止时间 调查期限是进行调查工作的时限 包括搜集资料和报送资料的工作所需的时间 应尽可能缩短 统计数据的搜集方法 数据搜集方法 直接观察法报告法 通讯法 强制性我国现行的统计报表制度采用这种方法采访法口头询问法被调查者自填法登记法当事人在事发后进行登记填写实验设计调查法通过科学实验取得资料其它方法 如网络 卫星遥感法 GIS等 任何一种调查都必须采用一定的调查方法去搜集原始资料 即使调查的组织形式相同 其调查方法也可以不同 应根据调查目的与被调查对象的具体特点 选择合适的调查方法 观察记录法 调查者 强制 约束 报告法 访问调查 调查者 被调查者 平等合作 按调查单位的范围大小分为 按调查时间是否连续分为 按调查的组织方式不同分为 概念 指组织搜集数据资源的方式方法 2 统计调查的组织形式 详见图2 1 非全面调查 对调查对象其中的一部分单位进行调查 以取得调查对象的一部分资料 用来推断总体或反映总体的基本情况 全面调查 对调查对象的所有单位一一进行调查 经常性调查是连续性的调查 它随着事物在时间上的发展变化而连续不断地进行登记 一般调查时期现象 如 产值 产量 原料消耗等 一次性调查是不连续登记的调查 它是对事物每隔一段时间后在一定时点上的状态进行登记 一般调查时点现象 如 例如 人口数 固定资产总值 指按照国家统一规定的各项要求 自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度 统计报表制度 统计调查的组织方式 统一的表式 统一的指标项目 统一的报送时间和报送程序 在报表资料的来源建立在各个基层单位的原始记录为基础上 统计报表是逐级上报和汇总的 统计报表属于经常性调查 调查项目相对稳定 有利于积累资料 并进行动态对比分析 特点 统计报表制度 优点 局限 统计调查的组织方式 一种专门组织的 一次性的全面调查 用来调查属于一定时点上或一定时期内的社会经济现象的总量 主要是用以搜集某些不能或不宜用定期报表搜集的统计资料 特点 普查 统计调查的组织方式 组织方式 普查一般用来调查属于一定时点上社会经济现象的总量普查比任何其它调查都更能掌握大量全面的统计资料 专门组织的普查机构派出调查人员 直接登记 利用调查单位的原始记录和资料 发一定的调查表格 由调查单位填报 作用 局限 由于需要大量的人力 物力和财力 不宜经常进行 普查 统计调查的组织方式 为了解总体基本情况 在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式 作用 局限 能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料 只适用于客观存在着重点单位的情况 重点调查 这些单位数目不多 但其标志值在总体标志总量中占有较大比重 能反映总体的基本情况 统计调查的组织方式 例如 为了掌握全国钢铁生产的基本情况 可以选出宝钢 鞍钢 首钢 马钢 武钢等几个大型钢铁企业调查 典型调查 在对调查对象有一定了解的基础上 有意识地选择少数典型单位进行调查的一种非全面调查组织方式 不能确定推断的把握程度 无法计算和控制推断误差 作用 指在数量表现上具有普遍意义和代表性的总体单位 可以用来推断总体的数量 局限 统计调查的组织方式 按照随机原则从调查对象中抽取一部分样本单位进行调查 再用样本资料推断把握总体的数量特征的一种非全面调查组织方式 抽样调查 指样本单位的抽取不受主观因素及其他系统性因素的影响 每个总体单位都有均等的被抽中机会 特点 优点 统计调查的组织方式 为什么要抽样 不可能或不必要进行全面调查的社会现象无限总体的调查 破坏性的产品质量检验 总体单位数过大 没必要全面调查 如城乡居民家计调查 民意测验等 实际情况的约束 如时间 成本等特殊情况 如战备物资调查 矿产调查等对普查资料进行必要的修正 三种非全面调查的主要区别 总体单位 调查单位 统计调查的组织方式 指构成调查对象的每一个总体单位 注意调查单位与填报单位的区别 当调查单位自己负责向上报告时 它同时也是填报单位 当调查单位的资料由它的上级组织收集整理并向上报告时 填报单位与报告单位则不一致 总体单位 调查单位 报表制度 可以全面调查 但通常是调查限定规模以上的总体单位 统计调查的组织方式 总体单位 调查单位 普查 统计调查的组织方式 对全部单位进行调查 总体单位 调查单位 重点调查 只调查重点单位 单位数不多但其标志量占标志总量比重较大的单位 统计调查的组织方式 总体单位 调查单位 典型调查 对典型单位进行调查 典型单位的选择并不一定按规模 统计调查的组织方式 总体单位 调查单位 抽样调查 按随机原则选择调查单位 各单位被选中的机会相同 统计调查的组织方式 关于统计调查误差 调查误差 指收集来的数据资料与真实情况间的差异 调查值 调查误差 真值 研究调查误差的主要目的是找出导致误差产生的原因 进而采取对策避免 减少误差或控制误差水平 调查误差的种类 由于人的主观故意或失误而产生的误差 理论上它可以用某种方法加以消除 由部分单位数值来推断总体数值所产生的误差 它不可以消除 但可以加以控制 随机误差 关于统计调查误差 登记误差 从全部学生中随机抽取20人组成样本并计算平均体重 样本一 52 35样本二 50 26样本三 53 19 真值 51 18 代表性误差 名称 编号 制表单位 填表日期等等 被调查者的基本情况 调查项目等等 备注 指标解释等 调查表的基本结构 我国建立以必要的周期性的普查为基础 经常性的抽样调查为主体 同时辅之以重点调查 科学推算和部分全面报表综合运用的统计调查方法体系 3 统计调查体系 现有统计资料主要是指次级资料 4 统计资料的来源 常用的统计数据来源 中国统计年鉴 中国统计摘要 中国统计信息网 国家统计局网站 常用的统计数据来源 美国经济分析局http www bea doc gov美国人口普查局http www census gov美国劳工统计局http stats bls gov美联储经济数据库http www stls frb org fred美国联邦统计http www fedstats gov世界银行http www worldbank org国际货币基金组织http www imf orgOECDhttp www oecd org 主要内容 2 1统计数据的搜集2 2调查数据的整理2 3频数分布2 4数据显示 统计整理 统计调查 客观现象数量表现 统计总体数量特征 统计研究的程序 统计研究目的 统计设计 推断分析描述分析 汇总性整理 对统计调查所搜集到的各种数据进行分类和汇总 综合性整理 对现成资料的整理 类别 1 数据整理的内容与程序 是统计调查的继续 统计分析的前提和基础 地位 设计整理汇总方案如何进行统计分组确定哪些指标对资料进行汇总 进而计算各项指标描述整理的结果 图表形式 内容 数据整理的内容与程序 资料审核资料分组和汇总编制统计表 汇制统计图统计资料的积累 保管和公布 程序 制定统计整理方案 对原始资料进行审核 数据处理 制作统计表或统计图 统计整理的步骤 根据统计目的和客观现象的内在特点 按某一 或几个 标志把总体划分为若干性质不同但又有联系的组的过程 概念 统计分组的性质 体现了 分 与 合 的统一不同的分组方法 可能得出不同的结论必须对现象的本质进行全面深刻分析 2 统计分组 明确分组对象 分组标志 统计分组的原则 穷尽原则 也称为完备性 例如 对西藏民族学院学生按民族分为 藏族和汉族两组 则可能会漏了一些其他民族的学生 正确应该分为 藏族 汉族 其他三组 互斥原则 例如 某商场把服装分为男装 女装和童装三类 就不符合互斥原则 若先把服装分为成年与儿童两类 然后再分为男女两组 就符合互斥原则 科学原则 统计分组 选择分组标志 确定分组体系 总体单位归类 科学性 组间差异大 组内差异小 穷尽性和互斥性 每个单位均能且只能归到某个组中 统计分组的程序与原则 按分组标志多少分 简单分组 重合分组 统计分组的种类 按分组标志性质不同分 按分组作用与任务不同分 简单分组 重合分组 类型分组 结构分组 分析分组 统计分组的种类 各分组标志并列使用 各分组标志交叉结合使用 平行分组体系 对教师的分类 按性别分类 男性 女性 按职称分类 按年龄分类 高级 中级 初级 青年 中年 共计7组2 3 2 交叉分组体系 按性别分类 按职称分类 按年龄分类 男 女 高级 中级 初级 青年 中年 共计12组2 3 2 对教师的分类 统计分组的作用 划分社会经济现象的类型反映社会经济现象的内部结构和比例关系揭示社会经济现象之间的相互依存关系 统计分组 可以将复杂的社会现象 划分为性质不同的各种类型 通过分组 就可以对不同类型的现象的特征进行比较和研究 从而揭示它的发展变化规律 例如 人口按经济收入 受教育程度划分为不同的阶层 某地人口受教育程度分布 可以分析总体的内部结构 可以将零星分散的统计资料 经过统计分组整理后 发现其特点与规律 例如 以下是某班50位同学统计学考试的成绩资料 6082467377916584697456687673886675809077796152567275856768747578868936787783656882787072859267755566 统计学考试成绩表 及格率为88 优秀率为6 例如 研究吸烟与健康的关系 下表是美国保险公司的统计资料 可以揭示现象之间的依存关系 总体经过分组 能够突出组与组之间的差异而抽象掉组内各单位之间的差异 使数据变得条理化 便于进一步分析研究 统计分组 统计分组的关键问题是正确地选择 分组标志 与划分 各组界限 统计分组的方法 分组标志的选择原则应根据研究的目的与任务选择分组标志要选择能够反映事物本质或主要特征的标志要根据现象的历史条件变化来选择分组标志统计分组方法 统计分组 应根据研究的目的与任务选择分组标志例如 同一个工人总体 有多种不同分组方法 如果研究学历对收入的影响时 应选择 文化程度 作为分组标志 如果研究资历对收入的影响时 则应选择 工龄 作为分组标志 要选择能够反映事物本质或主要特征的标志例如 研究职工生活水平的高低情况时 可以用 职工的工资水平 作为分组标志 也可以用 职工家庭成员平均收入水平 作为分组标志 应该选择后者作为分组标志 要根据现象的历史条件变化来选择分组标志例如 前面讲到研究职工生活水平问题 如果要列出 职工生活贫困户 一组 则 贫困户 的标准就随历史条件变化而变化 而且不同地区标准也不相同 Return 统计分组的方法 按品质标志分组按品质标志分组是用反映事物的属性 性质的标志分组 分组的结果将总体单位划分为若干性质不同的类型例如 职工可以按性别 民族 文化程度 技术等级等标志分组 又如企业按所有制形式 隶属关系 地区 大中小型等标志分组 按数量标志分组 量变导致质变 选用数量标志分组的关键是如何通过数量分组的差异 能够反映出各组的不同性质应根据被研究现象总体的数量特征 彩适当的分组形式 包括确定适宜的组距 组限 统计分组 国家统计局及有关部门 统一制定各种分类目录与规定标准 例如 工业部门分类目录 工业产品目录 大中小型工业划分标准 等 统计分组的方法 必须解决的两个问题组数划分多少为宜各组之间的界限如何确定 统计分组 单值数列 指每个组值只用一个具体的变量值表现的数列 同时具备 单项式分组与组距式分组 例 己知某车间有24名工人 他们的日产量 件 分别是 20 23 20 24 23 21 22 25 26 20 21 21 22 22 23 22 22 24 25 21 22 21 24 23 要求根据以上资料编制变量数列 编制结果如下 某地区家庭儿童数统计表 例 组距数列 指每个组的变量值用一个区间来表现的变量数列一个区间表现为 从 到 距离 把每个区间内的所有变量值归为一组 区别 连续组的上下限是否重叠 间断组距式分组与连续组距式分组 组限不相连 如年龄 组限相连 如定额完成程度 间断组距 连续数列 等距分组与异距分组 变量值变动区间的长度相等 变量值变动区间的长度不完全相等 某班同学统计学考试成绩表 例 相关概念 指每组两端表示各组界限的变量值 各组的最小值为下限 最大值为上限 组限 每组变量值变动区间的长度 为上下限之差 即 组距 本组上限 本组下限 组距 每组变量取值范围的中点数值 组中值 组距式分组步骤 1 确定数据的全距 R R xmax xmin 即最大变量值与最小变量值之差 2 确定组距 组限和组数 具体计算在后面讲解 1 组限分为上限和下限 上限是各组的最大变量值 下限是各组的最小变量值 2 各组上限与下限之差称为该组的组距 3 所谓组数是指某个变量数列划分为多少个组 说明 组数的多少与组距的大小成反比关系 组距越大 则可分的组就越少 组距式分组步骤 4 间断组距式分组与连续组距式分组凡是组限不相连的 称为间断组距式分组 例如儿童按年龄分组 未満1岁 1 2岁 3 4岁 5 9岁 10 14岁 凡是组限相连 或称相重叠的 即以同一数值作为相邻两组的共同界限 称为连续组距式分组 例如学生按考试成绩分组分为 60以下 60 70 70 80 80 90 90以上等组 统计上规定 如果总体某一个单位的变量值是相邻两组的界限值 则这一个单位归入作为下限值的那一组内 即所谓的 上限不在内 原则 例如 70分不归入60 70分组 而归入70 80分组 组距式分组步骤 3 组距 组数 组限与组中值的确定组距连续组距式分分组 组距 上限 下限间断式分组 组距 本组上限 前组上限或组距 本组上限 本组下限 1例如 3 4岁 5 9岁 则5 9岁组的组距5 9 4 组数 与组距大小成反比以下是美国学者斯特杰斯 H Sturges 经验公式 n 1 3 322logN n 组数 N 总体单位数 d R n xmax xmin n n为组数 d为组距 R为全距 分组组数参考表 上述数据仅供参考 不能生搬硬套 实际分组时要依所研究资料的性质而定 根据上述公式 可以得出如下的组数参考标准 组距式分组步骤 3 组距 组数 组限与组中值的确定组中值 上下限之间的中点数连续式分组 组中值 本组上限 本组下限 2间断组距式分组 组中值 本组上限 前组上限 2开口组的组距和组中值开口组的组距是以相邻组的组距为本组的组距 XX以上 组的组中值 下限 邻组组距 2 XX以下 组的组中值 上限 邻组组距 2 编制等距数列 适用于总体单位的标志值变动比较均匀的情况 实例 己知某地区某年50个商店商品销售额的资料如下 单位 百万元 7 412 629 02 012 47 014 817 515 018 218 715 512 826 017 38 314 712 03 56 825 019 36 44 011 98 513 214 517 115 613 44 59 520 015 76 011 423 014 216 721 016 013 610 013 95 05 810 516 322 0要求编制组距数列 编制步骤 求变异全距 确定组距及组数 确定组距的原则 要能区分各组的性质差异要能反映总体资料的分布特征为方便计算 尽可能为5或10的整数倍 R 组距 d 组数 m 编制等距数列 计算组数 组数不宜过多 也不宜太少 上例中 取d 5 则有 编制等距数列 确定组限 对于离散变量 相邻组组限可以间断 也可重叠 对于连续变量 相邻组组限必须重叠 符合 上组限不计入 原则 首末两组可使用 以下 及 以上 的开口组 组限的表示方法 编制等距数列 计算次数 编制等距数列 编制结果 5 5 5 2 2 5 25 25 5 2 27 5 茎叶表示Stem and LeafDisplay 将每一观测值分解为茎值和叶值 用直线隔开 垂直线左边的数字称为 茎 确定组别垂直线右边的数字 叶 确定频数 计数 Xi 开口组的组距与组中值的计算 首组假定下限 首组上限 相邻组组距末组假定上限 末组下限 相邻组组距 先计算开口组的假定上 下限 因此有 开口组的组距以相邻的组距为本组组距 标志值分布很不均匀的场合 例如 学生成绩如果密集于60 80分之间 而其它分数段人数稀少 则为了减少信息损失 可以60 80分之间组距取5分 其它取组距10 比如 50以下 50 60 60 65 65 70 70 75 75 80 80 90 90以上 标志值相等的量具有不同意义的场合 标志值按一定比例发展变化的场合 异距分组的应用场合 主要内容 2 1统计数据的搜集2 2调查数据的整理2 3频数分布2 4数据显示 分类 频数分布的基本概念 频率 频率 即各组频数 单位数 与总体单位总和之比 反映了各组频数的大小对总体所起的作用的相对强度 fi表示第组的频数 频率的性质 任何频率都是界于0 1之间的一个分数 即 各组频率之和等于1 即 变量数列的编制 频率密度 频率 组距 解决异距分组中 由于各组次数的多少受到组距不同的影响问题而提出的指标计算公式 频数密度与频率密度 频数密度 频数 组距 各组频率密度与各组组距的乘积之和等于1 各组频数密度与各组组距的乘积之和等于总体单位数 累计次数 频率 从变量值低的组开始 将各组次数 频率 逐次向变量值高的组累计 说明某一组上限以下各组的累计次数 频率 从变量值高的组开始 将各组次数 频率 逐次向变量值低的组累计 说明某一组下限以上各组的累计次数 频率 累计频数与累计频率 频数表 用SPSS制作 有效数据 频数 频率 有效频率 累计频率 约2 3的人身高不超过165cm 次数 频数 分布的主要类型 钟形分布 正态分布偏态分布 正态分布 左偏分布 右偏分布 次数 频数 分布的主要类型 U形分布 U型分布 正J形分布 反J型分布 J形分布 主要内容 2 1统计数据的搜集2 2调查数据的整理2 3频数分布2 4数据显示 2 4数据显示 统计表统计图 统计表 统计表的定义和结构 统计表是以纵横交叉的线条所绘制的表格 用来表现统计资料的一种形式 广义 任何用以反映统计资料的表格 或统计工作过程中的一切表格 狭义 统计资料经过整理 汇总按一定的规则排列在表格上 这种表格称为统计表 统计表是什么 统计表 统计表的定义和结构 从表的形式上看 统计表是以纵横交叉的线条所绘制的表格 表格包括 总标题 横行标题 纵栏标题 指标数值 从表的内容上看 统计表的组成 主词栏和宾词栏 主词栏是统计表所要说明的总体及其组成部分 宾词栏是统计表用来说明总体数量特征的各个统计指标 其它还包括补充资料 注解 资料来源 填表单位 填表人等 统计表的结构 统计表的常用结构 总标题 统计表的分类 对主体进行分组 选择指标及对指标进行分组 统计表 统计表的分类 按主词的结构分类 简单表 简单罗列 可按时间顺序 地区或统计指标分组表主词按一个标志分组形成的统计表复合表主词按两个及以上标志进行分组的统计表 厦门市降雨量情况 1991年 简单表 我国直辖市人口数 1990年7月1日0时 简单表 乡村劳动力情况表 19 年 单位 人 分组表 2000年平均每天创造GDP 复合表 统计表 统计表的分类 按宾词的设计分类宾词简单排列宾词不进行任何分组宾词分组平行排列宾词分开 平行排列宾词分组层叠排列统计指标同时有层次地按两个或两个以上标志分组 各种分组层叠在一起 宾词的栏数等于各种分组的组数连乘积 对宾词栏的简单分组 对宾词栏的交叉分组 统计表的设计 线条的绘制 表的上下端应以粗线绘制 表内纵横线以细线绘制 表格的左右两端一般不划线 采用 开口式 合计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 暗物质分布模拟-第1篇-洞察及研究
- 非线性光学材料设计-洞察及研究
- 讲解护理学基础
- 关于世界护理状况报告
- (2025年标准)水产股东协议书
- 作文指导策略这真是让我着迷范文分析
- 2025年新龚女士签字协议书
- (2025年标准)中医项目协议书
- 跨国法律冲突预防机制-洞察及研究
- 黄酒现代制剂开发-洞察及研究
- 中成药合理使用培训课件
- 建筑材料绿色采购实施方案
- 学堂在线 劳动教育 章节测试答案
- 2025-2031年中国AI成人娃娃行业市场发展规模及投资机会研判报告
- 2025至2030中国个人定位信标(PLB)行业产业运行态势及投资规划深度研究报告
- 2025年振兴中学分班考试题及答案
- 肿瘤防治宣传科课件
- 2025年军队文职人员招聘考试(公共科目)测试题及答案一
- 纪检监督检查培训课件
- 酒店公章使用管理办法
- 大兴安岭黄岗锡铁钨多金属矿床的成矿过程研究
评论
0/150
提交评论