统计学统计整理课件_第1页
统计学统计整理课件_第2页
统计学统计整理课件_第3页
统计学统计整理课件_第4页
统计学统计整理课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 统 计 整 理 第 三 章Excel1 统 计 整 理 第 三 章Excel1、了解统计整理的涵义及内容; 2、认识统计分组的重要性,掌握统计分组的基本要求与类型; 3、掌握分配数列的涵义及构成要素,掌握编制分配数列的基本方法及相关指标; 4、了解统计图表的主要形式。内容与要求1、了解统计整理的涵义及内容; 内容与要求资料的积累和保管审核原始资料对数据的分组 绘制 统计 图表检查统计误差整理的中心 显示数据的基本特征 深入分析的基础第一节 统计整理的意义根据统计任务,对原始资料加工汇总,使其系统化、条理化、科学化,得出反映总体综合特征资料的工作过程。统计 整理对数据汇总及加工整理的关键资料

2、的积累和保管审核原始资料对数据的分组 绘制 检查统计误差统 计 调 查 误 差登记性 误 差代表性 误 差偶然登记误差系统登记误差偶然代表性误差系统代表性误差检查对象:登记性误差检查方法:逻辑检查、计算检查误差种类统 登记性 代表性 偶然登记误差系统登记误差偶然代表性误差系调查误差指收集来的数据资料与真实情况间的差异调查值真值调查误差研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。误差调查误差指收集来的数据资料与真实情况间的差异调查值真值调查误根据统计研究目的和要求,将总体全部单位按一定的标志 划分成若干个类型组的一种统计方法目的:组内同质性、 组间差

3、异性(一)统计分组的作用 划分社会经济现象的类型 揭示现象总体内部的构成情况 分析现象间的相互依存关系第二节 统计分组根据统计研究目的和要求,将总体全部单位按一定的标志 划分成若统计分组有什么作用?A.划分现象的类型好人坏人男人女人婴儿青年老人统计分组有什么作用?A.划分现象的类型好人坏人男人女婴儿青老揭示现象的内部结构中国人口规模与结构变化图揭示现象的内部结构中国人口规模分析现象间的依存关系身高与体重有关系吗?哇!咦!分析现象间的依存关系身高与体重有关系吗?哇!咦!2、选择分组标志 1、原则 :(二)统计分组的方法:穷尽性、互斥性 根据研究问题的目的来选择 选择最能反映被研究现象本质特征的标

4、志 结合现象的历史或经济条件选择 3、统计分组的种类品质分组变量分组第一:各组数量界限的确定应能反映质的差别; 第二:采用适当的分组形式分组方法2、选择分组标志 1、原则 :(二)统计分组的方法:穷尽性、 开口组单项式分组组距式分组等距分组异距分组闭口组家庭按人 口数分组 1 2 3 4 5 6中学生按身高分组(cm) 150155 155160 160165 165 170 170175 175180人口按年龄分组(岁) 1岁以下 17岁 717岁 1755岁 55岁以上个人书报月购买金额分组(元) 50元以下 50100 100150 150200 200元以上 适用: 1、现象分布存在明

5、显偏斜; 2、现象标志变异范围较大适用:标志变异较均匀的现象分配数列 开口组单项式分组组距式分组等距分组异距分组闭口组家庭按人 分组体系同时使用两个及以上标志分组时,分组标志的组合形式。平行分组体系对教师的分类按性别分类男性女性按职称分类按年龄分类高级中级初级青年中年分组体系分组体系同时使用两个及以上标志分组时,分组标志的组合形式。平中级按性别分类男性女性按职称分类按年龄分类高级中级初级青年组中年组高级初级男性女性男性女性男性女性男性女性男性女性复合分组体系中级按性别分类男性女性按职称分类按年龄分类高级中级初级青年组分布 数列 某地区从业劳动者产业分组统计 产 业从业人数(万人)人数比重()第

6、一产业42846.47第二产业36439.52第三产业12914.01合计9211001、构成要素:统计分组基础上,将总体所有单位按组归类,形成总体中各个单位在各组间的分布。总体的各个组频数频率第三节 分配数列分布 数列 某地区从业劳动者产业分组统计 产 业单项数列是把每个变量值作为一组所生成的数列。例如,某生产组20名工人同种产品日产量如下(单位:件): 16 13 18 15 19 14 17 13 15 17 19 15 17 18 14 16 15 16 17 16 1.单项式变量分布数列的编制方法(1)按变量值大小顺序排列:变量数列的编制13 13 14 14 15 15 15 15

7、 16 1616 16 17 17 17 17 18 18 19 19(2)每种变量值为一组(重复者只取一个)顺序排列:13 14 15 16 17 18 19 七组 (3)列入表中并汇总计算各组频数,如下表所示。单项数列是把每个变量值作为一组所生成的数列。例如,某生产组2表 20名工人日产量资料(单项式)日产量(件)工人数(人)(频数)频 率xff/f1322/201422/201544/201644/201744/201822/201922/20合计201表 20名工人日产量资料(单项式)日产量(件)工人数(人将上表绘制成变量分布图将上表绘制成变量分布图组距数列指每个组的变量值用一个区间来

8、表现的变量数列变量数列的编制变量是连续变量;或:总体单位数较多,变量不同取值个数也较多的离散变量。 编制条件:变量值变动区间的长度相等变量值变动区间的长度不完全相等等距数列异距数列组距数列指每个组的变量值用一个区间来表现的变量数列变量数列的相关概念指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限组限每组变量值变动区间的长度,为上下限之差组距每组变量取值范围的中点数值 组中值组中值=相关概念指每组两端表示各组界限的变量值,各组的最小值为下限,开口式组距数列组中值的计算: 首组假定下限首组上限相邻组组距 末组假定上限末组下限相邻组组距先计算开口组的假定上、下限: 因此有:首组组中值

9、末组组中值开口式组距数列组中值的计算: 首组假定下限首组上限相邻组某地区100个百货商店月销售额与流通费用情况销售额(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50100100200200300300以上102030251514.211.410.19.28.5上组限U下组限L如:组距d=U-L=100-50=50(万元)如:组中值x=(U+L)/2 =(100+200)/2=150(万元)某地区100个百货商店销售额(万元)商店数(个)每百元商品销编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知某班40个同学统计学考试成绩分别如下: 89 88 76 99 74

10、 60 82 60 89 86 93 99 94 82 77 79 97 78 95 92 87 84 79 65 98 67 59 72 84 85 56 81 77 73 65 66 83 63 79 70要求编制组距数列。编制等距数列适用于总体单位的标志值变动比较均匀的情况实例己知编制步骤:求变异全距确定组距及组数确定组距的原则:要能区分各组的性质差异要能反映总体资料的分布特征为方便计算,尽可能为5或10的整数倍R组距(d) 组数(m)编制等距数列编制步骤:求变异全距确定组距及组数确定组距的原则:要能区确定组限对于离散变量,相邻组组限可以间断,也可重叠;对于连续变量,相邻组组限必须重叠;

11、符合“上组限不计入”原则;首末两组可使用“以下”及“以上”的开口组。组限的表示方法编制等距数列确定组限对于离散变量,相邻组组限可以间断,也可重叠;组限的计算次数编制等距数列编制结果: 分数组中值人数比重60以下60-7070-8080-9090以上556575859527111285.017.527.530.020.0合计40100.060-10/2=5590+10/2=95计算次数编制等距数列编制结果: 分数组中值人数比重60以下频率各组单位数占总体单位总数的比重累计次数(频率) 从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。向上累计

12、向下累计 从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。频率各组单位数占总体单位总数的比重累计次数(频率) 考分人数频率()累计次数累计频率()60以下60707080809090以上27111285.017.527.530.020.0合计40100 考分人数频率()累计次数累计频率()60以下25.0合考分人数频率()累计次数累计频率()向上累计向上累计60以下60707080809090以上27111285.017.527.530.020.0292032405.022.55080100合计40100考分人数频率()累计次数累计频率(

13、)向上累计向上累计60 考分人数频率()累计次数累计频率()向上累计向下累计向上累计向下累计60以下60707080809090以上27111285.017.527.530.320.0292032404038312085.022.550.080.010010095.077.550.020.0合计40100 考分人数频率()累计次数累计频率()向上累计向下累计向(三)、次数分布的主要类型1、钟型分布(1)对称的钟型分布日产量(件)(三)、次数分布的主要类型1、钟型分布(1)对称的钟型分(2)左偏分布日产量(件)(2)左偏分布日产量(件)(3)右偏分布日产量(件)(3)右偏分布日产量(件)2、型分

14、布2、型分布3、J型分布(1) 价格3、J型分布(1) 型分布()价格型分布()价格第五节 统计图表一、统计图二、统计表第五节 统计图表一、统计图统计图以点、线条、面积等方法描述、显示统计数据的形式具有直观、醒目、易于理解等特点组成:坐标系图形图例单式图复合图叠加图一个图只用来显示一种现象的数量特征用一个图同时显示几种数量的分布或变化情况统计图以点、线条、面积等方法描述、显示统计数据的形式具有直观某商店某日销售的饮料情况品牌名称频数累积 %旭日升冰茶1122.00露露940.00可口可乐1570.00百事可乐988.00其它6100.00合计50100.00某商店某日销售的饮料情况品牌名称频数

15、累积 %旭日升冰茶112柱状图(用于显示离散型变量的次数分布)柱状图(用于显示离散型变量的次数分布)饼图饼图折线图折线图直方图( Histogram )用于显示连续型变量的次数分布直方图( Histogram )用于显示连续型变量的次数分布具有容量大、方便计算等特点统计表的常用结构:统计表以纵横交叉的线条所形成的表格来表现统计资料的形式总 标 题宾词栏主词栏数据栏具有容量大、方便计算等特点统计表的常用结构:统计表以纵横交叉某地区100个百货商店月销售额与流通费用情况销售额(万元)每百元商品销售额中支付的流通费(元)213536394545464732936038718.316.917.215.

16、614.714.213.612.98.27.17.6按销售额分组(万元)商店数(个)每百元商品销售额中支付的流通费(元)50以下50100100200200300300以上102030251514.211.410.19.28.5某地区100个百货商店销售额(万元)每百元商品销售额中支付的统计表的编制规则选择合适的总标题;主词栏与宾词栏要各归其位,相互对应;表的上、下端用粗线或双线封口,左右两端一般不封口;可在各列的文字标题下面设置编号加以标识;数据栏不能有空白。统计表的编制规则选择合适的总标题;统计表的加工方法对主词栏加工对宾词栏加工(对主体进行分组)单式加工复式加工(选择指标及对指标进行分组)简单分组交叉分组统计表的加工方法对主词栏加工对宾词栏加工(对主体进行分组)单对主词栏的单式加工对主词栏的单

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论