应用统计学第2章描述性统计1_第1页
应用统计学第2章描述性统计1_第2页
应用统计学第2章描述性统计1_第3页
应用统计学第2章描述性统计1_第4页
应用统计学第2章描述性统计1_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1描述性统计的内容描述性统计的内容目的目的:对数据集对数据集(随机变量随机变量)的分布形状进行描述的分布形状进行描述,分析并解释数据分析并解释数据.方法方法:对搜集到的对搜集到的(原始原始)数据综合、整理数据综合、整理,以统计以统计表格表格(频数分布表频数分布表)和统计图形和统计图形(直方图直方图,条形条形图等图等)呈现出来(本书第呈现出来(本书第2章)章);计算一些描述性统计值计算一些描述性统计值(均值均值,标准差等标准差等). (本书第(本书第3章)章)2本章教学目标:本章教学目标:掌握利用统计图表整理和表示统计数据的掌握利用统计图表整理和表示统计数据的基本方法;基本方法;掌握利用掌握利用

2、 Office 软件绘制各种统计图表、软件绘制各种统计图表、计算各种统计综合指标。计算各种统计综合指标。掌握分类数据图表的制作方法。掌握分类数据图表的制作方法。掌握数值数据图表的制作方法。掌握数值数据图表的制作方法。了解图表汇总和制作原则。了解图表汇总和制作原则。 第第2章章 统计表和统计图统计表和统计图3变量分类变量分类 变量分为两类:定性的和定量的 1.定性变量:主要是离散变量:取值为可列的, 如:自然数,整数. 例如:分类变量; 性别:男(1),女(2); 学历:1.高中;2.大专;3.本科;4.研究生 2.定量变量: 离散变量:工龄:1,2,50,; 连续变量:取值用区间来表示的,如:

3、分数,无理数,等.例如:工资;4 在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便于人们的理解和使用。表格和图形是整理和反映统计资料的主要工具。 当数据是分类数据时, 对变量取值直接分类后,计算各类的频数和频率, 可以对每一分类数据制作频率分布表和相应的图表。2.1 分类数据的图表分类数据的图表 5 频数分布表列出了一系列分类数据的频数,频率(百分比),可以看出不同类别数据间的区别。 表2-1 1 000美元用途的频数分布表用钱做什么频数频率累积频率购买奢侈品、旅游或礼物2000

4、.200.20向慈善机构捐款200.020.22还贷2400.240.46储蓄3100.310.77购买必需品1600.160.93其他700.071.00合计:0001.001.频数分布表62.条形图05101520253035购买奢侈品、旅游或礼物向慈善机构捐款还贷储蓄购买必需品其他100美元的使用百分比/%73.圆饼图向慈善机构捐款 2% 储蓄 31% 购买必需品 16% 购买奢侈品、 旅游或礼物 20% 其他 7% 还贷 24% 8 在帕累托图中,不同类别的数据是按其频率降序排列的,并在同一张图中画出累积百分比图。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少类别中,极少剩下剩余

5、的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数” 0 5 10 15 20 25 30 35 储蓄 还贷 购买奢侈品、 旅游或礼物 购买必需品 其他 捐款 有钱要做什么 0 20 40 60 80 100 120 4.帕累托图帕累托图9 当数据量很大时,首先可以将数值数据进行排序或用茎叶图描述以获得初步信息。 (1) 排序 从没有排序的数据中很难看出数据的整体范围。排序是把数据从小到大(或从大到小)进行排列。 (2) 茎叶图 茎叶图就是将数据分成几组(称为茎),每组中数据的值(称为叶)放置在每行的右边。结果可以显示出数据是如何分布的,以及数据中心在哪里。 为

6、了制作茎叶图,可以将整数作为茎,把小数(叶)化整。例如,数值5.40,它的茎(行)是5,叶是4;数值4.30,它的茎(行)是4,叶是3。也可以将数据的十位数作为茎,个位数作为叶。 2.2 数值数据的整理数值数据的整理 10 当数据量很大时,排序和茎叶图都很难得出结论。此时需要使用图表。有多种不同类型的图表可以用来精确描述数值数据,包括频数分布表、折线图、面积图、柱形图、条形图、直方图、频数多边形、圆饼图、散点图、时间序列、曲线图以及对数图等等。 2.3 数值数据的图表数值数据的图表 11例:某公司汽车销售量例:某公司汽车销售量 (单位:辆单位:辆)48715253364169584760532

7、9417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750 12定量变量的频数分布表定量变量的频数分布表1.分组: 计算极差R=Xmax-Xmin =81-16=65;2.确定组数和计算组距:一般取组数k=512,这里k=8.计算组距 iR=(b-a)/k=(90-10)/8=103.计算各组频数,编制频数分布表.131.频数分布表频数分布表 分组统计整理后, 将杂乱无章的 60 个原始数据压缩到8组,清晰地反映了更多的有用信息。 14直方图的绘制直方图的绘制

8、横轴:变量的取值范围;纵轴: (1)频数;(2)频率/组距。如果直方图的纵轴取为(频率/组距),则每一直方块的面积=高*宽= (频率/组距)* (组距)= 频率因而,直方图可看成是随机变量概率密度曲线的近似(或逼近)。15(2)直方图直方图用以表示数据的频数分布规律。用以表示数据的频数分布规律。图1.5 公司汽车销售量的频数分布16制作频数分布表的注意事项制作频数分布表的注意事项1)分组的数量 2)实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。3)如果分组是为了揭示数据的分布规律,则分组不能过多和过少。通常应在515 之间。在绘制直方图时可以参照下表: 样本容量 n 参考分组数

9、2050 56 51100 78 101200 89 201500 910 5011000 1011 1000以上 112017制作频数分布表的注意事项制作频数分布表的注意事项2) 分组的方法 分组的方法可以有等距分组和不等距分组两类。采用哪种分组方法应根据数据的分布特点而定。通常,当数据在一定范围内基本呈对称分布时,宜采用等距分组;而当数据的分布状态极度偏斜时,则宜采用不等距分组。 18例:例: 按雇工人数分组的私营企业规模统计按雇工人数分组的私营企业规模统计 19制作频数分布表的注意事项制作频数分布表的注意事项3)组限:组限也即各组区间的上、下限。确定各组)组限:组限也即各组区间的上、下限

10、。确定各组区间的上限和下限时,应保证各组之间既不重叠,又不区间的上限和下限时,应保证各组之间既不重叠,又不能遗漏任一数据,使每一个数据都属于某一确定的分组。能遗漏任一数据,使每一个数据都属于某一确定的分组。重叠和组限不重叠组限重叠和组限不重叠组限重叠组限重叠组限相邻组的上下限重合。相邻组的上下限重合。适用于连续型变量。但各组上、下限中有一个不包含适用于连续型变量。但各组上、下限中有一个不包含再内。通常按再内。通常按“上限不在内上限不在内”处理,即组区间是处理,即组区间是 a, b)的的形式。形式。注意:注意:Excel在制作频数分布表时采用的是在制作频数分布表时采用的是“上限在内上限在内”的规

11、则。的规则。不重叠组限不重叠组限相邻组的上下限不重合。相邻组的上下限不重合。适用于离散型变量。适用于离散型变量。20例:离散型变量的分组(不重叠组限)例:离散型变量的分组(不重叠组限)某公司某月汽车销售量的频数分布表 21例:连续型变量的分组例:连续型变量的分组(上限不在内上限不在内)月工资(分组)人数(频数)比率(频率%)1000 以下15014.51000150018517.91500200025624.72000300026225.33000350012011.635004000545.24000 及以上80.8合 计1035100某企业职工工资的分组统计某企业职工工资的分组统计22制作

12、频数分布表的注意事项制作频数分布表的注意事项4) 组中值组中值是各组的代表值,在计算分组数据的许多统计指标时要用到。通常取该组上限和下限的平均值为组中值。如表2-7所示,1019的组中值是14.5,2029的组中值是24.5,等等。5) 表格线统计表中的表格线应当是两边开口的表格。23使用使用 Excel 制作频数分布表制作频数分布表利用 Excel 的 FREQUENCY 函数语法规则:格式:FREQUENCY(,) 接收区间各组上限值组成的一列区域功能:返回各组的频数。使用【工具】“数据分析”“直方图”功能 24 统计图可以形象、直观、生动、简洁地显示数据的特征。 常用的统计图有以下几种:

13、1.折线图 通常用来描述时间序列数据,用以表示某些指标的变化趋势。 制作折线图时应正确选择坐标轴轴的刻度。对同样的统计资料,延伸或压缩某一坐标轴可能传达不同的甚至是误导的印象。 其它数值数据统计图其它数值数据统计图25折线图折线图-反映随时间而变的趋势反映随时间而变的趋势262.面积图面积图 面积图可以直观地表示时间序列各组成部分的变化情况。 0%10%20%30%40%50%60%70%80%90%100%199719981999200020012002百百分分比比信息产业信息产业工业原料工业原料能源能源民用产品民用产品100 90 80 70 60 50 40 30 20 10 0 百分比

14、/% 1997 1998 2000 2001 1999 2002 年 图图 某地区各产业增加值构成比例的变化情况某地区各产业增加值构成比例的变化情况273.柱形图、条形图和直方图柱形图、条形图和直方图 柱形图、条形图和直方图是使用的最为广泛的统计图表。通常将横向绘制的柱形图称为条形图,而将各柱形之间没有间隔的称为直方图,但在Office中将直方图和柱形图统称为柱形图。 (1)柱形图 主要用于表示时间序列数据。 28图1.4 各类进口商品的变化情况柱形图示例柱形图示例29未分组数据的茎叶图未分组数据的茎叶图用于显示未分组的原始数据的分布由“茎”和“叶”两部分构成,其图形是由数字组成的以该组数据的

15、高位数值作树茎,低位数字作树叶对于n(20n300)个数据,茎叶图最大行数不超过 L = 10 log 10 n 茎叶图类似于横置的直方图,但又有区别 直方图可大体上看出一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息30未分组数据未分组数据茎叶图(茎叶图的制作)茎叶图(茎叶图的制作)314.频数多边形频数多边形 频数多边形是直方图的另一种表现形式,是由直方图的顶端中点(各组的组中值)连线而成,其中两边都要连接到横轴上的某点,以便通过覆盖的面积反映总频数。当希望在一个图上比较两种频数分布的特征时,就需要使用频数多边形。 020

16、40608010035455565758595 105体重频数女学生女学生男学生男学生体重/千克 频数 男、女学生的体重分布特征男、女学生的体重分布特征 325.圆饼图圆饼图 当要表示总体各组成部分的个体数量在总体中占的比率时,经常使用圆饼图,圆饼中各扇形的大小代表了不同组成部分的相对重要性。 某企业资产、负债与所有者权益的构成情况某企业资产、负债与所有者权益的构成情况 336.散点图、时间序列图和曲线图散点图、时间序列图和曲线图Microsoft Office中的曲线图属于平滑线散点图 。散点图:在回归分析中,经常需要用样本数据的散点图来分析两个变量之间大致的曲线关系,如正相关关系,即一个变

17、量的增长引起另一个变量的增长;负相关关系,即一个变量的增长引起另一个变量的减少。时间序列图:研究数值变量随时间变化的趋势。X轴代表时间,Y轴代表数值。时间序列图可用折线图来实现。曲线图:当变量是连续型数据时,通常使用曲线图来描述数据的分布情况,如连续型随机变量的密度函数和分布函数曲线。 34散点图散点图:描述两个变量的关系描述两个变量的关系35经济管理中几种常见的频数分布曲线经济管理中几种常见的频数分布曲线正态分布曲线正态分布曲线这是客观事物数量特征上表现得最为普遍的一这是客观事物数量特征上表现得最为普遍的一类频数分布曲线。类频数分布曲线。如人的身高、体重、智商,钢的含碳量、抗拉强度,如人的身

18、高、体重、智商,钢的含碳量、抗拉强度,某种农作物的产量等等。某种农作物的产量等等。正态分布曲线36偏态曲线偏态曲线图1.8 偏态曲线右偏(正偏)左偏(负偏) 例如收入和财富的频数分配曲线就是右偏的,大量财富都集中在极少数富豪手中,而多数人则是低收入者。 此外,在产品质量管理中也普遍存在这种现象,如多数次品都集中出在少数工人手中;次品也大都出在少数几道工序上。这就要求在管理和控制上需要突出重点、抓住关键因素。 按其长尾拖向哪一方又可分为右偏(正偏)和左偏(负偏)两类。37 J 形曲线形曲线其典型的应用分别是经济学中的供给曲线和需求曲线。供给曲线(正 J 形)表现为随着价格的增加,供给量以更快的速

19、度增加;需求曲线(倒 J 形)表现为随着价格的增加,需求量以更快的速度减少。供给和需求曲线的交点即供求平衡点。 正 J 形倒 J 形图1.9 J 形曲线38 U形曲线形曲线 人和动物的的死亡率、设备的故障率等通常都服从于 U 形曲线分布。图1.10 U形曲线 又称生命曲线或浴盆曲线又称生命曲线或浴盆曲线397.对数图对数图 人们经常对时间序列变量的相对变化率而不是绝对数值的变化感兴趣,如各种经济变量的环比发展速度。此时若要用统计图直观反映增长率等现象的变动趋势,就需要使用对数图。 对数图是以时间为横轴,以10为底的对数比率刻度为纵轴的折线图。可以通过对数图中各线段的斜率比较各时期增长率的大小。考虑以下统计数据:时期绝对数值对数值120.3240.6380.94161.240对数图可以直观反映时间序列的环比变化趋势对数图可以直观反映时间序列的环比变化趋势 可以在Office图表类型中选择自定义类型中的“对数图”,也可通过将一般折线图纵轴“坐标轴格式” 中的“刻度”设为“对数刻度”来绘制对数图。41交叉表可以由列联表和并行条形

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论