Business-statictics-2PPT优秀课件_第1页
Business-statictics-2PPT优秀课件_第2页
Business-statictics-2PPT优秀课件_第3页
Business-statictics-2PPT优秀课件_第4页
Business-statictics-2PPT优秀课件_第5页
已阅读5页,还剩43页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第二章 统计图表用图表展示定性定性数据用图表展示定量数据教学目标与要求用图表展示定性和定量数据,会正确使用图表展示数据集理解图表的意义,掌握图表的制作方法和解释图表。会用R,Excel,SPSS和Statsaas 中至少一个软件制表和绘图,并能解释图表。教学内容本章我们将学习描述统计之表格法和图形法,包括频数分布表、条形图、饼图、主次图、茎叶图、直方图;列联表、散点图和时间序列点图等。这些方法的目的是通过汇总数据,来理解和解释数据集。用图表展示定性数据2. 调查调查方式的分方式的分类类表2-1关于喜爱上网程度问卷调查部分结果编编号号性别性别 年龄年龄喜爱上网喜爱上网程度程度编号编号 性别性别

2、 年龄年龄喜爱上网喜爱上网程度程度1男12离不开网29男40偶尔上网2女40偶尔上网30女28经常上网3男39离不开网31男24离不开网4男16离不开网32男17离不开网5男30经常上网33男20离不开网6女44偶尔上网34男46偶尔上网7女22离不开网35男54偶尔上网8女52从不上网36女21离不开网9男55偶尔上网37女13经常上网10男14经常上网38女22离不开网11女21从不上网39男64从不上网12男28经常上网40男26经常上网13男25离不开网41男22经常上网14女20经常上网42女52偶尔上网15男8经常上网43男27经常上网16男48偶尔上网44男48偶尔上网17男31

3、经常上网45男67从不上网18女32经常上网46女17偶尔上网19男31经常上网47女9经常上网20男55偶尔上网48男30离不开网21男31经常上网49女32偶尔上网22女37离不开网50男28经常上网23男28离不开网51女21离不开网24男9经常上网52男18离不开网25女15离不开网53男26经常上网频数分布表喜爱上网程度喜爱上网程度 频数(人数)频数(人数) 相对频数相对频数 百分百分数数% 离不开网180.30 30 经常上网200.38 38偶尔上网110.2121 从不上网70.11 11 总计总计 56 1 100 表2-2 被访者喜爱上网程度频数分布表频数分布,相对频数分布

4、和百分数频数分布频数分布是一种数据的表格汇总,表示在几个互不重叠的组别中的每一组的项目个数。相对频数分布是各组相对频数数据的表格汇总。百分数频数分布是各组百分数频数数据的表格汇总条形图图2.1 不同上网程度人数的分布条形图(bar chart)用宽度相同的条形的高度或长短来表示各类别数据各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图。饼图显示了不同上网程度的受访者人数所占百分比。其中“经常上网”的人所占百分比最高,为37.50%;而从不上网的人占总人数的10.71%。比较饼图和条形图,我们发现条形图比饼图能体现更精确的频数大小,但在表示各组频数百分比时则没有饼图那么直观。饼图(Pie

5、Chart)用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例用于研究结构问题。主次图(Pareto Chart)主次图(Pareto Chart)主次图又叫排列图、帕累托图,是将各组按频率由高至低排列后制作的条形图,它能突出发生频率高的组,帮助分析主次图一般用双直角坐标系表示:左边纵坐标表示频率(矩形的高度);右边纵坐标表示累积频率百分比(累计百分比线的高度);横坐标则按出现频率高低,即影响程度的大小将各组从左到右排列。例 2.1 政府管理人员统计了不同软件公司出现的共150个软件项目交付失败的影响因素,分为员工技能低、进度压缩严重、

6、测试环境不足、预算不足、流程不规范和其他六大类。表2-3 软件项目交付失败的影响因素统计序号 影响因素频率频率% 累计频率%1 1进度压缩严重8254.67%54.67%2 2流程不规范3322.00%76.67%3 3员工技能低138.67%85.34%4 4测试环境不足117.33%92.67%5 5预算不足74.67%97.34%6 6其他42.66%100%总计150 100%主次图(Pareto Chart)在质量管理中,主次图将出现的质量问题按其出现的频繁程度从高到低依次排列,帮助管理者分析确定产生大多数质量问题的少数主要原因。主次图(Pareto Chart)80%左右的财富在大

7、约20%的手中 80%的顾客抱怨起因于20%的产品80%的缺陷项目由20%的错误决策引起 极其重要的少数,无关紧要的多数 -帕累托分析识别最重要的问题及导致这些问题的原因用图表展示定量数据频数分布表例1: 冬天白天的最高温度24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 2712, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58频数分布表 组组 频数频数10, 20) 3 .15 1520,

8、 30) 6 .30 3030, 40) 5 .25 25 40, 50) 4 .20 2050, 60) 2 .10 10 Total 20 1.00 100相对频数相对频数 百分数(百分数(%)频数分布表确定组数:组数的确定应以能够显示确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分数据的分布特征为目的。在实际分组时,组数一般为组时,组数一般为5=K =15。确定组距:组距确定组距:组距(Class Width)是一个是一个组的上限与下限之差,可根据全部组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数据的最大值和最小值及所分的组数来确定,即数来确定,即频数分布表

9、组距组距( 最大值最大值 - 最小值最小值) 组数组数 统计出各组的频数。每个组的数据满统计出各组的频数。每个组的数据满足足a=xb(上限值不在内上限值不在内 )频数分布表1. 下限(lower limit) :一个组的最小值2. 上限(upper limit) :一个组的最大值3. 组距(class width) :上限与下限之差4. 组中值(class midpoint) :下限与上限之间的中点值频数分布表排序(升序):12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58变动范围: 58

10、 - 12 = 46确定组数: 5 (usually between 5 and 15)计算组距 (width): 10 (46/5 then round up)频数分布表确定边界 (limits):Class 1: 10 to less than 20Class 2: 20 to less than 30Class 3: 30 to less than 40Class 4: 40 to less than 50Class 5: 50 to less than 60组中值: 15, 25, 35, 45, 55统计各组数据出现的频数。频数分布表 组组 频数频数10,20) 3 .15 1520

11、,30) 6 .30 3030,40) 5 .25 25 40,50) 4 .20 2050,60) 2 .10 10 Total 20 1.00 100相对频数相对频数 百分数(百分数(%)12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58直方图(histogram)直方图(histogram)用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图例2

12、 样本数据是一家名为Sanderson and Clifford 的小型会计事务所对20位客户完成年末审计所需的时间(单位:天):12,15,20,22,14,14,15,27,21,18,19,18,22,33,16,18,17,23,28,13.审计时间(天)频数10-14415-19820-24525-29230-341合计20频数分布表频数分布表茎叶图(Stem-and-leaf display)大学大学生年生年龄龄日校日校16 17 17 18 18 1819 19 20 20 21 2222 25 27 32 38 42夜校夜校18 18 19 19 20 2123 28 32 3

13、3 41 45 Frequency Stem Leaf8 1 677888997 2 00122572 3 281 4 2日校学生年龄茎叶图(Stem-and-leaf display)大学大学生年生年龄龄Day StudentsDay Students(日校)(日校)16 17 17 18 18 1819 19 20 20 21 2222 25 27 32 38 42Night StudentsNight Students(夜校(夜校) )18 18 19 19 20 2123 28 32 33 41 45 夜校 Frequency StemLeaf4 1 88994 2 01382 3 2

14、32 4 15茎叶图(Stem-and-leaf display)1.用于显示未分组的原始数据的分布2. 由“频数”、“茎”和“叶”三部分构成,其图形是由数字组成的3. 以该组数据的高位数值作树茎,低位数字作树叶4. 树叶上只保留最后一位数字茎叶图(Stem-and-leaf display)茎叶图与直方图的区别: 直方图可观察一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 直方图适用于大批量数据,茎叶图适用于小批量数据二维数据的图表描述散点图散点图 分层直方图分层直方图列联表列联表复式条形图复式条形图堆积条形图堆积条形图列

15、联表(交叉分组表)列联表又叫交叉表,是一种用交叉表格展示两个或多个分类变量各类别中频数多少的统计方式,常用于展示两个属性变量值的分布。男学生更容易逃课吗? 复式条形图将两个或两个以上的单一条形图并排起来以比较同一组个体中不同类别的频数差异,并用不同的颜色对类别加以区分。堆积条形图是将代表不同类别的矩形“堆积”起来,矩形的长度表示该类的频数或相对频率(百分比),并以不同花纹或颜色区分代表各类别的矩形。散点图(Scatter Plot )1. 展示两个变量之间的关系2. 用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图散点图(Scatter Plot )Volume per dayCost per day231252614029146331603816742170501885519560200混合类数据的图示分层直方图是将某一数值变量在不同类别的分布直方图排列而成的图形。在分层直方图中,对于不同类别中的某个数值型特征的直方图都采用相同的分组,并将不同组的数据直方图上下排列以便于比较。时间序列图是以时间为横轴,以变量的值为纵轴的连线图。空间数据的展示例 2.8 英国广播公司(BBC)新闻网站上一张关于美国

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论