统计学(02)第2章_用图表展示数据(2011年).ppt_第1页
统计学(02)第2章_用图表展示数据(2011年).ppt_第2页
统计学(02)第2章_用图表展示数据(2011年).ppt_第3页
统计学(02)第2章_用图表展示数据(2011年).ppt_第4页
统计学(02)第2章_用图表展示数据(2011年).ppt_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析 方法与案例 统计学 Statistics 图并没有说谎 是说谎者在画图 BenjaminDisraeli 统计名言 第2章用图表展示数据 2 1用图表展示定性数据2 2用图表展示定量数据2 3合理使用图表 Display 学习目标 定性数据的频数分布表定性数据的图示方法定量数据的频数分布表定量数据的图示方法用SPSS作频数分布表和图形合理使用图表 用哪些图形展示奖牌 2009年7月26日至8月3日第13届世界游泳锦标赛在意大利罗马举行 美国的泳坛霸主地位难以撼动 中国军团也创造了史上第二的佳绩中国代表团取得金牌数和奖牌与美国并列第一 奖牌榜排名第二的好成绩 用哪些图形展示奖牌 根据上面的数据 你认为可以选择哪些图形来展示三个国家所获得的奖牌情况 学完本章的图表展示技术 这样的问题就会迎刃而解 2 1用图表展示定性数据2 1 1生成频数分布表2 1 2定性数据的图示 第2章用图表展示数据 2 1 1生成频数分布表 2 1用图表展示定性数据 生成频数分布表 定性数据 1 列出各类别 3 生成频数分布表 定性数据的描述统计量 频数 frequency 落在各类别中的数据个数比例 proportion 某一类别数据个数占全部数据个数的比值百分比 percentage 将对比的基数作为100而计算的比值比率 ratio 不同类别数值个数的比值 生成频数分布表 定性数据 例2 1 为研究人们对不同类型软饮料的偏好情况 一家调查公司在某超市随机调查了50名顾客 右表是顾客性别及其所偏好的饮料类型记录 生成频数分布表 观察不同性别的顾客及其所偏好的饮料类型的分布状况 并进行描述性分析 用SPSS生成定性数据的频数分布表 单变量频数分布表 第1步 选择 Analyze DescriptiveStatistics Frequencies 进入主对话框第2步 将 饮料类型 或 顾客性别 选入 Variable s 选中 DisplayFrequencytables 第3步 若需要描述统计量或图形 主点 Statistics 或 Charts 并选择相应的选项 点击 OK 生成频数分布表 SPSS 生成频数分布表 定性数据 SPSS 不同类型饮料的频数分布 升序排列 汉字拼音字母 用SPSS生成定性数据的列联表 Crosstabulation 交叉表 第1步 选择 Analyze DescriptiveStatistics Crosstabs 进入主对话框第2步 将 饮料类型 选入 Row s 将 顾客性别 选入 Column s 行列可以互换 第3步 若需要对列联表进行描述性分析 点击 Cells 在 Percentages 下选中需要的统计量 如 Row Column Total 等 若需要图形 点击 Displayclusteredbarchart 点击 OK 生成交叉频数分布表 SPSS 列联表的描述性分析 例题分析 SPSS 列联表的统计描述 行百分比 列百分比 列联表的描述性分析 例题分析 SPSS 列联表的统计描述 行百分比 列百分比 2 1 2定性数据的图示 2 1用图表展示定性数据 条形图 barChart 用宽度相同的条形的高度或长短来表示各类别数据各类别可放在纵轴 称为条形图 可以放在横轴 称为柱形图 columnchart 复式条形图 barChart 饮料类型和顾客性别的条形图 SPSS的输出 帕累托图 paretochart 1 按各类别数据出现的频数多少排序后绘制的柱形图2 用于展示分类数据的分布 用SPSS绘制饼图 Pie 第1步 选择 Graphs Interactive Pie Clustered 进入主对话框第2步 如果绘制简单饼图 将某个分类变量 如 饮料类型 选入 Slice 部分 片 点击 Pies 选择在饼图中要展示的内容 如 Category Count Percen 等 点击 确定 如果要绘制复式饼图 将某个分类变量 如 饮料类型 选入 Slice 将另一个分类变量 如 顾客性别 选入 Cluster 点击 Pies 选择在饼图中要展示的内容 如 Category Count Percen 等 点击 确定 绘制饼图 SPSS 简单饼图 pieChart 用圆形及圆内扇形的角度来表示数值大小的图形 主要用于表示一个样本 或总体 中各组成部分的数据占全部数据的比例用于研究结构问题 复式饼图 pieChart 主要用于展示两个或多个分类变量的构成比较 比如 在男女分类的基础上又增加了饮料类型的分类 环形图 doughnutchart 环形图中间有一个 空洞 样本或总体中的每一部分数据用环中的一段表示与饼图类似 但又有区别饼图只显示一个总体各部分所占的比例环形图则可以同时绘制多个样本或总体的数据系列用于结构比较研究 环形图 doughnutchart 例2 2 2006年北京 上海和天津地区按收入法计算的地区生产总值 按当年价格计算 数据 绘制环形图比较三个地区的生产总值构成 环形图 doughnutchart 北京 上海和天津地区按收入法计算的地区生产总值 2 2用图表展示定量数据2 2 1生成频数分布表2 2 2定量数据的图示 第2章用图表展示数据 2 2 1生成频数分布表 2 2用图表展示定量数据 生成频数分布表 例题分析 例2 3 某电脑公司120天的销售额数据 单位 万元 生成一张频数分布表观察销售额分布的特征 生成频数分布表 例题分析 确定组数 组数的确定应以能够显示数据的分布特征为目的 在实际分组时 组数一般为5 K 15 确定组距 组距 ClassWidth 是一个组的上限与下限之差 即组距 最大值 最小值 组数统计出各组的频数 每个组的数据满足a x b 即上组限不在内原则 分组中的几个概念 1 下限 lowerlimit 一个组的最小值2 上限 upperlimit 一个组的最大值3 组距 classwidth 上限与下限之差4 组中值 classmidpoint 下限与上限之间的中点值 spss制作频数分布 2 2 2定量数据的图示 2 2用图表展示定量数据 分组数据看分布 直方图 histogram 用于展示分组数据分布的一种图形用矩形的宽度和高度来表示频数分布本质上是用矩形的面积来表示频数分布在直角坐标中 用横轴表示数据分组 纵轴表示频数或频率直方图下的总面积等于1 用SPSS绘制直方图 第1步 选择 Graphs 菜单 并选择 histogram 选项进入主对话框第2步 在主对话框中将变量选入 Variables 点击 OK 绘制直方图 SPSS 分组数据看分布 直方图 SPSS绘制的直方图 分组数据看分布 直方图 直方图与条形图的区别 条形图中的每一矩形表示一个类别 其宽度没有意义 而直方图的宽度则表示各组的组距由于分组数据具有连续性 直方图的各矩形通常是连续排列 而条形图则是分开排列条形图主要用于展示定性数据 而直方图则主要用于展示定量数据 未分组数据看分布 茎叶图 stem and leafplot 用于显示未分组的原始数据的分布由 茎 和 叶 两部分构成 其图形是由数字组成的以该组数据的高位数值作树茎 低位数字作树叶树叶上只保留最后一位数字 未分组数据看分布 茎叶图 stem and leafplot 5 茎叶图类似于横置的直方图 但又有区别直方图可观察一组数据的分布状况 但没有给出具体的数值茎叶图既能给出数据的分布状况 又能给出每一个原始数值 保留了原始数据的信息直方图适用于大批量数据 茎叶图适用于小批量数据 用SPSS绘制茎叶图和箱线图 包括直方图 第1步 选择 Analyze 菜单 并选择 Descriptivestatistics Explore 选项进入主对话框第2步 在主对话框中将变量选入 Variables 点击 Plots 在对话框中选择 Stem and leaf 根据需要可选 Histogram 以给出直方图 点击 Continue 回到主对话框 点击 OK 绘制茎叶图 SPSS 未分组数据看分布 茎叶图 例题分析 某电脑公司销售额分布的茎叶图 未分组数据看分布 茎叶图 例题分析 第一列给出每个茎上叶子的频数第二列是 茎 第三列是 叶 下面标出了1个极端值237 茎的宽度10 每个叶代表一个数据 案例 SPSS自动将每个茎重复了一次 使分布的细节看的更清楚一些 当然 在数据较少时茎的数值也可以不重复 未分组数据看分布 箱线图 boxplot 用于显示未分组的原始数据的分布箱线图是由一组数据的最大值 maximum 最小值 minimum 中位数 median 两个四分位数 quartiles 这5个值绘制而成的绘制方法首先找出一组数据的5个特征值 即最大值 最小值 中位数Me和两个四分位数 下四分位数QL和上四分位数QU 连接两个四分位数画出箱子 再将两个极值点与箱子相连接 未分组数据看分布 箱线图 箱线图的构成 中位数 4 6 8 10 12 Median Quart Range箱线图 未分组数据看分布 箱线图 例题分析 最小值141 最大值237 中位数182 25 四分位数170 25 75 四分位数197 140150160170180190200210220230240 某电脑公司销售额数据的Median Quart Rang箱线图 分布的形状与箱线图 不同分布的箱线图 对称分布 Bell shapeddistribution Left skeweddistribution 左偏分布 右偏分布 Right skeweddistribution 未分组数据看分布 多批数据箱线图 例题分析 例2 4 从某大学经济管理专业二年级学生中随机抽取11人 对8门主要课程的考试成绩进行调查 所得结果如表 试绘制各科考试成绩的批比较箱线图 并分析各科考试成绩的分布特征 用SPSS绘制多批数据箱线图 第1步 选择 Graphs 下拉菜单 并选择 Boxplot 第2步 在出现的对话框中选择 Simple 在 DatainChatAre 中选择 Summariesofseparatevariables 点击 Define 返回主对话框第3步 在主对话框将所有变量 这里是11个学生 选入 BoxesRepresent 将 课程名称 选入 LabelCasesby 点击 OK 绘制箱线图 SPSS 未分组数据 多批数据箱线图 例题分析 Median Quart Range 8门课程考试成绩的箱线图 11名学生考试成绩的Median Quart Range箱线图 未分组数据 多批数据箱线图 SPSS绘制的箱线图 垂线图可用于展示多个变量或多个样本取值的分布状况将属于同一样本或类别的多个取值的散点用一条垂线连接起来 用垂线的长度及垂线上的各个点来反映某个样本或类别取值的差异及其变动状况 未分组数据 垂线图 drop line 绘制垂线图 SPSS 未分组数据 垂线图 drop line 用SPSS制作垂线图第1步 选择 Graphs 菜单 并选择 Line 第2步 在出现的对话框中选择 Drop line 在 DatainChartAre 中选择 Valuesofindividualcases 点击 Define 返回主对话框第3步 在主对话框中将所有变量选入 PointsRepresent 在 CategoryLabels 下选择 Variable 并将相应的类别选入框内 点击 OK 绘制垂线图 SPSS 未分组数据 垂线图 例题分析 11名学生8门课程考试成绩的垂线图 误差图是以均值为中心 加减一定倍数的标准差 也可以是加减一定倍数的标准误差 绘制而成的 该图也可以绘制均值的一定置信水平的置信区间 用于展示多个样本或分类的不同取值的分布状况和离散状况 未分组数据 误差图 errorbar 绘制误差图 SPSS 未分组数据 误差图 errorbar 用SPSS制作垂线图第1步 选择 Graphs 菜单 并选择 ErrorBar 第2步 在出现的对话框中选择 Simple 在 DatainChartAre 中选择 Summariesofseparatevariables 点击 Define 返回主对话框 第3步 在主对话框中将所有变量选入 ErrorBars 在 BarsRepresent 下选择 Standarddeviations 在 Multiplier 框内输入所需的标准差倍数 点击 OK 绘制误差图 SPSS 未分组数据 误差图 例题分析 11名学生8门课程考试成绩的误差图 均值加减2倍的标准差 两个变量间的关系 二维散点图 2DScatterplots 展示两个变量之间的关系用横轴代表变量x 纵轴代表变量y 每组数据 xi yi 在坐标系中用一个点表示 n组数据在坐标系中形成的n个点称为散点 由坐标及其散点形成的图有2维 3维 矩阵等形式 两个变量间的关系 二维散点图 2DScatterplots 例2 5 表2 12是我国31个地区2006年的固定资产投资额 地区生产总值 GDP 和最终消费支出数据 绘散点图并观察它们之间的关系 用SPSS绘制重叠散点图 OverlayScatter 第1步 选择 Graphs 菜单 并选择 Scatter Dot 第2步 如果绘制两个变量的简单散点图 点击 SimpleScatter 点击 Define 将两个变量分别选入 YPairs 和 XPairs 点击 OK 如果要绘制重叠散点图 点击 OverlayScatter 点击 Define 将所要配对的数据依次选入 Y XPairs 本例为 固定资产投资额 地区生产总值 和 固定资产投资额 最终消费支出 点击 OK 如果要绘制矩阵散点图 点击 MatrixScatter 将几个变量 本例为 固定资产投资额 地区生产总值 和 固定资产投资额 同时选入 MatrixVariables 将区分坐标轴的样本 本例为 地区 选入 LabelCasesby 点击 OK 绘制重叠散点图 SPSS 两个变量间的关系 二维散点图 2DScatterplots 如果想比较几个变量之间的关系 也可以把它们的散点图绘制在同一张图里 绘制成重叠散点图 OverlayScatter 比如 如果想比较固定资产投资额与地区生产总值和最终消费支出的关系 可以把固定资产投资作为共同的一个坐标轴 地区生产总值和最终消费支出作为另一个坐标轴也可以绘制散点图矩阵 MatrixScatter 两个变量间的关系 重叠散点图 用SPSS绘制重叠散点图 两个变量间的关系 重叠散点图 OverlayScatter 两个变量间的关系 矩阵散点图 MatrixScatter 比较多个样本的相似性 雷达图 radarchart 也称为蜘蛛图 spiderchart 从一个点出发 用每一条射线代表一个变量 多个变量的数据点连接成线 即围成一个区域 多个样本围成多个区域 就是雷达图可用于研究多个样本在多个变量上的相似程度当多个变量的取值相差较大或量纲不同时 可进行变换处理后再做图 线性变换 对数变换 多变量数据 雷达图 例题分析 例2 6 2006年我国东部 中部 西部及东北地区城镇居民的生活消费支出数据如表2 8所示 绘制雷达图 比较不同地区的消费支出构成 多变量数据 雷达图 例题分析 原始数据 1 四个地区城镇居民消费支出中 食品支出额都是最多的 杂项商品与服务支出额则是最少的2 东部地区城镇居民的各项支出额普遍高于其他三个地区 而中部 西部和东北地区的各项支出则相差不大3 四个地区各项支出额的结构具有很大的相似性 多变量数据 雷达图 例题分析 标准化变换 1 更适宜分析多个样本在多个变量上的差异2 东部地区城镇居民的各项支出额普遍高于其他三个地区 而中部 西

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论