版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,第章描述数据的图表方法,学习目标,1. 定量数据的图表描述 数据整理 单变量描述 双变量描述 2. 定性数据的图表描述 数据整理 单变量描述 双变量描述,单变量定量数据的图表描述,单变量定量数据的图表描述数据整理,统计分组 根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组。 例,收集到某班所有同学的英语考试成绩,为了研究需要划分高、中、低三个成绩段,每个成绩段的范围分别是85-100,70-85,0-70,将每个成绩归入到相应的组中。,单变量定量数据的图表描述数据整理,频数分布表 对定量数据进行分组时,需要建立频数分布表,以便更有效地显示
2、数据的特征和分布。 构成: 频数,各组的单位的次数 频率,各组次数与总次数之比 频数分布,由分组标志序列和各组相对应的分布次数这两个要素构成。 频率分布,由分组标志序列和各组相应的频率构成频率分布。,频数分布表,原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38,组别,频数, 15 且 25,3, 25 且 35,5, 35 且 45,2,编制频数分布表,1. 选择组数 可参考Sturges的经验公式 3. 计算各组的宽度 宽度 4. 确定组界(上下限) 5. 计算组中值 某组的组中值 6. 根据分组整理成频数分布表 计算每个组的频数、相对频数(即频率),
3、频数分布表实例,原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38,组界,(上界+下界)/ 2,组距,组别,组中值,频数, 15 且 25,20,3, 25 且 35,30,5, 35 且 45,40,2,频率,30.0,50.0,20.0,(可参考书上实例),累积频数分布表,为了统计分析的需要,有时要观察某一数值以上或某一数值以下频数或频率之和,这就需要在频数分布表基本分组的基础上绘出累积频数或累计频率。 “向下累积” 由表的上方向表的下方的频数或频率相加 “向上累积” 由表的上方向表的下方的频数或频率相加,小于组别下限的百分数,原始数据: 24, 26
4、, 24, 21, 27, 27, 30, 41, 32, 38,组别下界,30% + 50%,80% + 20%,组别,累计,百分比,15 25,0.0,25 35,30.0,35 45,80.0,45 55,100.0,累积频数分布表实例,(可参考书上实例),单变量定量数据的图表描述数据图形描述(分组后数据),数据分组整理后的图形描述 直方图 用矩形的高度和宽度来表示频数分布 折线图 作用与直方图相似 累积频数分布图 描述累积频数或频率信息,0,1,2,3,4,5,直 方 图,频数 或 频率,01525354555,下界,柱条接触,计数,(可参考书上实例),0,1,2,3,4,5,折线图,
5、中点,虚拟的外推组,0102030405060,组别,频数,15 25,3,25 35,5,35 45,2,计数,(可参考书上实例),频数 或 频率,0%,25%,50%,75%,100%,累积折线图,下界,虚拟的外推组,01525354555,组别,累计 %,15 25,0%,25 35,30%,35 45,80%, 45 100%,累计 %,(可参考书上实例),单变量定量数据的图表描述数据图形描述(未分组数据),数据未分组整理后的图形描述 茎叶图 用于直接描述未分组原始数据的探索性分析 描述数据分布形状,如数据是否集中,是否有极端值等 由茎、叶、每个茎对应叶的个数、茎的宽度这四元素组成 箱
6、线图 用于直接描述未分组原始数据的探索性分析 描述数据的分布形状,如数据是否集中,是否有极端值等 可以比较多组数据分布特征 图中包含五个点组成:样本数据的最小值、下四分位数、中位数、上四分位数、最大值,茎叶图,把每一项观察分解为茎值和叶值 茎值确定组别 叶值确定频数 (计数),Xi,奇异值,箱线图,最大值,最小值,中位数,大于1.5 倍四分位数间距,四分位数 间距范围,箱线图,(可参考书上实例),中间的黑粗线为中位数 方框为四分位间距的范围 离方框上/下界的距离超过四分位数间距1.5倍的为离群值,以 “O” 表示;超过3倍的则为极值,用“*”表示。,多变量定量数据的图表描述,1. 散点图 同时
7、研究两个数字变量的取值 在图上标出所有数对 (Xi, Yi) 2. 时间序列图 表示一列定量数据如何随时间变化 3. 组箱线图 比较多个总体的分布特征 4. 雷达图 用于要同时分析的变量个数较多的情况,多变量定量数据的图表描述,散点图,标出所有数对 (Xi, Yi),(可参考书上实例),时间序列图,年份,(可参考书上实例),组箱线图,单变量定性数据的图表描述,单变量定性数据的图表描述数据整理,频数分布表(又叫总结表) 类似于整理定量数据的频数分布表 包含: 分类的频数或频率,即指落在某一特定类中的观察值数 分类的相对频数,指某个特定类的频数除以观察值总数所得的商 累积频数分布表 类似于整理定量
8、数据的累积频数分布表,频数分布表,(可参考书上实例),单变量定性数据的图表描述数据图形描述,条形图 类似直方图,条形图的横轴表示的是各个分类,直方图的横轴表示所分的组 饼图 通常用来描述落在各个分类中的观察值数分别在总数中所占的比率 累积频数分布图 类似于描述定量数据中的累积频率分布图 帕雷托图 变量的分类数目较多时,用帕雷托图要比条形图和饼图更能直观地显示信息。 广泛应用于过程分析和质量分析中,0,50,100,150,会计,经济,管理,条 形 图,水平条表示类型变量,条长表示频数或者 %,条宽的1/2 到 1 倍,相同的条宽,零点,频数,专业,也可使用百分比,(可参考书上实例),经济,10
9、%,管理,25%,会计,65%,饼 图,1. 表示出总量的分类 2. 是表示相对差异的有效办法 3. 角度大小 360(百分数),专业,36010% = 36,36,(可参考书上实例),0%,33%,67%,100%,会计,管理,经济,帕雷托图,百分数,专业,递减顺序,累积频数分布图,相同的条宽,竖直条形,条的中点,(可参考书上实例),多变量定性数据的图表描述,环 形 图,交 叉 图,多 重 条 形 图,多定性数据的图表描述,1. 环形图 显示具有相同分类且问题可比的多个样本或总体中各类别所占的相应比例,对各总体进行比较研究 在类别值为定序数据时这种比较才有意义 2. 交叉表 可检测两个定性变量的关系 同样可用来描述两个变量都是数字变量,或者一个变量是定类或定序变量,另一个是数字变量之间的关系 3. 多重条形图 描述两个定类或定序变量间关系,多变量定性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关系客户服务承诺书(4篇)
- 履行使命责任保证承诺书3篇
- 人力资源绩效评估模板及指标体系
- 基于芳香疗法的健康养生产品开发策略
- 基于物联网的智能煤炭开采技术研究
- 产品品质控制与优化服务承诺书(3篇)
- 飞行员飞行前准备指导书
- 环保设备投入及措施实施承诺书7篇范文
- 销售谈判模板逻辑策略驱动型
- 行业技术规范文档
- 小肠切除术护理查房课件
- 中学基于问题化学习的课堂教学实践研究结题报告
- 2023年危险化学品安全监管工作要点和危险化学品企业装置设备带病运行安全专项整治等 9个工作方案附件
- 学生编著:《雷雨》剧本
- 儿童生长监测和健康检查课件
- 7我们的衣食之源- 白白的大米哪里来 (教案)部编版道德与法治四年级下册
- 肠内营养的并发症及其防治
- 不确定状况下的判断:启发式和偏差
- 雷火灸教学课件
- 煤炭工业安全高效矿井(露天)标准及评审办法
- 2023学年完整公开课版高中英语4Module4GreatScientistsnapoleon
评论
0/150
提交评论