版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据可视化展示
——统计图形选取1数据可视化展示
——统计图形选取1可视化的概念借助于图形化手段,清晰有效地传达与沟通信息。(维基百科)•数据可视化起源于1960年计算机图形学,那时候人们使用计算机创建图形图表,可视化提取出来的数据,可以将数据的各种属性和变量呈现出来。•随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,于是乎发展了数据采集设备和数据保存设备,而此时也需要更高级的计算机图形学技术及方法来创建这些规模庞大的数据集。•随着数据可视化平台的拓展,应用领域的增加,表现形式的不断变化,以及增加了诸如实时动态效果、用户交互使用等,数据可视化像所有新兴概念一样边界不断扩大。2可视化的概念借助于图形化手段,清晰有效地传达与沟通信息。(维Example——各编程语言关系可视化展示3Example——各编程语言关系可视化展示3Example——词云图4Example——词云图4可视化的三要素1.信息
海量复杂高维清理统计2.设计视觉交互简介适度3.沟通直观高效传递信息发现知识5可视化的三要素1.信息5基本流程(BenFry)1.获取数据;2.分析数据意义、结构;3.过滤掉无价值的数据,保留有价值的数据;4.挖掘数据规律,建立适合的模型;5.可视化表述,选取合适的图形展示;6.修饰,使图形变得直观、易读;7.交互。6基本流程(BenFry)1.获取数据;6使用数据说明——MDG2000年9月,世界各国的领导人在联合国达成了一项新千年宣言的历史性协议,随之而来的协商形成了关于新千年发展目标(MDG)进一步的协议,将用8个目标和100余个指标来监测其进展。这些目标包括:消除极度贫困和饥饿。普及全球初等教育。促进性别平等和提高妇女权力。减少儿童死亡率。提高母亲的健康水平。与艾滋病、疟疾和其它疾病作斗争。保证环境的可持续发展。为促进发展建立全球性的合作关系。7使用数据说明——MDG2000年9月,世界各国的领导人在联合数据预处理8数据预处理8数据集指标解释IndicatorCode中文含义SP.ADO.TFRT人口出生率EN.ATM.CO2E.KT二氧化碳排放量(千吨)EN.ATM.CO2E.PC二氧化碳排放量(吨每人)AG.LND.FRST.ZS森林覆盖率AG.LND.FRST.K2森林面积SH.H2O.SAFE.ZS改善的水源SH.TBS.INCD结核病发病率(每10w人)IT.NET.USER.P2互联网用户(每100人)SP.DYN.LE00.IN人口预计寿命SP.DYN.IMRT.IN婴儿死亡率(每1000活者)SH.DYN.MORT5岁以下死亡率(每1000活者)SP.POP.TOTL总人口IT.MLT.MAIN.P2每100人电话线数量ER.LND.PTLD.ZS陆地保护区(占总表面积的百分比)SH.TBS.MORT肺结核死亡率(每10w)9数据集指标解释IndicatorCode中文含义SP.AD可视化展示图形选取1.定性变量2.定量变量3.定性变量与定量变量结合10可视化展示图形选取1.定性变量10定性变量1.饼图(扇形图)单一定性变量的分布。每一块扇形的面积大小对应该类数据占总体的比例大小。极坐标形式的柱形图。11定性变量1.饼图(扇形图)11
定性变量2.堆积柱形图两个定性变量分布。数量VS比例每个柱形表示数据在在A属性的各类分布,每种颜色代表B属性的分布。列联表常用的的展示方法,直观展示属性A内各类数据的属性B各类的分布情况。12
定性变量2.堆积柱形图12定性变量3.风玫瑰图两个定性变量分布情况。极坐标形式的数量型堆积柱形图。每片“花瓣”大小代表A属性各类数目。13定性变量3.风玫瑰图13定性变量4.簇状柱形图两个定性变量分布情况。列联表常用的展示方法,直观对比两个定性变量的交叉。14定性变量4.簇状柱形图14定量变量1.直方图描述单一数量变量分布特征。人为分出组区域,在每组统计数目或者频率。与柱形图有本质区别。可添加拟合曲线看出变量的粗略分布。15定量变量1.直方图15定量变量2.二维核密度曲线(等高线)用于两个数量型变量点密度分布的展示。散点图的衍生,也可看出两个变量间的关系。16定量变量2.二维核密度曲线(等高线)16定量变量3.气泡图表示三个数量型变量的关系特征。两个变量以散点图的形式画出,第三个变量以气泡面积的展示于图中。展示第三个变量随前两个变量的变化。17定量变量3.气泡图17定量变量——高维4.散点图矩阵用于多个数量型变量关系探究。散点图的延伸。可利用适当的变换对数据进行处理。18定量变量——高维4.散点图矩阵18定量变量——高维5.相关系数图探索多个数量型变量可能的线性相关关系。红:负相关;蓝:正相关颜色越深代表相关系数的绝对值越大19定量变量——高维5.相关系数图19定量变量——高维6.平行坐标图探究多个数量型变量的可能关系。每条标准化之后的记录表示为图上的一组点,并连接为折线段。便于看出多个变量之间可能的关系。20定量变量——高维6.平行坐标图20定量变量——高维7.雷达图将每列数据进行标准化,将条记录画在一个图上,作几张图的对比。适用于指标多,记录少的数据。21定量变量——高维7.雷达图21定性变量+定量变量1.箱线图描述一个定性变量与一个数量型变量关系的常用图。五个关键点:最大值、上四分位数、中位数、下四分位数、最小值离群点。22定性变量+定量变量1.箱线图22定性变量+定量变量2.小提琴图两个一维密度曲线结合而成,展示具有某种特征的变量的分布特征。中间某处越粗代表指标在此处分布越密集。大部分正值变量呈右偏分布,呈现类似小提琴形状。结合箱线图综合分析。23定性变量+定量变量2.小提琴图23定性+定量变量3.分组图形用于一个定性变量和若干个数量变量的关系描述。所有图形集中于同一个画图板上。每种颜色对应同种定性变量数量变量的特征。24定性+定量变量3.分组图形24定性+定量变量4.分面图形至多两个定性变量与若干定量变量。将画图板分割为矩阵,将不同的定量变量的图形按照定性变量的不同画在的不同位置。每个分块对应同种定性变量数量变量的特征。25定性+定量变量4.分面图形25总结定性变量定量变量定性变量+定量变量1.单一变量:柱形图、饼图2.两个变量:堆积柱形图、簇状柱形图、风玫瑰图1.单一变量:直方图、密度曲线
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 语文01卷(河北专用)-(参考答案)(需要分值)七年级下册语文期末考试
- 南京化工园安全管理实务
- 【高中语文】《临安春雨初霁》课件+统编版高二语文选择性必修下册
- 无尘室安全管理培训方案
- 达菲林药物论文
- 酒店客房消防安全指南
- 煤炭买卖合同2026年付款方式
- 公司级物流试题及答案
- 定西幼教招聘试题及答案
- 安全培训试题及答案a
- 简单钢构垃圾房施工方案
- 民法典侵权课件
- 央企出国外事安全培训课件
- 车间夜间作业安全培训课件
- 2026中考数学《重难点解读+专项训练》专题09 二次函数与胡不归综合应用(学生版+名师详解版)
- (正式版)DB15∕T 3202-2023 《高纬度多年冻土区公路工程地质勘察技术规范》
- 细胞凋亡的研究方法与技术体系
- 女性导尿术课件
- DB42∕T559-2022 低能耗居住建筑节能设计标准
- 股骨头坏死髋关节置换护理查房
- 城市轨道交通行车值班员基础技能培训手册
评论
0/150
提交评论