数据可视化展示_第1页
数据可视化展示_第2页
数据可视化展示_第3页
数据可视化展示_第4页
数据可视化展示_第5页
已阅读5页,还剩21页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,数据可视化展示,统计图形选取,2,可视化的概念,借助于图形化手段,清晰有效地,传达与沟通信息,维基百科,数据可视化起源于,1960,年,计算机图形学,那时候人们使用计算机,创建图形图表,可视化提取出来的数据,可以将数据的各种属性,和变量呈现出来,随着计算机硬件的发展,人们创建更复杂规模更大的数字模型,于是乎发展了,数据采集设备和数据保存设备,而此时也需要更高,级的计算机图形学技术及方法来创建这些规模庞大的数据集,随着数据可视化平台的拓展,应用领域的增加,表现形式的不断,变化,以及增加了诸如,实时动态效果、用户交互使用等,数据可,视化像所有新兴概念一样边界不断扩大,3,Example,各编程

2、语言关系可视化展示,4,Example,词云图,5,可视化的三要素,1,信息,海量,复杂,高维,清理,统计,2,设计,视觉,交互,简介,适度,3,沟通,直观,高效,传递信息,发现知识,6,基本流程,Ben Fry,1,获取数据,2,分析数据意义、结构,3,过滤掉无价值的数据,保留有价值的数据,4,挖掘数据规律,建立适合的模型,5,可视化表述,选取合适的图形展示,6,修饰,使图形变得直观、易读,7,交互,7,使用数据说明,MDG,2000,年,9,月,世界各国的领导人在联合国达成了一项新千年宣言的历史性协议,随之而来的协商形成了,关于新千年发展目标,MDG,进一步的协议,将用,8,个目标和,10

3、0,余个指标来监测其进展。这些目,标包括,a,消除极度贫困和饥饿,b,c,d,e,f,g,h,普及全球初等教育,促进性别平等和提高妇女权力,减少儿童死亡率,提高母亲的健康水平,与艾滋病、疟疾和其它疾病作斗争,保证环境的可持续发展,为促进发展建立全球性的合作关系,8,数据预处理,9,数据集指标解释,Indicator Code,SP.ADO.TFRT,EN.ATM.CO2E.KT,中文含义,人口出生率,二氧化碳排放量(千吨,二氧化碳排放量(吨每人,森林覆盖率,森林面积,改善的水源,结核病发病率,每,10w,人,互联网用户,每,100,人,人口预计寿命,婴儿死亡率(每,1000,活者,5,岁以下死

4、亡率(每,1000,活者,总人口,每,100,人电话线数量,陆地保护区(占总表面积的百分比,肺结核死亡率,每,10w,EN.ATM.CO2E.PC,AG.LND.FRST.ZS,AG.LND.FRST.K2,SH.H2O.SAFE.ZS,SH.TBS.INCD,IT.NET.USER.P2,SP.DYN.LE00.IN,SP.DYN.IMRT.IN,SH.DYN.MORT,SP.POP.TOTL,IT.MLT.MAIN.P2,ER.LND.PTLD.ZS,SH.TBS.MORT,10,可视化展示图形选取,1,定性变量,2,定量变量,3,定性变量与定量变量结合,11,定性变量,1,饼图(扇形图,

5、单一定性变量的分布,每一块扇形的面积大小对应该类数据占总体的比,例大小,极坐标形式的柱形图,12,定性变量,2,堆积柱形图,两个定性变量分布,数量,VS,比例,每个柱形表示数据在在,A,属性的各类分布,每种颜色代表,B,属性的分布,列联表常用的的展示方法,直观展示属性,A,内各类数据的属性,B,各类的分布情况,13,定性变量,3,风玫瑰图,两个定性变量分布情况,极坐标形式的数量型堆积柱形图,每片“花瓣”大小代表,A,属性各类数目,14,定性变量,4,簇状柱形图,两个定性变量分布情况,列联表常用的展示方法,直观对比两个定性变量,的,交叉,15,定量变量,1,直方图,描述单一数量变量分布特征,人为

6、分出组区域,在每组统计数目或者频率,与柱形图有本质区别,可添加拟合曲线看出变量的粗略分布,16,定量变量,2,二维核密度曲线(等高线,用于两个数量型变量点密度分布的展示,散点图的衍生,也可看出两个变量间的关系,17,定量变量,3,气泡图,表示三个数量型变量的关系特征,两个变量以散点图的形式画出,第三个变量,以气泡面积的展示于图中,展示第三个变量随前两个变量的变化,18,定量变量,高维,4,散点图矩阵,用于多个数量型变量关系探究,散点图的延伸,可利用适当的变换对数据进行处理,19,定量变量,高维,5,相关系数图,探索多个数量型变量可能的线性相关关系,红:负相关;蓝:正相关,颜色越深代表相关系数的

7、绝对值越大,20,定量变量,高维,6,平行坐标图,探究多个数量型变量的可能关系,每条标准化之后的记录表示为图上的一组点,并连接,为折线段,便于看出多个变量之间可能的关系,21,定量变量,高维,7,雷达图,将每列数据进行标准化,将条记录画在,一个图上,作几张图的对比,适用于指标多,记录少的数据,22,定性变量,定量变量,1,箱线图,描述一个定性变量与一个数量型变量关系的常用图,五个关键点:最大值、上四分位数、中位数、下四分,位数、最小值,离群点,23,定性变量,定量变量,2,小提琴图,两个一维密度曲线结合而成,展示具有某种特征的变,量的分布特征,中间某处越粗代表指标在此处分布越密集,大部分正值变量呈右偏分布,呈现类似小提琴形状,结合箱线图综合分析,24,定性,定量变量,3,分组图形,用于一个定性变量和若干个数量变量的关,系描述,所有图形集中于同一个画图板上,每种颜色对应同种定性变量数量变量的特,征,25,定性,定量变量,4,分面图形,至多两个定性变量与若干定量变量,将画图板分割为矩阵,将不同的定量变量的图形按照定,性变量的不同画在的不同位置,每个分块对应同种定性变量数量变量的特征,26,总结,1,单一变量:柱形图、饼图,定性变量,2,两个变量:堆积柱形图、簇状柱形图、风玫瑰图,定量变量,1,单一变量:直方图、密度曲线,2,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论