版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章大数据与数据可视化教学目标理解大数据的基本特征与数据思维初步掌握FineBI数据仪表板可视化操作初步掌握Matplotlib数据可视化方法7.1大数据7.1.1大数据的基本特征与数据思维4V特征:Volume(数据规模)、Velocity(数据流转)、Variety(数据类型)、Value(数据价值)数据思维:数据意识、数据获取与处理、数据分析、数据可视化、数据驱动决策、数据伦理与隐私保护7.1.2数据可视化的基本概念数据可视化的定义与目的数据可视化是为了让人们理解数据,从而快速找到数据背后隐藏的现实问题,并有针对性地解决问题数据可视化的准备对数据分析的需求和关注点明确数据分析目的确定可视化要表达的内容及如何凸显用户关注的核心指标7.1.2数据可视化的基本概念常见数据可视化图形:比较类、趋势类、占比类、分布类、关联关系类7.2FineBI数据仪表板7.2.1数据准备连接数据库创建数据集业务包管理添加Excel数据集7.2FineBI数据仪表板7.2.2数据分析与图表应用维度和指标内置函数:聚合函数、统计函数、逻辑函数、日期函数属性设置7.2FineBI数据仪表板7.2.3仪表板布局与其他组件仪表板的整合与复用过滤组件与图表交互其他图文组件:文本组件、图片组件、Web组件、Tab组件7.2FineBI数据仪表板7.2.4资源迁移导出仪表板数据包上传仪表板数据包7.3Matplotlib数据可视化7.3.1线条图和散点图plot()函数与scatter()函数常用颜色、线型、描点标记设置坐标轴、标题、网格线等ucr.csv文件中是编码为GBK的24小时不同分组治疗患者尿肌酐含量数据。用Matplotlib绘制用蓝色虚线连接、描点标记为五角星的折线图importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=Falseudata=pd.read_csv('./ucr.csv',encoding='gbk')gr=udata.groupcr=udata.ucrplt.title('24小时尿肌酐分组比较')plt.xlabel('UCR')plt.xticks(rotation=45)plt.plot(gr,cr,'--*b',label='UCR')plt.legend(loc='upperright')plt.axis('equal')plt.savefig('./ucr.png')#此代码要放在前面plt.show()7.3Matplotlib数据可视化7.3.2柱状图与直方图柱状图:bar()函数直方图:hist()函数plt.bar(gr,cr,color='#7ecef4',edgecolor=color,label='UCR')importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=Falsetdata=pd.read_csv('体检.csv',encoding='gbk')tz=tdata.体重plt.title('某年级学生体重分布')plt.xlabel('体重')plt.ylabel('人数')plt.ylim(0,8)plt.hist(tz,5)plt.axis('equal')plt.show()7.3Matplotlib数据可视化7.3.3饼图pie()函数常用参数:explode、labels、colors等importpandasaspdimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['SimHei']CHN=pd.read_csv('gold.csv',encoding='gbk')gold=CHN.金牌xm=CHN.类别plt.title('第32届夏季奥运会中国队八项比赛金牌占比')explodes=[0]*8#相当于explodes=[0,0,0,0,0,0,0,0],预设都不突出显示explodes[3]=0.2#explodes[3]是第4个,即乒乓球项目plt.pie(gold,labels=xm, #设置数据标签为xmautopct='%.1f%%', #设置扇形里面的文本,数字自动归一化
explode=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年村社传销活动识别题库
- 2026年医疗机构环境表面清洁与消毒试题
- 2026年血站安全生产三年行动题
- 2026年环境保护法及公民环保行为规范专项普法试题
- 2026年大型游乐设施安全技术规程试题
- 2026年烟草系统招聘笔试烟草市场监督管理实务
- 2026年群众性精神文明创建活动组织及群众参与热情激发方法测试
- 2026年校外培训机构培训时间及结束时间限制知识测试
- 临床试验中的随机分组方法
- 临床技术操作规范
- 数学 2025-2026学年北师大版数学八年级下册期中仿真模拟卷(三)(第1-3章)
- 2026安徽省交控建设管理有限公司校园招聘5人笔试参考题库附带答案详解
- 综合管理岗笔试题及答案
- 器械生产清场管理制度
- 2025中国未来交通产业发展全景图及趋势研究报告
- 安全管理与应急处理课件
- 企业所得税筹划研究-以一心堂药业为例
- 2025昌吉州科技馆招牌编制外聘用人员(3人)考试参考试题及答案解析
- 共用支架施工方案
- 药物作用机制-洞察及研究
- 物业营销溢价方案(3篇)
评论
0/150
提交评论