数据可视化技术与应用(Python) 课件 项目9 租房信息数据可视化项目实战_第1页
数据可视化技术与应用(Python) 课件 项目9 租房信息数据可视化项目实战_第2页
数据可视化技术与应用(Python) 课件 项目9 租房信息数据可视化项目实战_第3页
数据可视化技术与应用(Python) 课件 项目9 租房信息数据可视化项目实战_第4页
数据可视化技术与应用(Python) 课件 项目9 租房信息数据可视化项目实战_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据可视化技术与应用租房信息数据可视化项目实战项目导读作为租房网站的商家,租房信息数据可视化项目实战能够为其客户提供帮助。该项目旨在以可视化的方式展示租房信息数据,包括三大租房网站排名数据、典型租房城市排名数据和租房价格相关性数据等。收集和整理这些数据,并利用数据可视化技术将其以气泡图和热力图的形式展示出来,以便更好地理解和分析目前租房的状况和趋势等信息。项目导读01洞察市场和趋势03用户体验优化02租房定价和策略制订通过对租房信息数据进行可视化展示和分析,租房网站商家可以更直观地了解三大租房网站的排名情况,以及典型租房城市的排名情况,这有助于租房网站商家获取市场洞察和趋势,为他们的租房业务决策提供支持和参考。通过租房价格相关性数据的可视化,租房网站商家可以更好地了解租房价格与其他因素的关系,如城市、地区和房型等,这有助于租房网站商家制定合理的租房定价策略,提高租房业务的竞争力。通过可视化技术展示租房信息,租房网站商家可以更好地了解租房用户对不同房源的需求和喜好,这有助于租房网站商家优化租房网站的用户界面和功能,提升用户体验,吸引更多的租房用户。项目目标知识目标能力目标素养目标掌握气泡图的绘制方法掌握热力图的绘制方法思考气泡图和散点图的区别掌握PyEcharts中的配置选项通过租房信息可视化案例培养学生的探究精神通过租房信息可视化案例培养学生数据驱动决策的意识三大租房网站排名数据可视化项目实战典型租房城市排名数据可视化项目实战0102目录CONCENTS租房价格相关性数据可视化项目实战03总结与建议049-1三大租房网站排名数据可视化项目实战过滤三大租房网站排名数据的异常字符使用气泡图进行数据的可视化分析0102目录CONCENTS9-1-1过滤三大租房网站排名数据的异常字符过滤三大租房网站排名数据的异常字符从“素材与案例\项目9\数据集\”路径中找到“中国租客信息数据集.csv”文件,该数据集的文件类型依然为CSV,使用Python处理CSV文件可以使用pandas模块。打开“中国租客信息数据集.csv”文件,其中一共30列数据,每列字段名如下图所示。过滤三大租房网站排名数据的异常字符importpandasaspddf=pd.read_csv(r'c:\Users\Administrator\Desktop\中国租房信息数据集.csv',encoding='gbk')#读取CSV文件allowed_names=['网站A','网站B','网站c']#设置允许的租房网站名称列表invalid_rows=df[~df['租房网站名称'].isin(allowed_names)]#判断是否存在异常字符ifinvalid_rows.emptyprint("没有异常字符")》else:invalid_row_numbersinvalid_rows.index.tolist()#输出存在异常字符的行号print("存在异常字符的行号:",invalid_row_numbers)代码如下:过滤三大租房网站排名数据的异常字符代码运行结果:过滤三大租房网站排名数据的异常字符针对上述代码,需要对invalid_rows=df[~df['租房网站名称'].isin(allowed_names)]进行讲解,这组代码的作用是从DataFramedf中选择不在允许的网站名称列表allowed_names中的行。具体解释如下:df['租房网站名称]:选择了DataFramedf中的一列,该列包含租房网站的名称。代码讲解:过滤三大租房网站排名数据的异常字符名称是否在允许的网站名称列表allowed_names中,然后使用波浪线~对结果取反,即选择不在允许的网站名称列表中的行。invalid_rows=df[~df['租房网站名称'].isin(allowed._names)]:将选择的行赋值给变量invalid._rows,这些行包含不在允许的网站名称列表中的数据。通过这组代码,读者可以过滤掉不在允许的网站名称列表中的行,只保留允许的网站名称对应的行数据。代码讲解:9-1-2使用气泡图进行数据的可视化分析使用气泡图进行数据的可视化分析1、使用气泡图进行数据的可视化分析气泡图用于展示多个变量之间的关系。它通过在二维平面上绘制圆形气泡来表示数据,其中气泡的位置代表两个变量的取值,气泡的大小代表第3个变量的取值。观察气泡的位置和大小,可以直观地了解变量之间的关系和趋势。气泡图的构成如下图所示。使用气泡图进行数据的可视化分析使用气泡图进行数据的可视化分析这个表格清晰地展示了散点图和气泡图在不同方面的区别和特点。散点图适用于展示两个变量之间的关系,使用横轴和纵轴来表示变量值,数据点以离散的点表示;而气泡图适用于3个变量的展示,除了横轴和纵轴,还使用气泡的大小或颜色来表示第3个变量的值,数据点以气泡的形式呈现。同时,气泡图可以更直观地展示数据点之间的差异,提供额外的数据维度。使用气泡图进行数据的可视化分析#导入所需的库和模块frompyecharts.chartsimportScatter#导入Scatter类frompyechartsimportoptionsasopts#导入选项模块,用于配置图表的参数frompyecharts.globalsimportThemeType#导入内置主题类型importwebbrowser#导入webbrowser模块,用于在浏览器中打开HTML文件importpandasaspd#导入pandas库,用于数据处理df=pd.read_csv(r'c:\Users\Administrator\Desktop\中国租房信息数据集.csv',encoding='gbk')#读取数据集#使用pandas读取CSV数据文件#统计数据name_counts=df['租房网站名称'].value._counts()#对租房网站名称列中的值进行计数,得到每个名称的出现次数代码如下:使用气泡图进行数据的可视化分析#准备气泡图数据x_valueslist(range(len(name_counts)))

#创建一个与网站数量相同长度的列表,作为气泡图的×轴数据y_valuesname_counts.tolist()

#将租房网站名称的计数转换为列表,作为气泡图的y轴数据bubble._sizes=y_values#使用计数作为气泡的大小#创建气泡图对象bubble_chart=(Scatter(init_opts=opts.Initopts(theme=ThemeType.LIGHT))#初始化一个Scatter对象,设置为浅色主题.add_xaxis(name_counts.index.tolist())

#设置x轴数据为租房网站名称.add_yaxis(series._name="租房网站",

#设置系列名称代码如下:使用气泡图进行数据的可视化分析y_axis=y_values,

#设置y轴数据symbol_size=bubble_sizes) #设置气泡大小,根据计数动态变化.set_global_opts (title_opts=opts.Tit1eOpts(title="租房网站排名",pos_left='center'),#设置图表标题legend_opts=opts.Legendopts(is_show=False),visualmap_opts=opts.VisualMapoptstype_="size",

#设置视觉映射类型为按大小映射max_=max(bubble._sizes),

#视觉映射最大值min_=min(bubble_sizes),

#视觉映射最小值pos_right='0px')))#视觉映射组件位置#渲染图表到HL文件,并用浏览器打开bubble_chart.render("bubble_chart.html")#渲染图表,并保存为bubble_chart.html文件webbrowser.open("bubble_chart.html")#使用默认浏览器打开HTML文件代码如下:使用气泡图进行数据的可视化分析由下图可以看出,3个网站的租房信息数据排名差距并不大,但也能看出在一些城市,大众对网站C的认可度是比较高的。代码运行结果:使用气泡图进行数据的可视化分析上图中右下角的下三角是视觉映射组件,

由Visua1MapOpts类实现,

该类中的字段是PyEcharts中用于配置视觉映射组件的参数。

视觉映射可以通过不同的视觉表现

(如颜色、大小、

明暗等)

来展示数据的差异或分布情况。Visua1MapOpts类中常用的一些配置选项见下表。代码讲解:使用气泡图进行数据的可视化分析VisuaLMapOpts类中常用的配置选项使用气泡图进行数据的可视化分析如果想将气泡图的代码修改为散点图的代码,只需删除symbol_size=bubble_sizes,该代码是根据计数动态变化设置气泡大小的。另外,还需要删除前面提到的视觉映射组件,即visualmap_opts=opts.VisualMapOpts(type_="size",max_=max(bubble_sizes),min_=min(bubble_sizes),pos_right='Opx'),这些代码是针对不同气泡大小设置的,所以散点图也不需要,修改完毕后再次运行代码即可得到如图9-5所示的散点图。代码讲解:使用气泡图进行数据的可视化分析使用气泡图进行数据的可视化分析由上图可以发现,虽然3个点所对应的纵坐标值不同,但是点的大小是一样的。另外,针对使用PyEcharts创建的气泡图,也可以使用Matplotlib生成可视化气泡图。代码如下:importmatplotlib.pyplotaspltimportpandasaspdimportnumpyasnpplt.rcParams['font.sans-serif']['simhei']

#设置字体为SimHeidf=pd.read_csv(r'C:\Users\Administrator\Desktop\中国租房信息数据集.csv',encoding='gbk')

#读取数据集#统计数据name_counts=df['租房网站名称'].value_counts()使用气泡图进行数据的可视化分析websites=df['租房网站名称'].unique()#准备气泡图数据x_valuesnp.arange(len(websites))y_valuesname_counts.tolist(bubble_sizesy_valuesbubble_sizes[size0.2forsizeinbubble_sizes]#缩小气泡的大小#创建气泡图plt.scatter(x_values,y_values,s=bubble_sizes,alpha=0.5)p1t.x1abe1('租房网站类别)p1t.y1abe1('网站数量')p1t.tit1e('租房网站排名')代码如下:使用气泡图进行数据的可视化分析name_counts=df['租房网站名称'].value_counts()plt.xticks(x_values,websites)

#设置横坐标刻度标签plt.ylim(0,max(y_values)1.1)

#设置纵坐标范围plt.show()

#显示图形代码如下:运行上述代码,可以显示用Matplotlib生成的气泡图。使用气泡图进行数据的可视化分析对比Matplotlib和PyEcharts生成的气泡图和代码可知,Matplotlib是一个使用广泛的绘图库,提供了大量的绘图功能和自定义选项。它需要较多的代码来创建和定制图形,但提供了更多的灵活性和自定义选项。在Matplotlib中,需要使用plt.scatter()函数创建气泡图,并通过调整参数来控制气泡的大小、颜色和不透明度等。Matplotlib适合在静态的环境中生成图形,如保存为图像文件显示。PyEcharts是一个基于Echarts库的Python图表库,具有更高的抽象层级。使用气泡图进行数据的可视化分析它提供了简单的API调用来生成各种图表,并提供了丰富的主题、样式和交互选项。在PyEcharts中,使用Scatter()类创建气泡图,通过add_xaxis()和add_yaxis()方法设置数据,并通过set_global_opts()方法设置坐标轴标签和标题。PyEcharts适合在Web应用程序和可交互式环境中生成图表,可以通过HTML文件进行显示。总的来说,Matplotlib提供了更多的灵活性和自定义选项,而PyEcharts提供了更高的抽象层级和交互功能。选择使用哪个库取决于读者的需求和个人偏好。9-2典型租房城市排名数据可视化项目实战典型租房城市排名数据的操作使用热力图进行数据的可视化分析0102目录CONCENTS9-2-1典型租房城市排名数据的操作典型租房城市排名数据的操作在该任务中,同样使用在子项目9-1用到的数据集“中国租房信息数据集.csv”,子项目9-1用到了“租房网站名称”列,这里将使用“租房网站名称”和“城市”列,如图9-7所示。本任务需要处理“城市”列,对“城市”列的处理和子项目9-1中处理“租房网站名称”列一样,只需参考子项目9-1即可。9-2-2使用热力图进行数据的可视化分析使用热力图进行数据的可视化分析热力图是一种用于可视化数据分布和集中程度的图表。它通常以数据矩阵的形式呈现每个数据矩阵的颜色深浅表示对应数据的数值大小。较深的颜色代表较高的数值,较浅的颜色代表较低的数值。通过热力图快速了解数据的分布情况和集中程度,可以得出有关数据集的有益见解。热力图广泛应用于各个领域,如地理信息系统、生物学和金融分析等,为人进行数据分析和做出决策提供了强大的可视化工具。热力图的构成如图9-8所示。使用热力图进行数据的可视化分析图9-8热力图的构成使用热力图进行数据的可视化分析由图9-8可以看出,热力图提供了直观且易于理解的数据可视化方式,通过使用颜色编码和渐变效果,使复杂的数据模式和趋势一日了然。热力图的特点和优势见表9-3。表9-3热力图的特点和优势使用热力图进行数据的可视化分析frompyecharts.chartsimportHeatMapfrompyechartsimportoptionsasoptsimportpandasaspdimportwebbrowser#读取数据集df=pd.read_csv(r'C:\Users\Administrator\Desktop\中国租房信息数据集.csv',encoding='gbk')#获取唯一的城市和租房网站名称列表cities=df['城市'].unique().tolist()websites=df['租房网站名称'].unique().tolist()#创建热力图对象代码如下:使用热力图进行数据的可视化分析heatmap=(HeatMap().add_xaxis(cities).add_yaxis("租房网站名称",websites,[[city,website,df[(df['租房网站名称']==website)&(df['城市']==city)].shape[o]]forwebsiteinwebsitesforcityincitiesl,代码如下:

通过图9-9可以看出,并没有哪个租房网站在所提到的3个城市都有较大的优势,反而是根据业务重心不同,所布局的城市是不同的。使用热力图进行数据的可视化分析运行结果:代码运行结果如图9-9所示。使用热力图进行数据的可视化分析在创建热力图的代码中,使用PyEcharts2.0版本创建的热力图不再使用HeatMap()类,因为这个类在新版本中已经不存在,取而代之的是使用HeatMap功能通过Chant类的不同配置来实现,即通过pyecharts.charts来配置HeatMap类。下面介绍在PyEchants2.0版本中HeatMap类的方法及其参数。add_xaxis(x_axis_data):添加热力图的轴数据。x_axis_data是一个列表,包含了热力图X轴上的数据点。代码讲解:使用热力图进行数据的可视化分析add_yaxis(series_name,y_axis_data):添加热力图的Y轴数据和对应的系列名称。series_name是一个字符串,表示系列的名称,用于在图例中展示。y_axis_data是一个列表,包含了热力图Y轴上的数据点。set_global_opts(opts):设置热力图的全局配置项。参数opts是一个配置项对象,用于配置热力图的全局属性,如标题(TiteOpts)、视觉映射(VisualMapOpts)、提示框(TooltipOpts)和工具箱(ToolboxOpts)等。代码讲

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论