共享单车的数据可视化系统_第1页
共享单车的数据可视化系统_第2页
共享单车的数据可视化系统_第3页
共享单车的数据可视化系统_第4页
共享单车的数据可视化系统_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、目 录摘要1Abstract2第一章 绪论31.1研究背景及意义31.2共享单车发展趋势及存在的问题31.2.1共享单车的兴起背景31.2.2共享单车的发展现状41.2.3共享单车发展的机遇和挑战51.3 本文的组织结构7第二章 相关工作82.1国外共享单车背景调查82.1.1美国共享单车市场概况82.1.2 未来展望92.2数据可视化系统简介102.1.1数据可视化系统102.1.2 数据可视化的实现102.1.3发展情况和应用领域11第三章 需求分析和系统结构143.1需求分析143.1.1功能需求143.1.2性能需求143.2系统结构设计143.3系统应用部署16第四章 设计的实现17

2、4.1数据的获取和描述174.2数据库设计194.3前后台功能实现、224.3.1利用数据可视化画散点图224.3.2利用数据可视化每日使用情况234.3.2 对用户信息进行可视化24第五章 运行测试和分析结果265.1 运行测试265.2 站点散点图分析265.3用户使用时间分析295.3.1每天使用情况图305.3.2二十四小时使用图305.4 用户类型分析315.4.1用户类型分析315.4.2 用户性别分析335.4.3用户年龄分析34第六章 总结与展望366.1 本文工作总结366.2未来工作展望36参考文献38致谢39摘要近年来,共享经济在我国发展迅速,收到了政府和广大民众的重大关

3、注,而出现的很多问题也引起了众多学者的注意,关于共享单车的研究也越来越多。共享单车是指企业在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供自行车单车共享服务,是一种分时租赁模式。从共享单车数据中比如使用次数、骑行时间、骑行时长、起点和终点经纬度坐标等属性,我们可以看出人们的许多习惯从而进行研究。我们做一个数据可视化的系统要能做到文件上传,文件解析,文件数据可视化等功能,从而完成进一步分析。关键词:共享单车 数据可视化 数据分析AbstractIn recent years, the sharing economy has developed rapidly in China and

4、 has received significant attention from the government and the general public. Many problems have also attracted the attention of many scholars. There are also more and more studies on sharing bicycles. Shared bikes refer to the sharing of bikes on campus, subway stations, bus stops, residential ar

5、eas, commercial areas, and public service areas. It is a time-sharing rental model. From the shared bike data, such as the number of uses, riding time, riding time, starting and ending latitude and longitude coordinates, we can see many habits of people and conduct research. We can do a data visuali

6、zation system to be able to do file upload, file analysis, file data visualization and other functions, and further analysis.Key words:Shared bikes data visualization data analysis第一章 绪论1.1研究背景及意义我毕业设计的选题是“共享单车的数据可视化系统”,共享单车是一个近年来很热门的新兴事物, 共享经济在我国发展迅速,收到了政府和广大民众的重大关注,而出现的很多问题也引起了众多学者的注意,关于共享单车的研究也越来

7、越多。共享单车是指企业在在一些人群密集的行程出发点或结束点向出行人提供自行车共享服务,然后按消费时长或者骑行距离收费,是一种分时租赁模式。从共享单车数据中比如使用次数、骑行时间、骑行时长、起点和终点经纬度坐标等属性,我们可以看出人们的许多习惯从而进行研究。我们可以通过可视化更好的去了解和研究共享单车,为研究者们提供许多新的角度。我们做一个数据可视化的系统要能做到文件上传,文件解析,文件数据可视化等功能,从而进一步分析。这个系统的功能有读取csv文件,保存并分析数据,将数据可视化:显示出发结束点,显示集散散点图,显示轨迹等,可以选择显示哪些数据。1.2共享单车发展趋势及存在的问题在过去的两年里,

8、共享自行车在全国各地兴起,特别是在一线城市,也有一种不断扩大的趋势。目前,在中国共享自行车方兴未艾。在过去的两年里,共享的自行车就如雨后春笋一样涌现出来,带来了一种新的出行途径。作为共享经济理念下的一个新方面,共享单车受到许多投资机构的青睐。除了刚开始带头的小黄车和摩拜单车,又有源源不断很多新的品牌加入。到目前为止,已经制造了超过20种单一类型的共享单车。本文采用数据可视化系统,希望能有助于更好地理解共享自行车。1.2.1共享单车的兴起背景2014年首批共享单车诞生在北京大学的校园。2013年戴威从本科毕业后开始了他成为ofo小黄车首席执行官兼创始人第一步,当时他已被北大保研,但是戴维去了青海

9、省大通县东峡镇支教。东峡镇位于西北偏远山区,生活条件比较艰苦,他为了改善生活每周去一次县城,而他去现成的交通工具就是一辆老自行车。每周不断的骑行戴威想起在大学四年里他丢失了5辆自行车,很多同学都有过这样的麻烦,当你需要去一些汽车不方便到达的地方的时候,你的身边却没有一辆单车。他突然明白骑车去旅游并不是所有人都需要的,但是出行却是每个人都需要的。因此,2014年,第一代共享单车在北京大学的校园内诞生。随着共享经济的兴起,依赖互联网的进步与发展,出现了一种全新的商业模式共享经济,一般是指基于陌生人且存在物品使用权暂时转移的,以获得一定报酬为主要目的一种新的经济模式1。它的本质在于统筹调配线下的暂时

10、没有人使用的产品或者服务,让他们以更低,更经济的价格提供产品或服务。而支撑共享经济发展的理念在于,“人们需要的是产品的使用价值,而非产品本身”2。所以在这样共享经济的理念之下,用户共享我们单车的价值,而又不需要去购买单车的所有权,从而实现了资源更好的分配和利用。互联网技术的进步发展和流行。众所周知,共享单车的使用依赖于互联网技术。其核心环节包括找车、开锁、还车和计费等,都严重依赖一张高质量的无线网络将单车与云端服务器稳定连接起来3。随着互联网技术的发展、5g技术长码短码控制码的钻研、芯片技术含量的提高和网络的覆盖为共享单车的应用提供了强有力的支持。1.2.2共享单车的发展现状所谓共享单车,是指

11、企业在地铁站点、校园、公共服务区、公交站点等提供自行车共享服务。这是一种分时租赁模式4。作为一个新型的的共享经济理念的代表,共享单车一问世就被许多投资机构所看好,不仅仅是最始的ofo小黄车和摩拜单车,后面还有许多源源不断加入的新品牌。这些共享单车都纷纷完成了他们的融资,并且时间短,融资金额大。表1.1部分共享单车融资情况表1.2.3共享单车发展的机遇和挑战作为一个被许多投资机构所看好的新奇事物,共享单车具有很好的前途和未来。它的出现是社会和时代飞速发展和进步的产物,在刚刚开始阶段拥有其快速发展的机会。与机遇和挑战并存的是刚开始阶段所遇到的困难。只有客服这些困难,共享单车才能够更快更好的发展。(

12、1) 共享单车发展的机遇1).有利于贯彻落实可持续发展。摩拜单车CEO王晓峰认为,与政府倡导的低碳节能,绿色出行相一致,是共享单车快速成长的重要前提5。共享单车作为一种绿色环保并且有益身体的出行方式,有利于用户的身体健康、缩短了出行时间并且节能减排有益环境,对于实现可持续发展有着重要的意义。2).市场需求庞大。一是在解决了部分用户的出行难题,从出门到地铁口或者是公交车站这一段距离如果用骑行来代替步行可以很好的节省时间。而且在大城市里面,很多时候邮费高,堵车,停车难等问题都使得用户选择共享单车。二是作为一种环保健康的绿色出行方式,共享单车既能节能减排保护环境,又可以锻炼身体,所以很廋用户喜爱。(

13、2) 共享单车所面临的挑战图1.1 2016年中国单车租赁市场主要问题分布图1).一部分用户破坏或占有单车。共享单车私有化现象、破坏共享单车现象一直很严重。部分使用者不了解“共享”的含义,为了自己的便利或者贪婪将单车锁上自己的锁,涂改破坏二维码等等,这些都导致了单车的维修和重新投放,大大提高了成本,并且在一定程度上浪费了许多的资源。2).严重的随意停放现象。共享单车开始的设计理念就是走到哪停在哪,为用户提供更便捷的用车服务,可是这也造成了严重的随意停放现象。此外,城市里的空地资源十分有限,尤其是一些大城市,也没有明确的自行车停放区域,这些都容易造成停车难或者引发相关问题。共享单车随意停放在路边

14、或者人行道一定程度上会影响市容,妨碍交通,严重的话甚至会引起交管部门的介入。3).共享单车公司没有做好服务和管控。很多共享单车企业在刚开始获得融资的时候,为了能够抢占市场或者扩大市场份额,大量投放共享单车。这个做法不仅使得过剩的单车被浪费,也使得占地过大从而造成了单车的随意停放。其次,很多被破坏的单车回收后并没有被及时维修而是堆积成山,因为某种程度上维修成本才超过了重新投放单车的成本。这点也造成了资源的闲置浪费。1.3 本文的组织结构本文分为六章,各章内容介绍如下:第一章:绪论。本章介绍了课题的研究背景及意义,介绍了共享单车大致的发展情况,最后介绍本论文的组织结构。第二章:相关工作介绍。本章主

15、要介绍了研究对象citibike所在国家共享单车发展的背景,以及数据可视化的系统的简介,如何实现数据可视化系统并举了一些实际应用的例子。第三章:系统需求分析和系统结构。描述系统的功能需求、性能需求等其他需求,同时说明了系统的层次,给出了层次图和相关的应用部署。第四章:设计的实现。包括数据的获取,数据库的设计还有前后端如何实现等三个部分,大致说明了设计的思路第五章:运行测试和分析结果。运行完成的代码,测试可视化系统并对可视化的结果进行分析。 第六章:总结与展望。本章总结了全文,并且对本系统的不足以及对系统的展望作出了比较详细的阐述。第2章 相关工作2.1国外共享单车背景调查在以往的科技互联网世界

16、里,人们习惯把硅谷当成目标或者标杆,并且把这个“创新创业圣地”的成功方式介绍到自己的国家,这已经是先进科学圈的一种思维习惯,现在这样的趋势正在悄然改变。2.1.1美国共享单车市场概况根据美国国家城市交通协会最近发布的一份报告,近几年来美国的共享单车的骑行次数已经超过了八千万次。在2016年,共享单车在美国的骑行次数超过了两千八百万次,这个数字大概相当于每年美国人达成铁路交通的总次数了,大大超过了每年迪士尼乐园的游览次数。图2.1 美国共享单车市场份额2016 年的骑行的次数比前一年增长了四分之一,越是大城市的共享单车项目所对应的骑行次数也越多,包括New York的 Citi Bike(花旗自

17、行车,也是我们的数据来源)、Washington D.C.的 Capital Bikeshare(首都自行车)、Miami的 Citi Bike、Chicago的 Divvy以及Boston地区的 Hubway,这几个大型贡献单车品牌的市场份额占了八成以上。目前,全美国的单车共享项目(拥有超过十个停车点并且超过一百辆共享单车)的数目正在飞速上升中,这个数字已经从2010年刚开始的四个增长到了2016年的五十五个系统,其中,超过八成的能够经营超过1年的共享单车系统在慢慢扩大规模。2016年有两大单车共享系统正式启动,一是在Portland的 BIKETOWN,二是在LA的 Metro Bike

18、Share,全国自行车的数量也在飞速上升。图2.2 美国共享单车增长情况美国的第一个共享单车系统开始于2010年,那时候全美国只有一千六百辆共享单车,2013年,一个更大的共享单车项目被开启,从2012年的七千辆飞速上升到了2013年的一万九千辆,然后进一步增加到了2016年的四万两千辆。共享单车数量的增加的同时,质量也在提高。最近几年智能共享单车(smart bike)的份额在不断的提高。这些智能共享单车运用了更加智能的车载设备和停车设施。从2014年第一辆智能车在美国出现到现在为止,比例正在不断地增加。2.1.2 未来展望目前,美国单车项目仍在增长,许多城市,包括Detroit、City

19、of New Haven、New Orleans,或已选择供应商,或正计划启动相关项目,许多现有的共享单车系统仍在计划扩大,如纽约citibike项目。共有2000辆车增加到12000辆,Houston将在100个单点增加车辆,San Francisco Bay Area计划将目前的700辆车辆共享系统扩展到7000辆车6。单车的发展趋势是实现一个低成本,便捷的一体化经济城市交通系统,更多的人使用单一的汽车共享系统意味着更多的人得到体育锻炼、节约时间,或者更容易获得经济机会。许多城市将更深入地融入社会,雇佣当地人,建造特殊的自行车道,创造更便宜的价格体系,这将更有利于促进所有群体中共享自行车的

20、普及。2.2数据可视化系统简介2.1.1数据可视化系统在如今这个大数据时代,数据发现数据挖掘数据分析无处不在。我们从citibike网站上获得的数据可以了解到共享单车的试用情况包括站点,使用时长等各个方面的具体情况,然后通过数据可视化使其更直观更具体的展现出来。这个系统我们可以自行上传csv文件令其读取,从而对其他数据也可以进行展示,可以自定义要去展示的参数。数据可视化技术是运用计算机图形学和数据处理技术,将数据进行读取分析并按照要求显示成为图标或者图像然后再进行处理的一门技术。数据可视化概念首先来自科学计算可视化(visualization in scientific computing),

21、这不仅仅是将数据可视化,还要计算这一过程中数据的变化。随着计算机技术的发展,数据可视化概念已经扩张,现在不仅包含科学计算数据的可视化,而且包含工程数据和测量数据的可视化,学术界常把这种空间数据的可视化称为可视化(volume visualization)技术7。2.1.2 数据可视化的实现随着互联网技术的飞快发展,数据可视化的技术也在不断的提升,现如今已经进入了大数据时代,数据可视化技术作为分析数据的一种重要的手段,值得引起我们对重视。随着数据可视化技术的发展,有很多优秀的工具可以让我们来实现数据可视化,你如JQchart、xcharts、highcharts和echarts等,本文便是运用了

22、echarts来实现数据可视化。Echarts有百度商业前端数据可视化团队开发,底层基于一个叫ZRender的轻量级canvas库,拥有坐标系,图例等许多基本的组建,可以用来创建饼状图、折线图、散点图和雷达图等各种图表,也支持任意维度的堆积和多图标混合展示8。2.1.3发展情况和应用领域最近几年来,随着网络运用和电子商务的飞速发展,对我们科学数据的研究也提出了更高的标准和要求,数据可视化技术也随之飞速进步。我们可以应用数据可视化技术,发现很多在金融,商业还有通信等数据中隐含的规律,从而提供决的依据。这些已经成为了书库可视化技术中的热门方面。因为各方面的发展需求,数据可视化系统在近几年也不断涌现

23、,像Tableau,echarts等都是优秀的数据可视化工具。数据可视化技术的应用方面十分广泛,几乎在大多数领域都可以运用:自然科学,金融,商业,网络通信,工程等各个方面。近年来是数据可视化技术发挥着越来越大的作用。其中数据可视化技术主要用于以下几个领域:1).医学数据可视化技术已经广泛用于医学的各个方面。数据可视化在医学应用中的核心技术,是构建人肉眼看不到的身体器官的3D模型,从而根据这些图像模型来进行诊断。尽管3D数据处理技术与显示效果更好,但它需要基于庞大的数据量统计,而且计算方式很复杂,因此还需要对其进行进一步的科学研究从而才能更好地利用这项技术解决医学问题。3D数据的可视化,目前在脑

24、部核磁共振图像序列重建中有着广泛的应用,主要为图像分割技术、标定多重数据集合图像技术以及实时渲染技术这三个方面9。 2) .新闻新闻就是最新鲜的消息,其中必然包含了大部分的数据,这也就涉及到了数据分析或者数据处理,在这里我们就可以用数据可视化来分析处理新闻索要给我们呈现的数据,从而能让观众简洁明了的了解新闻中所要传达给我们的数据。就像下图直接明了的可以看出柏林的房价在这几年的涨幅,还有不同地区的房租区间也用色块明显的表达了出来,让人一看就懂。图2.3 新闻中的数据可视化3).气象预报数据可视化在气象方面的运用也十分广泛,我们平常看的天气预报上面的全国气象图,风向图等都在一定程度上运用了数据可视

25、化。在天气大数据系统中,利用全球气象监测数据与计算结果来显示全世界不同时期的天气情况的图像,从而对全球气象进行了深入研究和预测。如下图就是一个调用echarts来进行数据可视化的简单的例子,我们可以从图表中清晰的看出一周中气温的变化,亦可以读出每天最高或者最低温度的数据。图2.4 天气中的数据可视化4).公共监管图2.5 公共管理中的数据可视化数据可视化在公共监管上面也有着很大的运用。相关部门每天都要对相关文件进行资格检验或者审批,有时候面对海量的数据处理很容易在疲惫之下出现错误从而导致误差。这个时候我们引入数据可视化系统,不仅能够把数据简洁明了的显示出来,更能够清晰的反映出对比关系,让人一看

26、就懂。第3章 需求分析和系统结构3.1需求分析3.1.1功能需求(1) 上传文件:能从本地上传csv格式的数据文件(2) 保存数据:读取文件,并对文件中的共享单车的数据进行分类保存(3) 读取保存的数据,对数据进行可视化:a. 形成一个根据经纬度分布的共享单车站的散点图,同时也能反映出每个单车站点被使用的次数;b. 形成一个每个月内按天数计算的共享单车使用次数的柱状图;c. 形成一个每天内按二十四小时计算的共享单车使用次数的柱状图;d. 形成一个按是否会员分类的饼状图;e. 形成一个按性别分类的饼状图;f. 形成一个按年龄分类的饼状图;(4) 历史文件查询:有一个历史文件查询功能,能够快速的检

27、索到以前使用过的csv文件。3.1.2性能需求(1) 文件读取快速,数据保存准确,不会出现数字误差;(2) 系统响应时间短运行快速;(3) 可视化图形简洁明了,方便理解。3.2系统结构设计这一节着重讨论共享单车可视化系统的设计,主要考虑系统的结构设计,要综合可行性、开发性和效率等多个方面综合考虑。可视化技术在近年发展迅速,可视化工具与方法也出现很多,大量的数据可视化开源工具库被开发出来,大大提高了开发的交互性和效率。本文构建的是基于web端的共享单车数据可视化系统,系统结构分为三层:1) 用户层:作为系统的用户界面,我们采用web页面的模式,运行代码之后我们点击生成的网址进行访问。我们可以在用

28、户界面进行文件上传、查看可视化的结果和查看历史文件。2) 数据库层:这一层是数据库用来存储数据、查询数据和计算数据,我们可视化所需要的数据就从这里取得。主要包括:日期、时间、开始站点、结束站点和用户个人信息(性别,年龄)等。我们的系统采用MySQL作为数据库。3) 服务器层:服务器层是位于用户层和数据库层之间的层面。一边接受来自用户界面的请求,然后再根据这些请求向数据库申请数据。得到数据之后对数据进行处理,最终得到可视化的画面再返回到用户层。系统层次如下图所示: 图3.1 系统层次图3.3系统应用部署1) 用户层作为前端,我们以web的形式可以用浏览器打开,运行程序以后会出现一个网址,点击网址

29、就可以进入共享单车数据可视化系统。我们利用html来构建网页的内容结构,用python语言作为前后端的桥梁。2) 后台服务器的框架有很多种,我们这里用的是基于python的flask框架,虽然规模较小,但支持一个小型的系统绰绰有余。本文的可视化系统只是对共享单车的一些基本数据进行图表绘制,系统规模比较小,所以就采用了flask框架。服务器层运行在flask搭建的本地服务器上,便捷且效率高。3) 数据库我们采用的是MySQL,操作方便,运行速度也快,也较为适合本文这个小型系统。第四章 设计的实现4.1数据的获取和描述本次实验的数据文件,是从美国纽约的花旗单车也就是citibike官网上下载的共享

30、单车的相关数据。这些数据文件都是csv格式的,包括开始时间,结束时间,开始站点,结束站点,使用者信息等。图4.1 共享单车ER图图4.2 原数据文件本文中用2014年02月的数据来举例,数据文件如上图所示。在用户层面,我们首先点击上传文件的指令,如果此时会判断文件类型,如果上传成功则会返回上传成功的消息,服务器得到指令之后就开始读取数据。图4.3 文件上传界面我们还附加了一个读取本地历史文件的窗口,方便快速检索以前曾经上传过的文件,我们可以在上传的目录中检索到。 图4.4 历史文件上传我们读取我们想上传的csv文件,因为要把数据都上传到数据库中,先分割数据得到数据库名,判断数据库是否存在。然后

31、创建一个表,因为这里的数据种类很多,我们首先建立一个列表,保存必要的数据。把时间进行切割,得到具体的天,然后我们把列表内每个元素用作字典,包括日期,小时等,最后把数据保存进列表。大致流程如下图。 图4.5 文件上传流程图4.2数据库设计读取文件中的数据都保存到数据库之后我们可以得到一下一个数据总表:图4.6 数据库总表将数据上传到数据库之后,我们就可以进行可视化了。我们在前端输入分析数据的指令之后,服务器层面接受到了指令就可以调用在数据库里面的数据了。图4.7 数据库操作界面数据库的结构是数据库字段和csv文件一一对应,先将每个元素都保存到数据库中,等到我们需要数据的时候,再对得到的数据进行处

32、理,筛选,我们共画了六个图建立了以下三个ER模型:图4.8 用户信息ER图图4.9 使用时间ER图图4.10 租车点ER图4.3前后台功能实现、前端方面,我们利用一个web可视化框架flask来构造前端的用户层面,用来进行操作,发出指令。后台的服务器,我们是利用flask搭建的本地小型服务器,方便快捷。服务器取到数据之后就可以对数据进行可视化了,我这里用的可视化方法是调用echarts来进行可视化。4.3.1利用数据可视化画散点图首先要处理的是站点散点图,我们先筛选数据,去掉没有用的时间,日期,用户信息等数据,建立一个表用来保存起始站,出发站等数据进行处理。我们构建一个坐标轴,将每个站点定义为

33、一个三维数组(经度,纬度,使用数量),可以将每个站点根据位置显示到坐标轴上,而点的大小也就表示了这个站点被使用次数的多少。定义每个点的三维数据,定义一个三维数据item,把每个点的经度,纬度都保存在item中,然后用一个计数器来统计使用次数。最后我们调用echarts中的scatter函数,将每个点的三维数组赋值则可完成可视化。具体的流程如下。图4.11 散点图可视化流程图4.3.2利用数据可视化每日使用情况我们把每个数据的时间这个项目提取出来,绘制成一幅每天共享单车使用数量的柱状图。同样是调用echarts。先将日期数据进行去重处理,然后定义数据,横轴为日期,一个月有三十天,纵轴为使用次数。

34、对每天使用数据进行了可视化之后我们可以清晰的看出一个月内每天使用量的对比,表格下面还配了一个按钮,是用来选择我们要显示的天数的,我们可以一次性将一个月的全部天数都显示出来,也可以选择只显示某几天来单独对比。提取数据列表中使用时间的小时,我们可以整合出一天二十四小时的使用图像。一样的先对数据进行去重,然后调用echarts进行可视化。4.3.2 对用户信息进行可视化数据中包含许多用户的信息包括出生年份,性别,会员身份等,我们可以对这些数据进行可视化,然后分析citibike最终的面向群体是哪些人。图4.12 Citibike用户信息图我们还是先筛选数据,选取出我们需要的信息,然后再进行可是画,利

35、用select语句我们可以得到以下的一张用户信息表。表4.1 用户信息表得到我们想要的数据之后,调用echarts里面的pan函数来绘制饼状图就可以了。第5章 运行测试和分析结果5.1 运行测试完成了代码的编写,我们可以开始对这个系统进行运行测试了,运行代码之后,提示栏会有一个提示让你打开我们的web前端。图5.1 web打开提示打开网页之后,会有一个界面出现,让你上传文件,如果上传成功,会返回上传成功的字样。首先上传2014年02月的数据为例。图5.2 文件上传成功提示上传成功之后我们点击分析数据,稍作等待就可以得到数据可视化的图像了。5.2 站点散点图分析我们利用这个数据可视化系统画的第一

36、个图就是关于共享单车租车点的散点分布图,在文件中就是start station和end station这两个数据。我们先看一下可视化的图片。这个坐标轴是用经度作为横坐标,纬度作为纵坐标,清晰了反映了每个站点的地理位置,我们可以用这张图和citibike的手机app上面的分布图来进行对比。图5.3 可视化出的站点图图5.4 Citibike手机app的地图界面在手机app的地图上,绿色的点代表这个站点还有许多空闲的共享单车可以租借;橙色的点代表这个站点只有少数几辆空闲的共享单车,剩余的资源很紧张,甚至可能租借不到单车;而红色的点表示该租车点所有的共享单车都被租走了,已经没有空闲的单车了。我们可以

37、将可视化出来的图像和这个地图相对比:可以看出可视化出的图像中那些较大的点的分布,和手机app地图中橙色和红色的站点的分布基本是吻合的。因为被使用次数多的共享单车站会出现相应的单车资源紧缺的情况。下图是2018年5月的citibike 的地图,而我们可视化的数据是2014年2月的,在这几年正是共享单车萌芽之后的飞速发展阶段,在New York city中新增了许多新的租车点,扩大了规模,方便市民的使用。而在可视化图上空白的地方,就是地图上的河流。图5.5 纽约城区内的租车点分布从第二幅图我们可以看出New York城区是共享单车租车点最密集的地方,租车点覆盖了下图是New York城区内的每一个

38、角落。而在Jersey city和Brooklyn这两个地方,仅仅是靠New York城区的地方才有租车点分布,说明这是近两年新开发的市场,虽然现在分布的不多,但是市场潜力巨大。第三幅图是New York城区内citibike租车点分布,我们可以看到,几乎每一个街区都有租车点分布,形成了一个星罗棋布的完善的共享单车网络。下图是我们用数据库统计出的十个最常使用的租车点。图5.6 最常使用的十个租车点5.3用户使用时间分析在这个可视化系统的第二个功能点就是利用时间数据来可视化,我们将时间数据分为两类,画了两张图,一是一个月内天数的柱状图,一个是二十四小时内的折线图。5.3.1每天使用情况图图5.7

39、 每天使用情况统计上图就是每天使用情况统计,这是2014年02月的数据,我们可以结合当时的天气分析。我们查阅资料得知月初的气温10大约在0-5摄氏度,属于冬天的正常气温,所以共享单车的使用量还算正常,但是在月中旬的时候,突然出现的一次断崖式的下跌,那是因为当时下了暴雪气温都在零摄氏度以下,还刮着北风,恶劣的天气严重影响了共享单车的使用量,是的大部分用户选择开车出门或者使用其他较为舒适的公共交通工具例如地铁、公交车等。由此我们可以看出使用共享单车的人数和气温还是有着很大的关系的。我们还进行了工作日和节假日的对比,发现工作日和节假日对使用人数并没有太大的影响。5.3.2二十四小时使用图二十四小时使

40、用图是将数据中的小时数分离出来,然后单独进行对比,我们绘制了一副折线图来反映一辆共享单车在二十四小时内的使用情况。在图中我们可以看出在一天中有两个十分明显的高峰:一是早上的商务七八点;二是晚上的下班晚高峰,也就是晚上五点到六点之间。图5.8 二十四小时使用量折线图由此我们可以分析出,共享单车的使用者大部分都是本地的居民,外来旅游的人使用的较少。这两个使用高峰与上下班高峰吻合,在下午12点到14点也有一个小高峰。在现在这个可持续发展的大前提下,去多白领都选择用共享单车出门来代替开车、公交等,或者是骑单车从家里到地铁站、公交站台等。一是因为节能减排,绿色环保,还能剩下一笔油费;二是用上下班的单车代

41、替锻炼,对身体健康大有裨益;三是也避免了公共交通拥挤和道路交通堵塞这两个难题。5.4用户类型分析5.4.1用户类型分析我们绘制了一张饼状图,来描述citibike的用户类型。我们在数据表中可以看出,citibike的用户分为两种类型:一是会员(subscriber),另一种是普通消费者(customer)。用户类型生成的可视化图形如下所示。图5.9 会员比例饼状图由上图我们可以看出,citibike的使用者里面会员数量超过了百分之就是五以上,只有不到百分之三的人是没办会员直接消费的。之所以会员占比会如此之多是因为citibike的会员在15分钟之内是可以免费骑行的,所以大部分经常使用的客户就会

42、办理会员,因为大部分共享单车出行都是比较短途的出行,十五分钟足够涵盖这一路程。这一点我们国内的单车也有相似的制度:会员免押金,会员每个月享有多少免费的骑行时间或者骑行里程等。这个制度很大程度上提高了citibike的用户粘性,使得该共享单车可以长期发展。5.4.2 用户性别分析在我们的文件中也有着性别(gender)这一栏,在这一栏中0代表未知,1代表男性,2代表女性。我们则根据这一项数据绘制出来一则用户性别的饼状图。绘制出的可视化图形如下所示。图5.10 用户性别饼状图从图中我们可以看出,超过七成的共享单车用户都是男性用户,女性用户的数量不到百分之二十,而那不到百分之三的未知性别的用户应该是

43、非会员用户,所以没有详细的用户性别信息,这个比例和章节3.3.1图中的非会员比例也相吻合。女性用户远远少于男性的原因有以下几点:一是女性更注意保养,骑单车造成的风吹日晒会对皮肤造成损伤,加速衰老;二是女性着装问题,有时候女性着裙装或者短裤的时候,并不方便使用共享单车,对于男性则没有这么多困扰。所以来说citibike的主要面向对象群体的性别大多数还是男性。5.4.3用户年龄分析在用户信息中还有一栏就是出生日期(birth year),我们可以根据这个数据来得到共享单车使用人群的年龄信息。用现在的年份减去出生的年份得到年龄,再分成20一下、20-30岁、30-40岁、40-50岁和50岁以上这五组数据,进行可视化之后,得到的饼状图如下图所示。图5.11 用户年龄分布饼状图由这个饼状图我们可以看出没有在20岁以下的用户,说明citibike对于用户群组有着一定的年龄要求,没满20周岁可能不能使用这类共享单车;20-30岁的用户所占比例最少,剩余的用户全是30岁以上的,其中30-40岁所占

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论