【大数据分析分享系列】商品信息数据分析及展现系统的设计与开发_图文_第1页
【大数据分析分享系列】商品信息数据分析及展现系统的设计与开发_图文_第2页
【大数据分析分享系列】商品信息数据分析及展现系统的设计与开发_图文_第3页
【大数据分析分享系列】商品信息数据分析及展现系统的设计与开发_图文_第4页
【大数据分析分享系列】商品信息数据分析及展现系统的设计与开发_图文_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、【大数据分析分享系列】之商品信息数据分析及展现系统的设计与开发基于数据挖掘技术的智能化数据分析系统设计与开发潍坊物价信息数据分析及展现目录背景: (1实现过程: (1一、数据获取 (2数据来源: (2获取方式: (21.使用Excel工具抓取 (22.使用RCurl爬虫 (2二、数据展现 (3展现方式: (3展现内容: (31.价格分析 (3价格走势: (3价格对比: (3全国商品价格 (42.居民消费指数 (6同比环比 (6CPI比例 (7各省月度CPI (83.商品流通情况 (94.各农作物主要产地 (105.价格预测 (11三、数据预测 (12不足与展望: (19背景:商品价格和人们生活

2、息息相关,比如农产品价格波动不仅会对农民收入和农民生产积极性产生直接影响,更关乎百姓的日常生活和切身利益。经常看新闻看到农民辛苦了一个季度的农作物全都烂在地里,因为价格太低廉,或者没有销路。虽然说物价波动是一种正常的经济现象,但是在一定程度上物价稳,人心才稳,社会才稳。为保持经济平稳健康发展、保障群众生活,稳定物价,信息公开显得尤为重要。价格监测和预测是维持物价稳定的一个重要环节。而对于商品价格、产量、以及销路、销量等数据公开,建立产品价格分析、监测、预测平台可以为相关政府管理部门提供生产调控、决策分析的依据,成为农门种植的依据,避免盲目种植。国家也有譬如南菜北运、西果东送等等政策但是数据实时

3、公开,友好的向全国人民展示我认为还有很大的提升空间。实现过程:针对从价格信息网抓取来的数据利用eclipse工作平台开发出了商品信息数据分析及展现系统,实现了价格展示、价格分析、价格预测、居民消费指数分析、商品流通情况以及作物主要产地及产量的展示。价格分析包括价格走势、价格对比(市场之间对比、价格展示(各省对比。价格预测最后采用基于时间序列的神经网络算法做了初步短期价格预测。居民消费指数CPI作为反映消费者支付商品和劳务的价格变化情况,也是一种度量通货膨胀水平的工具,主要包括同比环比及其涨跌情况、CPI构成比例以及各省月度CPI展示等。分析结果以带有时间轴的折线图、柱状图、地图热力图、饼状图形

4、式展示,界面美观,和用户交互性强,简单易懂。 一、数据获取数据来源:潍坊物价信息网;中华人民共和国国家统计局获取方式:针对数据来源网站信息大多有规律的更新,但网页数据结构保持不变,使用的方式有两种:1.使用Excel工具抓取1通过Excel从网页导入数据,选中自己要导入的数据。2新建宏,重复上步操作3观察数据发布的网页地址规律,修改宏代码(使用该方法的好处是可用Excel对获取来的数据进行数据处理2.使用RCurl爬虫(方便对抓回来的数据用R直接对数据进行相关分析计算数据处理:因为各种原因,价格信息网提供的商品价格信息有数据单位不统一、商品名称不规范、市场名称前后不一、缺失值等等问题。经过对这

5、些数据的分析和总结,对数据进行了统一商品名称格式、规范市场名称、规范数据单位、去重和缺失值5方面的处理。存储方式:将处理好的数据,建好表结构存储到mysql数据库中。二、数据展现展现方式:使用Echarts在网页显示。展现内容:1.价格分析 价格走势:这里主要展示的是将爬取来的每日商品价格数据按商品类型取平均值(右侧图例选择要查看的商品类型,做曲线图。通过下面时间轴拖动、拉长查看某一范围内的价格走势;也可通过区域缩放按钮查看某一段曲线的详细走势。效果展示:(点击图片可放大 价格对比:针对从潍坊物价信息网获取来的数据,根据价格采集地点进行价格对比。大体分为两类:超市价格和集市价格。以柱状图的方式

6、可直观的看出某天某种商品在不同地点的价格高低情况。如要查看2014-08-01的价格对比情况。 效果展示如下:鼠标移动切换标签展示集市商品价格对比。 全国商品价格在地图上,以热力图的形式展现全国各省某种商品价格的高低。鼠标悬停显示具体价格信息。 此外,可以具体到某省下的各市价格展示: 继续往下深入,具体到某市下各区、镇价格展示(以潍坊市为例: 2.居民消费指数CPI (Consumer price index 居民消费指数,反应通货膨胀或者紧缩的程度,一般来讲,物价全面的持续的上涨就会被认为发生的通货膨胀。 同比环比(数据来自潍坊物价信息网可选择查看整体CPI涨跌情况,或者影响CPI八大类中某

7、一类CPI涨跌情况。 如选择食品类,还可继续查看食品类下的具体涨跌情况 效果展示如下:下方为时间轴,可以选择相关年份查看 CPI比例用饼状图的方式可直观展现八大类及其分类对整体CPI的构成影响。下方为时间轴,展现不同时间段的构成比例。 各省月度CPI(下方为时间轴,可以选择年月份查看 3.商品流通情况国家有南菜北运、西果东送的政策,友好的相关信息展示,为合理分配资源开辟市场提供相关决策依据。 效果展示如下: 4.各农作物主要产地 鼠标悬停显示产地产量信息。效果展示如下: 5.价格预测主要包含两部分:1 .价格预警 2.商品价格预测价格预警:采用Ajax技术每隔一小时自动刷新属于,红色为预警标识

8、。计算上一周价格移动平均值,和当前价格做差,涨跌绝对值大于0.5红色箭头标识预警。效果展示如下: 商品价格预测(以大白菜价格为例:虚线为预测价格,实线为实际价格 三、数据预测预测工具:rapidminer数据来源:潍坊物价信息网实现算法:基于时间序列神经网络的短期价格预测实现过程:(以大白菜价格为例训练集:选取2013-2014内大白菜的价格。测试集:抽取1/3作为测试集。预测模型:方案有两种一是采用支持向量机SVM,二是采用神经网络,下面对两种模型进行评估。指数平滑和移动平均模型如下:首先使用支持向量机进行移动平均和指数平滑的计算(这里窗口大小设为5, alpha设为0.8 部分结果如下:

9、折线图如下: 可以看出移动平均线和本期实际价格有一定误差,而指数平滑出来的价格exponential_smoothing(本期价格和本期价格基本重合,而趋势线(trend蓝线效果不是很好。再使用神经网络进行移动平均和指数平滑的计算(参数设置如上 部分结果如下: 折线图如下: 可以看出时间序列几何平均法(average和本期价格误差不大,而指数平滑exponential_smoothing基本和本期价格一致。趋势线基本符合价格涨跌情况,在14年4月出现了大幅度上升,这样就能发现价格异常的产品,从而对其价格预警。为了评估模型预测的精度,加入时间序列包中Validation 操作符,并设定好相关参数

10、。 Validation 操作符内部需要放置某种算法,这里采用支持向量机 SVM: 预测精度: 下面再采用神经网络Neural Net 比较一下预测精度: 预测精度: 可以看出采用神经网络预测精度高一些,所以下面采用神经网络算法进行模型训练及预测。这里窗口大小设为5 模型如下: 预测结果如下: 红色线为实际价格 ,蓝色线为预测价格。 从图中可以看出,预测价格基本还行。 不足与展望: 因为时间和能力有限, 作品本身还有很大的提升空间。比如数据抓取和处理 没有实现完全自动化。 数据预测因素单一,需要收集更多的数据来进一步产品价 格预测精度,及时发现价格异常的农产品。商品价格波动的主导因素很复杂,像 供需关系、生产成本、自然条件、科技发展、运输存储、国家政策、自然灾害等 都是造成价格波动的主导因素。 这也为提高商品价格预测的精度带来了很多困难。 19 如何有效、准确的预测商品价格还需要继续学习和研究。 自己对物价这方面的研究很有兴趣,因为它和人们的生活息息相关,一方面 对农民收入和农民积极性产生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论