大数据可视化平台设计方案_第1页
大数据可视化平台设计方案_第2页
大数据可视化平台设计方案_第3页
大数据可视化平台设计方案_第4页
大数据可视化平台设计方案_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据可视化平台设计方案目录CONTENTS1大数据预测概述2描述性数据分析3诊断性数据分析4大预测性数据分析5处方式数据分析6数据分析示例7大数据预测度特征8大数据未来展望PART 01 大数据预测概述大数据预测是大数据最核心的应用,大数据预测将传统意义预测拓展到“现测”。数据可视化大屏建设背景04随着数字科技的发展,数字化多媒体展示方式是多样变化;专注于数字多媒体展示技术于一体的系统集成服务商;数字多媒体科技展示技术数字化、立体化体验式的表现方式展示内容;各种数字科技如:大屏幕的单点、多点、多屏,沙盘控制、多通道立体成像、环幕、球幕、全息立体技术、磁悬浮技术、互动成像技术、数字城市沙盘、光

2、电沙盘、虚拟仿真、3D墙体秀多媒体软件开发、系统集成控制等12大系列现代数字多媒体软硬件技术开发及应用;04数据可视化大屏建设背景互动触摸系列互动投影系列VR虚拟仿真特效影院系列全息成像系列数字沙盘互动系列智能识别(人机)交互系列各类动画多媒体系列各种硬件设备、数字集成控制系统开发;各种产品模型、工业模型、写真沙盘模型、水晶模型制作(有3000平米的模型工厂)交互程序开发系列跨平台系统开发系列系统集成控制系列实物模型制作系列12大系列数字多媒体互动技术:04数据可视化大屏建设背景04单点、多点触摸橱窗触摸非触控,体感触摸全息互动触摸多屏幕拼接智能会议桌(吧台)智能互动茶几触摸大屏幕触摸数据可视

3、化大屏建设背景04数据可视化大屏建设背景全息投影球幕投影数字沙盘投影地面互动虚拟翻书系统幻影成像3D墙体秀预测是大数据的核心价值04大数据预测是大数据最核心的应用大数据的本质是解决问题,大数据的核心价值就在于预测,而企业经营的核心也是基于预测所做出的正确判断。大数据预测的优势05大数据预测则是基于大数据和预测模型去预测未来某件事情的概率,让分析从“面向已经发生的过去”转向“面向即将发生的未来”是大数据与传统数据分析的最大不同大数据预测的优势体现在它把一个非常困难的预测问题,转化为一个相对简单的描述问题,而这是传统小数据集根本无法企及的从预测的角度看,大数据预测所得出的结果不仅仅得到处理现实业务

4、简单、客观的结论,更能用于帮助企业经营决策,收集起来的资料还可以被规划,引导开发更大的消费力量数据分析的四个层次06数据分析的根本目的就是要洞察数据背后的规律,企业可以基于数据分析的结果制订决策、并采取相应措施和行动,进而达成想要的结果数据分析的四个层次描述性分析(Descriptive Analysis)诊断性分析(Diagnostic Analysis)预测性分析(Predictive Analysis)处方性分析(Prescriptive Analysis)数据分析的四个层次07描述性分析发生了什么08描述性分析主要是对已经发生的事实用数据做出准确的描述比如某企业本月订单签约额比上月增加

5、100万,至1100万,但是订单履约率从上月的98%下降到了95%,库存周转率从上月的0.8下降到了0.7诊断性分析为什么会发生09通过评估描述型数据,诊断分析工具能够让数据分析师深入地分析数据,钻取到数据的核心比如经过分析,发现订单履约率下降的原因是成品生产不出来,无法完成交付,而成品生成不出来的原因则是部分原材料的供应商未能按时送货,导致原材料不齐套,无法开始生产预测性分析什么可能会发生10预测型分析对事件未来发生的可能性,预测一个可量化的值,或者是预估事情发生的时间点比如通过建模可以预测本月该供应商会使我们的订单履约率下降2%处方性分析该做些什么11处方性分析基于对“发生了什么”、“为什

6、么会发生”和“可能发生什么”的分析,来帮助用户决定应该采取什么措施通常情况下,是在前面的所有方法都完成之后,最后需要完成的分析方法比如,供应商A会导致本月订单履约率下降,可能采取的措施就是把A换掉,但是现在有B和C两个供应商供选择,通过分析和计算得出:选用供应商B会比选C的订单履约率高1%,因此建议选择供应商B数据分析方法总结12传统分析方法只能完成描述性和诊断性分析大数据分析方法使用大量多样化和可变数据来实现预测,在充满不确定性的环境下,能够帮助企业做出更好的决定大数据预测是大数据在很多领域的重要应用PART 02 描述性数据分析描述性分析做为商业数据分析的第一个层次,主要回答发生了什么的问

7、题。描述性分析14描述性分析对采集到的大量数据进行初步的整理和归纳,对调查总体所有变量的有关数据进行统计性描述,主要包括数据的频数分析数据的集中趋势分析数据的离散程度分析数据的分布统计图形绘制数据的频数分析15利用频数分析可以发现一些统计规律比如说,被调查者使用个人支票支付方式的最多,使用信用卡支付的最少数据的集中趋势分析16数据的集中趋势分析是用来反映数据的一般水平平均值:是衡量数据的中心位置的重要指标,反映了一些数据必然性的特点,包括算术平均值、加权算术平均值、调和平均值和几何平均值 中位数:是反映数据的中心位置的指标,其确定方法是将所有数据以由小到大的顺序排列,位于中央的数据值就是中位数

8、众数:是指在数据中发生频率最高的数据值如果各个数据之间的差异程度较小,用平均值就有较好的代表性如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性数据的离散程度分析17数据的离散程度分析主要是用来反映数据之间的差异程度,常用的指标有方差和标准差方差是标准差的平方,根据不同的数据类型有不同的计算方法数据的分布18在统计分析中,通常要假设样本的分布属于正态分布,因此需要用偏度和峰度两个指标来检查样本是否符合正态分布偏度衡量的是样本分布的偏斜方向和程度而峰度衡量的是样本分布曲线的尖峰程度如果样本的偏度接近于0,峰度接近于3,就可以判断总体的分布接近于正态分布绘制统计图

9、19绘制统计图:用图形的形式来表达数据,比用文字表达更清晰、更简明绘制各个变量的统计图形,包括条形图、饼图和折线图等描述性分析方法20了解业务场景首先要了解和还原数据产生的业务场景,包括:数据涉及到的部门和岗位,这些部门和岗位之间的业务流程,在不同业务流程中有哪些输入,对数据做了什么处理,又是如何输出和传递给下游部门的探索性分析提问,理顺初步分析思路和目标收集数据选择相应分析方法提炼指标对数据做探索性分析后,可对数据反映的事实有一个直观的感受,但是要想更准确、简洁地描述发生了什么,还应该进行总结和提炼出相应指标,做为企业日常经营管理的KPI比如描述库存周转的整体情况,库存周转率、库存周转天数等

10、指标更有效探索性分析步骤21提问,理顺初步分析思路和目标在了解清楚数据产生的业务场景后,试问一些what happened的问题比如,本月销售额是多少?环比和同比变化分别是多少?本财年销售的变化趋势是怎么样的?收集数据有了初步的分析思路和目标以后,就可以确定需要收集哪些数据了比如销售额分析可能用到的数据为销售订单数据、销售开票数据选择相应分析方法根据分析的思路和目标,就可以对收集到的数据选择相应的分析方法了。具体的方法包括:对数据位置的探索,包括:最大值、最小值、均值、中位数、分位数等对数据分布的探索,包括:偏差、方差、标准差、茎叶图、直方图、箱形图、密度图等对数据趋势的探索,包括:同比、环比

11、、趋势图、条形图等对数据聚合的探索,包括:排序、筛选、计数、重复项、分组、求和、比例、条形图、饼图等PART 03 诊断性数据分析诊断性分析可以明确到底发生了什么。诊断性分析23诊断性分析的目的是明确为什么发生寻找相关特征首先需要知道和结果可能相关的因素有哪些,这依赖于对业务的了解程度,只要是可能相关的,都纳入考虑,也可以基于现有特征构造新特征相关性分析列出和结果可能相关的特征后,就需要验证这些特征和结果到底是否相关因果性分析诊断性分析就是要找到事物的因果关系,即因果性分析所谓因果性,假设X是因,Y是果,则只要X出现,必然会导致Y的发生相关性分析24二维散点图若分析的仅是一个特征与结果的相关性

12、,则可以通过画二者的二维散点图进行分析,通过图形描述,可以初步且直观判断二者的存在何种相关关系:正相关、负相关、无关;如果相关的话,是线性相关还是非线性相关(抛物线、指数等)。左图为不同性别年龄与身高关系的散点图,可以看出在青少年时期,这二者是呈线性正相关的相关性分析25矩阵散点图当有多个特征与结果相关的情况时需要矩阵散点图进行分析。其实质就是针对每一个特征与结果分别做二维散点图,以分析其相关性。因果性分析26诊断性分析的隐含意思就是要找到事物的因果关系,即因果性分析所谓因果性,假设X是因,Y是果,则只要X出现,必然会导致Y的发生PART 04 预测性数据分析预测性分析可以明确未来会发生什么。

13、预测性分析28预测性分析试图基于历史数据来预测未来的结果预测性分析的步骤:建立预测模型,模型评估和预测预测性分析第一步:建立模型29预测性分析第二步:用模型进行预测30预测性分析的数据挖掘算法31回归分析模型SVM神经网络预测性分析的数据挖掘算法32回归分析模型一元回归多元回归非线性回归线性回归非线性回归线性回归两个及两个以上自变量一个自变量回归分析的一般步骤33一元线性回归分析示例34例1:已知工作年限与收入的额关系如下表所示。问题:当工作年限为10年时,年收入是多少?问题:当工作年限为25年时,年收入是多少?能够用货币计量35由最小二乘法可得到对应的一元线性回归为:y=3.5*x+23.2

14、一元线性回归分析示例36问题:当工作年限为10年时,年收入是多少?将工作年限10带入一元线性回归方程中,可预测出对应的年收入为Y=3.5*10+23.2=58.2问题:当工作年限为25年时,年收入是多少?将工作年限25带入一元线性回归方程中,可预测出对应的年收入为Y=3.5*25+23.2=110.7。PART 05 处方式分析处方式分析给出问题的解决方案和行动建议。处方式分析回答的问题是:为了解决这个问题,我们该做些什么?或者说,为了达到某个目标,我们该朝哪个方向努力?处方式分析38处方式分析给出问题的解决方案和行动建议处方式分析回答的问题是:为了解决这个问题,应该做些什么?或者说,为了达到

15、某个目标,该朝哪个方向努力?处方式分析的步骤39首先,进行描述性分析,通过描述性分析明确现状和问题,及业务人员和管理人员的需求,这样才能做到有的放矢其次,进行诊断性分析,寻找和当前问题相关的特征,并对其进行建模最后,根据不同的业务场景和需求,给出具体的解决方案和行动建议处方式分析的方法40预测性分析有些情况,仅使用诊断性分析和预测性分析的模型,即可以给出建议比如银行可根据申请人的基本信息,包括学历、收入、是否有车、是否有住房、存款金额、是否有违约记录等,去建立模型预测其信用违约的风险有多大,进而给出建议是否要给这个申请人发放信用卡,如果要发放,信用卡的额度又该是多少处方式分析的方法41仿真仿真

16、就是通过建模模拟真实世界的系统或流程,并通过不同的输入参数或条件查看其对结果的影响,据此制订相应决策主要是通过在电脑上做数学建模仿真,进而根据仿真结果给出相应的解决方案和行动建议比如企业的成本支出和客户服务水平是一个两难问题,往往成本的削减意味着客户服务水平的下降,那如果说企业要制订年度成本削减目标,通过仿真发现成本降低5%,但是客户服务水平仅下降1%,属于可接受范围,但是当成本降低10%时,客户服务水平下降达6%,可能对公司的经营、商誉等产生重大影响,则此时成本降低5%是相对合适的,而10%就不是那么合适了。处方式分析的方法42最优化最优化是应用数学的一个分支,主要指在一定限制条件下,选取某

17、种研究方案使目标达到最优的一种方法最优化问题在当今的军事、工程、管理、商业等领域有着极其广泛的应用比如,企业都希望利润尽量高,那如何在现实的约束条件下,达到上述目标就是一个普遍的最优化问题最优化常用的方法为线性规划、非线性规划、凸优化、整数规划、网络流优化(物流、电网、通讯网络应用)等处方式分析的其他特点43处方式分析除了会给出行动建议外,另一大特点就是需要有一个反馈系统可以收集采取相应行动后的结果数据,以验证行动建议的有效性,若效果不佳,则需要调整,给出新的可行性建议,这个过程会不断循环迭代,直至达到预期目标一个优秀的处方式数据分析系统,迭代过程应该是无须人工干预、智能自动完成的,这也是目前

18、机器学习和人工智能方法的最大优势处方式分析是数据分析方法的最高阶形态,也是在商业环境中对企业最有用、产生价值最大的方法PART 06 数据分析示例前面已经详细介绍了商业数据分析的四个层次,本节将通过一个示例将这四个层次串联起来。示例背景45PAS是一家销售企业管理软件的公司,虽然整个行业欣欣向荣,但是这家公司的业务却陷入泥沼,销售额连续八个季度出现下滑。为了扭转此局面,希望能通过数据分析的方法提供有力支撑PAS公司的业务现状和数据情况PAS公司上线了CRM、ERP、HR等系统,针对商机、合同、付款、客户、价格、销售员的入职时间、接受过的培训等信息都是有详细记录描述性分析46在做描述性分析时,最

19、重要的是结构化思维,即要把分析的问题或指标进行逐层结构化分解,直到无法分解为止总体销售收入=销售漏斗中所有销售机会的数量 * 每个销售机会的交易金额 * 胜率每个销售机会的交易金额=每个销售机会包含的产品 * 每个产品包含的模块数量 * 每个模块的平均单价首先对去年销售员整体的业绩情况做了分析:总体销售指标为 1亿2000万,已签单 1个亿,指标达成了83%,目前有100个销售员,平均每个销售员的签单金额为100万,这样看起来貌似还不错。但是再看下一项数据就会发现比较大的问题,仅有20%的销售员完成了销售指标。对计算智能的新认识47首先对去年销售员整体的业绩情况做了分析总体销售指标为 1亿20

20、00万,已签单 1个亿,指标达成了83%,目前有100个销售员,平均每个销售员的签单金额为100万,这样看起来貌似还不错。但是再看下一项数据就会发现比较大的问题,仅有20%的销售员完成了销售指标。描述性分析48通过查看去年销售员签单金额分布,这个问题体现的更明显。销售业绩主要是靠几个明星销售员来达成的。描述性分析49再看去年整体销售漏斗的表现,整体销售漏斗金额高达5亿,而每个销售员平均的漏斗金额有500万,但是平均签单金额仅有100万,也就是说胜率仅为20%;另外,去年已完结的交易数量为1000,而销售员平均完成交易数量仅为10个,数量偏少;同样,平均的交易金额仅为10万,平均客户价值仅为20

21、万,在企业管理软件行业,这两个数字都是偏小的。描述性分析50 接着分析新老客户平均交易金额及胜率,可以看出新客户虽然单子大,但是赢单的概率较低;反之,老客户虽然单子小,但是胜率很高。描述性分析51 再看新老客户对收入的贡献,可以看到老客户虽然平均交易金额较小,但是对整体收入的贡献还是远远高于新客户的。描述性分析52再看交易金额分布及其胜率,可以看出单子金额越大,胜率越低。描述性分析53再看不同产品的收入分布和胜率,A、B、C这三种产品收入贡献较高,并且胜率也相对较高,证明在产品、价格等方面在市场上有较明显的竞争优势,可以重点突破。诊断性分析54 经过初步的描述性分析,对现有CRM、ERP、HR

22、、售后、市场等5大系统或数据源中的数据做了梳理,共137个变量或KPI。 如此之多的变量想通过传统的数据分析方法分析是很困难的(如通过散点图分析这些变量与销售业绩的相关性),只能使用机器学习的技术;通过此项技术,可计算出不同变量(机器学习称为特征)对结果值(即销售业绩)的影响到底有多大。诊断性分析55根据去年销售员业绩达成率分布把销售业绩分为三类:平庸,中等和优秀;其中平庸为业绩完成不到50%的;中等为业绩完成50%-99%的;优秀为业绩完成100%的。诊断性分析56优秀组和平庸组在12个关键KPI的差异:对业绩影响最大的变量为销售员销售的产品种类:业绩优秀的销售员,是所有产品都销售的;而业绩

23、平庸的销售员,则只销售自己熟悉的产品; 其次,业绩优秀的销售员,和合作伙伴的关系很紧密,销售线索可能来自于合作伙伴,甚至合同都是与合作伙伴联合与客户签订;而业绩平庸的销售员,只依赖于公司内部市场部提供的销售线索;第三重要的是平均合同金额。业绩优秀的销售员合同金额是平庸的销售员的2倍多;而较大的合同金额通常是因为每个合同销售的产品更多;第四重要的是销售漏斗金额与销售指标的比率。业绩优秀的销售员会在全年保持稳定的销售机会创造率,其每月创造的销售漏斗金额是平庸销售员的3倍。预测性分析57再细致分析不同销售人员的12个变量表现:可以看出,尺有所短,寸有所长。比如,85号销售员看起来大部分变量都处于平均

24、水平或之下,但是其也有闪光点,这些人里只有他每季度创造的销售机会超过平均水平,那其他人就可以向他学习如何提升这一点。虽然可看出不同销售员在单个变量的表现,但是很难据此直接判断出其未来是否能完成业绩指标。如果可以做到这点,就可以把可能不达标的人提前找出来,进而给予其必要的帮助。因此需要使用预测性分析,通过建立预测性模型,根据其关键KPI的表现情况,即可以预测其业绩达标情况。小白根据历史数据训练出的预测模型,预测的准确率已经达到了95%。处方式分析58预测模型完成后,即开始发挥作用。根据模型预测,刚入职一年的销售员很难完成今年的业绩指标。虽然其很努力,每月创造的销售机会比均值高不少,销售漏斗金额与

25、销售指标的比率也OK,但是在部分关键指标表现不佳:对销售业绩影响最大的因素合同的平均金额,目前均值是180K,但是其只有25K。他不怎么和合作伙伴一起合作,公司平均60%的合同是和合作伙伴一起打单打下来的,而他的比率是0;而有合作伙伴参与的订单金额是没有合作伙伴参与的订单金额的6倍,胜率也更高。处方式分析59根据数据分析的结果,建议该员工着重提升合同的金额,并给出了以下改进措施:首先,小王需要更积极地联系合作伙伴,主管给到小王负责区域的合作伙伴名单,以及以往公司与每个伙伴签署的平均金额其次,建议小王要提升捆绑销售软件的数量,公司平均有40%的软件都是捆绑销售出去的;主管给了小王捆绑销售占比较高

26、的产品清单,以及在与合作伙伴和捆绑销售做的好的同事名单,要求小王找他们多沟通,看他们是如何做到的。结果60经过一年的时间,PAS公司的业绩得到了明显的提升。结果61PART 07 大数据预测的特征在互联网之前便已经有基于大数据的预测分析了:天气预报。因为互联网,天气预报为代表的大数据预测的以下几个特征在更多领域得到体现。大数据预测的四大特征63在互联网之前便已经有基于大数据的预测分析了:天气预报。因为互联网,天气预报为代表的大数据预测的以下几个特征在更多领域得到体现。大数据预测的时效性大数据预测的数据源大数据预测的动态性大数据预测的规律性大数据预测的四大特征64大数据预测的时效性天气预报粒度从

27、天缩短到小时,有严苛的时效要求,基于海量数据通过传统方式进行计算,得出结论时明天早已到来,预测并无价值。其他领域的大数据预测应用特征对“时效性”有更高要求。譬如股市、实时定价,而云计算、分布式计算和超级计算机的发展则提供了这样的高速计算能力。大数据预测的四大特征65大数据预测的时效性大数据预测的数据源天气预报需要收集海量气象数据,气象卫星、气象站台负责收集,但整套系统的部署和运维耗资巨大。在互联网之前鲜有领域具备这样的数据收集能力。WEB1.0为中心化信息产生、WEB2.0为社会化创造、移动互联网则是随时随地、社会化和多设备的数据上传,每一次演化数据收集的成本都大幅降低,范围和规模则大幅扩大。

28、大数据被引爆的同时,大数据预测所需数据源不再是问题。大数据预测的四大特征66大数据预测的动态性不同时点的计算因子动态变化,任何变量都会引发整个系统变化,甚至产生蝴蝶效应。如果某个变量对结果起决定性作用且难以捕捉,预测难上加难,譬如人为因素。大数据预测的应用场景大都是极不稳定的领域但有固定规律。如:天气、股市、疾病。这需要预测系统对每一个变量数据的精准捕捉,并接近实时地调整预测。发达的传感器网络外加大数据计算能力让上述两点更加容易。大数据预测的四大特征67大数据预测的规律性大数据预测与传统的基于抽样的预测不同之处在于,其基于海量历史数据和实时动态数据,发现数据与结果之间的规律,并假设此规律会延续

29、,捕捉到变量之后进行预测。一个领域本身便有相对稳定的规律,大数据预测才有机会得到应用。古人夜观天象就说明天气是由规律可循的,因此气象预报最早得到应用。反面案例则是规律难以捉摸,数据源收集困难的地震预测,还有双色球彩票。大数据预测的典型应用领域68互联网给大数据预测应用的普及带来了便利条件。天气预报之外,以下10个领域是最有机会的大数据预测应用领域。体育赛事预测股票市场预测市场物价预测用户行为预测人体健康预测疾病疫情预测灾害灾难预测环境变迁预测交通行为预测能源消耗预测PART 08 大数据未来展望数据除了第一次被使用时提供的价值以外还具有的无穷无尽的“剩余价值”可以被利用,通过借助一些具体的应用模式和场景就能得到集中体现。大数据未来展望70大数据帮助企业挖掘市场机会探寻细分市场大数据提高决策能力大数据创新企业管理模式,挖掘管理潜力大数据变革商业模式催

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论