时空大数据预测挖掘和可视化v1_第1页
时空大数据预测挖掘和可视化v1_第2页
时空大数据预测挖掘和可视化v1_第3页
时空大数据预测挖掘和可视化v1_第4页
时空大数据预测挖掘和可视化v1_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

时空大数据:预测、挖掘和可视化2016LenovoInternal.Allrightsd.联想创投香港大数据实验室JulieZhu大数据和深度学习Workshop(2016-12-14~2016-12-16)2015LenovoInternal.Allrightsd.什么是时空大数据?时空:带有时间、空间标签的数据大数据:海量数据(种类、容量、采样速度)2016LenovoInternal.Allrightsd.时空大数据的意义人+环境数据量每年翻倍,越来越多的业界数据城市时空大数据(交通、某著名企业、交通+)广义时空大数据(空间

特征空间,例:属性、领域)交通监控采购交易审计2016LenovoInternal.Allrightsd.联想时空大数据:预测、挖掘和可视化联想时空大数据城市大数据交通大数据某著名企业大数据交通大数据+2016LenovoInternal.Allrightsd.Outline联想时空大数据1.交通大数据出租车、地铁、公交、货车、电动车……2.某著名企业大数据手机某著名企业数据公共出行轨迹3.交通大数据+交通+物流,商圈,广告,救护,养老交通+….总结:大数据解决方案的思考探索的方向大数据解决方案:垂直化平台+闭环生态时空数据分析时间序列预测实时流数据处理运筹优化地图匹配调度规划2016LenovoInternal.Allrightsd.联想时空大数据

1.交通大数据2016LenovoInternal.Allrightsd.出租车大数据某省市:出租车GPS监控数据(约26500辆出租车,1-15s/次采样,包含位置、速度、载客信息,3~5TB/day)政府:监控、管理、规划公司:交通产品、服务市民:方便出行3辆车,1天的轨迹4000辆车,1天的轨迹2015LenovoInternal.Allrightsd.出租车客流分析上客热点区域出租车客流分析某省市各个区域出租车上下客流量的统计和分析,反映了各个区域上下客的热点程度,以便对各个区域的的士出行热度有精确的把握,进而为出租车的调度、交接班、行业规模设定等工作方案的调整提供依据。下客热点区域2016LenovoInternal.Allrightsd.路网匹配:GPS+路网出租车1天的轨迹原始GPS轨迹(噪声)结合路网数据进行轨迹匹配采样缺失轨迹偏移2016LenovoInternal.Allrightsd.路段拥堵、基于统计的交通预测2015LENOVOINTERNAL.Allrightsd.拥堵的传播实时处某省市公交(5000辆)和出租车(16000辆)数据预测车辆轨迹准确率~50%预测交通拥挤程度拥堵的传播2016LenovoInternal.Allrightsd.时空挖掘与可视化路网数据(从Openstreetmap获某省市高速、主路、2-4级辅路信息)出租车GPS监控数据(约26500辆出租车,1-15s/次采样,包含位置、速度、载客信息)当前交通状况未来交通状况1)统计模型(例:星期三10:00am)2)基于时空挖掘的预测模型交通状况展示、拥堵监测和预测基于Openstreetmap的可视化输出:1)单个车辆的路网轨迹2)全局速度展示及统计3)拥堵识别,时空pattern4)时空拥堵传播预测反馈:1)优化数据展示效果2)模式识别模型、参数路网匹配2015LenovoInternal.Allrightsd.出租车历史轨迹查询通过查询出租车历史轨迹,可以判断绕路、拼车、调换牌照、超速等违规违法现象,对拼车等相关违规行为进行辅助验证。此外还可以通过模糊匹配,为公安或个人等提供快速查找某些特定车辆的工具。

“老司机”优化导航模型起点终点绕路常规路线2016LenovoInternal.Allrightsd.交通大数据应用场景出租车大数据公交大数据地铁大数据货车大数据电动车大数据出租车地铁电车公交车航空货车2015LenovoInternal.Allrightsd.地铁客流分析北京西站通过地铁刷卡信息,结合地理语义信息,推算出去某个地方的人来自哪儿4:11PMPassengerSourcesofChaoYangHospital北京朝阳医院客源PassengerSourcesofBeijingWestStation北京西站客源来源:中南大学,授2015LenovoInternal.Allrightsd.公交大数据预测公交车到站时间、道路拥挤程度、乘客人数。。。。。。2015LenovoInternal.Allrightsd.货车大数据物流车辆管理平台提供物流车某省市市实时分布,实时监控,货线推荐,加油统计分析、加油站推荐,行驶、停驶统计分析以及公司运营数据分析等业务功能。2015LenovoInternal.Allrightsd.电动汽车大数据通过电动汽车的轨迹分析充电的需求,确定充电桩的布点最佳位置,及实时推荐电动汽车最佳充电站。2016LenovoInternal.Allrightsd.航班流量建模展示2016LenovoInternal.Allrightsd.联想时空大数据

2.某著名企业大数据2016LenovoInternal.Allrightsd.2000年前的某著名企业数据时间:前138~前119,人物:、卫青、霍去病。“小数据”。2016LenovoInternal.Allrightsd.春节的人口流动(分布)2016LenovoInternal.Allrightsd.春节的人口流动(关联)2015LenovoInternal.Allrightsd.手机某著名企业数据发现家庭住址BA2015LenovoInternal.Allrightsd.发现工作地点2015LenovoInternal.Allrightsd.LenovoShenzhenCenter2015LenovoInternal.Allrightsd.发现工作地点医生2015LenovoInternal.Allrightsd.人的Activity与职业出租车司机医生某省市2015LENOVOINTERNAL.Allrightsd.公共出行轨迹

个人行为模式判断

抓扒手所有乘客轨迹游客轨迹购物者轨迹小偷轨迹BowenDu,ChuanrenLiu,WenjunZhou,

HuiXiong.

CatchMeIfYouCan:DetectingPickpocketSuspectsfromLarge-ScaleTransitRecords.

The22ndACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining(KDD-2016),SanFrancisco,CA,USA,2016..2016不同类别乘客有不同的轨迹模式,游客一般去景点,购物者一般去商场,一般乘客都有明确的目的地,小偷的轨迹没有明确的目的地。2016LenovoInternal.Allrightsd.总结某著名企业大数据的应用场景通过用户的手机某著名企业轨迹,公共出行轨迹,和其他反应用户活动的数据,表征用户的行为,模式、类别、兴趣爱好等。帮助更好的了解用户需求。用户去了哪儿?个体行为模式:轨迹与职业群体迁移模式:监管用户分哪些类?购物控?旅友?夜猫子?吃货?用户做了什么?位置+餐厅位置+购物位置+心率位置+天气用户喜欢什么?App的活跃度2016LenovoInternal.Allrightsd.联想时空大数据

3.交通大数据+2015LenovoInternal.Allrightsd.交通大数据+的应用场景以数据资源体系为基础;行业内、外数据融合;围绕交通运输业务需求;支持宏观数据的查询、分析;快速、及时反映交通发展状况和运行状态;数据服务公众;数据支持助力政府决策;生成科学合理的指标体系;探索行业管理新模式。交通+物流交通+商圈,广告交通+救护交通+养老交通+房地产。。。2016LenovoInternal.Allrightsd.交通+物流基于实时交通的物流管理物流管理2015LenovoInternal.Allrightsd.城市商圈大数据分析通过深入分析海量数据,利用交通轨迹、个人消费、商业活动等各类复杂异构数据,某省市商圈大数据智能分析,主要基于:

1.交通客流量数据建模

2.社交网络热门话题导入

3.商圈功能主题动态显示

4.商圈吸引度动态分析分析用户的行为,并利用多样化的智能终端为用户提供主动的、智能化的商圈管理、商业服务和消费体验,从而提升商圈管理水平,促进商圈内实体商业的繁荣,改善顾客的消费体验。来源:数据极客2015LenovoInternal.Allrightsd.交通+广告(广告投放地点大数据分析)某省市商圈内聚集效应的愈发显现,商户之间的竞争也愈发激烈:

1.结合交通轨迹数据

2.某省市商圈主要功能

3.刻画广告受众画像及区域

4.精确化广告投放路线

来帮助商户优化广告投放策略(广告投放区域优化及广告投放目标人群精准化)。2016LenovoInternal.Allrightsd.交通+救护2016LenovoInternal.Allrightsd.交通+养老2016LenovoInternal.Allrightsd.总结:大数据解决方案的思考2016LenovoInternal.Allrightsd.总结:探索的方向城市时空大数据(交通、某著名企业、交通+)广义时空大数据(空间

特征空间,例:属性、领域)某省市时空大数据——多源数据的融合交通、人的运动、健康、天气的结合虚拟世界的消费与现实世界的消费的关联某省市中的问题、需求2、广义时空大数据——传统行业的升级根据供需关系提供更精准的采购分析财务报表的自动化异常侦测把人从繁重、琐碎的工作中解救出来现有团队成员罗军:美国UTDalla曾在华为诺亚方舟大数据实验室任研究员担任中科院先进院副导师在荷兰Utrecht大后研究兰亮:美国Templ曾任新加坡信息通讯研究院研究科学家擅长大规模机器学习,金融行业大数据挖掘和反欺诈、反洗建模姬莉娅:香港科技大学硕士师从人工智能专家授曾就职于腾讯基础架构部机器学习团队章一磊:香港中曾任职于华为高级软件工程师,专业方向为机器学习和推荐系统:香EFellow研究领域包括模式识别、深度学习:香MSRA长期实习,研究时空数据挖掘和机器学习HKPhDfellowship获得者:香港中文大学硕士曾就职于百度数据分析团队:香港科技大学硕士曾就职于香港ASTRI视觉分析团队,研究方向为计算物理、复杂系统:香、博士后研究领域包括社交网络分析,网络影响力传播:香港中研究领

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论