




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
时空数据分析算法及其应用研究空间和时间是现实世界最基本、最重要的属性,许多空间应用系统都需要表达地学对象的时空属性,例如在地理位置变更、环境监测、城市演化等领域都需要管理历史变化数据,以便重建历史、跟踪变化、预测未来。面向对象的技术是用在软件设计中的一种方法,它用在时空数据1表达中主要是为了克服给定实体的空间或非空间属性在不同时间不同频率变化而出现的复杂问题2。下面从KNN、RNN、SkyLine三种时空数据分析算法出发,论述时空数据分析算法的应用。1、KNN分析算法的基本概述及应用分析KNN算法是非参数回归模型的基本算法之一,通过在状态空间中搜索与待测点X相近的k个样本(Xi,Yi)估计gn(x),因此又称为k最近邻非参数回归,其预测函数3可表示为Y=g(X)=Wi(X;Xk1,Xkk)Yi=kiYi (1)其中Xk1表示与x距离最近的点,并赋予权值k1;Xk2则被赋予权值k2;以此类推,得到k个权函数k1,k2,kk,满足k1k2kk0,=1 (2)KNN算法通过计算样本个体之间的距离或者相似度来寻找与每个样本个体最相近的K个个体,在这个过程中需要完成一次样本个体的两两比较,所以算法的时间复杂度,跟样本的个数直接相关。K最近邻算法通常情况下是用于分类的,这只是对K近邻算法用途的本质说明4。从实际来看,K近邻算法可以应用的地方还有很多,比如系统推荐等等。简单的讲,就是挖掘出客户喜欢的相同商品,来进行相似物品的推荐。另外区分客户群体,从而使我们更好的为客户服务。下面是KNN分类器构建实例。KNN的实现分训练和识别两步。训练时,把每类样本降维后的结果作为KNN的输入。如图1所示,圆圈表示待识别数据所处的位置,选择K值为3时,选中实线圆中的3个数据,识别结果为三角形代表的类;选择K值为5时,选中虚线圆中的5个数据,识别结果为正方形代表的类。图1 KNN分类器构建关于智能商务中的聚类算法等,已经应用于很多系统中,比如推荐系统、文本分类系统等等5。这其中衍生出的产品或者项目都已经被广泛使用于电子商务领域。为了增加交易,满足不同的顾客的需求,研究人员已经推出了利用消费者访问和购买的行为的推荐系统。广泛应用在大的超市或者企业中。这些系统通常通过给顾客一些与他购买物品高度相关联的推荐物品,来增加购买和交易。比如亚马逊是通过偏好和用户信息和购买信息来向顾客推荐相关书籍。并且在这过程中,使用的技术并不复杂,而这不妨碍推荐系统的精确有效。2、RNN分析算法的基本概述及应用分析通常,RNN查询6的定义为:给定一个数据点集合P和一个查询点q,单色反向最近邻查询(Monochromatic Reverse Nearest Neighbor Query,RNN)找出所有以查询点q为最近邻的数据点,即RNN(q)=pP丨P s.t.d(p,p)d(p,q),其中d是一个距离度量。给定两个数据集P和Q以及一个查询点q,双色反向最近邻查询(Bichromatic Reverse Nearest Neighbor Query,bRNN)找出所有的数据点pP,满足p与q之间的距离比p与Q中任意一个点的距离都要短,即bRNN(q)=pP丨Q s.t.d(p,q)d(p,q)。图1展示了该查询算法的一个实例7,图中显示有四个数据点,每个数据点都对应一个限定圆,查询点g落在数据点p1,P2对应的限定圆中,因此p1,P2就是g的RNN查询结果,即RNN(q)=Pl,P2)。图2 查询实例近年来,反向最近邻查询学术界得到了深入探讨和研究,并且在诸如决策支持、资源分配等许多领域得到了广泛应用。例如利用随机神经元网络方法和辐射神经元网络方法设计分布式数据库系统,从而确定数据的物理分段方式8;再如利用基于随机神经网络的时延预测模型对时延进行精确的预测,为实施网络拥塞控制、路由选择提供重要的依据9。3、SkyLine分析算法的基本概述及应用分析近年来,流数据挖掘与管理成为学术界和工业界所共同关注的问题,并且随着信息技术的不断发展和应用的不断深入,数据收集手段越来越丰富,海量存储也越来越普遍。由此,一种新的操作算子-skyline操作被引入了数据库领域,目的是要发现数据集中不被其他点支配的所有点的集合10。随着skyline计算在多标准决策系统、城市导航系统、数据挖掘和可视化、智能防御系统、以及地理信息系统等领域的广泛应用,有效地在数据流上实现skyline计算成为数据挖掘领域的研究热点。一个多维数据库的skyline,是该数据库上不被其它任何数据点支配(dominate)的点所组成的集合。数据点p支配点q,当且仅当p在任一维上的取值都不比q差,且至少在一个维度上比q更好。Skyline计算就是从数据库中快速、准确地z到所有的skyline数据点。图1是一个skyline例子11,图中的每一个点是一个二维的数据记录,共同组成一个二维的数据库。在图26中,p点支配q点,p点与r点互不相支配,所有实心的点组成了skyline集合。图1 一个skyline例子数据流足连续、实时、有序的数据项序列,数据流上的skyline查询是近来流数据挖掘领域的一项研究热点,它所独有的特征:数据实时到达、规模宏大、次序独立以及数据往往只能一次读取,要求数据流上的skyline查询处理算法必需高效地处理到达的每一个对象,并且具有较低的时间复杂度。但现有算法对数据的去除率不足,使得在进行skyline计算时对部分操作重复,造成时间和空问的浪费。并且在实际应用中,产生的数据流往往以分布式的形式出现,例如无线传感器网络中传感器节点的数据流。Skyline查询在诸如多标准决策支持、数据挖掘、用户优先选择查询、协作数据检索以及Web交互式系统等领域中有着广阔的应用前景,它已经成为了当前数据库领域的一个研究重点与热点。Skyline查询返回一组有意义的对象,这些对象在各维上都不被其他对象所控制,从而支持用户在复杂的情况下进行决策,这使得它在许多领域都有着广泛的应用,如多标准决策支持系统以及用户偏好查询等为了更好地适应在不同环境下的应用,最近两年,对Skyline问题的研究逐渐地趋向于在具体应用环境下进行,如Web信息系统、分布式P2P网络、数据流和公路网络等12。4、结语与展望近年来,随着全球定位系统、传感器网络和移动设备等的普遍使用,时空数据急剧增加。特别是时空数据的处理方面更为复杂。因此,寻找有效的时空数据挖掘方法具有十分重要的意义。针对这一背景,文章主要围绕KNN、RNN、SkyLine三种时空数据分析算法分析了其概念,对其研究的现状进行了详细介绍。当前,时空数据挖掘的研究已吸引了来自GIS13、时空推理、数据挖掘、机器学习和模式识别等众多领域的学者,取得了诸多研究成果。与此同时,时空数据挖掘也在许多领域得到应用14,如移动电子商务(基于位置的服务)、土地利用分类及地域范围预测、全球气候变化监控(如海洋温度、厄尔尼诺现象、生物量、犯罪易发点发现、交通协调与管理(交通中的局部失稳、道路查找)、疾病监控、水资源管理、自然灾害(如台风、森林火灾)预警、公共卫生与医疗健康等时空数据挖掘作为一个新兴的研究领域,正致力于开发和应用新兴的计算技术来分析海量、高维的时空数据,揭示时空数据中的有价值知识。当然,现有的这些时空数据分析算法还处于发展阶段,随着各种信息系统的完善和飞速发展,相关研究领域必须深入研究时空数据所蕴含的巨大的能量,并抓住研究的重点,对现有的算法进行创新性的改造和优化。参考文献1 Langran,G.(1992)Time in Geographic Information System. London ,TayIor &Franic .2姜晓轶.从空间到时间时空数据模型研究.吉林大学学报(地球科学版)J .2006,36(3):480-484.3王新颖. KNN算法的数据优化策略.吉林大学学报(信息科学版)J.2010,28(3):309-313.4刘振.商务智能应用中数据挖掘KNN算法的改进与高性能程序的实现D.浙江理工大学2013.3.5张雪婷,张晓平,王洪凯数据挖掘算法的一种实现方法J山东建筑工程学院学报,2003,(01):466Zheng Shan.Probability Reverse Nearest Neighbor Search for Probability Graph D.ZheJiang University.2012.1.7蒋本天,李英梅分布式数据库管理系统中的RNN方法J哈尔滨师范大学自然科学学报,2013,29(2):57598蒋本天,李英梅分布式数据库管理系统中的RNN方法J哈尔滨师范大学自然科学学报,2013,29(2):57599胡治国,张大陆,侯翠平,沈斌,朱安奇基于随机神经网络的多步网络时延预测模型J计算机科学,2009,36(7):858810周红福. 基于索引的Skyline算法研究 D.复旦大学2007.4.11王艳杰. 基于数据流的Skyline计算及
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 监理单位竣工验收总结报告模板
- 出租车运营数据隐私保护方案
- 2025年三级飞行员考试真题附答案
- 网络营销推广策略及效果分析报告
- 七年级数学相反数专题练习题集
- 冬季安全生产考试题库及答案解析
- 押运员从业人员资格考试及答案解析
- 基金从业考试从业方向及答案解析
- 购房合同协议书标准模板
- 低血容量性休克护理操作规程
- 家谱中奶奶的纪传范文
- 穴位按摩法操作评分标准
- (高清版)WST 227-2024 临床检验项目标准操作程序编写要求
- 《客舱安全与应急处置》-课件:灭火设备:旅客供养系统
- 英语AB级大纲词汇表(教育部下发的)1
- 2023全国卷甲卷应用文写作课件高三英语二轮复习
- 医院感染管理培训课件-呼吸科感染防控
- 中华民族复兴之路
- 苏教版三年级上册100道口算题(全册)
- 中式烹调师技能厨师培训课件
- 2024年上海申能集团招聘笔试参考题库含答案解析
评论
0/150
提交评论