学位论文开题报告初稿.doc_第1页
学位论文开题报告初稿.doc_第2页
学位论文开题报告初稿.doc_第3页
学位论文开题报告初稿.doc_第4页
学位论文开题报告初稿.doc_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京理工大学硕士研究生学位论文开题报告姓 名: 学 号: 109060970 学 科: 计算机应用 所在院系: 计算机科学及技术学院 指导教师: 王永利 2010 年 9 月 17 日填注:本表内容尽可能打印,宋体小四号,单倍行距。一、 拟选定学位论文的题目名称基于列存储的RFID数据的时态管理技术的研究与应用二、 选题的科学意义和应用前景随着计算机技术、通信技术、人机交互技术的快速发展,人类迎来物联网(The Internet of things)时代。物联网的定义是:通过射频识别(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络。目前,物联网中使用最多的、也是最成熟的技术是RFID(Radio Frequency Identification的缩写,即射频识别)。随着物联网的不断发展,人们对于RFID数据的存储以及查询要求也在不断提高。在与RFID相关的应用中,RFID数据具有如下几个特点:l 插入频率高,但不涉及修改。l 数据量很大,要求较高的数据压缩比。l 数据之间存在大量冗余。l 数据之间的属性可能存在较大差异,比如有的RFID标签只记录温度信息,有的只记录湿度信息,有的则两种信息都记录。基于RFID以上这些特点,国内外这方面的研究也有许多,例如RFID数据建模、RFID数据的存储模式、RFID数据管理、基于RFID的数据仓库等等。数据库系统是目前进行数据存储的主要方式,但随着企业信息化程度的提高,分析型数据库应用例如只读的OLAP查询有着不同于传统数据库应用的新需求,同时海量数据上的OLAP查询对高性能查询处理有更高的要求。基于这样的需求和背景,近年来对于列存储数据库的研究与开发越来越多。目前使用的绝大部分的数据库都是基于行的数据库系统,它将数据库表中的每一条记录中的不同属性进行连续存储。基于行存储的数据库与传统的数据库不同,在表中按属性而不是按行,进行连续存储。列存储数据库主要有以下几个优点:l 压缩比高。由于同一种属性的数据是连续存储的,相邻之间的数据相关性较高,压缩比也应此更高。l 查询更有效。每个字段的数据聚集存储,在查询只需要少数几个字段的时候,不会像传统数据库读出所有的属性,能大大减少读取的数据量。l 自动索引。由于查询中的选择规则是通过列来定义的,因此整个数据库是自动索引化的。因此,在高性能的OLAP应用中,将RFID这类传感数据采用列存储的方式进行记录,能更好的发挥列存储数据库的优势,将是一种更为合理的存储方式。今后,与以列存储为基础的相关技术和应用,也将逐渐成为研究的重点。时间索引(temporal index),概念源于时空数据库,功能是对和时间相关的时空数据库数据进行存储与索引,以提高查询效率。在RFID应用中,时间属性是十分重要的信息,比如贴有RFID标签的货物的入库时间等等。因此,在目前越来越多的基于RFID的海量、高性能的应用的背景下,基于时间查询的效率显得尤为重要,对于时间索引的研究也将十分有意义。本课题围绕数据库查询体系,对于RFID数据在列存储数据库中的时态管理技术进行研究,并在项目RFID标签动态信息实时管理软件的研究与开发中进行验证。重点研究基于RFID的时态数据模型、列存储数据库中时间索引的数据结构和算法,以及基于列存储的RFID数据仓库的分析算法。目标是提出一种更适合RFID时态管理的数据模型,在此基础上设计并实现一种基于列存储模型的时间索引,提出12中在列存储数据仓库中的分析算法,并且通过实验和实际应用验证其优越性。三、 背景科研项目情况简介本课题的科研项目背景是基于南京市科技发展计划,项目名称为RFID标签动态信息实时管理软件的研究与开发。根据Research and Markets公司的统计数据, 2010年与RFID相关的销售额预计会达到7.695亿美元,2011年将达到15.575亿美元。根据驰昂咨询(Sinotes)的数据显示,国内市场2005年RFID中间件在市场中占2.0亿,2007年市场规模已经达到了6.2亿元,预计在2010年达到19.4亿。从应领域来看,本项目成果RFID数据处理中间软件在电子支付、对象位置跟踪、物联网等领域具有广泛的应用。目前公认的基于RFID传感器的数据采集、管理、应用参考结构下图所示,分层结构从左到右三层分别是数据捕获层、RFID数据管理层、应用层。RFID数据采集、管理、应用系统结构数据捕获层由RFID标签、读写器组成,这些标签附加在对象上。该层处理形如(TagID,ReaderID,Timestamp)的数据流,同时处理在阅读器与标签对象交互期间产生的有关数据流的简单事件。RFID数据管理层(又称商业处理层)负责将来自阅读器的低层数据流映射成便于与应用层交互的易于管理的形式,此层最具有挑战性的工作是怎样将商务管理逻辑与来自数据捕获层的数据流进行组合,并能够实时响应用户注册的事件探测请求。考虑到RFID数据的巨大数量和不精确性,向下一层发送数据之前必须对低层数据进行处理,这种对低层数据处理包括数据清洗和聚集。复杂事件的检测和血统跟踪也是RFID数据处理层的另一主要任务。应用层支持高层应用的业务管理,诸如RTLS(实时定位系统)、ERP(企业资源计划)、SCM(供应链管理)、CRM(客户关系管理)等应用等。上述三层参考结构中RFID数据管理处于核心地位,本项目即是针对与数据管理层相关的动态数据实时管理、复杂事件处理、标签信息的动态跟踪等关键问题,设计一种基于数据流连续查询处理的RFID动态数据实时管理中间件平台,将物理世界中RFID观测值自动转化为虚拟应用世界中对应的形式,解决标签信息的时空一致性问题。本项目将为RFID多数据流实时管理中间件系统的发展建设提出科学的设计实现方法,规范应用查询语言,从而促进RFID软件的标准化建设,提高嵌入式设备及软件模块可靠性、通用性和复用率,缩短设备研制周期,加快RFID一体化进程,便于新技术的研究、试验和集成。为提升南京市乃至江苏省的RFID相关产业水平。本项目的总体目标为:开发完成支持RFID标签实时读写的RFID动态数据实时管理软件,解决基于RFID标签信息的动态跟踪存在的RFID标签信息时空一致性问题。主要创新点为:l 基于实时数据流管理系统的中间件设计,适于动态的海量RFID传感数据处理;采用多通道数据流输入,多事件探测连续查询注册,改变现有RFID数据单通道数据流处理模式,增强RFID应用的功能和RFID数据管理系统的动态可扩展性;l 灵活的可配置事件探测与处理框架允许用户以声明性事件语句定义规则或连续查询,实时捕获连续RFID数据流中有意义的事件信息。提供类似CEP的功能,为不同的应用提供了一个可重复使用的框架去实时的处理、评估和分析事件l 建立适应RFID数据特征的数据血统追踪模型。突破现有RFID数据仓库中无法支持复杂查询回溯的技术局限,基于流式处理的复杂查询结果血统追踪运算理论与血统追踪查询算法(涉及区域位置、距离、时间的逆选择、投影、并、交、聚集及连接运算)。可在线得出数据血统信息,为与时空相关的新型RFID智能追踪系统的研制提供科学而实用的计算依据。四、学位论文主要研究内容本课题主要研究内容包括如下部分:1. RFID数据建模方法RFID技术使得数据的传输具有速度快、并发度高、非接触等优点,但是,RFID原始数据结构简单,只含有隐式语义,同时也会出现数据冗余、漏读等现象,这些情况使得数据本身没有足够的语义供人们理解。因此,本课题将参照已提出的RFID数据模型以及时态数据的特点,研究如何对RFID数据进行更有效的建模。2. 列存储数据库中的时间索引技术与传统以行为主的数据库不同,在列存储数据库中,每张表中的记录按属性进行连续排列。因为数据按列存储,所以数据即是索引。目前,在列存储数据库的研究与开发中,已有一些基于某个数据类型或者某种数据特性的索引,例如低基数索引、高基数索引、Join索引等等,但是,对于列存储数据库中时间属性索引的研究目前并不多。对于时间索引技术的研究主要集中在时空数据库或者时态数据库,其主要思想是将数据库中的数据打上时间标记,并赋予一定的含义,比如数据进入时间、离开时间、时间区间等等,将这些时间标记存储在特定的数据结构中,使用算法对其进行索引,已达到基于时间的高效查询。本课题将基于目前的研究现状,结合时态数据库中时间索引的思想以及列存储数据库的数据存储特点,实现列存数据库基于时间的高效查询。3. 复杂时间查询优化技术目前绝大多数数据库,对于时间变量只支持变量之间诸如大于、小于关系的判断,而随着人们对于查询要求的日益提高,一些基于时间的复杂查询(例如时间区间相交、包含、时间长度判断等等)的支持以及其性能,也变得越来越重要。本课题将从两个方面研究如何使得列式关系型数据库支持复杂的时间查询:l 在SQL语句查询的上层进行扩展,程序接收用户提交的支持复杂时间查询的SQL语句,根据语句以及列存储数据库的特点,将其转化为标准的SQL语句,在提交给底层数据库系统,最后将查询结果返回给用户。l 运用编译原理、自动机等方面知识,对某种列存储数据库底层的查询子模块进行修改和扩展,使其支持时间变量的复杂查询。4. 索引压缩技术计算机存储的容量限制仍然日益成为IT系统的瓶颈。其主要原因有两个:第一,信息革命导致人们产生了比过去多得多的数据。巨大的数据库系统每时每刻都在产生海量的新数据。第二,随着计算机存储能力的增长,人们倾向于永久性保存所有的数据。随着存储的数据量越来越大,索引本身的数据量也变得十分庞大,因此对索引的压缩变得十分重要,目前也已经有与索引压缩相关的研究。本课题将参考以往的相关研究,针对列存储数据库中的时间索引,研究其压缩技术与策略,以保证在基本不影响查询效率的前提下,使得索引数据本身有比较好的压缩比。5. 列存储数据仓库的分析算法数据仓库的一个重要应用就是对于其中海量、复杂的数据进行分析,从中提取出有意义的信息。本课题将在RFID时态数据模型下,对已有的上卷、下钻、切边等传统数据仓库分析算法进行改进。6. (扩展标准SQL语句)五、 预期解决的主要问题(对每个预期解决的问题介绍其难点所在、国内外研究的现状和趋势、解决问题的基本思路和技术路线、预期解决到什么程度)本课题预期解决以下关键问题:l 基于时态的RFID数据建模技术RFID数据模型是管理RFID数据的基础,决定着基于该模型数据管理方法的有效性。因为RFID的应用领域众多,涉及到物流、仓储、安全等各个方面,因此建立的数据模型及其侧重点也不尽相同。国内外也已提出几种RFID数据模型,例如动态关系实体关系模型、位图数据模型、数据立方体模型等等,每种模型各有所长,本课题将对比几种RFID数据模型,针对RFID的时态性以及上层的数据分析特点,设计出一种新的基于时态的RFID数据模型。l 复杂时间查询索引技术目前的数据库管理系统中,绝大多数支持的SQL标准为SQL99,这一标准的SQL语句对于时间变量查询,只支持变量之间大于小于等关系的判断。在SQL2003标准中,SQL语句开始支持period(时间区间)类型的变量,这为SQL语句的复杂时间查询提供了标准。目前,已有在时间索引中关于时间区间重叠(overlap)的研究。本课题打算讨论和研究支持其他时间区间关系(例如包含、区间长度对比等)的时间索引技术,设计出一套数据结构和算法,对时间变量进行索引,有效的解决复杂时间的查询。l 时间索引数据结构的压缩技术对索引压缩比较常用的方法有 Golomb编码和 Eliass编码,压缩虽然减少了索引 占用的空间,但是同时也增加了查询时对索引解压的时间消耗。商用数据库DB2 也 在行压缩的基础上提出了索引压缩,减少磁盘空间的占用。但目前的索引压缩技术还存在一些局限:一是大多数索引压缩技术都是针对于文本或者文档的,与时间、区间相关的较少;二是大部分索引压缩技术都是基于目前流行的行存储数据库体系结构之上。随着列存储数据库概念的提出,对于列存储数据的索引以及相关技术将成为趋势。本课题将在提出的时间索引中,添加有关压缩的算法和策略,使得在保证较高时间查询效率的情况下,获得较高的压缩比。l 列存储数据库中时间索引的实现基于区间的查询索引技术,国内外已有一些研究,但其研究的领域一般集中在时空数据库和对象数据库。在时空数据库中,数据的时间属性都会和空间属性结合在一起,时空索引是其中的主要索引方式,一般通过R-tree、HR-tree等数据结构进行实现,其中空间属性是主要的研究对象,时间一般只作为其附属信息,单独对数据的时间属性进行索引的研究并不多。对于RFID数据,其时间属性十分重要,而对其空间属性的要求并不明显。目前,已有Relational Interval Tree等数据结构及相关算法提出,对关系数据库中的区间数据和时间索引进行研究。列存储数据库Sybase IQ也基于日期、时间和日期,开发出Time Analytic索引。本课题将参考Relational Interval Tree等研究方法,进行相应完善和改进,将时间索引在列存储数据库中实现。l RFID列式数据仓库的分析算法传统数据仓库技术没有考虑不同元组间的关系,而RFID的数据元组包含路径等结构信息,比如RFID标签在A处被检测到,接着又在B处被检测到,则形成一条从A到B的路径。已有研究在传统数据仓库的基础上,提出了一些RFID数据仓库架构,考虑到物件的成批移动、数据泛化、部分路径的融合和展开等问题,但由于RFID数据的不确定性,这部分则成为研究的难点。另外,在已提出的RFID数据仓库框架中,大部分并没有考虑RFID数据的时态性以及列存储模式对于RFID数据仓库在查询效率等方面的影响,本课题将在这些方面进行研究。六、开题条件参照模板修改,可缩减一些,突出与自己研究相关的内容(包括学术条件、设备条件、经费概算及其落实情况)学术条件:到目前为止,国际上关于不确定数据管理领域有很多研究成果,跟本课题相关的不确定复杂事件处理相关的系统研究以及相关的RFID处理技术已经相对成熟,这其中有很多包括RFID和通用复杂事件推演模型系统都已涌现,这对本课题两大研究点:典型复杂事件世系追踪以及RFID复杂事件推演模型研究,有很好的帮助;同时王永利导师在RFID数据处理这方面研究有很深的造诣,他给本课题的指导起到很重要的作用。本课题在前人众多丰富研究成果的基础上,创新提出多种新模型来解决目前相关研究领域的瓶颈问题。设备条件可以提一下江苏电信的配套环境,市科技局项目的申报书中有,比如服务器,磁盘阵列,等,突出海量数据处理的支撑环境:实验室已经建立基于网格定位方式的RFID标签定位环境,在标签的选择上,由于超高频有源射频电子标签发射功率极低,空中无线数据传输距离可达近百米,且外界环境对其传输性能影响小,因此本课题的实验环境以超高频有源标签、及与之配套的阅读器、网格定位设备为主。目前实验室已经搭建了由5个阅读器、10张有源标签构成的实验环境,未来拟部署不少于500张的该种有源标签及配套硬件以模拟真实监控场景,从而满足大规模RFID海量数据处理的需求。七、文献综述(通过对文献的整理和归纳,对应“学位论文主要研究内容”一栏所列出的问题,介绍国内外学者对这些问题的研究结果及对其前景的看法。)随着物联网概念的兴起,RFID这类传感数据的研究与应用也越来越多,但是,RFID数据的管理,也成为相应的难点。Fusheng Wang总结了RFID数据的以下几大特性以及面临的问题:l 时态性和动态性当读取数据时,所有传感数据都与时间戳相关联。数据的状态以及包含关系都随着时间而改变。l 隐式的语义以及数据不确定性RFID数据携带者隐式的信息,表示状态或者业务流程的改变。但同时,又存在数据重复读、漏读等现象,数据的准确程度不够高。l 流式以及海量由于RFID数据可以迅速、自动的产生,所以数据量会很大,需要一种存储模式,以保证有效的查询和更新。l 整合RFID数据的管理需要整合在已有的系统中,需要RFID管理系统可以方便的配置,用较小的代价进行整合集成。李战怀18等人对比了RFID数据与传统关系数据和其它数据流,总结了RFID数据的以下特点:1. 原始数据元组结构简单RFID数据元组形如(EPC,LOC,TIME),其结构简单,元组组成元素的语义明确。其中,EPC为物品或包装容器等的电子产品编码,LOC为阅读器的位置,TIME为本次记录读取的时间;2. 时态性和空间性RFID相关数据会随时间和空间而不断变化,例如动态采集所产生的观察数据中,带有状态改变的信息,物品的位置及物品间包含关系也会随着时间而变化。同时,在实际应用中阅读器和标签都可被内置于个人数字助理(Personal Digital Assistant,PDA)、手机或其他移动物体中,贴有标签的物品和阅读器都是运动的;3. 数据不准确RFID阅读器存在错误多读或者错误漏读等问题,这要求在将这些数据传递给下一个更高级别处理或业务应用之前,需做数据清洗工作;4. 连续流产生巨量数据若一个贴有RFID标签的物品在同一个位置停留,则阅读器会在每个时间间隔周期记录读数,并向数据库插入一个数据元组。一个中等规模的RFID应用每天将产生10亿字节数量级的RFID数据;5. 粒度RFID数据集的粒度层级可包括时间、空间位置、其他物品描述等,这些需要基于实施RFID系统的具体应用业务来确定;6. 并发与分布RFID实际应用场景中将部署多个RFID阅读器,并且每个RFID阅读器对应一个RFID数据流。对于特定物品的跟踪和分析,需要整合多个物理上分布的数据流。因此,对于RFID这类传感数据的有效组织、高效查询,将是十分重要的。RFID数据模型是管理RFID数据的基础,已有多种RFID数据模型被提出,例如动态关系实体关系模型、位图数据模型、数据立方体模型、流立方体模型等等。其中,动态关系实体关系模型采用物件包含和关联等关系聚合RFID数据,通过基于规则的方法来解决问题,但并未考虑RFID事件/数据泛化等问题。位图数据模型将具有相同EPC前缀的元组压缩成一条记录,数据压缩比和查询效率较高,但没有考虑对RFID事件数据的时态、数据流等特性的支持。数据立方体模型包括一个由RFID数据在不同抽象层级上聚合而得到的高度精简摘要的层次结构,在数据压缩、查询处理效率等方面更有优势,但该RFID数据立方体模型及分析方法的前提单个物件在早期倾向于成批移动和停留的假设,在除供应链之外的许多其他应用领域中,如身份识别,并不成立。流立方体采用概率模型建模,但该模型如同数据立方体,也是基于单个物件在早期倾向于成批移动和停留的假设,因而适用范围缩小。另外,如何采用索引优化查询,提高查询速度,也是研究的重点与难点。索引是一个单独的、物理的数据库结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。表的存储由两 部分组成,一部分用来存放数据页面,另一部分存放索引页面。通常,索引页面相对于数据页面来说小得多。数据检索花费的大部分开销是磁盘读写,没有索引就需要从磁盘上读表的每一个数据页,如果有索引,则只需查找索引页面就可以了。所以建立合理的索引,就能加速数据的检索过程。近年来,随着移动计算和无线通信等技术的发展,时空数据库广泛应用于交通控制和全球定位等领域。为了支持时空查询和有效地管理时空数据库中海量的时空对象,专家学者提出了大量的时空索引方法。比如基于快照-增量的时空索引19、COLR-Tree20、SEST索引21等。其中大部分方法的思想是维护数据库在某些时刻的快照,并用日志来存储发生在两个连续的快照之间发生的事件。当一个对象的空间属性在某个特定的时刻发生改变时,就会产生一个事件。日志按时间顺序存储,可以重构两个连续快照之间的数据库的任何状态,然后再在这些日志的基础上进行查询。大部分的时空索引着重研究数据的空间属性,对于那些时间属性很重要、但空间属性重要程度不明显或者没有空间属性的数据,并不能进行很好的索引和查询。时间索引就是针对时态数据提出的,将研究的重心放在了数据的时间属性上。Ramez等人于1990年提出Time Index2技术,在B+树的基础上,扩展出支持简单区间查询的数据结构和算法。以后,又有许多方法被提出,例如TP-index3、Relational Interval Tree5等等。TP-index的主要思想是将时间段转化为以“起始时间”、“结束时间”为坐标轴的二维平面上的线段,再将二维的图形分解成一系列标准的二维图形,从而达到索引的作用。Relational Interval Tree提出了在关系型数据库中实现时间区间管理的方法,使得用户都能在绝大多数关系型数据库之上整合这种方法。近年来,随着企业信息化程度的提高,分析型数据库应用例如只读的OLAP查询有着不同于传统数据库应用的新需求,同时海量数据上的OLAP查询对高性能查询处理有更高的要求。目前物联网的蓬勃发展,基于RFID技术的物联网相关应用也越来越受到人们的关注。由于RFID标签的读写频率高、速度快、数据量大,因此对于RFID数据的高效存储、查询和索引就显得尤为重要。基于这样的需求,许多相关研究认为,采用列存储体系,把同一列(或属性)的数据连续存储在一起,会更有效率。因为这类面向ad-hoc大数据量查询的系统大多是读优化(read-optimized)的(例如数据仓库),常常是短时间内写入大批新数据,然后长时间的进行ad-hoc查询操作。其他以读操作为主的应用系统包括customer relationship management (CRM)系统,electronic library card catalogs和其他ad-hoc查询系统。现有的数据仓库产品如Sybase IQ,Addamark和KDB都能证明这个观点。在国内,于利胜23等人提出了基于行存储模型的模拟列存储策略,采用聚类相关属性、全索引等方法模拟列存储,以减少系统的部署和维护成本。但Daniel24等人在其研究中,通过实验和对比得出结论,在不改变数据库存储层以及查询执行器的前提下,通过常规的数据库优化策略,行存储数据库是无法取得列存储数据库的优势的。C-Store7是一套基于列存储的原型系统,其中结合了读优化的列存储系统和写优化的存储系统,用一个叫tuple mover的模块来联系它们。在顶层,有一个小的可写存储组件(WS),支持高性能的插入和更新。还有一个大些的读优化组件(RS),支持大数据量读取。RS对数据读取进行了优化,只能进行特殊的插入,比如从WS到RS的批量记录转移,这个转移工作由tuple mover来完成。C-Store提供了一种列存储的系统框架,但其中并未涉及列存储索引以及时间查询优化的相关研究。数据仓库概念始于上世纪80年代,由William H. Inmon提出,目前更为精确的定义为“在企业管理和决策中间面向主题的、集成的、与时间相关的、不可修改的数据集合”。李战怀18等人指出,目前,RFID数据仓库与传统数据仓库有所不同,传统数据仓库技术没有考虑不同元组间的关系,而RFID的数据元组包含路径等结构信息。通常,一般数据仓库中的数据更新并不频繁,而典型的RFID应用中数据更新是频繁的,而且更需要当前数据,所以RFID基础架构中需要支持数据在线传播方法。Gonzalez16根据RFID数据仓库的特点,在其研究中提出了RFID数据立方体概念。RFID数据立方体中的表stay和表info各自都具有一个关联的概念层级结构。这个概念层级结构是一个从较低层级抽象到较高层级映射的偏序关系。为了获得对各个抽象层级查询的快速响应,只计算最小限度感兴趣层级的RFID数据立方体。在做上卷或下钻操作时,如果还未物化需要的RFID数据立方体,那就从该数据立方体最靠近的已物化的低层级而不是最低层级开始做计算。通过采用关系查询执行和优化技术,就可以有效地实现切片和切块操作。但这种RFID数据立方体模型对RFID数据的时态性等未做充分考虑。八、学位论文工作进度安排本课题计划分为以下几个阶段进行:1. 课题开题阶段(2010年7月2010年9月)本阶段主要进行查阅文献,收集资料和调查研究的工作,做到了解和把握本研究课题的国内外现状、前人工作、发展动态等,并在此基础上形成自己对研究课题的想法。撰写开题报告,阐述要做的工作,并做好资料准备。2. 课题初期阶段(2010年9月2011年1月)本阶段从RFID数据建模、查询索引以及数据仓库三个方面关键技术的理论进行研究,讨论自己提出的想法在这些研究方向的可行性, 构思针对时态特点的RFID数据模型、索引数据结构以及RFID数据仓库的框架。3. 课题中期阶段(2010年1月2011年7月)本阶段按照设计方案,实现一套原型系统,并加以测试和对比,根据测试结果不断改进设计方案,最终将设计的系统应用在在实际项目中。4. 完成论文阶段(2011年7月2011年12月)本阶段主要根据前面的研究,整理资料,完成学位论文的撰写工作。5. 准备答辩阶段(2011年12月2012年2月)本阶段主要进行答辩的各方面准备工作,向答辩委员会提交论文评审,申请论文答辩并最终通过。硕士生签名: 年 月 日九、指导教师意见拟选定学位论文的题目为基于列存储的RFID数据的时态管理技术的研究与应用,研究内容包括:RFID数据建模方法;索引压缩技术;列存储数据仓库的分析算法;列存储数据库中的时间索引技术。本课题研究成果将广泛应用于物联网数据处理,实时OLAP分析等领域,具有重要的理论研究价值和应用价值。选题为本学科前沿领域,具有较强的先进性,有较大的理论意义或应用价值;有足够的工作量。所选课题涉及较深的基础理论和专门知识或解决工程技术问题所需的基础理论和专门知识。阅读较广泛,综述较全面,归纳总结较正确,基本掌握了本学科国内外发展最新动态。符合硕士学位论文开题要求,可以进入硕士学位课题研究阶段。 指导教师签名: 年 月 日查阅主要文献资料目录清单序号作 者题 目刊物名称期(卷)号年份起止页码1Fusheng Wang,Peiya LiuTemporal Management of RFID DataProceedings of the 31st VLDB Conference20051128-11392Ramez Ehnasri, Gene T. J.Wuu, Yeong-Joon KimThe time index:an access structure for temporal dataProceedings of the 16th VLDB Conference19901-123Han Shen Beng ,Chin Ooi ,Hongjun LuThe TP-Index: A Dynamic and Efficient Indexing Mechanism for Temporal DatabasesProc.IEEE Conf. Data Eng1994274-2814Christoph Brochhaus , Jost Enderle, Achim Schlosser , Thomas Seidl, Knut StolzeEfcient interval management using object-relational database serversInformatik Forsch. Entw202005121-1375Jost Enderle, Nicole Schneider , Thomas SeidlEfficiently Processing Queries on Interval-and-Value Tuples in Relational DatabasesProceedings of the 31st VLDB Conference2005385-3966Dengfeng Gao, Christian S.Jensen, Richard T. Snodgrass, Michael D. SooJoin operations in temporal databasesVLDB Journal1420052-297Mike Stonebraker, Daniel J. Abadi, Adam Batkin, Xuedong Chen, Mitch Cherniack, Miguel Ferreira, Edmond Lau, Amerson Lin, Sam Madden, Elizabeth ONeil Pat ONeil, Alex Rasin, Nga Tran, Stan ZdonikC-Store: A Column-oriented DBMSProceedings of the 31st VLDB Conference2005553-5648Daniel J. Abadi, Peter A. Boncz, Stavros HarizopoulosColumn-oriented Database SystemsVLDB 09200924-289Daniel J. AbadiColumn-Stores For Wide and Sparse Data3rd Biennial Conference on Innovative Data Systems Research (CIDR)January20077-1010Daniel J. Abadi, Samuel R. Madden, Miguel C. FerreiraIntegrating Compression and Execution in Column-Oriented Database SystemsSIGMOD 2006June200627-2911Daniel J. Abadi, Daniel S. Myers, David J. DeWitt, Samuel R. MaddenMaterialization Strategies in a Column-Oriented DBMSComputer Science and Artificial Intelligence LaboratoryTechnical Report200612Stavros Harizopoulos, Velen Liang, Daniel J. Abadi, Samuel MaddenPerformance Tradeoffs in Read-Optimized DatabasesVLDB 06September200612-1513Milena Ivanova, Martin L. Kersten, Niels NesSelf-organizing Strategies for a Column-store DatabaseEDBT08March200825-3014Stratos Idreos, Martin L. Kersten, Stefan ManegoldSelf-organizing Tuple Reconstruction in Column-storesSIGMOD09June 29July 22009297-30815Harry K. H. CHOW, K.L.CHOY, W.B.LEEDesign of a RFID-Based Resource Management System for Warehouse Operation2005 3rd IEEE International Conference on Industrial Informatics (INDIN)2005785-79016Hector Gonzalez, Jiawei Han, Xiaolei Li, Diego KlabjanWarehousing and Analyzing Massive RFID Data SetsProceedings of the 22nd International Conference on Data Engineering20061-1017Jiawei Han, Hector Gonzalez, Xiaolei Li, and Diego KlabjanWarehousing and Mining Massive RFID Data SetsADMA20061-1818李战怀, 聂艳明, 陈群, 尚学群RFID数据管理的研究进展中国计算机学会通讯 2007(8)第 3 卷 第 2 期200719尹章才, 李霖基于快照-增量的时空索引机制研究测 绘 学 报第 34 卷 第 3 期2005257-26120Yanif Ahmad, Suman NathCOLR-Tree: Communication-EfcientSpatio-Temporal Indexing for aSensor Data Web PortalICDEApril200821祝蜀平, 赵瑾瑾时空数据库索引方法研究计 算 机 技 术 与 发 展第 18 卷 第 7 期200856-5922Roger MacNicol, Blaine FrenchSybase IQ Multiplex Designed For AnalyticsProceedings of the 30th VLDB Conference20041227-123023于利胜, 张延松, 王珊, 张倩基于行存储模型的模拟列存储策略研究计算机研究与发展47(5)2010878-88524Daniel J. Abadi, Samuel R. Madden, Nabil HachemColumn-Stores vs. Row-Stores: How Different Are They Really?SIGM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论