《面向电子商务的大数据存储与分析技术及其应用》 项目总结_第1页
《面向电子商务的大数据存储与分析技术及其应用》 项目总结_第2页
《面向电子商务的大数据存储与分析技术及其应用》 项目总结_第3页
《面向电子商务的大数据存储与分析技术及其应用》 项目总结_第4页
《面向电子商务的大数据存储与分析技术及其应用》 项目总结_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

面向电子商务的大数据存储与分析技术及其应用》项目总结报告一、项目概况项目基本信息:本项目是由东南大学和焦点科技股份有限公司联合承担,立项时间为2013年9月,项目编号(BY2013073-01),项目负责人为东南大学计算机科学与工程学院东方。本项目研究经费210万元,其中省拨款30万元,单位自筹180万元。随着电子商务行业的深入发展,将会产生并积累更大规模的业务数据,同时为了满足用户日益复杂的查询请求,提高服务质量,电子商务提供商也必将支持更加高效的数据分析处理操作。此时电子商务将面临PB级数据的存储与分析处理,因此是一个典型的大数据处理应用。近年来,在电子商务数据量不断扩大的同时,相应的数据分析与处理应用也日趋复杂。基于此,实现电子商务大数据应用的高效执行与处理将面临新的挑战:(1) 如何实现电子商务图数据查询与分析传统电子商务应用主要进行面向单一对象的数据分析与处理,如面向个体用户的个性化推荐等,并不支持面向群体对象的数据挖掘与分析;另一方面,目前电子商务数据分析过程通常基于表结构进行数据的逐行扫描计算,没有考虑全局数据间的逻辑相关性。然而,随着电子商务数据量的不断增大,数据间的逻辑关系也变得不断复杂化。此时用户信息、商品信息以及用户行为(购买、访问等)之间具有广泛的时空序列关系,可以建模成大规模图结构(其中实体可表示为节点,关系可表示为边)。此时的大数据处理过程可以转化为基于图数据的查询与分析。因此为了能够利用全局信息进行更加灵活的分析与挖掘,需要提供支持大规模复杂图数据的查询与分析机制。(2) 如何实现支持流式数据处理的大数据并行计算框架电子商务数据产生方式通常是流式的,然而传统电子商务应用的数据更新时间往往是非实时的(以天为单位更新),在这种情况下数据的时效性往往得不到保证,而最新的数据在数据挖掘过程中所表现出的意义可能更为重要。因此面对电子商务产生的海量流数据,对静态数据的批处理已经难以满足业务需求。为了能够让电子商务数据分析应用更加具有实时性,需要对不断到达的流式数据进行分析与处理。因此需要提供支持流式数据处理的大数据并行计算框架及相关技术。(3) 如何实现面向电子商务的大数据高效存储、组织与管理随着电子商务应用的不断发展,电商平台需要管理的数据容量、速率和价值在持续、快速增长,底层存储系统也相应地面临严峻的扩展问题;同时由于电子商务数据分析处理过程中对数据的访问频度各不相同,且随时间变化,极有可能导致局部热点数据过载以及系统负载不均等问题。为平衡性能、容量、能耗和价格等需求,亟需一种面向电子商务大数据的新型数据存储架构及数据组织模式,在控制电商平台运维成本同时,让底层存储系统更加高效化,数据管理更加智能化。根据以上分析,现有电子商务数据处理技术无法有效满足大数据环境下电子商务的应用需求,缺乏完整的支持电子商务大数据处理的模型框架以及管理与分析的相关技术。基于上述需求,东南大学与焦点科技股份有限公司联合承担了江苏省产学研前瞻性研究项目“面向电子商务的大数据存储与分析技术及其应用”的研究工作,从实现电子商务大数据应用的高效执行与处理所面临的挑战出发,重点研究面向电子商务的大数据管理与分析技术。具体内容包含四个方面1)研究图结构的电子商务大数据处理机制:拟结合电子商务多源数据联合分析及个性化推荐应用的数据特征,研究基于图结构的新型数据组织模型,将原有结构化、非结构化数据按照时空特性进行抽象和重组织,形成图数据。结合大规模图数据所具有的内在逻辑关系,设计面向上层应用的多指标图分割算法,在考虑子图间逻辑关系的前提下降低子图间耦合性,进而提出通用分布式图查询算法,以支持上层分析和推荐应用。2)研究电子商务大数据流式处理模型及相关机制:为了满足电子商务多源数据联合分析及个性化推荐的实时性需求及推荐应用的时效性需求,我们还将基于通用数据并行计算平台Hadoop研究基于数据本地化的流式处理模型,设计数据本地化机制、研究内存管理机制、设计流水线任务调度机制,为上层电子商务应用提供透明的流式数据支撑平台。3)研究电子商务大数据处理的自动分级存储架构及数据组织与管理机制:针对电子商务大数据处理特性,以及不同的存储设备在性能、容量、价格上的不同,研究并设计具有高度可扩展性、高效性以及自适应性的分级存储系统架构,在此基础上,研究海量电子商务相关数据的放置算法及数据迁移策略,从而更好地为大数据处理分析提供高效服务。4)支持电子商务应用的大数据处理平台设计与实现:面向电子商务大规模数据处理的实际需求,综合运用分布式数据组织管理机制以及流式数据处理机制等上述理论研究成果,设计并实现大数据处理支撑平台,并与企业现有的电子商务平台进行整合,从而支持个性化推荐和数据挖掘等典型电子商务大数据应用,并且验证本项目所取得的各项理论成果,与此同时,通过该系统的示范作用将项目研究成果加以推广。二、项目实施情况经东南大学及焦点科技股份有限公司双方协作,本项目成立了以项目负责人为首的校企联合研发团队共计15人,其中副教授3人,讲师2人,企业工程师5人,博硕士研究生5人。经过两年多的产学研合作研究,较系统研究了面向电子商务的大数据存储与分析技术,成功研制了支持电子商务应用的大数据处理平台原型系统,集成到焦点科技股份有限公司现有的电子商务平台并实现了示范应用,圆满完成了研发和产业化任务。具体表现在以下几方面:1)在基于图结构的电子商务大数据处理方面,结合电子商务多源数据联合分析及个性化推荐应用的数据特征,本项目研究了基于图结构的新型数据组织模型,将原有结构化、非结构化数据按照时空特性进行抽象和重组织,形成图数据。结合大规模图数据所具有的内在逻辑关系,设计了面向上层应用的多指标图分割算法,在考虑子图间逻辑关系的前提下降低子图间耦合性,进而提出了通用分布式图查询算法,以支持上层分析和推荐应用。2)在电子商务大数据流式处理方面,为了满足电子商务多源数据联合分析及个性化推荐的实时性需求及推荐应用的时效性需求,本项目基于通用数据并行计算平台Hadoop研究基于数据本地化的流式处理模型,设计了数据本地化机制、研究了内存管理机制、设计了流水线任务调度机制,为上层电子商务应用提供流式数据支撑平台。3)在面向电子商务大数据处理的自动分级存储架构及数据组织与管理方面,针对电子商务大数据处理特性,以及不同的存储设备在性能、容量、价格上的不同,研究并设计了具有高度可扩展性、高效性以及自适应性的分级存储系统架构,在此基础上,提出了海量电子商务相关数据的放置算法及数据迁移策略,从而更好地为大数据处理分析提供高效服务。4)在支持电子商务应用的大数据处理平台的设计、实现与应用方面,面向电子商务大规模数据处理的实际需求,综合运用分布式数据组织管理机制以及流式数据处理机制等上述理论研究成果,设计并实现了大数据处理支撑平台,并与企业现有的电子商务平台进行了整合,从而支持个性化推荐和数据挖掘等典型电子商务大数据应用。达到了图数据处理加速比、流式处理加速比、处理响应时间以及平台可扩展性等方面的设计要求,充分验证了本研究的理论成果的可用性,提升了企业的服务质量和经济效益。5)项目完成时,共申请发明专利9项;软件著作权1项;在国内外核心期刊和会议上发表论文25篇,其中SCI收录论文7篇,EI收录论文24篇。6)项目研究过程中,培养博士研究生6名(张竞慧、王宇翔、周经亚、熊润群、沈典、史济源),硕士研究生6名(施洵、张毅、陈苗、张骏雪、杨业、丁玎)。项目执行期间,焦点科技股份有限公司通过应用面向电子商务的大数据存储与分析技术技术,为中国制造网平台的运行提供了更好的支持。合计实现新增销售580万元,利税233.5万元。三、项目技术情况本项目主要围绕面向电子商务的大数据存储与分析技术,从基于图结构的电子商务大数据处理机制、数据流式处理模型及相关机制、电子商务大数据处理的自动分级存储架构及数据组织与管理机制以及支持电子商务应用的大数据处理平台等四个方面进行研究与开发,具体技术情况汇报如下:1) 图结构的电子商务大数据处理机制•解决的关键技术结合电子商务多源数据联合分析及个性化推荐应用的数据特征,研究基于图结构的新型数据组织模型。结合大规模图数据所具有的内在逻辑关系,设计面向上层应用的基于超快技术的图分割算法,在考虑子图间逻辑关系的前提下降低子图间耦合性,进而提出通用分布式图查询算法,以支持上层分析和推荐应用。•研究方法及技术路线基于超块划分算法的整体工作流程如图1所示。给定原始的大规模图数据后,首先将对大规模图数据进行预划分,形成原子快。原子块根据应用的执行模式组合后得到超块,组合过程将同时考虑均衡计算负载以及减小网络开销这两个目标。预划分阶段的主要任务是将大规模的图数据通过一定的方法划分为一组原子块。划分的方法可以采用基于哈希的方法或者聚类的方法。相较于超块组合而言,图数据的预划分阶段将需要较长的计算时间并消耗大量的计算资源。但是对于同一份图数据而言,预划分操作是离线进行的并且只会进行一次,因此其开销是可以接受的。而在线动态超块组合算法相比离线的划分算法而言,则更加快速和高效。该阶段将会利用预划分阶段产生的原子块来生成超块。相比原始的图而言,原子块的数量远小于原始的图的顶点,因此在线动态超块组合算法只需要在一个较小的数据集上进行处理。受益于超块组合这种快速、高效的方法,使得动态为每个应用进行满足应用需求的数据划分成为了可能。•取得成果及创新点针对各类图数据处理应用资源需求各不相同的特点,本文提出了面向应用感知的大规模图数据快速划分方法。提出了大规模图数据处理应用执行模式抽取和分析技术和基于超块思想的大规模图数据划分方法,通过自适应感知应用的资源需求,动态调整图数据划分策略,达到加快处理电子商务图数据的目的。图结构的电子商务大数据处理机制解决的关键技术为了满足电子商务多源数据联合分析及个性化推荐的实时性需求及推荐应用的时效性需求,我们还将基于通用数据并行计算平台Hadoop研究基于数据本地化的流式处理模型,设计数据本地化机制、研究内存管理机制、设计流水线任务调度机制,为上层电子商务应用提供透明的流式数据支撑平台。研究方法及技术路线电子商务数据产生方式通常是流式的,然而传统电子商务应用的数据更新时间往往是非实时的(以天为单位更新),在这种情况下数据的时效性往往得不到保证,而最新的数据在数据挖掘过程中所表现出的意义可能更为重要。因此面对电子商务产生的海量流数据,对静态数据的批处理已经难以满足业务需求。为了能够让电子商务数据分析应用更加具有实时性,需要对不断到达的流式数据进行分析与处理。因此需要提供支持流式数据处理的大数据并行计算框架及相关技术。本项目通过数据本地化、中间数据分发流水线和基于KVBTree的内存管理技术提高电子商务大数据流式数据处理执行性能。在数据本地化及中间数据分发流水线方面,数据本地化技术使得数据提前发送、聚合与存储;通过使用数据本地化机制,可以使数据发送与聚合同时进行,以提高系统处理速度。本项目提出基于概率统计的划分方法,是根据数据分布的特点进行划分,追求数据划分的均匀性,可以保证StreamMapReduce各个节点负载的均衡性。有效解决简单hash划分法的不足。另一方面,对于大数据处理,系统瓶颈一般在于IO,CPU资源相对较充裕,通过分发流水线控制与调度,可以一定程度上提高CPU的使用率,由于计算结果直接传递到下一阶段,一定程度上也缓解了当前节点的IO负载。具体如图2所示。在基于KVBTree的内存管理方面,由于MapReduce中间结果为<key,list(value)>这一特殊形式,需要设计特定的适用B+树才能存放。基于此本项目根据大数据处理中的中间数据的特性,使用类似B+树的索引结构管理大规模的中间数据,保证其存储的可靠性、大容量、高速读写等性能。具体包括相关数据结构的定义,如:树节点结构,数据区结构,缓存区结构,缓存区信息头结构等等;以及缓存区的建立与管理。具体如图3所示。

l\xl\x■:102:x10:x103:x100:x104:x101:x105:x106:x•取得成果及创新点针对当前Hadoop等大数据处理模型在处理流式数据时效率低下的问题,提出了数据本地化处理、中间数据分发流水线和基于KVBTree的内存管理等执行优化技术。上述技术通过减少计算节点间的数据传输量、减少计算节点间同步等待时间、减少磁盘10开销,达到加快处理流式数据的目的。3) 电子商务大数据处理的自动分级存储架构及数据组织与管理机制解决的关键技术针对电子商务大数据处理特性,以及不同的存储设备在性能、容量、价格上的不同,研究并设计具有高度可扩展性、高效性以及自适应性的分级存储系统架构,在此基础上,研究海量电子商务相关数据的放置算法及数据迁移策略,从而更好地为大数据处理分析提供高效服务。研究方法及技术路线为平衡性能、容量、能耗和价格等需求,亟需一种面向电子商务大数据的新型数据存储架构及数据组织模式,在控制电商平台运维成本同时,让底层存储系统更加高效化,数据管理更加智能化。为实现上述目标,本项目提出了如图4所示的采用异构性感知的动态副本放置策略的大规模异构Hadoop系统模型。

□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□BigDataSetAdministrator图4基于SLRP的异构Hadoop系统模型BigDataSetAdministrator在此基础上,设计并实现了一个Hadoop集群节点的异构性感知模块(Heterogeneity-awareModule,简称HaM),采用节点异构性感知算法(Heterogeneityawarealgorithm,简称Haag)对大规模Hadoop集群节点进行分级管理,形成多层级的虚拟存储域(VirtualStorageTier,简称VST);然后,通过数据块热度监测模块(HotnessMonitor,简称HoM),采用文件访问热度感知的复制机制(Hotness-ProportionalReplication,简称HoP)确定其副本因子,以优化存储资源的利用率;在此基础上,数据副本放置模块(Snake-LikeReplicaPlacement,简称SLRP)在每个虚拟存储域内按照Snake-Like方式对数据块及其副本进行布局,充分利用多层级VST内节点性能的差异性,尽量把热点数据及其副本分布在高性能的VST中,以此引导MapReduce任务集中运行在性能优异的Hadoop节点上,并进行VST域内的负载均衡;最后,通过能耗控制模块(PowerControl,简称PoC)管理集群所有虚拟存储域的能耗开销,并结合基于SLRP的数据块副本放置方案,按照一定的策略关闭或开启集群中的节点,优化Hadoop集群的能耗开销。•取得成果及创新点针对电商平台需要管理的数据容量、速率和价值在持续、快速增长导致底层存储系统面临严峻的扩展问题以及局部热点数据过载和系统负载不均等问题,提出了大规模集群节点异构感知算法,并基于此设计了一种蛇形电商大数据放置策略,在控制电商平台运维成本同时,让底层存储系统更加高效化,数据管理更加智能化。4) 支持电子商务应用的大数据处理平台•解决的关键技术面向电子商务大规模数据处理的实际需求,综合运用分布式数据组织管理机制以及流式数据处理机制等上述理论研究成果,设计并实现大数据处理支撑平台,并与企业现有的电子商务平台进行整合,从而支持个性化推荐和数据挖掘等典型电子商务大数据应用,并且验证本项目所取得的各项理论成果。•研究方法及技术路线采用相关研究成果并基于开源云软件部署相应的研究成果,实现支持电子商务应用的大数据处理平台,具体架构及各组件间的逻辑交互关系如图5所示。底层云计算环境为上层提供基础设施;数据存储管理层包括数据采集、数据预处理、数据预放置和数据迁移等;数据处理技术层包括大数据分析、大数据查询和流式数据处理;应用服务层包括应用解析与构建、电子商务应用集合、任务调度和资源管理。对于数据存储部分,由于电子商务平台的客户量大,用户数据多达TB级,为了实现高效、可靠地数据存取,我们对底层各类存储介质进行自动分级管理,并采用HadoopHDFS文件系统组织存储海量的用户数据。对于数据分析部分,利用图查询技术构建用户数据全局视图,基于图数据时空序列关系及属性逻辑关系实现两阶段图分割算法和图查询算法,丰富个性化推荐结果,促进其完整性,同时使得数据挖掘内容更加多样化。此外,为了应对电子商务中数据流式到达情况,我们对HDFS系统进行二次开发,设计基于内存管理的数据本地化计算、存储机制,实现流式数据的本地化处理,以提供对个性化推荐以及数据挖掘应用中流数据处理的支持。在任务调度和资源管理部分,我们采用HadoopMapreduce处理模型,针对性地分析电子商务应用的资源使用特点,优化了其中的资源分配方案。在云基础设施层,我们拟采用开源软件OpenStack搭建云计算环境。OpenStack具有易扩展、较灵活、兼容性好等特点可以很容易地同其他模块进行相互协作和配合。•取得成果及创新点结合电子商务平台的特点,基于东南大学云计算平台,开发完成基于子图匹配的电子商务推荐、基于流式数据处理的在线聚集查询、大数据分级存储等模块,实现了云计算环境下面向电子商务的查询和推荐原型系统。通过将该系统与企业现有电子商务平台的集成,完成了企业数据查询与推荐的实际部署运行,达到了计算(存储)可扩展性、数据处理实时性等设计要求,充分验证了本研究的理论成果的可用性,提升了企业的服务质量和经济效益。四、合同任务指标完成情况在江苏省产学研前瞻性研究项目的资助下,东南大学联合焦点科技股份有限公司开展了紧密的产学研合作研究,取得了以下研究成果:1) 主要的技术指标完成情况深入研究了基于图结构的电子商务大数据处理技术:提出了大规模图数据处理应用执行模式的抽取和分析机制。结合大规模图数据所具有的内在逻辑关系,设计面向上层应用感知的多指标图分割算法,实现了复杂电子商务数据的快速组织与划分。在考虑子图间逻辑关系的前提下降低子图间耦合性,进而提出通用分布式图查询算法。深入研究了电子商务大数据流式处理模型及相关技术:针对电子商务多源数据联合分析及个性化推荐的实时性及时效性需求,建立了基于数据本地化的流式处理模型,提出了数据本地化及中间数据分发流水线技术,基于KVBTree的内存管理技术。深入研究了面向电子商务大数据处理的自动分级存储架构及数据组织与管理技术:针对电子商务大数据处理特性,以及不同的存储设备在性能、容量、价格上的不同,建立了采用异构性感知的动态副本放置策略的大规模异构Hadoop系统模型,并提出Hadoop集群系统节点异构性感知算法、基于热度感知的数据副本复制机制。东南大学和焦点科技股份有限公司结合电子商务的特点,基于所研发的大数据分析处理技术和东南大学云计算平台,设计并研制出支持电子商务应用的大数据处理平台。通过将该系统集成进焦点科技股份有限公司现有电子商务平台进行应用及测试,证明本项目所研发的支持电子商务应用的大数据处理平台具有可扩展性强、数据访问延迟低、支持TB级数据处理等特点。(1)在基于图结构的电子商务大数据处理方面,本系统支持十亿用户规模的图数据数据,并可近实时(秒级)地商品推荐。本系统可扩展性强,与单机环境相比,4台服务器以上的集群环境的加速比大于2.5;(2)在电子商务大数据流式处理方面,本系统支持基于流式处理的电子商务数据在线聚集操作,可对TB级电子商务数据近实时(秒级)地进行分析处理。相较于Hadoop等采用Block方式处理数据的模型,流式数据数据处理的加速比大于2;(3)在面向电子商务大数据处理的自动分级存储架构及数据组织与管理方面,支持大规模Hadoop集群节点的异构性感知,可形成多层级的虚拟存储域,能够完成PB级的电商大数据高效放置。对于热点的电商大数据能够在秒级范围内完成必要迁移,与现有HDFS相比,电商平台任务的执行效率提升了近25%;对于低价值的电商大数据,则被自适应地迁移到低级存储层级,有效提升了存储空间效率,提升幅度超过30%。充分验证了本研究的理论成果的可用性,满足了不断扩大的电子商务大数据分析处理应用需求,提升了企业的服务质量和经济效益。项目共申请发明专利9;软件著作权1项;在国内外核心期刊和会议上发表论文25篇,其中SCI收录论文7篇,EI收录论文24篇。项目培养博士研究生6名,硕士研究生6。焦点科技股份有限公司通过应用面向电子商务的大数据存储与分析技术技术,为中国制造网平台的运行提供了更好的支持。合计实现新增销售580万元,利税233.5万元。申请的国家发明专利熊润群,罗军舟,东方,金嘉晖.一种云数据中心大规模异构集群节点快速定量分级方法,国家发明专利,受权时间:2016.9,授理号:201610809567.2.张竞慧,董坚,罗军舟.一种基于日志分析的IaaS云平台网络故障定位方法及系统,国家发明专利,受理时间:2016.9,受理号:201610808973.7.东方,罗军舟,张毅,王宇翔,徐晓冬.大数据环境下的流式数据处理方法,国家发明专利,授权时间:2016.6,授权号:ZL201310287554.X东方,罗军舟,沈典.一种用于云计算环境中防范旁路攻击虚拟机的方法,国家发明专利,受权时间:2015.4,授权号:ZL201210356355.5.东方,罗军舟,金嘉晖.基于网络带宽估计的云计算任务调度方法,国家发明专利,授权时间:2014.12,授权号:ZL201210205574.3.东方,陈苗,罗军舟,孟宪栋.高性能计算和云计算混合环境中的动态资源管理方法,国家发明专利,受理时间:2014.8,受理号:201410410274.8.东方,周经亚,罗军舟.一种基于DHT机制的云存储系统的资源动态分配方法,国家发明专利,受理时间:2014.7,受理号:201410326861.9.东方,罗军舟,王巍,黄彬彬.一种基于动态定价策略的多数据中心成本优化方法,国家发明专利,受理时间:2013.10,受理号:201310519850.8.东方,罗军舟,施洵,朱夏,徐晓冬.电子商务环境下基于云计算处理模式的个性化推荐方法,国家发明专利,受理时间:2013.10,受理号:201310287555.4软件著作权登记证书东方,施洵,张毅,张骏雪,王宇翔,朱夏.面向电子商务环境的协同过滤推荐系统软件V1.0,计算机软件著作权,登记号:2013SR163273(与焦点科技股份有限公司共同申请)论文发表ShiJ,LuoJ,DongF,etal.Elasticresourceprovisioningforscientificworkflowschedulingincloudunderbudgetanddeadlineconstraints[J].ClusterComputing,2016,19(1):167-182.ZhangJ,ChenJ,LuoJ,etal.Efficientlocation-awaredataplacementfordata-intensiveapplicationsingeo-distributedscientificdatacenters[J].TsinghuaScienceandTechnology,2016,21(5):471-481.DongF,ZhangJ,LuoJ,etal.Enablingapplication-awareflexiblegraphpartitionmechanismforparallelgraphprocessingsystems[J].ConcurrencyandComputation:PracticeandExperience,2016.ShenD,LuoJ,DongF,etal.Stochasticmodelingofdynamicright-sizingforenergy-efficiencyinclouddatacenters[J].FutureGenerationComputerSystems,2015,48:82-95.ZhangJ,LuoJ,DongF.Scientificworkflowschedulinginnon-dedicatedheterogeneousmulticlusterwithadvancereservations[J].IntegratedComputer-AidedEngineering,2015,22(3):261-280.ZhangJ,WangM,LuoJ,etal.Towardsoptimizedschedulingfordata-intensivescientificworkflowinmultipledatacenterenvironment[J].ConcurrencyandComputation:PracticeandExperience,2015,27(18):5606-5622.XiongR,LuoJ,DongF.OptimizingdataplacementinheterogeneousHadoopclusters[J].ClusterComputing,2015,18(4):1465-1480.DongF,LuoJ,LiuB.APerformanceFluctuation-AwareStochasticSchedulingMechanismforWorkflowApplicationsinCloudEnvironment[J].IEICETransactionsonInformationandSystems,Vol.E97-D,No.10,October2014,2641-2651WangY,LuoJ,SongA,etal.OATS:onlineaggregationwithtwo-levelsharingstrategyincloud[J].DistributedandParallelDatabases,2014,32(4):467-505.LuoJ,JinJ,ShanF.StandardizationofLow-LatencyTCPwithExplicitCongestionNotification:ASurvey[J],IEEEInternetComputing,vol.21,no.1,pp.48-55,Jan.-Feb.2017.ShenD,LuoJ,DongF,etal.AppBag:Application-AwareBandwidthAllocationforVirtualMachinesinCloudEnvironment[C]//ParallelProcessing(ICPP),201645thInternationalConferenceon.IEEE,2016:21-30.ShiJ,DongF,ZhangJ,etal.Resourceprovisioningoptimizationforservicehostingoncloudplatform[C].ComputerSupportedCooperativeWorkinDesign(CSCWD),2016IEEE20thInternationalConferenceon.IEEE,2016:340-345.LiuZ,DongF,ZhangJ,etal.AClient-SideDirectoryPrefetchingMechanismforGlusterFS[C].IEEEInternationalConferenceonSystems,Man,andCybernetics(SMC),2016:3942-3947.ZhouP,Dongf,XuZ,etal.ECStor:AFlexibleEnterprise-orientedCloudStorageSystembasedonGlusterFS[C].2016FourthInternationalConferenceonAdvancedCloudandBigData.IEEE,2016:13-18.JinJ,KhemmaratS,GaoL,etal.Queryingweb-scaleinformationnetworksthroughboundingmatchingscores[C].Proceedingsofthe24thInternationalConferenceonWorldWideWeb.ACM,2015:527-537.YangY,DongF,LuoJ.ComputingserviceSkyeubeforwebserviceselection[C].ComputerSupportedCooperativeWorkinDesign(CSCWD),2015IEEE19thInternationalConferenceon.IEEE,2015:614-619.ShiJ,DongF,ZhangJ,etal.Two-PhaseOnlineVirtualMachinePlacementinHeterogeneousCloudDataCenter[C].Systems,Man,andCybernetics(SMC),2015IEEEInternationalConferenceon.IEEE,2015:1369-1374.ZhangJ,DongF,ShenD,etal.Superblock:AnApplication-AwareDynamicPartitionStrategyforLarge-ScaleGraph[C].2015ThirdInternationalConferenceonAdvancedCloudandBigData.IEEE,2015:167-174.WangY,LuoJ,SongA,etal.ASampling-BasedHybridApproximateQueryProcessingSystemintheCloud[C].201443rdInternationalConferenceonParallelProcessing.IEEE,2014:291-300.JinJ,KhemmaratS,GaoL,etal.Adistributedapproachfortop-kstarqueriesonmassiveinformationnetworks[C].201420thIEEEInternationalConferenceonParallelandDistributedSystems(ICPADS).IEEE,2014:9-16.ShiJ,LuoJ,DongF,etal.Abudgetanddeadlineawarescientificworkflowresourceprovisioningandschedulingmechanismforcloud[C].ComputerSupportedCooperativeWorkinDesign(CSCWD),Proceedingsofthe2014IEEE18thInternationalConferenceon.IEEE,2014:672-677.ZhangJ,DongF,ShenD,etal.Gametheorybaseddynamicresourceallocationforhybridenvironmentwithcloudandbigdataapplication[C].2014IEEEInternationalConferenceonSystems,Man,andCybernetics(SMC).IEEE,2014:1128-1133.ShenD,DongF,ZhangJ,etal.Cost-EffectiveVirtualMachineImageReplicationManagementforCloudDataCenters[C].HighPerformanceComputingandCommunications,2014IEEE6thIntlSymponCyberspaceSafetyandSecurity,2014IEEE11thIntlConfonEmbeddedSoftwareandSyst(HPCC,CSS,ICESS),2014IEEEIntlConfon.IEEE,2014:229-236.XiongR,LuoJ,DongF.SLDP:ANovelDataPlacementStrategyforLarge-ScaleHeterogeneousHadoopCluster[C].2014SecondInternationalConferenceonAdvancedCloudandBigData(CBD),IEEE,2014:9-17.ChenM,DongF,LuoJ.DynamicresourcemanagementinaHPCandCloudhybridenviron

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论