




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 云计算环境下的大规模图数据处理技术研究 赵威摘 要 本文简要分析了云计算的概念,论述云计算图数据储存的方法、分割的原理,建立相关的计算模型。关键词 云计算;大规模图数据;处理技术tp3 a 1674-6708(2017)196-0053-02在计算机技术应用的环节中,图是一类非常重要的数据,其形成了一个非常抽象的数据结构,比常规的线性语言,其在语言表达方面也更加的复杂。随着时代的发展,科学技术水平在不断的提升,图数据实现了大规模的处理,相关的处理技术也应该更新换代,才能跟上时代的发展。所以,我们应该充分的了解云计算的概念,在云计算的背景下,
2、实现大规模图数据的处理。1 云计算简介1.1 云计算的含义云计算指的是在互联网发展的基础上,研发出的一类全新的计算方法,是依托了互联网技术实现了大量数据的整合。在2007年,云计算概念首先由美国的ibm公司提出,其将云计算定义为一个具体的系统平台和应用程序。1.2 云计算的主要特征1.2.1 虚拟化用户可以在网络环境下采用不同的工具使用云计算的服务,及时的完成各类计算的任务。云计算服务器一般以群集的方式提供各类服务,而且其一般都是以虚拟的形式存在,并不存在实体。1.2.2 通用性和可拓展性云计算有大量的群集系统的支持,所以,这个平台可以为用户提供不同的服务,不仅仅可以为用户特定的应用,而且也能
3、根据客户不同的需求,确保各类应用同时运行。云计算群集的处理方式体现了良好的伸缩性能,可以动态的展现各类功能,即使应用的规模比较大,也能实现良好的可扩展性。1.2.3 经济性高云计算要结合大量的计算机任务,所以,群体的规模非常大,云计算服务可以同时针对谷歌的云计算平台进行服务,可以为200万台计算机同时提供服务,也能为其他的供应商提供服务,如微软、雅虎都能接受云计算的服务,用户在云计算群集中可以获得大量的资源。云计算群集服务器使用的设备的成本都比较低,而且计算机本身的容错能力非常好,可以建立成本低廉的服务,这一点充分展现了云計算的成本优势,而且也促进了其全面的推广。1.3 云计算的相关技术1.3
4、.1 海量分布式存储技术在云计算应用中,要对大量的数据进行存储,这时离不开分布式存储技术的应用,其可以提高数据的精确性和经济性。借助各类新型软件的研发,可以有效的弥补硬件能力不足的问题,云计算系统的用户群体非常的庞大,所以,就需要大量数据的支撑,用户对数据传输的速率提出了更高的要求。只有提升数据存储的能力,才能切实的为用户提供各类服务。1.3.2 数据管理技术云计算需要进行大量的数据分析,要及时的完成用户提交的计算任务,所以,云计算在进行数据管理的环节中,应该结合大数据的技术,提高数据管理的能力,而且还应该在庞大的数据中找出用户需要的数据,从而最大限度的满足用户的需求。云计算数据管理中最实用的
5、两个软件分别是bigtable和hbase。对于云计算而言,由于哈希算法的实现简单,基于哈希的划分方法是最快的。基于哈希预划分的超块划分算法则位居第二,比拓扑最优的划分方法快50%。1.3.3 虚拟化技术现在,全球范围内的信息产业都在朝着云计算的方向发展,虚拟化技术为信息产业提供了很多的便利,人们对虚拟化战略也更加的重视。在云计算的大背景下,虚拟化的方案可以实现系统的整合,在服务器、软件等结合的基础上,网络设备的功能更加的完善,可以带给人们虚拟化的服务。在图初始化阶段,我们主要针对slaver节点进行资源优化,此刻master节点的资源消耗很小,r=0。对于slaver节点而言,在该阶段将会读
6、取磁盘中的图数据并将其加载到内存中去,需要大量的memory和10资源。如果需要加载图的大小为m,slaver节点数量为w,则一个节点需要存储的数据规模为m/w。1.3.4 并行编程模式由于云计算的用户非常多,他们会同时提交大量的数据,云计算的编程模型应该复杂的运算,并且对调度任务执行,充分的利用云计算的资源。现在,云计算一般是运用map reduce的方式,这个编程的模式可以将复杂的数据简化,为数据的编程提供可行的解决方案,并且具有成本优势,其性能和效果都能得到保障。2 云计算环境下大规模图数据处理技术的研究图是一类非线性的数据结构,在应用的环节呈现出多对多的结构关系,图数据中,不同的元素中
7、都有很多个直接前趋和直接后继,与其他形式的数据相比,其表达的含义更加的丰富,而且被广泛应用在各项工程中。图数据的量非常大,所以,在进行大规模的图数据处理的环节中,存在一些技术局限性。在相关的专家和学者的大量研究中,相关的理论如今已经非常的成熟,这为图数据的处理提供了大量的可行的依据。但是,信息化时代在不断的发展,图数据的规模在不断的提升,所以应该完善图数据处理平台。图数据处理平台的内容如表1所示。2.1 云计算的图数据存储方式在对大量的资料进行研究后发现在进行图数据管理的环节中,一般采用单图数据模型和超图数据模型,这两种模型针对有向图和无向图进行处理,二者的储存方式存在差异。云计算的分布式的存
8、储方式可以分成文件系统和分布式数据库。分布式数据库可以实现不同模型的建立,模型的灵活性非常好,而且支持大量的存储功能。2.2 云计算的图数据分割在进行大规模的图数据处理的环节中,要进行分布式的处理方式,为了完善图数据的处理效率,各个图之间的耦合度会降低。所以,在对图进行分割的环节中,应该先分析图的逻辑结构,再完成每个子系统的计算任务。在这个环节中,针对大图的分割,应该充分结合图的规模和均衡性,应该完善图内部的连贯性。2.3 云计算的图数据计算模型现在,在进行云计算环境中最为广泛的模型,一般采用两种模型,其一是map reduce,其二是bsp模型。map reduce模型可以进行独立的单元分析
9、,可以同时处理多个任务,在作业执行的过程中也分成两个不同的阶段,首先是对任务进行分配,然后结合相应的数据进行计算,然后将key值输出,将结果的数据直接反馈到任务栏中。在第二个阶段,每个任务在处理的环节中,都能收到数据的聚集处理,从而可以及时的获取数据输出的结果,并且将数据进行及时的保存,在分布式的文件系统中有大量的数据。bsp模型可以执行消息通信的各项操作,其可以防止死锁的产生,也防止了数据的计算中产生竞争的问题。在云计算的背景下,采用大规模的图数据的方式,主要采用上述的两种模型,但是在进行迭代问题的处理环节中,采用bsp模型的效率更能得到保障。2.4 云计算的图数据查询处理在云计算的大背景下,在进行大规模图数据查询的环节中,主要采用主动的遍历模式和被动的遍历模式,这两种模式都是对图顶点进行操作。主动的遍历模式的普适性能得到保障,在一些特定的应用中,如果没有必要采用查询功能,就会导致功能的浪费。被动的遍历模式中,其不用对处理函数进行调节,而且也可以减少顶点的调用,使资源得到节约。3 结论在云计算的大背景下,对大规模图数据进行处理会更加的简单,云计算可以被广泛的使用,其适用性可以得到保障。参
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业环境管理体系建设与持续改进方法
- 三年级语文全单元模拟试题
- 历史记忆与个体情感融合-洞察与解读
- 边缘智能处理算法-洞察与解读
- 银行服务渠道优化策略分析
- 物资回收与再利用管理办法
- 2025-2030数字化早教工具创新趋势与用户需求分析
- 2025-2030教育编程培训行业市场年龄下沉及竞赛体系与就业衔接研究报告
- 2025-2030教育元宇宙行业市场现状与投资机会评估报告
- 2025-2030换电站运营效率关键指标监测与电池健康状态评估模型构建
- 长春地区的原始农业
- 三年级语文上册第五单元【教材解读】
- 《铁路职业素质》课件 4铁路职业意识与心理
- 人教版数学六年级上册第一单元测评卷(含图片答案)
- 高中毕业生登记表填写样表(四川版)
- 英语口语8000句-文本(全)
- 《留青竹刻》课程标准
- 急性卒中指南解读
- 内科学-有机磷杀虫药中毒
- 海康威视系列说明书ivms-4200客户端用户手册
- 数据中心液冷技术 - 数据中心液冷解决方案
评论
0/150
提交评论