下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
“大数据”时代计算机信息处理
技术探索
现代社会中无论是计算机的硬件设施还是软件的技术水平
的提升不断更新换代,大量数据应运而生,数据机构和数据的储存不
断的发生着巨大的变化。创新的数据的不断升级为计算机信息处理技
术提出了更高的要求,同时带来了更大的机遇和挑战。对于数据处理
的准确性和高效性,提供了帮助,进而使他被运用的数量和重视的程
度都非常高。
1“大数据”的概念与特点
1.1大数据的概念
大数据时代,信息的数据量不断的上涨,这样等待处理的数据
十分庞大,目前的计算机主流软件在短时间内无法实现对其进行获
取、处理、存储、传输、管理等方面的功能,它不仅包括数据量大,
同时还包括数据比较难以处理、复杂多样,同时在处理的过程中,还
会出现数据处理的重复性。对于大数据的数据量大到什么程度,目前
还没有一个统一的标准,一般认为数据量在10TB-
1PB(1TB=1024GB,1PB=1024TB)以上的数据为大数据。
1.2大数据的特点
1.2.1数量大
大数据的产生是基于大量数据信息处理而产生的,需要运用计
算机技术处理数据的量越来越大,从TB及已经发展到PB技术的数
据处理。
1.2.2速度快
海量的数据,就需要高速度的对数据进行处理,这样才能满足
使用者对信息数据的需求,如果大数据的处理出现滞后,将不利于信
息的传播与扩散。
1.2.3种类多
随着信息技术在生活应用中普及,现代人们对信息的需求日益
多样化,信息数据的来源也越来越多样化,结构化和半结构化的原始
数据也出现了多样化,使得大数据呈现出多样化的发展趋势。
2“大数据”时代的计算机信息处理技术要点
2.1分布式处理技术
分布式数据处理,主要是为了实现数据的分布式存储和处理的
一种方式,它是由谷歌公司提出的GFS技术。它采用了存储列的概
念,对数据进行存储后以列为单位,这种技术特点是,循环利用的效
率比较高,数据信息的压缩比较快,这种存储结构是采用了行列混合
的方式,能够快速的缩短数据的查询时间和加载海量数据的实际,更
加能够把利用磁盘空间提升到最高。目前,分布式处理技术在百度、
IBM得到了广泛的应用。
2.2信息安全处理技术
数据飞速发展的时代,相互关联的数据结构从各种数据信息原
来独立的形式中脱颖而出,也正是由于关联结构的影响,无论是那一
个数据出现问题,伴随其他数据也会受影响而变化。硬件性能在计算
机处理技术中经常会起到干扰问题,在大数据安全管理工作的性能中
没有完全得到需求,与此同时,这种方式却为计算机网络技术的发展
制造了良好条件。不断的发展的信息安全技术为保证大数据信息的安
全提供了前提。单个数据或者是单个数据的基础之上不适合建立对信
息的安全管理,最重要的是对整个全面的信息系统进行有效管理,正
是这种方式,为计算机信息处理技术带来了很大的发展机遇,与此同
时也有一定的挑战。
2.3大数据口的数据存储处理技术
随着网络的日益普及越来越多的内容诸如视频、影像以及虚拟
化等等,他们的数据不断的上涨,这是一个巨大的挑战对于存储数据
技术而言。在以往的普通数据存储过程中对于计算机网络性能要求并
不是很高,因为他的存储量是普遍比较小的,一般的计算机就可以满
足这些数据的需求的要求,但是对于出现的非常大的数据而言这样的
性能就很难保证存储的效率和容量了。但是如果大数据的存储中应用
了普通数据存储技术,那就会造成资源的浪费,所以需要结合当前大
数据中的性质特点,对于大数据的存储应该采取新的存储方法大大提
升大数据信息的存储中的稳定性和存储信息的快捷性。
2.4聚类分析技术和分类分析技术的特点
在没有明确数据点的前提下,将数据集中在一起分为很多个对
象组,然后对每一组对象进行数据分析,进行实现综合去查询数据,
这就是聚类分析技术。类分析和聚类分析技术在数据挖掘方面应用的
比较广泛。把信息的数据点进行归类总结,在综合数据点之后形成新
的数据点,在对他们进行明确的假设和客观结构预测,最终大大预测
未来信息的发展的要求,这就是分类分析技术。
2.5数据分析技术
数据分析技术在大数据处理中具有十分重要作用,它是一种应
用比较广泛的数据处理技术主要包括了网络的分析技术、空间的分析
技术、数据时域的序列分析技术、数据回归的分析技术以及情感的分
析技术等等。在这些数据分析技术当中,对自然语言进行编码分析的
技术是情感分析技术;在网络的特征基础之上对数据的特征进行分析
的技术是网络分析技术。将网络拓扑、地理和几何当中的数据编码技
术有机的融合在一起,对数据进行综合分析的统计技术是空间分析技
术。
2.6大数据时代,云计算被广泛认可
大数据时代日益发展,云计算也被大家普遍认可和接受,不断
被普及与人,这样就让云服务的浪潮趋势不断上涨。云计算把传递过
来的信息数据,拟定云平台,互通电子数据进行整合管理。在云平台
上可上传信息、下载必要信息等任意操作C云计算具有打破常规,不
断提升自身服务,对自身成长不断的挖掘,遵循自主创新的原则,不
断的提高日常中常用的流程性能,进行创新性的整合。
2.7新颖的数据挖掘。在搜索过程中提炼出大量的数据,对于
这类数据进行分别解析,寻找内在的规律性。这就是数据挖掘涵盖的
范畴。目前大部分企业自身拥有的数据库单纯只能进行录入数值、查
验并且统计这些功能。很难在大量搜集得出的数值当中提炼出有价值
必备的信息,更难总结出查找规律的潜在信息。遵循这种发展很难把
深层次的规律进行深挖,也就很难进行规律的表达。总体上来看,数
据挖掘可以分为初始预备阶段、探求潜在规律、表示这一规律等这三
个时段。数据挖掘为决策流程内增添了的更多的便利。当在大量数据
中,又缺失了信息,这种情况下就可以求救于这样的数据挖掘。原因
是因为,如果能够精准的辨别出信息的要点,就可以很快的挖掘出潜
藏深处的必要信息,这样就更能进行正确的抉择。综上所述,当今时
代的大数据处理技术,对计算机信息处理技术提出了更高的挑战和更
高的要求,需要采取比较复杂的信息技术对海量的技术进行分析,需
要运用计算机技术建立真正适应大数据时代的网络系统和信息处理
系统。
参考文献:
[1]崔杰,李陶深,兰红星
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年高危安全培训内容记录核心要点
- 2026年安全事故后培训内容重点
- 2026年瓷砖厂釉线安全培训内容实战案例
- 固原地区西吉县2025-2026学年第二学期五年级语文期中考试卷(部编版含答案)
- 甘南藏族自治州卓尼县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 崇左市龙州县2025-2026学年第二学期四年级语文第六单元测试卷(部编版含答案)
- 2026年-银行安全保卫培训内容实操要点
- 枣庄市市中区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 喀什地区泽普县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 百色市靖西县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 2026湖北宜昌夷陵区小溪塔街道办事处招聘民政助理1人笔试备考试题及答案解析
- 2026新疆兵团第七师胡杨河市公安机关社会招聘辅警358人考试参考试题及答案解析
- 2026陕西榆林市旅游投资集团有限公司招聘7人考试备考试题及答案解析
- 2024版前列腺癌药物去势治疗随访管理中国专家共识课件
- 2026年基于责任区的幼儿园联片教研活动设计方案
- 《油气管道地质灾害风险管理技术规范》SYT 6828-2024
- 2026新疆喀什正信建设工程检测有限公司招聘12人考试参考试题及答案解析
- 2026年宁夏工业职业学院单招职业技能考试题库含答案详解(完整版)
- 会计内部监督制度
- 2026春冀人版(2024)二年级下册小学科学教案(附目录)
- 09鉴赏诗歌语言之炼字炼句
评论
0/150
提交评论