微课3-2 大数据技术_第1页
微课3-2 大数据技术_第2页
微课3-2 大数据技术_第3页
微课3-2 大数据技术_第4页
微课3-2 大数据技术_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

微课3-2大数据技术大数据是对海量、高速、多样化的数据进行采集、存储、管理、分析的技术,旨在挖掘数据价值以支持决策。如今,大数据这个概念几乎应用到了人类致力于发展的所有领域中。所谓大数据,狭义上可以定义为:用现有的一般技术难以管理的大量数据的集合。这是指用目前在企业数据库占据主流地位的关系型数据库无法进行管理的、具有复杂结构的数据。研究机构高德纳指出:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。微课3-2大数据技术麦肯锡公司指出:“大数据是一个被故意设计成主观性的定义,并且是一个关于多大的数据集才能被认为是大数据的可变定义,即并不定义大于一个特定数字的TB才叫大数据。因为随着技术的不断发展,符合大数据标准的数据集容量也会增长;并且定义随不同的行业也有变化,这依赖于在一个特定行业通常使用何种软件和数据集有多大。随着“大数据”的出现,数据仓库、数据安全、数据分析、数据挖掘等围绕大数据商业价值的利用正逐渐成为行业人士争相追捧的利润焦点,在全球引领了又一轮数据技术革新的浪潮。微课3-2大数据技术从字面来看,“大数据”这个词可能会让人觉得只是容量非常大的数据集合而已。但容量只不过是大数据特征的一个方面,如果只拘泥于数据量,就无法深入理解当前围绕大数据所进行的讨论。因为“用现有的一般技术难以管理”这样的状况,并不仅仅是由于数据量增大这一个因素所造成的。“可以用3个特征相结合来定义大数据:数量(或称容量)、种类(或称多样性)和速度,或者就是简单的3V,即庞大容量、种类丰富和极快速度的数据”。3.2.1用3V描述大数据特征IDC(互联网数据中心)说:“实际上,大数据并不是新生事物,然而它确实正在进入主流,并得到重大关注,这是有原因的。廉价的存储、传感器和数据采集技术的快速发展、通过云和虚拟化存储设施增加的信息链路,以及创新软件和分析工具,正在驱动着大数据。大数据不是一个‘事物’,而是一个跨多个信息技术领域的动力/活动。”3.2.1用3V描述大数据特征大数据的关键技术,是用分布式存储与并行计算把海量、异构、高速的数据转化为实时可用的价值。(1)数据采集技术。包括:日志采集、传感器数据采集、网络数据采集,如采集网页数据,或通过网络接口获取社交媒体、网络流量等数据。(2)数据存储技术。如分布式文件系统;NoSQL数据库:用于存储非结构化和半结构化数据;数据仓库:对大数据进行集中存储、管理、分析和查询。(3)数据处理与分析技术。如批处理、流处理、数据挖掘与机器学习、数据可视化等。3.2.2大数据的关键技术大数据的主要应用领域如下。(1)商业智能:企业通过分析销售数据、客户行为数据等,优化营销策略、提升客户满意度、预测市场需求,从而提高竞争力和盈利能力。(2)医疗健康:分析电子病历、医学影像、基因数据等,辅助医生进行疾病诊断、个性化治疗方案制定,同时支持医疗研究和药物开发。(3)金融领域:风险评估、信贷审批、欺诈检测等,提高决策准确性。(4)政府管理:分析人口、经济、环境数据等,提高政府决策科学性。(5)工业制造:分析生产设备数据、生产流程数据等,实现生产过程的优化、设备故障预测与维护、质量控制,提高生产效率和产品质量。3.2.3大数据的应用领域大数据技术在各个领域应用深化,为社会和经济发展带来巨大变革和挑战。(1)数据质量问题:数据可能存在不完整、不准确、不一致等问题,需要进行数据清洗、数据预处理等操作。(2)数据安全与隐私保护:个人和敏感信息容易受到数据泄露、恶意攻击等安全威胁,需要采取加密、访问控制、数据脱敏等安全措施。(3)技术与人才短缺:大数据技术复杂,涉及多个领域,需要专业人才进行开发、管理和分析,但目前相关人才相对短缺。(4)成本与资源管理:大数据的存储、处理和分析需要大量的硬件资源和计算成本,企业需要合理规划资源,降低总体拥有成本。3.2.4大数据面临的挑战如今,人们不再认为数据是静止和陈旧的。数据已经成为一种商业资本,一项重要的经济投入,可以创造新的经济利益。事实上,一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。更重要的是,这些数据不再需要用传统的数据库表格来整齐地排列,这些都是传统数据库结构化查询语言(SQL)的要求,而非关系型数据库(NoSQL)就不再有这些要求。今天,大数据是人们获得新的认知、创造新的价值的源泉,大数据还是改变市场、组织机构以及政府与公民关系的方法。3.2.5大数据思维云计算与大数据之间存在着紧密的相互关系和显著的协同作用。(1)依赖关系。云计算为大数据提供存储和计算资源,是大数据处理的基础平台。大数据为云计算提供了丰富的应用场景和数据支持。(2)技术融合。云计算和大数据技术相互融合,共同推动信息技术创新发展。大数据技术不断推动云计算平台在存储、计算和管理等方面进行优化升级;云计算的发展为大数据提供了更强大的计算和存储能力。(3)协同发展。形成相互促进、相互补充的关系。云计算和大数据通常一起使用,共同解决企业面临的复杂问题。3.2.6云计算与大数据的融合云计算与大数据协同作用主要体现在以下几个方面。(1)资源共享与优化配置。大数据可以动态获取和释放云计算资源。(2)高效的数据处理与分析。云分布式计算框架能够高效处理海量数据。(3)弹性扩展与可扩展性。使大数据处理能够根据数据量和任务负载的变化自动调整计算和存储资源。(4)数据驱动的创新与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论