从数据到决策的大数据时代论文.pdf_第1页
从数据到决策的大数据时代论文.pdf_第2页
从数据到决策的大数据时代论文.pdf_第3页
从数据到决策的大数据时代论文.pdf_第4页
从数据到决策的大数据时代论文.pdf_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第 3 5卷第 3期 2 0 1 4年 5月 吉首大学学报 ( 自然科学版) j o u r n a l o f j i s h o u un i v e r s i t y( n a t u r a l s c i e n c e e d i t i o n ) vo 1 3 5 no 3 m a y 2 0 1 4 文 章编 号 : 1 0 0 72 9 8 5 ( 2 0 1 4 ) 0 3 0 0 3 1 0 6 从数据到决策的大数据时代 陈文伟 , 陈 晟 ( 1 海军兵种指挥学 院三 系, 广东 广州 5 1 0 4 3 1 ; 2 软通动力信息技术 ( 集团) 有限公司 , 北京 1 0 0 1 9 3 ) 摘 要 : 根据 大数据 时代 的特 点和带来的变化 , 明确 了大数据 时代 的核 心是从 数据 到决策 对大数据时代兴起 的即时决 策 , 从 大企业到 个人进行全 面的分析说 明 在数据辅助 决策 方面, 讨论 了利 用统计方 法的辅助决策 、 从数据 中归纳 出数 学模 型、 从 数据 中获取知识等有效 方法 大数据与云计算 的结合 , 将会达到相 互促 进和共 同发展 太数 据不仅 支持 大企业和政府 的决策, 也 支持 个人 的决策 关键 词 : 大数据 时代 ; 即时决策 ; 统 计方法 ; 数 学模型 ; 知识 ; 云计 算; 决策 中图分类号 : t p 3 0 1 文献标志码 : a d oi : 1 0 3 9 6 9 j i s s n 1 0 0 7 2 9 8 5 2 0 1 4 0 3 0 0 8 l 大数据 时代的简 介 2 0 1 2年, “ 大数据” ( b i g d a t a ) 】 一词是个热 门词汇 纽约时报 称 , “ 大数据” 时代 已经降临, 在商业 、 经济及其他领域中, 决策将 日益基于数据和分析 , 而非基于经验和直觉 联合 国在 2 0 1 2年发布 了“ 大数据 政务 白皮书” , 指出大数据对 于联合国和各国政府来说是一个历史性 的机遇 , 人们 如今可以使用极为丰富 的数据资源 , 来对社会经济进行前所未有 的实时分析 , 帮助政府更好地响应社会和经济运行 大数据的主要来源口 1 : 社交网络数据 、 遥测数据 、 传感器数据、 监控通信数据 、 全球定位系统 ( gp s ) 的 时间数据与位置数据 、 网络上的文本数据 ( 电子邮件 、 短信、 微博等) 这些数据来源是信息化过程( 数据设 备的广泛使用和数据多渠道大量生成) 产生的 王俊 ( 英国 自然 杂志 2 0 1 2年评 出的对世界科学影 响最大的 1 o大年度人物之一) 说 : “ 生命本身是数 字化 的, 基 因传代的过程是数字化 的过程 , 弄懂基因系列 , 通过基 因排序知道哪个基 因出了问题 , 对症下 药 ” 王俊领导的全球最大基因测序机构 , 每天产出的数据排名世界第一, 他说医学健康产业未来就是大数 据产 业 人类有个重要发现 , 2 0 1 0 -2 0 1 2年的数据总量超过 以往 4 0 0年 可以概括地认为: 大数据 一 海量数 据 + 复杂 类 型数据 大数据具有 4个基本特征 : ( 1 ) 数据量 巨大 到 目前 为止, 人类生产的所有 印刷材料 的数据量为 2 0 0 p b ( 2 ) 数据类型多样 现在的数据类型有文本形式 、 图片、 视频 、 音频、 等多类型 的数据, 个性化数据 占绝 对多数 ( 3 ) 处理速度快 , 时效性要求高 从各种类型的数据 中快速获得有价值的信息 ( 4 ) 价值密度低 例 如, 1 h的视频, 在不间断的视频监控过程中, 可能有用 的数据仅仅只有一两秒 大数据将带来的变化 : ( 1 ) 从掌握局部数据变为掌握全部数据 ( 2 ) 从纯净数据变为混杂数据, 可能 * 收 稿 日期 : 2 0 1 3 1 11 2 基 金项 目: 国家 自然科学基金 资助项 目( 6 1 2 7 3 3 0 6 ) 作者简 介 : 陈文伟 ( 1 9 4 0一 ) , 男 , 江西人 , 海军兵 种指 挥学 院三 系教授 , 博 士生 导师 , 主要从 事决 策支持 系统 、 数据仓 库 、 数据挖掘等研究 吉首大学 学报 ( 自然科学版) 第 3 5卷 会发现生活的许多层面是随机而不是确定 的 ( 3 ) 从探求因果关 系到掌握事物的相关性 以前总是试图了 解事件背后的深层原因, 大数据转变为弄清现象之 间的联 系 大数据主要 回答是什么, 而不是为什么的问 题 , 通常有这样的回答就足够 了 研究大数据的意义是不断提高“ 从数据到决策的能力” , 实现由数据优势 向决策优势的转化 数据是现 实世界 的记录, 它反映了现实世界的现状 数据 中包含 自然界的规律 , 也包含人类社会 的人的行为 在数据 中找出这些 自然规律和人的特定行为, 用于决策将会取得显著的效果 2 利 用即时数据的决策 国际商用机器公司( i b m) 估测 , “ 数据” 值钱的地方主要在于时效 对于片刻便能定输赢的华尔街 , 这 一 时效至关重要 华尔街的敛财高手们却正在挖掘这些互联 网的“ 数据财富” , 先人一步用其预判市场走 势, 而且取得了不俗的收益 利用这些数据可以做很多事 , 比如华尔街根据民众情绪抛售股票 ; 对冲基金依 据购物网站的顾客评论 , 分析企业产品销售状况 ; 银行根据求职网站的岗位数量 , 推断就业率 ; 搜集并分析 上市企业声明, 从中寻找破产的蛛丝马迹 ; 分析全球范围内流感等病疫 的传播状况等 即时数据的有效决策归纳为: 跟着当前潮流走; 不满足于现状逆着潮流走; 跟着新趋势走 ; 从搜索信息 中做决策; 存在人为制造病毒或者造谣; 网络丰富了个人生活和决策 ( 1 ) 跟着潮流走 跟着潮流走的典型实例 : “ 德温特资本市场” 公司首席执行官保罗 霍廷每天的工作 之一, 就是利用 电脑程序分析全球 3 4亿微博账户 的留言, 进而判断民众情绪 , 再 以 1 5 o进行打分 , 根 据打分结果 , 霍廷决定如何处理手中数以百万美元计的股票 霍廷的判断原则很简单 : 如果所有人似乎都高兴 , 那就买入 ; 如果大家 的焦虑情绪上升, 那就抛售 这 一 招收效显著 , 当年第一季度 , 霍廷的公司获得了 7 的收益率 ( 2 ) 逆着潮流走 2 0 1 3年 6月 9日, 美国国家安全局承包商的爱德华 斯诺登 , 披露 了美国国家安全局 一 项代号为“ 棱镜” 的计划的细节 斯诺登说 : “ 国家安全局打造了一个系统可截获几乎所有信息 有了这种 能力 , 该机构可 自动收集绝大多数人 的通信内容 你的电子邮件 、 密码 、 电话记录和信用卡信息就都在我手 上了 ” 斯诺登对 卫报 记者说 : “ 我不想生活在一个 我的一言一行都被记录在案 的世 界里 我不愿支持这 种事 , 也不愿生活在这样 的控制下 ” 2 0 1 0年陆军情报分析员布拉德利 曼宁 , 向维基揭秘 网发送了几十万份机密文件 他说 : “ 我希望人 们看到真相 , 因为如果不知情 , 公众就不可能做出明智的决定 ” 斯 诺登 和曼 宁都知 道披露 美 国 国家安 全局 这 样 势力 强 大情 报 机关 的秘 密是 非 常 危 险 的 , 他 们 是逆 着 潮 流走 的典 型 ( 3 ) 跟着 新观 念走 跟着新 观念 走 的典 型 实例 : i b m 在 上一 个 1 0年抛 弃 了 p c, 成 功 转 向软 件 和服 务 , 而这次将远离服务与咨询 , 更多地专注于因大数据分析软件而带来的全新业务增长点 i b m 执行总裁罗睿 兰认为: “ 数据将成为一切行业 当中决定胜负的根本 因素 , 最终数据将成为人类至关重要的 自然资源 ” 在个人决定前途时的选择, 跟着新观念走 的实例 : 海事大学信息科学技术学院某副院长说 , 他在完成 学业以后 , 看见 计算机世界报 ( 1 9 9 7年) 首次向国内介绍“ 数据挖掘” 新技术后, 决定今后就选择“ 数据挖 掘” 作为方向, 从而形成了他的人生新轨迹 ( 4 ) 互联 网络上搜索信息 信息不对称现象普遍存在于社会 , 特别在市场经济活动 中, 各类人员对有关 信息的了解存在很大的差异 掌握信息多的人 , 有更多的机会从差距 中找商机获利 ( 信息不对称理论是由 乔 阿克尔洛夫等 3 位美国经济学家提 出的, 从而获得 2 0 0 1年诺贝尔经济学奖 ) 解决信息不对称现象, 需要利用互联网络进行搜索 , “ 知识在于搜索” 是 当今获取知识的新趋势 , 它是 “ 知识在于学习” 和“ 知识在于积累” 的补充 这也造 就了 g o o g l e ( 谷歌 ) 、 百度等搜索公司的辉煌成就 例 如 , 在识别流感疫情时, 谷歌比疾病控制和预防中心更有效掌握疫情 , 因为谷歌利用监测无数个搜索词( 比 如“ 最好的咳嗽药” ) 并加入详细地址的追踪 , 所以有效掌握疫情区域 搜索当前信息后做决策, 已经成为即时决策的新趋势 ( 5 ) 开源软件激发了人的创新热情 开源软件是在开源网站上交流, 相互之间激发出的创新热情 有的 第 3期 陈文伟 , 等 : 从数据到决策 的大数据时代 3 3 人通过软件开发锻炼 自己, 有的人想打破垄断 , 也有 的人想展示 自己的才能 各 自充分发挥 自己的智慧 , 在 别人 的研究基础上 , 增加更有用或更有效果的功能 , 共同开发 出免 费的软件 例如 , l i n u x操作系统打破 了 微软的 wi n d o ws 操作系统的垄断 , my s ql数据库软件使大家对数据库的应用更方便 ( 6 ) 制造病毒或者造谣 制造病毒数据 , 破坏网络系统或个人计算机 各国之间的隐形 战争就是制造病 毒破 坏敌 方 的 网络 系统 制造虚假信息进行造谣 , 让受骗者做愚蠢的决策, 送钱或银行帐号及密码给骗子 例如在电话 中, 冒充公 安机关人员, 说你家人犯罪 , 要你交钱赎人 ; 或者说你 中奖 , 要你寄钱后发奖品给你等等 这些受骗者都是严重 的信息缺乏者 , 也是典型的法盲 最近 , 武汉警方查获号称“ 中国最大的网络推广 网站” 的特大网络造谣团伙 , 其中参与谣言传播的“ 大 v” 的微博粉丝数量达 2 2亿 该公司在 1 年间经营获利多达 1 0 0多万元 ( 7 ) 网络丰富了个人生活和决策 个人上 网可以在 自己喜欢的网站上阅读信息 , 下载音乐、 电影 , 与友 人通信、 交谈等 个人可以建网站、 微博来发表 自己的见解, 也在制造数据 个人想从事学术研究或者商业 活动 , 都可以在网络上找到 自己所需要的信息 , 发表 自己的成果和信息 个人 已经享受到了大数据时代好 处 , 大数据时代也支持个人决策 大数据时代突出了即时决策 大数据时代既支持重大问题 的决策, 支持领导者的决策 , 也开创了个人 决 策 的信 息支 持 3 利用统计方 法的辅助 决策 分析数据离不开统计 在统计学中用总量、 平均数 、 百分比、 比率等数值 , 建立起对大数据 的概括认识 , 用 同类单 位 的 比较或 者用 自己的历 史数 据 比较 , 来发 现 问题 和找 出差距 , 为辅助决 策 提供 依 据 “ 统 计 与对 比” 已经得 到 广泛 的应 用 统计语言学成功地实现了计算机上的 自然语言处理 自然语言属于上下文有关文法 , 一个单词有多个 解 释 , 对 于 比较 复 杂 的句子 , 用语 法 规则 来理 解 遇到 了 困难 ( 基 于 规 则 的 自然语 言处 理 ) 以前 花 了很 大 的 代价一直在用语法规则进干 亍自然语言处理 , 但是进展不大 利用 统计 语 言模 型有 效地解 决 了 自然语 言处 理 : 一个 句 子 ( 它 由一 串特定 顺 序排 列 的 词 w , w , , 叫 组成) 是否合理 , 就看它的可能性( 概率 p( s ) ) 统计语言模型给出了计算概率 p( s ) 的公式为 p( s ) 一p( 砌1 w 2 w ) 一 p( w1 ) p( 叫2 l w1 ) p( w 3 l w 2 ) p( w 1 w 一 1 ) ( 1 ) ( 1 ) 式 中反 映 了单 词 的上 下 文关 系 , 如 w 与 w , w。 之 间的条 件概 率 , 因此用 这种 方 法有 效地 判 断 了句 子 s的合 理 性 统计学还有很多方法月 】 于数据分析达到辅助决策效果l 3 如回归分析是研究一个变量与其他多个变量 之间的关系, 建立回归方程; 假设检验是根据样本对关于总体所提出的假设做 出是接受还是拒绝该假设的判 断; 聚类分析是将样品或变量进行聚类的方法 ; 主成份分析是将多个变量化为少数的几个综合变量等等 统计 数据 以及 指标 的对 比是决 策 的依据 4从数据 中归 纳出数 学模 型 自然科学发展 的最重 要方法 是从数 据 中归 纳出规 律, 用 数学模 型( 公 式或方 程) 这种 数量形 式描 述 j 例 如 , 牛顿 的运 动 三大定 律 、 牛顿 的万 有 引力定 律 、 开普 勒 的行 星运 动三 大定律 、 麦 克 斯 韦 的电磁 方 程组 、 爱因斯坦质能方程、 纳维一 斯托克流体力学方程、 薛定谔量子方程等等 下面具体用典型例子说明 ( 1 ) 开 普勒 的行 星运 动 三大 定律 的发 现 过程 天文学家开普勒是利j 何 他老师第谷一生观察的天文数据 , 自己也用 了一生来归纳总结 出行星运动 的 三 大定 律 开普勒 先 从火 星 的观测 数据 中想找 出它 的运 动规 律 , 试探 将它 用一 条 曲线表 示 出来 一 开始 开 普勒 按 传统观念 , 认为行星做匀速圆周运动 , 因此他采用传统的偏心圆轨道方程来试探计算 但是经过反复推算 发现, 不能算 出与第谷观测相符的结果 开普勒开始大胆设想 , 火星可能不是作圆周运动。 经过多年的艰苦 计算 , 终于发现 了火星沿椭圆轨道绕太 阳运行 , 得到行星运动的第一定律( 椭圆轨道定律) 经过了 9 a的 3 4 吉首大学 学报( 自然科学版) 第 3 5 卷 苦战, 开普勒终于得 出行星公转周期的平方与它距太阳的距离的立方成正比的结论( p 。 d 。 = = =常数) 这就 是著名的开普勒行星运动第三定律 ( 2 ) 欧拉常数和公式以及陈文伟常数和公式的发现 州 欧拉在研究调和级数与 i n n之间, 在 -凡越大时 , 它们之间的差接近一个常数 他在求证它们之间的差 的极限后, 得到如下公式和值 , 该数称为欧拉常数 : y 一 ( 客 1 n ) - o 欧拉在研究虚数 i ( ) 的用途时发现 , 正弦函数 s i n z和余弦函数 c o s 以及指数函数 e 的密级数公式 , 三者之间存在关系 e 。比一c o s z+i s i n z 当 z取 7 c 值时, 就得到有名的欧拉公式 e +1 一o 欧拉公式将 3 个 毫不相关的数( 自然对数的底 e 、 圆周率 兀 、 虚数 i )联系在一起 陈文伟研究了调和级数公式 , 证明了尾项 e 的级数和收敛为一个常数, 定义常数为 , 它的计算公式为 一 ( 7 + in + 1 一 ) , ( 2 ) 它的值为 一0 1 3 0 3 3 0 7 0 0 7 5 3 9 0 6 3 1 1 4 7 7 0 7 陈文伟再利用阿贝尔求和公式, 证 明了自然对数的底 e 、 圆周率 丌和新常数 三者存在一个新公式 丌 一 其中 一1 +y+2 一1 8 3 7 8 7 7 0 6 6 4 0 9 3 4 5 4 8 3 5 6 0 6 5 ( 2 ) , ( 3 ) 式均将 2个著名常数 e 和 兀紧密联系起来, 它们都是形式化的公式 自然界中, 电和磁、 质量和能量 、 圆周率 丌和 自然对数的底 e , 它们都是不同概念 , 将它们联系起来既开 阔了人们的视野, 也开辟了科学的新天地 可以说, 包含不同概念的简洁公式反映了科学 的本质 , 也体现了 自然之美 斯坦福大学教授德福林说 : “ 联系、 结合在一起的事物 比相互分开的事物更为重要 、 更有价值 , 也 更加 绚丽 多姿 ” ( 3 ) 2 0 1 3年诺贝尔奖化学奖的“ 复杂化学系统的多尺度模型” 马丁 卡普拉斯等 3 位科学家将量子力学和经典力学计算相结合, 用量子化学计算小区间( 小分子计 算量庞大) 的化学反应 , 用经典力学处理小区间外 的环境( 大分子计算简单 ) 的影响 , 弥补了经典力学无法 模拟反应过程及量子化学无法完成环境的海量计算的缺陷 诺 贝尔经济学奖的获得者中, 不少是利用大量的数据建立经济学的数学模型, 用于解释 当前世界经济 现象 的 ( 4 ) 计算 机上 利用 数据 归纳 出数学 模 型的方 法是 数据挖 掘 的公式 发现 典 型 的方法 有 p a t l a n g l e y研 制 的 b ac on 系统 、 陈 文伟研 制 的 f d d 系统 f dd 系统 的启 发式 中包 含 了初 等 函数 , 这就使 f d d系统 发现 的公 式 比 b ac on 系统发 现 的更 广泛 5 从数据 中获取知识 在 计算 机 中 , 知识 属于定 性 的 , 一般 表示 为规 则形 式 从 数据 中获 取知识 主要 是利 用 数据 挖 掘技 术 , 典 型的数据挖掘方法大的分类有 : 属性约简方法、 信息论挖掘方法 、 集合论挖掘方法、 we b挖掘、 流数据挖 掘等 每个大类中又有很多具体的方法 下面概括说明 ( 1 ) 属性约简 例如 , 汽车数据库( c tr) 有 9 个条件属性( 类型、 汽缸 、 涡轮式 、 燃料 、 排气量、 压缩率 、 功 率 、 换档 、 重量) , 1 个决策属性( 里程) 利用属性约简方法 , 可以得到等价的 4个条件属性 ( 燃料、 排气量、 压缩率 、 重量) , 1个决策属性( 里程) 数据库约简后成精练的数据集 ( 2 ) 集合论挖掘方法 集合论原理是数据挖掘的重要理论基础 , 可用于分类问题、 聚类 问题和关联规则 挖 掘 集合论原理用于分类问题时 , 主要是利用集合之间的覆盖关 系, 如粗糙集方法是对条件属性和决策 ( 类别) 属性中的等价类 ( 1个或多个属性取值均相同的元组) 之间的覆盖关系; aq1 1 方法是对覆盖正例排 第 3期 陈文伟 , 等 : 从数据到决策 的大数据 时代 斥 反例 的种 子 ( 多个 属性 取值 的“ 与” 关 系 ) , 构成 规则 知识 集合论原理用于聚类问题时, 主要是按数据集中元组间的距离远近或相似度大小, 聚成多个类别集合 如 k 一 均值聚类 方法 集合论原理用于关联规则挖掘时 , 计算数据项 ( 如商品) 集在整个集合中和部分集合 中所 占的比例 , 大 于阈值( 支持度和可信度) 时构成数据项之 间关联规则 ( 3 ) 信息论挖掘方法 信息论方法一般用于分类 问题 在 已知有各实例的类别的数据 中, 找出确定类别 的关键的条件属性 求关键属性是计算是各条件属性 的信息量 , 再从中选 出信息量最大的属性 , 构造决策 树或 决 策规则 树 ( 4 ) we b挖掘 we b挖掘是从数以亿计存储大量多种多样信息的 we b页面及其链接和用户对页面的 访 问 中挖 掘 出需要 的有 用 知识 we b挖掘 分为 3类 : we b内容挖 掘 ( 网页 内的信 息 和知识 ) 、 we b结 构 挖掘 ( 网页之间的链接信息) 和 we b应用挖掘( 浏览和使用页面链接的信息) ( 5 ) 流数据挖掘 卫星给地球传 回大量的图像流数据 ; 监控摄像机能够连续不断 ( 比如每秒) 地产生图 像流 ; we b网站收到的流数据包括各种类型 例如 , 谷歌 1 d收到几亿个搜索查询 ; 雅虎的各个不同网站上 收到数 1 o亿个“ 点击” 基于这些流数据可 以学习到很多有趣的结果 , 比如“ 咽喉痛或咳嗽” 之类 的查询频 次 的 上升 能够 让人 们对 病毒 的传 播进 行跟 踪 流数据挖掘中, 一种通常的办法是在工作存储器上保存流数据的滑动窗 口 6 大数据与云计算 的结合 云计算是继个人计算机 、 互联网之后第 3次信息技术革命 , 它与大数据的结合 , 将会极大推动科学 技 术 与社会 的 发展 ( 1 ) 大数据与云计算是相辅相成的 云计算与大数据的关系相当于动与静 的关 系 云计算强调的是计算 , 这是动的概念; 而数据则是计算 的对象 , 是静的概念 大数据时代需要处理大数据的能力( 数据获取 、 清洁、 转换 、 统计等能力) , 这正是云计 算的优势 大数据是宝藏, 而云计算就是挖掘和利用宝藏的利器 ( 2 ) 大 数据 根植 于 云计 算 云计算关键技术中的海量数据存储技术( 用分布式方式存储数据和冗余存储方式保证系统可靠) 、 海 量数据管理技术 、 分布式编程模型( ma p re d u c e , 用于并行处理大规模数据集 的软件框架) , 它们也都是大 数据的关键技术 云计算有它独特的地方 , 即虚拟化技术和云计算平台管理技术 ( 3 ) 大数据技术与云计算相结合 大数据与云计算 的结合主要 体现为 : 利用云计算 的强大计算能力 ( s a a s软件服务 、 i a a s基础设施服 务 、 p a a s平台服务) , 可 以更加迅速地处理大数据 中的丰富信息 , 为有效的决策支持服务 对大数据的处理( 海量数据存储 、 海量数据管理和分布式并行计算) , 又为云计算提供了最有价值的实 际应用 即大数据为云计算提供了很有价值的用武之地 7 结语 大数据时代是信息时代的延伸和发展 ( 数据和信息本质是同一个东西, 数据是信息的符号表示 , 信息 是数据的含义) 信息时代的特点是实现信息化 、 数字化 , 其 目的就是充分利用计算机来提高各行业 的管理 和决策的水平 信息时代的基础在于计算机 信息化过程中数字设备 的进步( 如传感器 、 gp s和手机) 以及 数据的多元化( 各种渠道) 产生, 极大地促进了大数据 时代 的来临 大数据时代的基础在于网络 网络数据 已经遍及各行各业 , 也进人了家庭和个人 生活在大数据时代 , 就应该充分获取大数据中所需要 的数据 , 利用统计方法, 或者从数据中归纳出数 学模型 , 或者从数据中获取知识等手段 , 得到辅助决策信息 领导 者需 要 的是 粗粒 度数 据 对于 海量 数据 分 析 , 只能告 诉你 “ 大 概是什 么 ” , 其精 髓 就是 “ 客观 ” 利 用 计算机从海量的数据中发现模式 , 体现了数据中的共性和客观性 3 6 吉首大学学报 ( 自然科学版) 第 3 5卷 个人需要的是细粒度数据 在长期的知识积累的基础上 , 并通过 网络上的新知识搜索, 再进行横向或 者纵向的比较 , 辅助个人的决策 大数据使决策从“ 支持政府和企业” 走向“ 支持个人” 大数据时代 , 只要能从大数据中通过不同的方 法 , 获得所需要的信息就能获益 未来 , 数据将会像 土地、 石油和资本一样, 成为社会 、 经济和军事的根本性 资 源 参 考文 献 : e 1 英 维克托 迈 尔一 舍恩伯格 大数 据时代 m 杭 州: 浙江人 民 出版社 , 2 0 1 3 2 美 弗兰克斯 驾驭 大数 据 m 北京 : 人 民邮电 出版社 , 2 0 1 3 3 陈文伟 决策支持 系统及其开发 m 第 4版 北京: 清华大学 出版社 , 2 0 1 4 4 陈文伟 决策支持 系统教程e m 第 2版 北京: 清华大学 出版社 , 2 0 1 0 e 5 陈文伟 数据仓库与数据挖掘教 程 m 第 2版 北京 : 清华大学 出版社 , 2 0 1 1 e 6 陈文伟 论新常数 、 0和新公 式 一1 2 e j 高等数 学研 究, 2 0 0 9 , 4 ( 4 ) : 2 5 7 c he n we n we i t w o n e w c o n s t a n t s , 0 a n d a ne w f o r mu l a 7 c 一 1 2 e j oc t o g o n ma t h e ma t i c a l ma g a z i n e , 2 0 1 2 , 20( 2 ): 47 24 80 er a o f bi g da t a: fr o m da t a t o de c i s i o n chen w e nwe i , chen sh e ng ( 1 na v a l ar ms co mma n d ac a d e my, gu a n g z h o u 5 1 0 4 3 0, ch i n a ; 2 s o f t s t o n e i n f o r ma t i o n te c h n o l o g y( gr o u p )co , lt d , be ij i n g 1 0 01 9 3 , ch i n a ) ab s t r a c t : ac c o r di ng t o t he c ha r a c t e r i s t i c s o f t he e r a o f bi g da t a a nd t he c h a ng e s i t b r i ng s, i t i s c l e a r t h a t c o r e o f bi g da t a e r a i s f r o m da t a t o de c i s i o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论