版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章
商务智能基础:数据库与信息管理《管理信息系统》劳顿第15版学习目标
6-1在传统的文件环境中,数据资源管理的问题有哪些?6-2数据库管理系统(DBMS)有哪些主要功能?为什么关系型数据库如此强大?6-3从数据库中获取信息以提高企业绩效和决策水平的关键工具和技术有哪些?6-4为什么信息政策、数据治理以及保证数据质量对公司的数据资源管理至关重要?开篇案例:更好的数据管理帮助美国邮政服务复兴
问题颠覆性技术陈旧的技术解决方案
重新设计条形码邮件扫描设备的智能化Hadoop应用最优化模型美国邮政局使用智能邮件来优化投递、侦测欺诈行为,以及创造新服务本案例说明了IT在帮助组织提高业绩和保持竞争力方面的重要作用本案例显示了数据管理的重要性6.1文件组织的相关词汇和概念
数据库:相关文件的集合文件:同类型记录的集合记录:相关字段的集合字段:一组字符串,比如单词、数字实体:需要存储信息的诸如人、地址、物体等对象属性:描述实体的特征或特性数据层次
数据库记录字段位字节文件学生数据库课程文件财务文件学生个人文件课程图6.1在传统的文件环境中存在的问题
文件由不同的部门来各自维护数据冗余数据不一致性程序-数据的相互依赖性不够灵活安全性不足无法进行数据共享,可用性低传统的文件处理方式传统处理文件的方式激励企业的每个职能部门发展专门的应用。每个应用都需要单独的数据字段,这些字段可能是主文件的一个子集。这些子集导致了数据发生冗余以及不一致,这会降低数据处理的灵活性并且浪费了存储资源会计和财务销售和市场人力资源生产制造用户
用户
用户
应用程序1应用程序2应用程序3应用程序4
ABCD
ADEB
ABEG
AEFG主文件数据元素从A到Z衍生文件用户
图6.26.2数据库管理系统
数据库通过数据集中化以及数据冗余的控制,为众多应用同时提供服务数据库管理系统(DBMS)应用与物理层数据文件之间的接口做到了数据在逻辑结构与物理结构之间的隔离解决了传统文件环境中可能发生的问题控制冗余消除不一致性区分开程序和数据使得企业能够集中地管理数据并且保证数据的安全性人力资源数据库的多维视图
根据信息使用者的需求不同,人力资源数据库可以提供不同的视图。这里列示了两种可能的视图,一个视图从员工福利出发,另一个视图从工资记录出发。雇员编号姓名社会安全号职位入职日期总薪金净薪金人寿保险福利补贴医疗保健
数据库管理系统姓名社会安全号医疗保健姓名社会安全号总薪金净薪金福利视图薪资视图
人力资源数据库图6.3关系型数据库管理系统
将数据通过二维表来展示每张表包含实体和属性的数据表:包含行与列的网格行或记录
(元组):不同实体的记录属性(列):表示实体所包含的属性关键字段:用来唯一标识每条记录的字段主键:用来标识表中记录的关键属性的字段外键:被用来与另一张表建立联系,在原表中作为主键,两表中共同拥有的属性。关系数据库表实例
关系数据库从两个维度来建构数据。这里提供供应商和零件这两个实体来例如,图中体现了关系数据库如何展示实体以及其属性。供应商编号是供应商这张表的主键,是零件这张表的外键供应商号码供应商名称供应商街道供应商城市供应商所在州供应商邮编8259CBM公司5大街74号达顿俄亥俄州452208261B.R.模具甘道尔街1277号克利夫兰俄亥俄州493458263杰克逊合成米克林街8233号勒星顿肯塔基州567238444布莱恩特公司米尔街4315号罗彻斯特纽约州11344
零件号码
零件名称
单价
供应商137门闩锁22.008259145侧视镜12.008444150门模6.008263152门锁31.008259155压缩机54.008261178门把手10.008259列(属性、字段)供应商关键字段(主键)主键外键零件图6.4关系数据库的操作
用于开发有用数据集的三类基本操作选择:生成符合所描述标准的所有字段的数据的子集连接:将有关系的表连接起来,为用户提供更多的单一表中无法提供的信息投影:在表中建立列的子集,创建只包含筛选信息的表格关系数据库中的三类操作
选择、连接和映射操作使得两张表被合并起来,并且只列示被选择的属性图6.5数据库管理系统(DBMS)的功能
数据定义功能数据字典查询和报告数据操作语言结构化查询语言(SQL)许多数据库管理系统支持报表生成功能,能够生成精美的报表
(如MicrosoftAcess)微软Access数据字典的特征
微软Access拥有基本的数据字典功能,可以列示关于类型、格式以及数据库中其他字段属性的情况。这里的例子展示了供应商表中存储的数据字典信息,供应商编号旁边的小钥匙表示主键图6.6SQL查询的例子
本例子说明,使用SQL语句,筛选出零件编号为137或150的零件、零件名、供应商编号以及供应商名。筛选结果如图6.5所示。图6.7Access查询实例
本例子说明了如何使用微软Access的SQL工具完成图6.7所展示的查询任务。这里展示了查询所要求的表、字段以及选择标准。图6.8数据库设计
概念设计vs.物理设计标准化将复杂的数据群组进行简化,以减少冗余数据以及棘手的多对多关系引用完整性使相连接的表保持关系一致性实体-关系图正确的数据模型是系统有效支撑业务的前提未规范化的订单关系
一个未规范化的关系会包含重复的数据字段,比如一个订单可能会有很多的零件以及零件的供应商,但是在“订单号码”
和“订单日期”之间只有一对一关系。订单(规范化之前)零件数量单价零件名称零件号码订单日期供应商号码供应商名称供应商街道供应商城市供应商所在州供应商邮编订单号码图6.9订单关系中创建的规范化表格
在规范化之后,原来的ORDER关系被分解成为四个小的关系,“订单”关系只剩下两个属性,“所订零件”关系有一个由“订单号码”和“零件号码”组成的联合键或连接键。关键字段关键字段关键字段供应商供应商号码供应商名称供应商街道供应商城市供应商所在州供应商邮编关键字段订单订单号码订单日期零件零件号码零件名称零件单价供应商号码所订零件订单号码零件号码零件数量图6.10实体联系图
这幅图展示了供应商、零件、所订零件、订单这几个实体间的关系,这些实体可以建立起图6.10所描绘的数据模型。
提供供应商零件所订零件订单被预定包含属于包含被供应‖‖‖∧∧∧∣∣∣图6.11非关系数据库和云数据库
非关系数据库:“NoSQL”更具灵活性的数据模型通过分布式的存储来存放数据集
更容易度量可以处理大量的结构化以及非结构化数据(网站、社会化网络、图形)云数据库适合于初创企业、小微企业AmazonRelationalDatabaseService,MicrosoftSQLAzure私有云6.3大数据的挑战大数据大量的从网站流量、社会化网络、传感器以及其他途径获取的非结构/半结构化数据量级太大,传统数据库无法处理PB、EB级的数据量可以揭示更多的模式、关系以及反常现象需要新工具和技术来管理和分析数据商业智能的基础(1/3)
从分散的信息系统以及大数据中获取信息的一系列工具数据仓库存储来自核心的运营业务系统的当前和历史数据根据应用的目标,把企业范围内的数据进行整合和标准化处理,但数据不能改变提供分析和报告工具互动讨论--组织:
纽约市转向数据驱动方式来打击犯罪课堂讨论商务智能驱动的方式对执法人员和公众有什么好处?这种执法手段有什么问题?当建立商务智能驱动的执法信息系统时,需要考虑管理、组织和技术方面的哪些问题?商务智能的基础(2/3)数据集市数据仓库的子集重点聚焦于单一的主题或者某个业务领域Hadoop使得大数据能够在大量低成本的计算机上进行分布式并行处理关键的服务Hadoop分布式文件系统(HDFS):数据存储MapReduce:将数据分为不同的簇,便于工作Hbase:NoSQL数据库Yahoo、NextBio都使用Hadoop商务智能的基础(3/3)内存计算用于大数据分析在计算机内存(RAM)中进行数据的存储,以避免从磁盘数据中检索数据的延迟可以把处理数据的时间从几小时/几天减少到秒级分析平台使用关系及非关系工具的高速分析平台,以优化大数据集的处理现代商务智能的基础设施
现代商务智能基础设施具有管理和分析来自多个数据源的大规模不同类型数据的能力与工具。其中包括了为一般企业用户设计的易用的查询和报表生成工具,以及为高级用户设计的复杂的分析工具运营数据历史数据机器数据音频/视频数据外部数据提取、转换和下载Hadoop数据集群临时用户查询报告应用程式高级用户查询报告OLAP数据挖掘Web数据分析平台数据仓库数据集市图6.12分析工具:聚焦于关系、模式、趋势大量数据的整合、分析和获取工具,帮助用户更好的做出商业决策多维数据分析(OLAP)数据挖掘文本挖掘网络挖掘在线分析处理(OLAP)支持多维度的数据分析从多个维度来观察数据信息的每一方面均可以作为一个维度(产品、价格、成本、地区、时期)例子:与其他地区相比,东部地区六月销售了多少台洗衣机?OLAP能够快速、在线回答各种查询多维数据模型
这个模型显示产品和区域的销售情况。如果你旋转立方体90度,将展现的是产品对比实际销量和计划销量。如果你再转90度,你将会看到不同区域对比实际销量和计划销量。通过转动,也可以得到其他的视图。计划实际螺帽螺栓垫圈螺丝钉东部西部中部产品地域图6.13数据挖掘
发现数据集中隐藏的模式和关系例如:客户购买方式找出可以推断出未来行为的规则通过数据挖掘可以获得的信息种类关联分析序列分析分类聚类预测文本挖掘和网络挖掘文本挖掘从大量非结构化数据集中提取关键元素情感分析软件网络挖掘从网页中挖掘和分析有价值的模式以及信息网页内容挖掘网页结构挖掘网页使用挖掘数据库与网络
许多企业使用网络向客户或合作伙伴开放部分内部数据库传统的配置包括网络服务器应用服务器/中间件/公共网络接口数据库服务器(数据库管理系统主机
)使用网络数据库存取的优势容易使用浏览器软件网络界面只需对数据库做少许甚至不用修改增加网页和数据库的接口成本低网络与企业内部数据库的连接
用户利用个人电脑上的浏览器浏览,通过互联网访问企业内部数据库配备网络浏览器的客户机
互联网Web服务器应用程序服务器数据库服务器
数据库图6.146.4制定信息政策
针对分享、管理以及标准化数据的企业制度和规程数据管理建立数据管理的政策和规程数据治理是关于数据可用性、完整性、数据安全性的管理政策和程序,尤其是政府法规的政策和流程数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 食品安全体系FSSC22000-V6版标准要求及内审员培训教材
- 内分泌科糖尿病并发症防治细则
- 全科医学科高血压病管理指南
- 毕业设计计算机答辩
- 肥胖症综合治疗方案培训
- 白加黑案例深度解析
- 树状分析图设计
- 消化内科腹腔积液治疗方案
- 海鲜餐厅设计模板
- 浪漫时钟插画设计
- 施工方案编制的规范与标准要求
- 广东季华实验室管理部门招聘参考题库附答案
- AI赋能下北师大版小学数学四年级上册《确定位置》教学设计反思
- 2025年武汉辅警招聘考试真题含答案详解ab卷
- 煤矿后勤服务合同范本
- 实验室设备管理思路及方案
- 2025年高考新课标一卷物理真题卷及答案
- GB/T 30761-2025巴旦木坚果和果仁
- 矿山企业环保知识培训
- 《机械制图》电子教材
- 员工职业健康体检表模板
评论
0/150
提交评论