版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章
旅游数据资源管理技术第一页,共九十九页。1第四章旅游数据资源管理技术【学习目标】掌握数据库和数据仓库概念了解常用的数据库管理系统使用常用的数据挖掘工具进行统计决策【知识要点】数据库和数据仓库数据库管理系统数据挖掘工具第二页,共九十九页。21第一节数据管理技术的发展2第二节文件管理3第三节数据库模型4第四节旅游企业中常用的数据库管理系统本章内容5第五节旅游企业中的数据仓库第三页,共九十九页。3第一节数据管理技术的发展一、人工管理阶段人工管理阶段数据管理的特点人工管理阶段数据与程序的关系用户1用户2用户m应用程序1…应用程序2应用程序3应用程序n…数据组1数据组2数据组3数据组k…第四页,共九十九页。4第一节数据管理技术的发展二、文件系统阶段文件系统阶段数据管理的特点文件系统阶段数据与程序的关系用户1用户2用户m应用程序1…应用程序2应用程序3应用程序n…数据组1数据组2数据组3数据组k…文件管理系统第五页,共九十九页。5第一节数据管理技术的发展三、数据库系统阶段数据库系统相关概念数据库系统(DBS,DataBaseSystem)数据库(DB,DataBase)数据库管理系统(DataBaseManagementSystem)第六页,共九十九页。6第一节数据管理技术的发展三、数据库系统阶段数据库管理阶段数据与程序的关系数据库管理阶段的特点用户1用户2用户m应用程序1…应用程序2应用程序3应用程序n…数据库管理系统数据库第七页,共九十九页。7第二节文件管理一、文件概念文件系统在操作系统中的作用相关概念文件系统文件文件名称、文件命名、文件类型文件属性、文件长度、文件时间文件权限第八页,共九十九页。8第二节文件管理二、文件分类按文件的用途进行分类 系统文件、库文件、用户文件按文件的性质分类 普通文件目录文件特殊文件按文件的保护级别进行分类 源文件、目标文件、可执行文件第九页,共九十九页。9第二节文件管理三、文件存取和操作文件的存取 顺序访问、随机访问、索引访问文件的操作
对文件自身的操作建立、删除、打开、关闭、读写
对记录的操作插入、删除、修改、查找第十页,共九十九页。10第二节文件管理四、文件的结构与处理方法文件结构 物理结构、逻辑结构文件系统的安全性和可恢复性 常见的文件系统及特点 Sysv、Minix、Ext、Ext2、NFS、Hpfs FAT(FAT12、FAT16、FAT32)、exFAT NTFS第十一页,共九十九页。11第三节数据库模型一、数据库概念数据库系统
数据管理是数据处理的中心问题。数据处理是指对各种形式的数据进行收集、储存、加工和传播的一系列活动的总和。
数据管理指的是对数据的分类、组织、编码、储存、检索和维护。
数据库技术所研究的问题是如何科学地组织和储存数据,如何高效地处理数据以获取其内在信息。第十二页,共九十九页。12第三节数据库模型一、数据库概念数据库管理系统是数据库系统的关键内容。它在操作系统的支持下对数据库进行统一管理和控制。数据库的维护工作、安全性和完整性都由DBMS负贵,应用程序只有通过DBMS才能执行。数据库管理系统的主要功能数据库的定义、建立和维护功能为数据存取功能数据库运行管理功能第十三页,共九十九页。13第三节数据库模型一、数据库概念数据库系统的主要特征数据的结构化数据冗余度小数据共享具有较高的数据和程序独立性提供各种安全性功能第十四页,共九十九页。14第三节数据库模型二、关系数据库模型
现实世界的数据化过程现实世界、信息世界和数据世界之间的关系第十五页,共九十九页。15第三节数据库模型二、关系数据库模型概念模型与数据模型概念模型实体(Entity)实体的属性(Attribute)反映实体特性只涉及有限个属性属性名、属性值属性的域——属性的取值范围第十六页,共九十九页。16第三节数据库模型二、关系数据库模型概念模型与数据模型概念模型
实体集(EntityUnit)所有属性名完全相同实体的集合实体名——实体集的名称实体型(EntityType)实体名及其所有属性名的集合码或关键字(Key)确定实体集中唯一实体的属性(集)第十七页,共九十九页。17第三节数据库模型二、关系数据库模型概念模型与数据模型概念模型
实体集之间的联系一对一联系(1:1)一对多联系(1:n)多对多联系(m:n)第十八页,共九十九页。18第三节数据库模型实体集之间的联系AR联系名实体型A实体型R11(a)一对一联系AR联系名实体型A实体型R1n(b)一对多联系AR联系名实体型A实体型Rmn(c)多对多联系第十九页,共九十九页。19第三节数据库模型二、关系数据库模型概念模型的表示方法E-R图概念模型常用实体—联系法表示,即E-R图在E-R图中,长方形表示实体,椭圆表示属性,用无向边把实体与其属性连接起来。菱形表示实体间的联系,用无向边把菱形与有关实体连接起来并在无向边旁标上联系的类型。若联系具有属性,则也把属性与菱形用无向边相连。第二十页,共九十九页。20第三节数据库模型教师与课程关系的E-R图讲授nm工号姓名性别生日职务职称专业课程号名称学时教室开课时间教师课程第二十一页,共九十九页。21第三节数据库模型教务管理系统E-R图编排nm系号名称电话主任地址课程号名称学时教室开课时间系管理选择管理讲授课程nmnm工号姓名性别生日职务职称专业学号姓名性别生日民族入学日期籍贯学生教师11mm第二十二页,共九十九页。22第三节数据库模型二、关系数据库模型数据模型非关系模型前两种模型统称为非关系模型,它们的数据结构和图是相互对应的。在非关系模型中,概念模型中的实体、实体型分别反映为记录和记录型,因此图的结点表示记录型,结点之间的连接弧表示记录型之间的联系。第二十三页,共九十九页。23第三节数据库模型二、关系数据库模型数据模型非关系模型基本层次联系数据结构可以分解为基本层次联系。两个记录型及它们之间的 一对多(一对一)的联系 称为基本层次联系。父记录和子记录R1R2第二十四页,共九十九页。24第三节数据库模型二、关系数据库模型数据模型非关系模型层次模型若一个基本层次联系的集合满足下列两个条件,则它是层次模型 ①有且仅有一个无父结点,这样的结点称为根结点。 ②非根结点都有且仅有一个父结点。第二十五页,共九十九页。25第三节数据库模型多层层次模型RR1R2R21R22第二十六页,共九十九页。26第三节数据库模型二、关系数据库模型数据模型非关系模型网状模型若一个基本层次联系集合中,至少有一个结点有一个以上的父结点,则这种数据模型是网状模型。
①可能有一个以上的结点无父结点 ②结点与其父结点间联系可能不止一个第二十七页,共九十九页。27第三节数据库模型网状模型R1R2(a) (b) (c)R3R1R2R1R2R3R4第二十八页,共九十九页。28第三节数据库模型二、关系数据库模型数据模型关系模型当前广泛应用的数据库管理系统几乎都支持关系模型,称为关系型数据库管理系统(RelationalDataBaseManagementSystem,即RDBMS)关系模型用二维表表示实体及其相互联系对表的构成形式有一定限制第二十九页,共九十九页。29第三节数据库模型二、关系数据库模型数据模型关系模型关系模型的主要术语元组:行,对应实体,相当于记录属性和属性名:列,列的名称分量:一个元组在一个属性上的值关系与关系名:整表是一个关系关系模式:关系名及其所有属性名集合第三十页,共九十九页。30第三节数据库模型二、关系数据库模型数据模型关系模型关系模型对二维表的限制①表中每一列都必须是不可分的基本项。②表中没有完全相同的两个元组。在一个关系模式中:③不能有两个属性具有相同的属性名。④属性间顺序和元组间顺序都是无关紧要的。第三十一页,共九十九页。31第四节旅游企业中常用的数据库管理系统一、Oracle数据库管理系统完整的数据管理功能分布式数据库系统,支持Internet应用提供界面友好、功能齐全的数据库开发工具使用PL/SQL语言执行各种操作可开放性、可移植性、可伸缩性支持面向对象的功能,如类、方法、属性等对象/关系型数据库管理系统目前最新版本是Oracle11g第三十二页,共九十九页。32第四节旅游企业中常用的数据库管理系统二、DB2数据库管理系统具有较好的可伸缩性、高层次的数据利用性、完整性、安全性、可恢复性与平台无关的基本功能和SQL命令数据分级技术查询优化器,支持多任务并行查询网络支持能力,适用于大型分布式应用系统可通过开放数据库连接(ODBC)接口、Java数据库连接(JDBC)接口,或者CORBA接口代理被任何应用程序访问第三十三页,共九十九页。33第四节旅游企业中常用的数据库管理系统三、MSAccess数据库管理系统MicrosoftOffice组件之一桌面型数据库管理系统无需编写任何代码,可视化操作包括表、窗体、查询、报表、宏、模块等要素支持ODBC与其他数据库相连,实现数据交换和共享与Office办公软件进行数据交换和共享支持嵌入和链接多媒体数据第三十四页,共九十九页。34四大主流数据库比较一、开放性1.SQLServer只能在windows上运行,没有丝毫的开放性,操作系统的系统的稳定对数据库是十分重要的。Windows9X系列产品是偏重于桌面应用,NTserver只适合中小型企业。而且windows平台的可靠性,安全性和伸缩性是非常有限的。它不象unix那样久经考验,尤其是在处理大数据库。2.Oracle能在所有主流平台上运行(包括windows)。完全支持所有的工业标准。采用完全开放策略。可以使客户选择最适合的解决方案。对开发商全力支持。第三十五页,共九十九页。35四大主流数据库比较一、开放性3.SybaseASE能在所有主流平台上运行(包括windows)。但由于早期Sybase与OS集成度不高,因此VERSION11.9.2以下版本需要较多OS和DB级补丁。在多平台的混合环境中,会有一定问题。4.DB2能在所有主流平台上运行(包括windows)。最适于海量数据。DB2在企业级的应用最为广泛,在全球的500家最大的企业中,几乎85%以上用DB2数据库服务器,而国内到97年约占5%。第三十六页,共九十九页。36四大主流数据库比较二、可伸缩性,并行性1.SQLServer并行实施和共存模型并不成熟,很难处理日益增多的用户数和数据卷,伸缩性有限。2.Oracle并行服务器通过使一组结点共享同一簇中的工作来扩展windownt的能力,提供高可用性和高伸缩性的簇的解决方案。如果windowsNT不能满足需要,用户可以把数据库移到UNIX中。Oracle的并行服务器对各种UNIX平台的集群机制都有着相当高的集成度。第三十七页,共九十九页。37四大主流数据库比较二、可伸缩性,并行性
3.SybaseASE虽然有DBSWITCH来支持其并行服务器,但DBSWITCH在技术层面还未成熟,且只支持版本12.5以上的ASESERVER。DBSWITCH技术需要一台服务器充当SWITCH,从而在硬件上带来一些麻烦。4.DB2具有很好的并行性。DB2把数据库管理扩充到了并行的、多节点的环境。数据库分区是数据库的一部分,包含自己的数据、索引、配置文件、和事务日志。数据库分区有时被称为节点安全性。第三十八页,共九十九页。38四大主流数据库比较三、安全认证1.SQLServer没有获得任何安全证书。2.OracleServer获得最高认证级别的ISO标准认证。
3.SybaseASE获得最高认证级别的ISO标准认证。
4.DB2获得最高认证级别的ISO标准认证。
第三十九页,共九十九页。39四大主流数据库比较四、性能1.SQLServer多用户时性能不佳2.Oracle性能最高,保持开放平台下的TPC-D和TPC-C的世界记录。3.SybaseASE性能接近于SQLServer,但在UNIX平台下的并发性要优与SQLServer。4.DB2性能较高适用于数据仓库和在线事物处理。
第四十页,共九十九页。40四大主流数据库比较五、客户端支持及应用模式1.SQLServerC/S结构,只支持windows客户,可以用ADO、DAO、OLEDB、ODBC连接。2.Oracle
多层次网络计算,支持多种工业标准,可以用ODBC、JDBC、OCI等网络客户连接。3.SybaseASEC/S结构,可以用ODBC、Jconnect、Ct-library等网络客户连接。4.DB2跨平台,多层结构,支持ODBC、JDBC等客户。第四十一页,共九十九页。41四大主流数据库比较六、操作简便1.SQLServer
操作简单,但只有图形界面。2.Oracle较复杂,同时提供GUI和命令行,在windowsNT和unix下操作相同。3.SybaseASE较复杂,同时提供GUI和命令行。但GUI较差,常常无法及时状态,建议使用命令行。4.DB2操作简单,同时提供GUI和命令行,在windowsNT和unix下操作相同。第四十二页,共九十九页。42四大主流数据库比较七、使用风险1.SQLserver
完全重写的代码,经历了长期的测试,不断延迟,许多功能需要时间来证明。并不十分兼容。2.Oracle
长时间的开发经验,完全向下兼容。得到广泛的应用。完全没有风险。3.SybaseASE向下兼容,但是ct-library程序不益移植。4.DB2在巨型企业得到广泛的应用,向下兼容性好。风险小。第四十三页,共九十九页。43第五节旅游企业中的数据仓库一、数据仓库(DataWarehouse)数据仓库定义数据仓库定义为面向主题的、集成的、稳定的、不同时间的、反映历史变化数据集合,用于支持经营管理中决策制定过程。第四十四页,共九十九页。44第五节旅游企业中的数据仓库一、数据仓库(DataWarehouse)数据仓库的特点面向主题集成性稳定性反映历史变化的面向主题的集成的随时间变化的非易失的数据仓库第四十五页,共九十九页。45特点1:数据仓库是面向主题的基于传统关系数据库建立的各个应用系统,是面向应用进行数据组织的;而数据仓库中的数据是面向主题进行组织的。主题是指一个分析领域,是在较高层次上企业信息系统中的数据综合、归类并进行利用的抽象。所谓较高层次是相对面向应用而言的,其含义是指按照主题进行数据组织的方式具有更高的数据抽象级别。例如保险公司建立数据仓库,所选主题可能是顾客、保险金和索赔等,而按照应用组织的数据库则可能是汽车保险、生命保险和财产保险等。对于一个网上商城的数据仓库来说,那么销售分析就是一个主题,客户属性分析也是一个主题。第四十六页,共九十九页。46特点2:数据仓库是集成的面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。在创建数据仓库时,信息集成的工作包括格式转换、根据选择逻辑消除冲突、运算、总结、综合、统计、加时间属性和设置缺省值等工作。还要将原始数据结构作一个从面向应用到面向主题的转变。第四十七页,共九十九页。47特点2:数据仓库是集成的数据仓库环境下数据的集成第四十八页,共九十九页。48特点3:数据仓库是稳定的操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,数据一旦装入其中,基本不会发生变化。数据仓库中的每个数据项对应于一个特定时间。当对象某些属性发生变化就会生成新的数据项。一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。因此,数据仓库的信息具有稳定性。第四十九页,共九十九页。49特点4:数据仓库是反映历史变化的操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。第五十页,共九十九页。50数据随时间变化数据的不可更新是指数据仓库用户进行分析处理时不进行数据更新工作,不是说数据仓库从开始到删除的整个生命周期都是永远不变的。数据仓库的数据随着时间变化而定期被更新,每隔一段固定的时间间隔后,运作数据库系统中产生的数据被抽取、转换以后集成到数据仓库中,而数据的过去版本仍保留在数据仓库中。数据仓库的数据也有存储期限,一旦超过了这个期限,过期数据就要被删除,只是数据仓库内的数据实现要远远长于操作型环境中的数据时限。第五十一页,共九十九页。51第五节旅游企业中的数据仓库一、数据仓库(DataWarehouse)数据仓库是一个数据库,其中的数据来自于许多系统,旨在支持管理报表生成和决策制定。广义上,数据仓库实际上指的是数据存储和工具。数据仓库使用用户在业务活动中收集的信息来帮助用户决策,使用户更好、更巧妙、更快、更有效地操作业务。数据仓库是合理的业务智能架构的关键部分。第五十二页,共九十九页。52一、数据仓库(DataWarehouse)企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改 善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的管理决策人员,是数据仓库的根本任务。因此,从产业界的角度看,数据仓库建设是一个工程,是一个过程。第五节旅游企业中的数据仓库第五十三页,共九十九页。53数据仓库进化过程最初的数据仓库主要用于企业内部某一部门的报表。决策者关心的重点发生了转移——从"发生了什么"转向"为什么会发生"。分析活动的目的就是了解报表数据的涵义,需要对更详细的数据进行各种角度的分析。当一个公司决策过程得到量化以后,对经营动态的情况以及这种情况为什么发生都会有所体验,下一步就是要将信息用于预测。重在战术性决策支持。重点在企业外部,为执行公司战略的员工提供支持。动态数据仓库在决策支持领域中的角色越重要,企业实现决策自动化的积极性就越高。在CRM环境中,利用动态数据仓库,根据每一位客户的情况做出决策都是可能的。第五十四页,共九十九页。54数据仓库与数据库的区别数据仓库
数据库
面向分析型数据处理
面向事务型数据处理
对多个异构的数据源的有效集成
数据库之间相互独立且异构
数据相对稳定
数据实时更新
反映历史变化
通常关心当前数据
第五十五页,共九十九页。55数据仓库的体系结构第五十六页,共九十九页。56第五节旅游企业中的数据仓库一、数据仓库(DataWarehouse)当前报表架构存在的问题可访问性及时性格式完整性目标、业务、智能第五十七页,共九十九页。57第五节旅游企业中的数据仓库一、数据仓库(DataWarehouse)数据仓库在DSS(决策支持系统)中的地位传统辅助决策的软件结构是“三部件”型:总控部件、数据库部件和模型部件。问题处理和人机交互(综合部件)模型库管理系统数据库模型程序数据库管理系统第五十八页,共九十九页。58第五节旅游企业中的数据仓库一、数据仓库(DataWarehouse)数据仓库在DSS(决策支持系统)中的地位现代决策支持系统架构基于数据仓库、联机处理分析和数据挖掘。第五十九页,共九十九页。59第五节旅游企业中的数据仓库一、数据仓库(DataWarehouse)数据仓库在DSS(决策支持系统)中的地位数据仓库已经成为现代DSS的主要数据源传统DSS架构的不足现代DSS架构的突破实际应用案例基于数据仓库的高速公路营运管理辅助决策系统的概念模型第六十页,共九十九页。60第五节旅游企业中的数据仓库二、数据挖掘(DataMining)数据挖掘的产生起因:丰富的数据,贫乏的知识发展:20世纪80年代开始,数据挖掘技术逐步发展起来快速发展原因: 拥有巨大的数据资源,以及将这些数据资源转换为信息和知识资源的巨大需求数据挖掘可被看作是数据管理与分析技术的自然进化产物第六十一页,共九十九页。61什么是数据挖掘?数据挖掘是一个利用各种分析方法和分析工具在大规模海量数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来做出决策和预测。顾客数据到处都是,谁才是我的顾客?销售信息订单目录市场数据库库存信息客服信息市场信息第六十二页,共九十九页。62第五节旅游企业中的数据仓库二、数据挖掘(DataMining)数据挖掘基本知识数据挖掘: 从大量数据中挖掘或抽取出知识。数据库中知识发现
KDD,KnowledgeDiscoveryfromDatabase从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。整个知识挖掘过程由若干挖掘步骤组成,数据挖掘仅是其中一个主要步骤。第六十三页,共九十九页。63数据挖掘能做些什么?数据特征化和数据区分
关联分析
分类和预测
聚类分析
孤立点分析
演变分析
第六十四页,共九十九页。64数据挖掘的常用方法决策树
相关规则
神经元网络
遗传算法
可视化
OLAP联机分析处理
统计方法
第六十五页,共九十九页。65数据挖掘的常用方法决策树
决策树(DecisionTree)。决策树方法被成功地应用于信用卡损失和不同的国际流通货币的时序预测等各种问题中。一般可用于探索问题、数据预处理和预测中。目前常用的有ID3、CHAID和CART等几种典型的算法。决策树算法的主要优点是直观,其缺点在于随着数据复杂性的增加,分支数会增加,对数据仓库的搜索次数会增加,管理难度会加大。第六十六页,共九十九页。66数据挖掘的常用方法神经元网络
神经元网络(NeuralNetwork)。神经元网络虽然在易用性和易理解性方面受到了限制,但其正确率很高。它通过学习发现规律,然后进行预测。神经元网络可用于聚类、异常发现、特征制取和预测。第六十七页,共九十九页。67数据挖掘的常用方法遗传算法
遗传算法(GeneticAlgorithms)。遗传算法是霍兰等人于20世纪40年代提出的。以生物进化的过程为基础,加以交叉、变异和选择运算,逐步得到问题的最优解。第六十八页,共九十九页。68第五节旅游企业中的数据仓库二、数据挖掘(DataMining)数据仓库与数据挖掘数据仓库是创建商务智能过程中,继数据库技术后进一步的发展(超过数据库)。数据挖掘工具是人们用于数据仓库和商务智能推理过程中,支持决策、解决问题或创造竞争优势而挖掘有价值信息时所必需的工具。第六十九页,共九十九页。69ORACLE数据仓库和数据挖掘解决方案DataWarehousingETLOLAPDataMiningM
e
t
a
d
a
t
a第七十页,共九十九页。70Oracle数据库
SQL*Loader工具OracleWarehouseBuilder(OWB)
Oracle提供的数据仓库工具及其功能介绍第七十一页,共九十九页。711.Oracle9i数据库一个对象关系型数据仓库,用于存储大量的数据。第七十二页,共九十九页。722.SQL*Loader工具用于将数据装载到数据仓库中。这些数据包括Oracle数据库中的数据,其他数据管理系统中的数据和外部数据。开发人员可以利用这两种工具将多种数据源融合在一个单一的存储系统中,并加以管理,从而为最终用户提供对这多种数据源的无缝访问。第七十三页,共九十九页。733.OracleWarehouseBuilderOWB是OracleDeveloperSuits中的一个组件,是用于设计、实现、和管理企业数据仓库和数据集市的集成系统。通过向导驱动的用户界面来进行数据映射、元数据导入,利用预定义的转换库,能够减少设计和实施时间。自动生成代码,并且通过校验程序保证编码的正确性和唯一性,按照部署的要求生成不同的编码类型。第七十四页,共九十九页。743.OracleWarehouseBuilder提供可视化的直观映射和转换工具、对多维数据的拖放功能,以及一个用于管理仓库的系统外门户解决方案,降低设计和开发数据仓库和数据中心的复杂度。OWB为事实表和维度表提供向导和图形编辑器。OWB全面应用Oracle9i的分区、索引和总结管理等特性,与数据库的紧密集成允许Oracle9i作为一种转换引擎使用,排除了增加转换服务器的需求。第七十五页,共九十九页。753.OracleWarehouseBuilder利用OWB组件——文件集成器,实现从文本文件中提取数据。OWB包括一个全局共享库(GlobalSharedLibrary),用于存储可重复使用的转换。OWB软件还包括OraclePureIntegrate
和OWBIntegratorforSAPR/3,前者是将数据客户集成以形成战略性电子商务项目基础的软件,后者是对SAP特有的ERP数据进行强有力报表制作和分析的集成桥梁。第七十六页,共九十九页。76Oracle提供的数据挖掘工具及其功能介绍Oracle9iDataMining
Oracle9iOLAP工具集(1)OracleDiscoverer
(2)OracleExpress系列OracleExpressAnalyzer
OracleExpressObjects
OracleExpressServer第七十七页,共九十九页。771.Oracle9iDataMining提高应用软件的预测力和洞察力将数据挖掘功能嵌入
Oracle9i
数据库中
基于
Java的
APIDataMining第七十八页,共九十九页。78提高应用软件的预测力和洞察力利用DM,公司能够构建高级商务智能应用程序、对公司的数据库进行挖掘、发现新的有用信息并将其集成到商务应用程序中。利用DM,公司能够提高在客户关系管理(CRM)、企业资源计划(ERP)、网页入口和无线应用等商务智能方面的能力。鉴别最有利可图的消费者,避免客户流失获得新客户,对已有客户进行交叉销售检测欺诈行为预测零件质量寻找病人、药品和疗效之间的关系第七十九页,共九十九页。79数据挖掘功能的内嵌Oracle9iDataMining将数据挖掘功能嵌入Oracle9i
数据库中,用于分类、预报和关联。所有的模型构建、评分、以及元数据管理操作经由基于Java的API来启动并完全在该关系数据库中发生。采用贝叶斯法则进行预测和分类
运用关联规则检测隐藏于数据库中“相关”或并发事件自动提取商务信息并将其整合在其他应用软件之中第八十页,共九十九页。80基于Java的API商务智能(BI)开发人员可以使用基于Java的应用程序接口(API)来开发基于预测的应用软件。自动执行数据挖掘进程,为消费者打分以及产生需求预测。通过查询、分析和报表生成器产生新的数据挖掘信息。支持应用程序的集成。第八十一页,共九十九页。812.Oracle9iOLAP工具企业级OLAP可将跨部门的数据紧密地联系在一起,从而使所有用户在一个共同的信息基础上。它帮助用户使用数据仓库中的所有数据。企业级OLAP还能够超越数据仓库的范围,集成来自其它独立系统的数据,这些系统可能是关系型数据库或者外部的文件系统。这种集成使得新型应用,如:基于事实的促销、基于行为的定价以及产品利润分析等能够跨越单一部门的界限。第八十二页,共九十九页。82(1)OracleDiscoverer是Oracle公司面向决策支持系统OLAP工具集的组成部分。它是一个直观的随意查询、报告、搜索和Web公布的工具。它能够帮助公司内部各个层次的商业用户,获得迅速访问关系型数据库、数据中心或者联机事务处理系统中数据的能力。第八十三页,共九十九页。83(1)OracleDiscovererUserEdition提供了超乎寻常的易用性,通过任意深入能力、旋转和图表,给予用户强大的数据探索能力。AdministrationEdition提供了一个易于使用的基于服务器的强大的最终用户层(EndUserLayer™)。
对于那些需要集中精力处理商业问题而不是数据问题的最终用户而言,EndUserLayer为他们隐藏了数据结构和相互关系的复杂性。第八十四页,共九十九页。84(2)OracleExpress系列通过使用OracleExpress:分析咨询人员能够很轻松地从各自的视角观察数据产品经理能够跨越许多时间段和市场区域研究她负责的某个产品财务经理可以集中在当前或者以前的时间段,研究所有的市场和产品地区经理可在某些地区的所有时间段上考察所有产品策略规划人员可以集中在公司数据的某个集上,如在当前和下个季度,仅在西部地区销售的某个新产品第八十五页,共九十九页。85OracleExpressAnalyzer通用的、面向最终用户的报告和分析工具,它采用面向对象技术,在OracleExpressAnalyzer中能运行任何OracleExpressObjects应用。
在OracleExpressAnalyzer的一个基石性对象是简报(briefing)。一个简报由若干页组成,每一页上包含由可重用的对象建立的面向主题的分析。这些对象是交互的、用户能够旋转、深入和查询任何一张简报页中的表格或者图形,以运行他们自己的即席分析。第八十六页,共九十九页。86OracleExpressObjects是最早出现的用于建立C/S上OLAP应用的面向对象的可视化开发环境。提供图形化建模和假设分析功能。通过使用标准的Microsoft对象连接嵌入技术(OLE),实现对第三方软件开放。例如能够使用一个OLE控件显示销售某公司产品的商店。通过使用代理程序、预警程序和OLE控件,可以监控存货水平,当存货水平下降时向管理人员报警,自动提高主要产品的存货水平。第八十七页,共九十九页。87OracleExpressServer是一个先进的计算机引擎和数据高速缓存。支持最能反应用户对其业务思考方法的多维模型,而且具有分析、预测、建模,以及对数据进行假设分析(what-if)的能力。具有用于数学、财务、统计和时间序列管理等方面的内置功能。第八十八页,共九十九页。88第五节旅游企业中的数据仓库三、常用的数据挖掘工具数据挖掘工具查询与报表工具智能代理多维分析工具统计工具数据集市小型的数据仓库第八十九页,共九十九页。89数据库设计主键的故事什么是主键?
关系数据库为了唯一区分表的每一行记录,必须为表确定一个主键。主键可以是一个或多个列组成,这些主键列的值不能重复。一个表只能有一个主键,但可以有多个候选索引。因为主键可以唯一标识某一行记录,所以可以确保执行数据更新、删除的时候不会出现张冠李戴的错误。主键是两个表进行关联的基础,所谓“关系”体现的是一个表的字段(外键)与另一个表的主键的关联,防止出现数据不一致。所以数据库在设计时,主键起到了很重要的作用。
第九十页,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代汉语声韵母教学方案
- 装饰装修公司市场开拓策略方案
- 部编版五年级语文下册语文重点教案设计
- 小学英语词汇表及音标训练
- 企业年度安全隐患排查清单模板
- 浆砌石挡墙拆除施工详细技术方案
- 建筑施工质量验收检查规范
- 小学英语同步练习及听力训练
- 小学家长安全意识调查问卷设计
- 临床技能考试OSCE流程介绍
- 急性呼吸窘迫综合征ARDS教案
- 实验室质量控制操作规程计划
- 骨科手术术前宣教
- 电梯安全培训课件下载
- 事业单位职工劳动合同管理规范
- 老年人静脉输液技巧
- 呼吸内科一科一品护理汇报
- 2025年公安机关人民警察基本级执法资格考试试卷及答案
- 网恋诈骗课件
- 2025版压力性损伤预防和治疗的新指南解读
- 2025年新疆第师图木舒克市公安局招聘警务辅助人员公共基础知识+写作综合练习题及答案
评论
0/150
提交评论