2016数据库新技术考试复习资料_第1页
2016数据库新技术考试复习资料_第2页
2016数据库新技术考试复习资料_第3页
2016数据库新技术考试复习资料_第4页
2016数据库新技术考试复习资料_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库新技术考试复习资料几个基本概念DB数据库是长期存储在计算机内,有组织的,可共享的数据集合。DBMS位于用户与操作系统之间的一个数据管理软件,主要目标是提供一个可以方便,高效的存取数据库信息的环境,实现对共享数据的有效组织,管理和存取。DBS数据库系统是指在计算机系统中引入数据库后构成的系统。由数据库,数据库管理系统,应用系统,数据管理员,数据库用户构成的系统。数据模型是用来描述数据,组织数据和对数据进行操作的技术,用于提供信息表示和操作手段的形式框架,按照数据模型的进展,数据库技术经历了网状,层次数据库,关系数据库和新一代数据库三个阶段。数据库管理技术人工管理阶段,文件系统阶段,数据库系统阶段模式数据库全体数据的逻辑结构和特征的描述。外模式是数据库用户(程序员和最终用户)能看见的局部数据的逻辑结构和特征的描述,是与某一应用具体相关的数据的逻辑表示。内模式内模式是数据逻辑结构和存储方式的描述,是数据在数据库内部的表示方法,一个数据库只能有一个内模式。数据模型数据结构,建立在模式上的操作,数据的完整性约束。事务用户定义的一个数据库操作序列,是一个不可分割的工作单位调度是一个或多个事务的操作按时间排序的一个序列。对象是一个由一组属性和一组方法所组成的一个封装实体,每个对象都有一个系统赋予的具有唯一性的名字(OID),消息则是对象之间的一种协作机制。对象由一组属性与一组行为和一个对象标识符组成。对象有三个重要特征封装性,隐蔽性,稳定性。层次网状数据库区别层次模型是分层结构(树),网状模型是网状结构(有向图)。两级映像模式/内模式映像外模式/模式映像数据定义语言(DDL)CREATEDROPALTER数据操作语言(DML)INSERTUPDATEDELETE数据查询语言(DQL)SELECT数据控制语言(DCL)GRANTREVOKE定义事务的语句BEGINTRANSACTIONCOMMITROLLBACKXML可扩展标记语言,一种自描述、开放的方式定义数据结构。XML可以同时描述结构特性和数据内容,不仅可以用于设计文档描述语言,也可以用于互联网的数据交换。DDBS分布式数据库系统是物理上分散逻辑上集中的数据库系统OODB把面向对象的方法和数据库技术结合起来。第一章1数据库发展的3个阶段和特点层次网状数据库系统1支持三级模式的体系结构外模式,概念模式,内模式2用存取路径来表示数据之间的联系3独立的数据定义语言4导航的数据操纵语言关系数据库系统特点关系数据库是以关系模型为基础,关系模型包括三部分数据结构,关系操作,数据完整性。数据结构关系模型中数据结构只有一种就是关系,实体、实体与实体之间的联系都是通过关系这种单一的结构类型来表示的。关系操作传统的集合操作(并、交、差、笛卡尔积)选择(SELECT)、投影PROJECT和连接JOIN(特点是集合操作,无论是操作对象还是操作结果都是集合。)数据完整性新一代数据库系统1应支持数据管理、对象管理和知识管理;必须支持面向对象数据模型2必须保持和继承第二代数据库系统的技术3必须对其它系统开放新一代数据库技术的特点1面向对象的方法和技术对数据库发展的深远影响2数据库技术与多学科技术的有机结合是当前数据库技术发展的重要特征3相互结合,相互渗透,使新的技术内容层出不穷4数据库的许多概念,技术内容,应用领域都有了重大发展和变化5建立和实现了一系列新型的数据库分布式数据库、并行数据库、演绎数据库、知识库、多媒体数据库等6数据库技术与特定应用领域的有机结合是当前数据库技术发展的又一重要特征7如工程数据库、统计数据库、科学数据库、空间数据库、地理数据库等2数据模型的定义通用的数据模型有哪些给出其特点层次模型分层结构(树),结构简单,容易实现。网状模型网状结构(有向图),更灵活,结构复杂。关系模型二维表结构来表示实体和实体之间的联系。3数据库中数据的完整性约束有哪些实现方式如何四类实体完整性,域完整性,参照完整性,用户定义的完整性。实体完整性关系中键属性的值不能取空值域的完整性指定列有效的输入值参照完整性关系间引用所遵循的规则,与外键有关。用户定义的完整性4SQL的特点是什么SQL的组成1语法简单,易学易用。2高度非过程化的语言。3面向集合的语言。4SQL独立使用,也可以嵌入到宿主语言5功能强大。SQL语言由数据定义、数据操纵、数据控制和数据查询四个部分组成。5数据库管理系统的功能是什么科学地组织和存储数据、高效地获取和维护数据6数据库管理系统的层次结构给出各层的功能、实现原理用例子说明各个层次是如何协助完成相应的功能应用层最上层是应用层。它处理的对象是数据库应用,终端用户通过应用接口发出事务请求。语言翻译处理层第2层是语言翻译处理层。它处理的对象是数据库语言,其功能是对数据库语言的各类语句进行语法分析、视图转换、授权检查、完整性检查、查询优化等。通过对下层基本模块的调用,生成可执行代码。数据存取层第3层是数据存取层。该层处理的对象是单个元组。它把上层的集合操作转换为单记录操作。执行扫描如表扫描、排序、元组的查找、插入、修改、删除、封锁等基本操作。完成数据记录的存取、存取路径维护、并发控制、事务管理等工作。数据存储层第4层是数据存储层。该层处理的对象是数据页和系统缓冲区。执行文件的逻辑打开、关闭、读页、写页、缓冲区读和写、页面淘汰等操作,完成缓冲区管理、内外存交换、外存的数据管理等功能操作系统它处理的对象是数据文件的物理块。执行物理文件的读写操作,保证DBMS对数据逻辑上的读写真实地映射到物理文件上。操作系统提供的存取原语和基本的存取方法通常作为和DBMS存储层的接口。用例子说明各个层次是如何协助完成相应的功能(19页)应用层用户通过程序向DBMS发出命令。语言翻译处理层进行语法检查,语义检查和用户存取权限检查,执行查询优化。数据存取层DBMS执行存取操作序列。数据存储层DBMS首先在缓冲区中查找记录,查看存储模式,决定从哪个文件,用什么方式读取哪个物理记录,根据结果向操作系统发出读取记录的命令。数据存取层DBMS根据查询命令和数据字典的内容导出用户所要读取的记录格式。将数据记录从系统缓冲区传送到应用程序A的用户工作区。执行状态信息,并且提示。7数据库中事务的定义和特征事务的并发含义如何为什么要并发控制并发控制的原理是什么并发控制技术及其实现原理是什么事务(TRANSACTION)是一个逻辑工作单元,是指数据库系统中一组对数据的操作序列。一个事务可以是一条或一组SQL语句、或整个应用程序。在SQL语言中,定义事务的语句有以下三条BEGINTRANSACTIONCOMMITROLLBACK事务具备的以下几个基本特征又称为其应遵循的ACID准则ACID,指数据库事务正确执行的四个基本要素的缩写(1)原子性(ATOMICITY)。一个事务要么全部执行,要么全不执行,不允许仅完成部分事务。(2)一致性(CONSISTENCY)。事务的正确执行应使数据库从一个一致性状态变为另一个一致性状态。数据一致性指数据应满足的约束条件。(3)隔离性(ISOLATION)。多个事务的并发执行是独立的,在事务未结束前,其他事务不能存取该事务的中间结果数据。(4)持久性(DURABILITY)。事务提交后,系统应保证事务执行的结果可靠地存放在数据库中,不会因为故障而丢失。并发控制的必要性同一数据库系统中往往有多个事务并发执行,如果不进行控制,就会产生数据的不一致性。1丢失更新2脏读3不可重读并发控制原理DBMS认为事务串行调度的结果保持了数据库的一致性,串行调度是不同事务的活动在调度中是一个接一个执行的,没有交叉的运行。事务管理器的重要功能是并发控制,为保证事务的隔离性,通常有1每个事务依次顺序执行2事务之间并发执行。基于封锁的调度要求对数据项的访问以互斥的方式进行来确保可串行化。给数据加锁,并且只允许事务访问当前事务持有锁的数据项。共享锁(S锁)如果事务TI申请到数据项Q的共享锁,则TI可以读数据项Q,但不能写Q。排它锁(X锁)如果事务TI申请到数据项Q的排它锁,则TI可以读数据项Q,也可以写Q。(两段锁协议指所有事务分两个阶段提出加锁和解锁申请增长阶段在对任何数据进行读、写操作之前,首先申请并获得该数据的封锁;收缩阶段在释放一个封锁后,事务不再申请和获得其它的任何封锁。)基于时间戳的并发控制技术以时间戳的顺序处理冲突,使一组事务的交叉执行等价于一个由时间戳确定的串行序列,其目的是保证冲突的读操作和写操作按照时间戳的顺序执行。基于有效性检查的协议利用时间戳的值,通过时间戳排序技术决定可串行化顺序。事务乐观的执行。多粒度并发控制技术封锁粒度是封锁对象的大小。封锁粒度与系统并发度息息相关。各种事务在运行过程中可能需要不同的封锁粒度。多版本并发控制技术一个事务读取位于其前一时刻的最近版本8故障的不同类型日志的用途系统日志记录项包括哪些内容恢复子系统的任务和过程如何事务故障事务没有完成引起的故障,系统崩溃包括硬件故障、数据库软件或操作系统的漏洞造成的系统停止运转。介质故障在数据传送操作过程中由于磁头损坏或故障造成磁盘块上的内容丢失。日志是DBMS用来记录事务对数据库的更新操作的文件,是日志记录的序列。日志记录描述内容主要包括事务标识符是执行写操作事务的唯一标识符,数据项标识符是事务操作对象的唯一标识符,前像(BI)是更新前数据的旧值,后像(AI)是更新后数据的新值。恢复子系统的功能是把数据库从错误状态恢复到某一已知的正确状态事务故障事务在运行至正常终止点前被中止恢复方法由恢复子系统应利用日志文件撤消(UNDO)此事务已对数据库进行的修改。事务故障的恢复步骤1反向扫描文件日志,查找该事务的更新操作。2对该事务的更新操作执行逆操作。3继续反向扫描日志文件,查找该事务的其他更新操作,并做同样处理。4如此处理下去,直至读到此事务的开始标记,事务故障恢复就完成了。系统故障的恢复系统故障的恢复由系统在重新启动时自动完成,不需要用户干预。恢复方法1UNDO故障发生时未完成的事务2REDO已完成的事务系统故障的恢复步骤1正向扫描日志文件2对UNDO队列事务进行UNDO处理3对REDO队列事务进行REDO处理介质故障的恢复1重装数据库,使数据库恢复到一致性状态2重做已完成的事务9数据模型的发展及其各种新型数据模型的特点网状,层次,关系面向对象模型用面向对象观点来描述现实世界实体的逻辑组织、对象间限制、联系等的模型。对象关系模型关系数据模型与对象数据模型的结合,关系数据模型的基础上扩充对象数据模型的某些特征。OPDBMS既保持了关系数据库系统的非过程化数据存取方式和数据独立性,继承了关系数据库系统已有的技术,提供原有的数据管理,又能支持对象数据和对象管理。模型数据交换的标准XML数据具有自描述的、不规则的特点,可以用图模型来表示。是半结构数据模型基于逻辑、基于图。一般的半结构化数据存在一定的结构,但这些结构或者没有被清晰的描述、或者是经常动态变化的、或者过于复杂不能被传统的模式定义来表现。10数据库技术与相关技术的结合情况和发展1数据库技术与网络处理技术相结合,形成了分布式数据库系统2数据库技术与并行计算技术相结合,形成了并行数据库系统3数据库技术与面向对象技术相结合,形成了面向对象数据库系统4数据库技术与多媒体技术相结合,形成了多媒体数据库系统5数据库技术与人工智能相结合,形成了知识库系统和主动数据库系统6数据库技术与模糊技术相结合,形成了模糊数据库系统等7数据库技术与各种工程技术领域相结合,形成了各类不同应用的工程数据库系统等数据库技术发展趋势数据来源和特性的变化数据类型越来越多数据结构越来越复杂数据量越来越大11面向应用领域的数据库技术有哪些特点如何发展方向是什么CAD/CAM、CIM、OIS、GIS特点大量数据,复杂结构,历史数据的管理与重用工程设计与制造实时科学与统计多媒体INTERNET科学研究和商务逻辑实时数据库技术及时性,可预测性和可靠性。WEB数据的提取与集成数据流管理技术传感器网络数据管理技术移动数据管理网格数据管理第二章1面向对象方法的起源是什么1以客观世界存在的事务为出发,用对象作为事务的抽象表示,作为基本单位2对象两种特征属性,行为3对象两种特征构成一独立实体,对外屏蔽其内部细节封装4将具有相同属性与方法的对象归并成类,类是对象的统一抽象描述,类中对象称为实例5类与类之间的关系继承6类与类之间的关系组成7类与类之间的关系消息8以类为单位通过一般特殊结构,整体部分结构构成一个基于面向对象的网络结构图,称为类层次结构图。2OID的主要特征是什么对象标识符是每个对象的唯一表示,它是对象的代表,它是唯一的,由外部按一定规则统一确定的。3如何用封装创建新数据类型4了解类型构造器,如何使用它们构造复杂对象结构5简述面向对象数据库管理系统的基本功能面向对象数据库管理系统的基本功能包括类管理,对象管理和对象控制三个部分类管理对类的定义、操作进行管理。对象管理分主要完成对类中对象的操纵管理。对象控制数据控制功能,外,在OODBMS还补充了一些新的功能。6给出面向对象事务处理的特殊性长事务由于长事务的原子性和可串行性,因此有别于传统事务处理方式并发控制粒度封锁粒度为类层次结构,类,对象和对象属性。类封锁与关系表封锁对封锁具有更复杂的考虑类层次的封锁封锁粒度类封锁类层次的封锁长事务封锁恢复在面向对象数据库中发生故障后,做恢复时需要使用UNDO与REDO操作7如何扩展关系数据模型为对象关系数据模型扩充原来RDBMS中不适合ORDBMS的地方,增加面向对象的特征。1不修改原来的关系型DBMS,直接在现有关系型DBMS上添加面向对象的接口,通过该接口来实现对象到关系的转换。2对关系型DBMS的核心进行扩充,增加对象的特征。8对象关系数据库语言SQL3包含的内容有哪些命令行类型抽象数据类型封装性继承性引用类型用户自定义函数或过程聚合类型大对象(P61)第三章1XML和HTML标记用法有什么不同HTML是超文本标记语言,一种标记语言。XML称为可扩展标记语言,集成了SGML的丰富和HTML的易用性,以一种自描述和开放的方式定义数据结构。里允许用户创建标记,称为可扩展性。(功能强大的原因)HTML需要人们通过对文字的阅读才能理解。XML可以通过对语义的分析由记起来解释。HTML是写给人看的,XML是写给机器看的。2XML中属性和元素有什么不同P68属性和子元素的比较属性是左标记的一部分子元素是文档内容的部分同一信息两种方法都可以A101用属性作为元素的标识符,用子元素表示文档内容的部分子元素不同,属性没有顺序之分。属性必须有一个类型声明和一个默认声明。一般情况下,当元素没有属性时,可以用属性代替;考虑到以后扩展,用元素比较合适,可以扩展它的属性3XML模式和XMLDTD之间有什么不同XML文档有两种定义形式DTD(文档类型定义)SCHEMA(XML模式);XMLSCHEMA和DTD都用于文档验证,但二者还有一定区别,本质区别SCHEMA本身是XML的,可以被XML解析器解析这也是从DTD上发展SCHEMA的根本目的。另外XMLSCHEMA是内容开放模型,可扩展,功能性强;而DTD可扩展性差;XMLSCHEMA支持丰富的数据类型,而DTD不支持元素的数据类型,对属性的类型定义也很有限;XMLSCHEMA支持命名空间机制,而DTD不支持;XMLSCHEMA可针对不同情况对整个XML文档或文档局部进行验证;而DTD缺乏这种灵活性;XMLSCHEMA完全遵循XML规范,符合XML语法,可以和DOM结合使用,功能强大;而DTD语法本身有自身的语法和要求,难以学习4什么是XML数据库,其主要特点是什么讨论XML数据库与WEB数据库的联系与区别1、XML数据库能够对半结构化数据进行有效的存取和管理。2、提供对标签和路径的操作。3、XML数据库适合管理复杂数据结构的数据集XML数据模型是一种带标签的树形结构。5XML会取代关系数据库吗会取代HTML吗为什么会,关系型数据库虽然技术很成熟,但局限性非常明显,对技术界出现的越来月多的复杂类型的数据,关系数据库技术显得无能为力。XML是一种特殊的半结构化数据,没有强制性的模式限制,具有很大的灵活性否,XML优势在于处理数据与数据结构,而无法对页面进行有效控制,不能用XML来直接写网页,XML创建来克服HTML(超文本标记语言)的局限。HTML重点在描述数据的显示,能够对页面显示进行精确的描述6XML的查询访问句法P767XML的优缺点有哪些XML有许多有点XML是面向内容的,它具有许多的结果和更多的语义,简单而易于掌握,良好的可扩展性以及自描述等特点。适用于WEB上的数据交换。XML是一种特殊的半结构化数据,与半结构化数据相比,XML的特点1XML数据包含了引用信息2XML数据元素之间通常是有序的3XML数据中的元素4XML数据中的特有数据块5XML的嵌套结构8给出使用XQUERY中对XML进行查询的方法(P79)XQUERYUSESAFORLETWHERERESULTFLWRSYNTAXFORSQLFROM连接记忆法三个字母相同LET设置,允许临时变量,(SQL中无)WHERESQLWHERE条件RESULTSQLSELECT投影9写出下面XML的DTDB表示10对下页的XML用XPATH,XQUERY写出下列查询语句查询所有的客户元素查询所有的客户名称给出所有客户的姓名、账号信息、余额信息返BALANCE值大于500的账户元素P77P78DOWNTOWN500PERRYRIDGE900JOEMONROEMADISONLISAMOUNTAINMURRAYHILLMARYERINNEWARK第四章1分布式数据库定义、特点DDB是计算机网络环境中各场地上数据库的逻辑集合特点物理分布性数据是分布的逻辑整体性数据是逻辑相关的结点自治性2全局应用什么是局部应用局部概念模式是对全局关系在这个结点上物理图象的逻辑结构及特征的描述。局部内模式描述局部概念模式涉及的数据在局部DBMS中的物理存储3分布式数据库管理系统DDBMS的主要功能组成是什么分布式数据库管理系统DDBMS是建立、管理和维护分布式数据库的一组软件。1LDBMSLOCALDBMS,局部场地上的数据库管理系统,其功能是建立和管理局部数据库,提供场地自治能力,执行局部应用及全局查询的子查询2GDBMSGLOBALDBMS,全局数据库管理系统,主要功能是提供分布透明性,协调全局事务的执行,协调各局部DBMS以完成全局应用,保证数据库的全局一致性,执行并发控制,实现更新同步,提供全局恢复功能等3全局数据字典GLOBALDATADIRECTORY,简称GDD,存放全局概念模式、分片模式、分布模式的定义以及各模式之间映象的定义,存放有关用户存取权限的定义,存放数据完整性约束条件的定义,其功能与集中式数据库的数据字典类似4通信管理COMMUNICATIONMANAGEMENT,简称CM,通信管理系统在分布数据库各场地之间传送消息和数据,完成通信功能4分段模式和分布模式数据分布透明性有哪些不同级别的分布透明性P99分布模式描述片段到不同结点间的映象。如果规定一个片段仅能存放在一个结点,则是非冗余的,否则是冗余的数据分片1水平分片2垂直分片3导出分片4混合分片数据分布透明性指用户不必关心数据的逻辑分段,不必了解数据物理位置分布,不必指明对哪个副本进行操作,也不必关心局部结点上数据库支持哪种数据模型。分片透明性指用户不必关心数据是如何分片的。位置透明性数据在结点间的转移不会影响应用程序;对冗余型的系统,用户不必关心多个副本存储在哪些结点,因而用户不需维护重复副本的一致性。局部映射透明性该透明性提供数据到局部数据库的映象。5有下列全局模式、分段模式和分布模式全局模式STUDENTNUMBER,NAME,DEPT分段模式STUDENT1SELECTFROMSTUDENTWHEREDEPT”EE”STUDENT2SELECTFROMSTUDENTWHEREDEPT”CS”分布模式STUDENT1存放在结点1和结点2STUDENT2存放在结点3和结点4,设DEPT只有“CS”和“EE”两种取值。分别在分段透明性、位置透明性和本地映射透明性下,写一个用学生号查询学生姓名的应用。(P99)6试述分布式查询处理的一般过程。在分布式数据库中有三类查询局部查询、远程查询和全局查询。过程1词法及语法分析2把查询语句变为查询树3将全局关系分割成片段,为查询分解提供条件4多结点查询优化5子查询的执行和优化6汇总和处理子查询结果,以获得查询结果7分布式事务的基本特征是什么分布式数据库系统中的事务也应具有事务的ACID四个特征,即原子性ATOMICITY、可串行性SERIALIZABILITY)、隔离性ISOLABILITY)和耐久性DURABILITY)。8二段提交协议的实现过程是什么P117第一阶段为决定段协调者向所有参与者发出准备消息,参与者根据本结点子事务执行结果进行回答第二阶段为执行段1协调者先将全局提交记录2参与者根据接收到的命令将COMMIT或ABORT记录写入运行记录并执行相应的操作3该事务的两阶段提交处理完毕,协调者将事务完成记录写入运行记录。9三段提交协议与二段提交协议的区别是什么两阶段提交协议不是一个无阻塞协议,失败修复方式有可能使得结点拥塞,而三阶段提交协议在所有的结点都失败的情况下也不会阻塞。尽管三阶段提交协议能避免拥塞,但实现起来比较复杂,通信次数明显增多。在当前的网络资源下,并不适用。两阶段提交协议简单,适用,可靠,有可能引起拥塞的情况。10分布式数据库中的可串行性与集中式数据库中的可串行化概念有何区别分布式数据库并发控制(P119)11试述分布式数据库的并发控制方法。封锁法对同一数据项在同一时刻可以有多个事务持有对其的读锁,但对同一数据项在任何时刻只能有一个事务持有对其的写锁。(P119)时间印法在每个事务启动运行时,并发控制机制赋予其唯一时间印,以实现多事务的可串行性。悲观并发控制锁定系统阻止用户以影响其他用户修改数据乐观并发控制用户读数据时不锁定数据,如果另一个用户更新了数据,将产生一个错误,接受错误信息的用户将回退事务并重新开始。12分布式数据库的故障类型和恢复方法事务故障,系统崩溃,介质故障。备份恢复技术和日志恢复技术。第五章1什么是数据仓库特点数据仓库数据仓库就是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合。特点(1)面向主题(2)集成(3)不可更新(4)随时间不断变化2建立数据仓库的步骤1收集和分析业务需求2建立数据模型和数据仓库的物理设计3定义数据源4选择数据仓库技术和平台5从操作型数据库中抽取、转化、和装载数据到数据仓库6选择访问和报表工具7选择数据库连接软件8选择数据分析和数据展示软件9更新数据仓库(P139)3试述数据仓库与数据库联系与区别。数据库用于事务处理,数据仓库用于决策分析。数据库保持事务处理的当前状态,数据仓库既保存过去的数据又保存当前的数据,数据库中的数据一直在更新,数据仓库中的数据是批量更新的。数据仓库的数据是大量数据库的集成。对数据库的操作比较明确,操作量少,对数据仓库的操作不明确,操作数据量大。数据与数据仓库的对比(P136)4给出数据仓库系统的结构说明每个部分的功能和实现方法数据仓库系统(DWS)由数据仓库、仓库管理和分析工具三部分组成1数据源是数据仓库系统的基础,是整个系统的数据源泉,通常包括企业内部信息和外部信息。2数据的存储与管理是整个数据仓库系统的核心。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库通常称为数据集市。3OLAPONLINEANALYTICALPROCESSING服务器对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。4前端工具主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。(P139)5数据仓库的设计原则是什么面向主题原则数据驱动原则原型法设计原则6数据仓库与数据挖掘的关系与区别是什么数据仓库就是面向主题的、集成的、不可更改的、随时间不断变化的数据集合。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中、提取隐含其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘可以实施在任何类型的数据库上,包括数据仓库。(P159)7试述数据挖掘的概念数据挖掘的步骤数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识。这些知识是隐含的、事先未知的潜在有用信息。数据挖掘一般可由下面5个步骤组成,它们是数据集成数据归约挖掘评价表示8数据挖掘发现的知识分类广义知识关联知识分类知识预测型知识偏差型知识9数据挖掘常用算法用于特征规则挖掘的方法面向属性归约方法数据立方方法关联规则挖掘序列模式分析分类分析聚类分析10数据挖掘的目标和任务数据挖掘的目的用归纳出的规律来指导客观世界数据挖掘就是从大型数据库数据仓库的数据中提取人们感兴趣的知识。这些知识是隐含的、事先未知的潜在有用信息。11简述数据挖掘处理3个过程模型多处理阶段过程模型螺旋处理过程模型以用户为中心的处理模型第六章1传统的数据库存在什么局限性1面向机器的语法数据模型只能存储离散的数据和有限的数据与数据之间的关系,语义表示能力差无法表示客观世界中的复杂对象2数据类型简单固定3数据操纵语言与程序语言失配4存储和管理的对象有限2简述GIS中基本空间数据模型。最基本的空间数据类型1点(POINT),例如城市。点只表示其空间位置,不表示其范围;2线(LINE),例如河流、道路、管道、航线等。线不仅表示线上各点在空间的位置,而且还有长度,即表示其在空间的延伸范围;3面(AREA),具有长和宽的目标,通常用来表示自然或人工的封闭多边形。一般分为连续面和不连续面。4体(GEOMETRY),有长、宽、高的目标。通常用来表示人工或自然的三维目标,如建筑、矿体等三维目标。3空间数据库的基本特征是什么1数据量特别大2具有高可访问性3)不仅有属性数据,还有大量的空间数据4)数据应用广泛5)空间数据模型复杂4空间数据库的基于方位的关系有哪些基于方位的关系是描述空间对象之间的空间相互作用关系。绝对关系相对关系顺序空间关系度量空间关系5简述空间数据库中矢量与栅格数据结构比较。栅格模型矢量模型优点1、数据结构简单;2、叠加操作易实现;3、能有效表达空间可变性;4、栅格图象便于做图象的有效增强。优点1、提供更严密的数据结构;2、提供更有效的拓扑编码,因而对需要拓扑信息的操作更有效,如网络分析;3、图形输出美观,接近于手绘。缺点1、数据结构不严密不紧凑,需要用压缩技术解决这个问题;2、难以表达拓扑关系;3、图形输出不美观,线条有锯齿,需要增加栅格数量来克服,但会增加数据量。缺点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论