




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章 计算机系统知识一、 计算机系统组成1. 运算器:对数据进行加工处理的部件;控制器:从主存取出指令,并指明下一指令的地址。指令取出后,经指令寄存器送往指令译码器。寄存器:计算机系统中的记忆设备,存放程序、原始数据、中间数据、最终结果。二、 工作原理1. 码制: 最高位其它位原码0为正,1为负正负相同,为其二进制数反码、正:与原码同;负:原码负的按位求反补码正:与原码同;负:反码+12. 指令:由操作码(操作的类型)和地址码(操作数和运算结果的存放地址)组成。三、 体系结构1. 高速缓存地址映像:直接映像、全相连映像、组相连映像。替换算法:随机替换算法、先进先出、近期最少使用、优化替换算法。性能分析:等效访问时间 = 命中率 * cache访问时间 + (1 命中率)* 主存访问时间2. CISC:复杂指令集计算机3. RISC:精简指令集计算机4. 中断:5. 流水线:吞吐率 = 最长子过程的倒数:= 1/Max(t1,t2)建立时间:6. 总线结构1) 内总线:ISA、EISA:33MB/sPCI: 32位133MB/s, 64位266MB/s;与CPU时钟频率是独立的,非同步的。即插即用2) 外总线SCSIUSB:即插即用,2.0=480MB/sIEEE 1394:即插即用四、 安全性、可靠性与系统性能基础知识(一) 加密技术1. 对称加密:典型代表:DES适合对文件等大信息量数据。2. 非对称加密典型代表:RSA适合小信息量数据。数字加密和数字签名的区别:1) 数字签名,使用发送方的密钥对;数字加密,使用接受方的密钥对;2) 数字签名使用非对称密钥算法;数字加密,对称和非对称都使用;(二) 认证技术Cache等效访问时间:Z = H*X + (1-H)*Y H为Cache的命中率,X为Cache的存取时间,Y为主存的存取时间流水线处理机的吞吐率:= 1 / (最长子过程时间) 如:n / (1+3+1+2+1)t + 3*(n-1)t计算机系统可靠性:串联: R = R1 * R2 * R3.并联:R = 1-(1-R1)(1-R2)(1-R3).进程同步与互斥:同步:相互合作的进程,当一个进程到达某点后,除非另一个进程完成某操作,否则就不得不停下来等待这些操作结束。互斥:各进程共享某资源,但这些资源只能供一个进程使用。P操作:S=S-1 V操作:S=S+1不发生死锁的条件:M N * (X - 1); M个资源,N个进程,每个进程最多申请X个资源;M的最小数还需要+1,才能正确的;第二章 数据结构和算法一、 二叉树的遍历:前序遍历中序遍历后序遍历层序遍历霍夫曼树、构造最优二叉树的霍夫曼算法二叉树:满二叉树:深度为k的二叉树有2的k次方-1个节点。完全二叉树:每个节点都与满二叉树一一对应。最优二叉树(哈夫曼树):带权路径长度最短的树。第三章 操作系统知识第四章 程序设计语言基础一、 基础知识1. 解释程序和编译程序的区别:2. 语法、语义、语用:二、 语言处理程序基础第五章 网络基础知识第六章 多媒体基础知识PC机处理的音频信号,主要是人耳能听到的,频率20 HZ20K HZ。声音的数据传输率(kb/s) = 采样频率(HZ)* 量化位数(b) * 声道数声音信号数据量 = 数据传输率 * 持续时间 / 8MPEG系列标准:Mpeg-1:普通电视视频信号压缩标准;Mpeg-2:高清电视信号压缩标准;Mpeg-4:多媒体应用标准;Mpeg-7:多媒体内容描述接口标准;Mpeg-21:多媒体框架结构标准;软件项目关键路径时间最长的是关键路径;由该路径上节点,可依次倒推出其他节点的最晚完成时间、最晚开始时间。类图:依赖,关联,泛化,实现UML:聚合:表示整体和部分的关系比较弱;代表部分的事物,与代表整体的事物的对象的生存期无关;删除了整体的对象,不一定删除部分的对象。 实线,空心菱形组合:表示整体和部分的关系比较强;整体和部分的对象,生存周期一致;删除了组合的对象,同时也就删除了代表部分的对象; 实线,实心菱形依赖:include 包含关系,箭头指向被包含者 extend 扩展关系,箭头指向主用例第七章 数据库技术基础一、 数据库技术的发展1. 人工管理阶段1) 数据不保存在计算机中;2) 没有专用的软件对数据进行管理;数据与程序不具有独立性;数据的逻辑结构和物理结构没有区别;3) 只有程序的概念,没有文件的概念;4) 数据面对程序,即一组数据对应一个程序;2. 文件管理阶段1) 数据以文件的形式可长期保存在外部存储器上;2) 数据的逻辑结构和物理结构有了简单区别;3) 文件组织多样化;但文件之间相互独立、缺乏联系;4) 数据不再属于某个特定的程序;但程序与数据结构之间的依赖关系并未根本改变;3. 数据库阶段DB能为各种用户共享,具有较小冗余度、数据间联系紧密、较高的数据_独立性_等特点。DB分成物理数据库和_描述_数据库两类,后者由DD系统管理二、 数据模型模型:是现实世界的抽象。数据模型的三要素:数据结构、数据操作、数据的约束条件。数据结构:所研究的对象类型的集合;静态特性的描述;数据操作:对数据库中各种对象实例的允许的操作;动态特性的描述;数据的约束条件:完整性规则的集合,应用数据必须遵循的语义约束条件,以保证数据的正确性。三、 数据模型1. 数据抽象的四种模型:概念模型:表达了数据的整体逻辑结构,是系统用户对整个应用项目涉及的数据的全面描述;表达用户需求观点;独立于硬件和软件;是设计人员与用户之间的交流工具。ER模型来表达。逻辑模型:是设计人员对整个应用项目数据库的全面描述;从数据库实现的观点出发;独立于硬件,但依赖于软件(DBMS);层次模型(树形),通过指针实现,查询效率高,但数据结构复杂和编程复杂;网状模型:有向图,通过指针实现,查询效率高,但数据结构复杂和编程复杂;关系模型:主要特征是用二维表格表达实体集。外部模型:是逻辑模型的一个逻辑子集;独立于硬件,但依赖于软件;表达用户使用数据库的观点内部模型:DB物理结构模型2. 三层模式和两级映像外模式:是用户和数据库系统的接口,是用户用到的那部分数据的描述;由若干外部记录类型组成。概念模式:是数据库中全部数据的整体逻辑结构的描述,由若干逻辑记录类型、记录间联系、数据完整性、安全性等要求。内模式:数据库物理存储方面的描述,定义了所有内部记录类型、索引、文件的组织方式,以及数据控制方面的细节。外模式/概念模式映像:存在于外模式和概念模式之间,用于定义外模式和概念模式之间的对应。一般存在在外模式中描述。内模式/概念模式映像:存在于内模式和概念模式之间,用于定义内模式和概念模式之间的对应。一般存在在内模式中描述。数据独立性:物理数据独立性:如果对内模式修改,只要对概念模式/内模式映像做相应修改,使概念模式尽可能保持不变,对外模式影响更小。逻辑数据独立性:如果对概念模式修改,只要对外模式/概念模式映像做相应修改,使外模式尽可能保持不变。四、 ER模型基本元素:实体:现实世界中可以区别于其他对象的事物。属性:实体某方面的特性。联系:。属性分类:按属性类别:简单属性(如性别,年龄)、复合属性(如地址)按取值特点:单值属性(如年龄),多值属性(如性别,学历);多值属性使用双线椭圆表示。存储属性(如基本工资,奖金),派生属性(如实发工资);派生属性使用虚线椭圆表示。弱实体与强实体:一个实体的存在必须已另一个实体的存在为前提,即具有很强的依赖关系,前者是弱实体,后者是强实体。弱实体用双线矩形框表示,与弱实体的联系,用双线菱形框表示;弱实体参与联系是使“完全参与”,所以双线矩形框与双线菱形框之间是双线边。弱实体与强实体的联系只能是1:1或1:N;子类实体与超类实体:从子类到超类的抽象过程叫普遍化;从超类到子类的具体化过程叫特殊化。子类和超类之间具有继承特点;这种继承是通过子类和超类有相同的实体标示符实现的。ER图题要点:1) 先确定有哪些实体,再确定实体之间是否有联系,最后再确定联系的类型;五、 DBMS功能:1. 数据定义2. 数据库操作3. 数据库运行管理4. 数据的组织、存储和管理5. 数据库的建立和维护6. 其他功能特征:1. 数据结构化且统一管理2. 有较高的数据独立性3. 数据控制功能安全性保护完整性并发控制故障恢复六、 三级模式和二级映象七、 客户端、服务器数据库体系结构特定:客户端和服务器端之间职责明确,客户端负责数据的表示,服务器端负责数据库服务。数据库服务器分为:事务服务器和数据服务器。事务服务器,也叫查询服务器,它提供一个接口,使得客户可以发出执行一个动作的请求,服务器响应请求后将执行结果返回给客户。数据服务器:八、 并行数据库系统分为共享内存式多处理器,无共享式并行体系结构。共享内存式多处理器:一台计算机上同时有多个活动的CPU,他们共享单个内存和一个公共磁盘接口。无共享式并行体系结构:一台计算机上同时有多个活动的CPU,但它们都有自己单独的内存和磁盘。各个CPU之间是高速网络。九、 分布式数据库系统有两中,一是物理上分布,逻辑上集中;一是物理和逻辑上都分布。十、 Web数据库十一、 事务(Transaction)管理:DBS运行的最小逻辑工作单位是事务。事务:是构成单一逻辑工作单元的操作集合,要么完整执行,要么完全不执行。事务的ACID性质:原子性Atomicity:一个事务对数据库的操作,是一个不可分割的工作单元,要么完整执行,要么完全不执行。(事务管理子系统)一致性Consistency:一个事务独立执行的结果,应保持数据库的一致性,即数据不会因事务的执行而遭到破坏。(完整性子系统)隔离性Isolation:在多个事务并发执行时,系统应保证与这些事务先后单独执行时的结果一样。(并发控制子系统)持久性Durability:一个事务一旦完成全部操作后,它对数据库的所有更新应永久的反映在数据库中,不会丢失。(恢复管理子系统)检查点技术:检查点时刻才真正把内存缓冲区的DB修改,写入磁盘。-检查点t1-故障点-检查点t2-T1前完成的事务,不必恢复;故障点前已完成的事务,重做REDO。故障点前未完成的事务,撤销UNDO。事务的执行次序称为调度;如果多个事务依次执行,称为事务的串行调度;如果利用分时方法,同时处理多个事务,称为事务的并发调度;事务的隔离级别:由高到低SERIALIZABLE:可串行化:允许事务与其他事务并发执行,但并发调度是可串行化。程序开始时默认这个级别。REPEATABLE READ:可重复读:只允许事务读已提交的数据,并且在两次读同一数据时不允许其他事务修改此数据。READ COMMITTED:读提交数据:允许事务读已提交的数据,但不要求“可重复读”。READ UNCOMMITTED:可以读未提交数据:允许事务读已提交的数据或未提交的事务。SET TRANSACTION ISOLATION LEVEL SERIALIZABLE;十二、 故障恢复数据库的四种故障:事务内部故障、系统故障、介质故障、病毒。基本原理是:建立数据冗余,即重复存储。恢复方法:1. 静态转储和动态转储:静态是指转储期间不允许对数据库进行存取、修改操作;动态是允许。2. 海量转储和增量转储3. 日志文件恢复步骤:反向扫描日志文件,查找更新操作;对更新操作进行逆操作;继续步骤一直到事务的开始标记。十三、 并发控制1. 并发:多个事务同一时间对同一数据进行操作。丢失更新问题:读脏数据问题:所谓脏数据是指未提交(no commit)的随后被撤销(rollback)的数据。不可重复读问题:事务T1需要两次读取同一数据A,但是在两次读操作的间隔中,另一个事务T2改变了A的值。2. 封锁技术:锁的作用是使并发事务对数据库中数据项的访问能够同步。n封锁的粒度:封锁对象的大小;封锁粒度越大,并发度越小,系统的开销越小;封锁粒度越小,并发度越高,系统开销越大。排他锁,X锁:如果事务T对某个数据R实现了排他锁,在事务T对数据R解锁之前,其他事务不能再对数据R加任何类型的锁。共享锁(又称读锁,S锁):事务对数据加共享锁后,允许其他事务对该数据加共享锁,但在该共享锁解锁前,不允许任何事务对该数据加排他锁。3. 三级封锁协议1) 一级封锁协议:事务在修改数据R之前,必须对其加X锁,直到事务结束。可以解决丢失更新问题;2) 二级封锁协议:在一级的基础上,事务T在读R之前必须先对其加S锁,读完后释放S锁。可解决读脏数据问题。但不能保证可重复读问题。3) 三级封锁协议:在一级的基础上,事务T在读R之前必须先对其加S锁,直到事务结束时释放S锁。三级封锁协议能够解决丢失更新、读脏数据、不可重复读的问题。4. 死锁与活锁死锁:指两个以上事务分别请求对方已经封锁的数据,导致长期等待而无法继续运行下去的现象。5. 事务的嵌套事务是不能嵌套的,因为违背了事务的原子性。十四、 安全性和授权十五、 数据仓库数据仓库的基本特性:1) 面向主题主题就是一些数据集合,这些数据集合对分析对象进行了比较完整的、一致的数据描述,这种数据描述不仅涉及数据本身,还涉及数据之间的联系。2) 数据是集成的集成性是指根据决策分析的要求,将分散于各处的原数据进行抽取、筛选、清理和综合等集成工作。3) 数据是相对稳定的主要是需要查询,很少更新。4) 数据是反映历史的数据仓库的体系结构:分三层1) 底层为数据仓库服务器2) 中间层是OLAP(联机分析技术)服务器3) 顶层为前端工具数据仓库的模型分类:1) 企业仓库:企业各个主体的所有信息;2) 数据集市:对特定用户有用的、企业范围数据的一个子集;3) 虚拟仓库十六、 数据挖掘数据挖掘:从海量数据库中挖掘信息的技术;应用步骤:1) 确定挖掘对象2) 准备数据3) 建立模型4) 数据挖掘5) 结果分析6) 知识应用第八章 关系数据库一、 关系数据库的基本概念1. 笛卡尔积2. 关系模型元数=属性的个数=4; 基数=元组的个数=6;候选码:能够唯一标示一个元组的属性;主码:若关系有一个或多个候选码,选定其中一个作为主码;外码:如果一个关系的属性不是本关系的主码,而是其他关系的主码,对本关系而言,该属性是外码;全码:所有属性都是候选码,则称为全码;关系的三种类型:1) 基本表2) 查询表3) 视图3. 完整性约束1) 实体完整性:主属性不能为空;2) 参照完整性:外键约束,空值或某个关系的主码;3) 用户自定义完整性二、 关系运算表达式中:表示or表达式中:表示and并(union):属于R或属于S的集合,记为RS差:属于R但不属于S,记为R-S。这与交是不同的。笛卡尔积:即乘法,记为R*S。如果R和S中有相同的列名,在R*S中列名不能合并,使用 关系名.列名 表示。乘法的结果是,列数是R列数+S列数,行数是R行数*S行数。投影:对关系进行垂直分割,消去某些列,并重新安排列的顺序3,1(R)表示:其结果关系中第一列是R的第3列,第二列是R的第1列。选择:根据某些条件对关系做水平分割。B4(R):表示从R中过滤出满足B4的元组。交:属于R同时也属于S,记为RS。RS = R-(R-S)连接:先做R*S,再做选择操作。等值连接:连接运算符是“=”的连接运算称为等值连接。它是从关系R与S的广义笛卡尔积中选取A,B属性值相等的那些元组自然连接是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且在结果中把重复的属性列去掉 自然连接:计算过程:公共属性A1、A2Ak;挑选R*S中R.A1 = S.A1、R.Ak = S.Ak的元组;去掉S.A1S.Ak。如果没有公共属性,就只计算笛卡尔积。除:参考数据库系统工程师教程的432页中的例8.5.。算法:1) 在关系R中,列出AB属性所对应的CD属性的象集2) 列出的象集中,包含关系S的,即为结果。外连接:左外连接、右外连接、全外连接外部并:如果R,S的关系模式不同时,构成的新关系的属性有R和S的所有属性组成,元组由R或S的元组构成,元组在新增加的属性上是null。数据库系统工程师教程的432页中的例8.6要动手做一次。三、 元组演算四、 查询优化五、第九章 SQL语言比较重要的关键词:Cluster 创建的是聚簇索引Escape 条件语句中的转义符Union 集合操作中的并Intersect集合操作中的交Except 集合操作中的差Assertion 断言Exists 存在Sql语句支持数据库的三级模式:视图对应外模式,基本表对应模式,存储文件对应内模式。1. SQL语言是介于关系代数和_元组演算_之间的一种语言。2. 表的三种类型:基本表是实际存储在数据库中的表;视图是由基本表和视图构成的表的定义;导出表是执行了查询是产生的表。3. 核心SQL的四个组成部分:4. DDL:数据定义语言,定义sql模式,基本表,视图,索引等结构;5. DML:数据操作语言,分为查询、插入、删除、修改操作。6. 嵌入式SQL7. DCL:数据控制语言,包括授权、完整性规则、事务控制等。8.9. 创建域:Create Domain 域名 varchar(8) 域可作为字段类型来定义属性的类型。10. 创建表:11. Create Table table_name (12. Field_name varchar(8),13. 完整性约束14. )完整性约束:15. 主键Primary Key(Field_name)16. 外键Foreign Key Field_name References PK_table_name(PK_Field_name)17. 检查Check (Field_name 12) : 基于元组的检查子句断言: Create Assertion Check ()18. Alter table 表名 add 列名 字段类型;19. Alter table 表名 Drop 列名 CasCade | Restrict;20. CasCade:删除时,所有引用该列的视图和约束也要自动删除; Restrict:没有引用该属性时,才能删除,否则拒绝操作;21. Alter table 表名 Modify列名 字段类型;22. Drop table表名 CasCade | Restrict;23. Create View 视图名 as selelct 24. Create Unique Index 索引名 On 表名 (列名序列);25. 列名序列中,列名后可加Asc、Desc表示排序。26. Drop Index索引名;27.一、 创建表Create table 表名(列名 数据类型 ,表级完整性约束条件)约束条件:Null, UniquePrimary key (列名)Foreign key (列名) References 表名(列名)二、 修改和删除表Alert Table 表名 Add 列名 数据类型 ;Alert Table 表名 Modify 列名 数据类型 ;Alert Table 表名 Drop 列名;三、 索引Create Unique Cluster Index 索引表 On 表名(列名 次序, 列名 次序); Unique:每一个索引值对应唯一的数据记录;Cluster:建立的事聚簇索引次序:Asc,Dsc;Select语句查询结果可以进行集合操作:Union并Intersect交Except差ESCAPE 转义符:Like ab%cd% ESCAPE : 匹配以ab%cd开头的字符串NOT Exists :集合是否为空;NOT UNIQUE :集合是否有重复元组;视图的更新:1) 从多个基本表通过连接操作导出的视图不能更新;2) 对使用了分组、集操作的视图,不能更新;3) 从单个基本表中使用选择、映射操作导出的,允许更新;Create View 视图名 as selelct WITH CHECK OPTION如果视图是从单个基本表中使用选择、映射操作导出的,并包含了表的主键,视图定义时加上“With Check Option”短语,该视图称为“行列子集视图”;该视图是可以插入、删除、更新的。四、 授权数据库由低到高安全性级别依次是环境级、职员级、OS级、网络级、_DBS_级。是指保护数据库,防止不合法的使用,以免数据的泄密、更改和破坏。安全性是保护数据以防止非法用户故意造成破坏;完整性是保护数据以防止合法用户无意中造成的破坏。安全性机制:视图:数据安全性,逻辑数据独立性和操作简便性。授权:SQL定义了6类权限:select,Insert,update,delete,alter,All Privileges(5种权限的总和)授权:Grant on to WITH GRANT OPTION数据库元素可以使关系、视图、域;WITH GRANT OPTION表示获得授权的用户能够传递授权,把获得的授权给其他用户。用户名可以是Public代替,表示可将权限赋予全体用户。例:Grant select,insert on Table SC to wangwenjun WITH GRANT OPTION;Grant Insert(fName) on Table SC to wangwenjun WITH GRANT OPTION;回收:Revoke on From 角色:Grant to ;审计:五、 触发器Create trigger 触发器名 on 表名 Referencing old row as orow, new row as nrow For each row When 触发条件BeignEnd;六、 嵌入式SQL1. 主变量:主语言通过主变量向SQL提供参数;2. SQLCA:向主语言传递SQL执行的状态信息,使主语言能够控制程序流程;3. 游标:对于返回多条记录的SQL,游标能使主语言逐条处理;SQL游标的使用作用:SQL语句处理的是集合记录,而主语言处理的是单条记录,因此需要用cursor机制,把集合转换为单记录处理方式。步骤:定义游标 EXEC SQL DECLARE CURSOR FOREND_EXEC打开游标EXEC SQL OPEN END_EXEC推进游标EXEC SQL FETCH FROM INTO END_EXEC关闭游标EXEC SQL CLOSE END_EXEC七、 存储过程:使用sql语句和流程控制语句编写的模块,编译后存储在数据库中。优点:提高运行速度:相比交互执行的sql语句是解释执行,其速度较慢;增强了sql功能和灵活性:流程控制语句可以完成复杂的逻辑判断和复杂的运算;降低网络的通信量:;减轻程序编写的工作量;间接实现安全控制功能;SQL/PSM:SQL标准的一部分,规定了如何编写持久层存储模块、流程控制逻辑。If then Elseif ElseEnd if;While doEnd while;RepeatUntil End repeat;For as cursor for doEnd for;八、 SQL-99第十章 系统开发和运行一、 软件工程的6个阶段1. 项目计划2. 需求分析3. 软件设计4. 编码5. 测试6. 运行和维护二、 软件开发项目管理知识1. 成本估算2. 风险分析: 风险识别、风险预测、风险评估、风险控制。3. 进度管理1) Gant图:横纵坐标能清晰的描述每个任务何时开始、结束以及每个任务之间的并行性;但不能清晰反映任务之间的依赖关系,难以确定项目的关键阶段。2) Pert图:有向图松弛时间关键路径最早时刻:在此时刻之前,从该事件出发的任务不可能开始;最迟时刻:从该事件出发的任务必须在此时刻之前开始,否则整个工程不能如期完成。通常,松弛时间为0的路径是关键路径;4. 人员管理软件能力成熟度模型:1) 初始级: 杂乱无章,没有明确定义的步骤;2) 可重复级:建立了基本的项目管理过程;3) 已定义级:软件过程已标准化、文档化,并综合为标准软件过程;4) 已管理级:制定了软件过程和产品质量的详细度量标准;5) 优化级:加强了定量分析,通过反馈不断改进;三、 系统分析基础知识系统分析方法:(一) 结构化分析法数据流图数据库系统工程师教程 528 页软件设计师教程 ? 页(二) 面向对象分析方法UML:类图、对象图、用例图等四、 系统设计概要设计:将系统细分为模块,决定每个模块的功能、模块的调用关系、模块的接口及界面。详细设计:代码设计、输入输出设计、处理过程设计、数据存储设计、用户界面设计、安全控制设计。一个模块应具备4个要素:1) 输入和输出2) 处理功能3) 内部数据4) 程序代码五、 系统实施六、 系统运行和维护第十一章 数据库设计一、 系统需求分析需求分析的方法和步骤:数据方面的产出物是数据字典和数据流图。1. 数据字典:数据项、数据结构、数据流、数据存储、处理过程。2. 数据流图:参看第10章。二、 概念结构设计从概念设计,到逻辑设计和物理设计,这一过程就是数据建模。1. 概念结构设计策略:有4种常用策略:1) 由顶向下:先定义全局概念结构框架 然后逐步细化。2) 由底向上:先定义局部概念结构,集成后得到全局概念结构。3) 逐步扩张:首先确定核心业务的概念结构,以此为中心向外扩张,最终得到全局概念结构。4) 混合策略:前2种策略的结合使用。2. 概念结构设计方法:ER图:由局部ER图,合并后形成全局ER图三、 逻辑结构设计ER图实体向数据库关系模型的转换:实体类型的转换:联系类型的转换:A二元联系类型1:1 两个实体类型转换为2个关系模式,在其中一个关系模式中增加另一个关系模式的键(作为外键)和联系类型的属性。1:N 在N端关系模式中增加另一个关系模式的键(作为外键)和联系类型的属性。M:N 两端实体类型转换为2个关系模式,将联系类型转换为关系模式,其属性是两端实体类型的键(作为外键)和联系类型的属性,键是两端实体键的组合。B一元联系类型与二元联系类型类似。C三元联系类型1:1:1 3个实体类型转换为3个关系模式,在其中一个关系模式中增加另2个关系模式的键(作为外键)和联系类型的属性。1:1:N 在N端关系模式中增加另2个关系模式的键(作为外键)和联系类型的属性。1:M:N 将联系类型也转换为关系模式,其属性是M和N实体类型的键(作为外键)和联系类型的属性,键是M和N实体键的组合。M:N:P 将联系类型转换为关系模式,其属性是三个实体类型的键(作为外键)和联系类型的属性,键是3个实体键的组合。四、 数据库物理设计1. 确定数据分布2. 确定存储结构3. 确定访问方式五、 应用程序设计六、 数据库系统的实现七、 系统实施与维护八、 数据库的保护1. 事务:四个特性,ACID;2. 数据库的备份和恢复恢复:建立冗余数据,常用技术是数据转储、日志文件。恢复策略:撤销事务:反向扫描未完成的事务日志,执行逆操作,直到事务的开始标记处。重做事务:从事务的开始标记起,正向扫描日志,重新执行日志文件的所有操作,直到事务的结束标记。3. 数据库的安全性权限视图数据加密4. 数据库的完整性5. 并发控制见第七章第十二章 数据库运行和管理一、 运行策略:1. 正常运行策略对物理环境的要求对人员的要求数据库的安全策略备份和恢复的策略2. 非正常运行策略突发事件的应对策略高负载状态的应对策略二、 数据库系统的监控监控对象是系统性能、系统故障和系统安全。分别对应性能监控、故障监控和安全监控。性能监控:资源占用率、事务的响应时间、事务量、死锁、用户量。故障监控:对三种故障(事务故障、系统故障、介质故障)安全监控:入侵、用户访问监控、病毒监控。系统日志是监控的主要依据。三、 运行和维护1. 业务持续性:指一个组织的主要业务流程、服务流程能够得到连续的处理。2.四、 数据库的维护五、 数据库系统的审计:审计室一种DBMS工具,它记录了数据库资源和权限的使用情况。审计是被动的,它只能跟踪数据库的修改而不能防止;审计功能的开启会影响系统性能。六、 数据字典的管理数据字典:是存储在数据库中所有对象的知识库;元数据:通常把数据字典中的数据称为元数据;数据字典是只读的。七、 数据库的存储管理:下列手段可有效提高系统性能1. 索引文件和数据文件分开存储,事务日志文件存储在高速设备上。2. 适时修改数据文件和索引文件的页面大小3. 定期对数据进行排序4. 增加必要的索引项。八、 数据库安全性管理从以下方面实现:1. 建立网络级安全2. 操作系统的安全3. DBMS级安全,对访问的用户进行验证4. 角色和用户的授权管理5. 视图和存储过程加强安全性6. 审计功能,发现安全漏洞,为追责提供依据。九、 数据库性能调整1. SQL:优化策略:尽可能减少多表查询或建立物化视图;只检索出需要的列;用带In的子句等价替代or子句;经常commit,已释放锁。2. 表设计的评价符合3NF或BCNF;如果频繁的访问的多个表的连接操作,则考虑合并表;如果频繁的访问表中某一部分字段,则考虑分解表;对于很少更新的表,引入物化视图;3. 索引的改进如果查询是瓶颈,则在查询条件的属性上适当增加索引;如果更新是瓶颈,因每次更新都会重建索引,引起效率降低,则考虑删除索引;选择适当的索引类型;将有利于大多数查询和更新的索引,设为聚簇索引;4. 设备增强引入高速的计算机;增加内存;使用高速网络设备;使用高速存储设备;第十三章 网络与数据库一、 分布式数据库(一) 概念:完全分布式数据库系统:1) 分布性:即数据存储在不同的多个节点上;2) 逻辑相关性:即数据库系统内的数据在逻辑上存在关联关系;3) 场地透明性:即使用分布式数据库中数据时不需指明数据所在的位置;4) 场地自治性:即每一个单独的节点都能够执行局部的应用请求;(二) 特点:分散与集中统一1. 数据的集中控制性:继承自传统数据库的特点;数据分层控制结构:全局数据库管理员负责管理所有数据库,局部管理员负责各自节点的数据库;2. 数据独立性应用程序面对的虽然是分散的数据,但就像集中式数据库一样,不必考虑数据的分布。3. 数据冗余的可控性4. 场地(节点)的自治性5. 存取的有效性在分布式中,存取或查询的优化可分为全局优化和局部优化,全局优化主要决定在多个副本中选取合适的副本,使场地间的数据传输最小化,从而减少系统通讯开销;局部优化与传统的集中式数据库的优化一致。(三) 分布式数据库的体系结构:1. 分布式数据库的模式结构:4层模式1) 全局外层全局视图由多个用户视图组成,用户视图是针对分布式数据库特定的全局用户的,是对分布式数据库的最高层的抽象;分布式数据库中视图与集中式数据库的不同之处是:它不是从一个具体的场地的局部数据库中抽取,而是从一个虚拟的局部数据库的逻辑集合中抽取。2) 全局概念层全局概念层是对分布式数据库的整体抽象,与传统数据库的概念模型一样,是对数据库的整体描述。下分三种模式描述信息:A 全局概念模式:描述分布式数据库全局数据的逻辑结构;是分布式数据库的全局概念视图。B 分片模式:描述全局数据逻辑划分的视图;每一个划分就是一个分片。C 分配模式:从全局概念模式、分片模式到分配模式,之间存在映射关系;全局概念模式与分片模式的映射是一对多;分片模式与分配模式的映射是一对一,或一对多,这是由数据分布的冗余策略决定的;一对一:非冗余,一个分片只有一个副本;一对多:冗余,一个分片有多个副本存储在不同的场地;3) 局部概念层由局部概念模式描述,是全局概念模式的子集。4) 局部内层是分布式数据库中关于物理数据库的描述,相当于集中数据库中的内模式。四层结构和其之间的映射关系,体现了分布式数据库的特点:1) 全局数据库和局部数据库分离;2) 数据独立性3) 透明性4) 数据冗余控制2. 数据分布指在分布式环境中,通过合理的分布数据,提高数据操作的并行度,以达到执行效率最佳的目标。数据的划分、数据的放置是数据分布问题的两个方面。解决策略:1) 集中式2) 分割式3) 复制式4) 混合式3. 数据分片(数据分割)全局数据库由各个局部数据逻辑组合而成,各个局部数据库则是全局数据库的逻辑分割。4. 分布透明性5. 分布式数据库管理系统(四) 分布式查询和优化在集中式数据库的优化策略上,考虑两个方面:网络传输速度和质量;数据并行传输和处理;(五) 分布事务管理分布式事务的执行也是分布式的。分布式事务会转变为若干个与相应节点有关的操作序列,这些操作序列也称为子事务,所以一个分布式事务是由若干个节点上的子事务组合的。分布式与集中式一样,也遵守ACID四个特性,此外有下列特点:1. 执行特性:分布式事务需要创建一个控制进程,以协调子事务的操作;2. 操作特性:必须加入大量通讯原语,协调数据传送;3. 控制报文:子事务的协调需要使用。(六) 分布式数据库故障(七) 分布式数据库的恢复原则(八) 二阶段提交协议简称2PC,把本地的原子性提交行为的效果扩展到分布式事务。协调者:具有提交和撤销事务的决定权;参与者:2PC将事务提交分为2个阶段:1. 表决阶段:目的是形成一个共同决定协调者向所有参与者发“准备提交”, 参与者根据自身情况回答“建议提交”或“建议撤销”;如果参与者要撤销,则可以单方面撤销事务;只要有一个参与者要撤销,协调者就必须从整体上撤销整个分布式事务,向所有参与者发送“全局撤销”,否则向所有参与者发送“全局提交”。2. 执行阶段:目的是实现协调者的决定根据协调者的指令,参与者或提交或撤销事务,并向协调者发送确认信息。规则:只要有一个参与者建议撤销,协调者就必须从整体上撤销整个分布式事务;只有所有参与者都同意提交事务,协调者才能做出全局提交决定。(九) 三阶段提交协议:降低事务阻塞的可能性3PC分三个阶段:1. 协调者向所有参与者发“准备提交”报文,参与者根据自身情况进行投票,当所有参与者均回答“建议提交”后,进入第二阶段;2. 协调者向所有参与者发“全局预提交”,参与者收到后,如果准备好提交则回答“准备就绪”,否则进行撤销处理;3. 协调者收到所有参与者的“准备就绪”的回答后,向所有参与者发“全局提交”,此时所有参与者进行提交。二、 Web与数据库三、 XML与数据库第十四章 数据库发展技术和趋势一、 面向对象数据库二、 ERP和数据库三、 决策支持系统的建立需要通读一遍。第十五章 知识产权基础知识一、 著作权1. 职务开发职务期间的属于单位;非职务期间的,如果不是执行本职工作的结果、与工作内容无直接联系、未利用单位物质技术条件,则属于个人。2. 合作开发由合同约定;没有约定,则对各自部分单独享有著作权;3. 委托开发有合同约定;没有约定的,归受委托者。著作权产生的时间,自作品完成创作之日起,保护期50年,期满后除身份权外,其它权利终止。二、 商业秘密权三、 专利权第十六章 标准化基础知识下午题:ER图关系模式数据流图:1) 分层数据库流的平衡原则,即父图和子图的输入输出数据流要一致;2) 每个加工至少要有一个输入和输出流,输出数据流应该有其对应的输入流;3)范式、函数依赖参考“数据库系统工程师教程”452页1NF:指每一列都是不可分割的基本数据项。存在的问题:数据冗余;数据修改的不一致性;插入异常;删除异常;2NF:关系模式符合1NF,且每一个非主属性完全依赖于主属性,则是2NF。实体的每个非主属性完全依赖于主关键字;完全依赖是指不能存在仅依赖主关键字一部分的属性,如果存在,那么这个属性和主关键字的这部分应该分离出来组成一个新的实体,新实体和原实体之间是一对多的关系;如:关系模式R(学号,课程号,成绩,任课教师号,教师职称),主键:学号,课程号任课教师号和教师职称属性依赖于课程号,课程号是主关键字的一部分,因此,FD: 课程号-任课教师号,教师职称 是局部依赖,不是完全依赖。不符合2NF。R2(学号,课程号,成绩),R1(课程号,任课教师号,教师职称)符合2NF。3NF:实体的每个非主属性都不传递对主键的依赖;不满足3NF的关系模式中,必定存在非主属性对主键的传递依赖;要求数据库表中不包含已在其他表中包含的非主关键字信息。如:上例中R2是2NF也是3NF;R1则不一定,如果课程号-任课教师号、任课教师号-教师职称,那么课程号-教师职称就是一个传递依赖BCNF:每个属性都不传递对主键的依赖;4NF:限制关系模式的属性间有 非平凡 且 非函数依赖 的 多值依赖;多值依赖:只要两个独立的1:N联系出现在一个关系中,就可能出现多值依赖。1. 高级数据库阶段2. 数据描述概念设计:根据用户的需求设计数据库的概念结构,它以规范的形式,表达了对用户需求所涉及事物的理解。实体:客观存在,可以相互区别的事物;实体集:同类实体的集合;属性:实体的特性;实体标示符:唯一标示实体的属性或属性集;关键码;键。逻辑设计:根据概念设计的结果设计数据库的逻辑结构,即表达方式和实现方式。字段,记录,文件,关键码。联系是实体之间的相互关系。3. 数据库系统生存期:分为8个阶段规划需求分析概念设计:分三步:进行数据抽象,设计局部概念模型;将局部概念模型综合为全局概念模型;评审。逻辑设计:分五步:将概念模型转换为逻辑模型;设计外模型(设计应用程序与数据库的接口);评价和修正模型;物理设计:实现运行和维护4. 在DBS 中数据字典(DD)中的作用?DD 是存储三级结构的描述(即元数据)。DBMS 的所有工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商砼浇筑管理办法
- 嘉宾接待管理办法
- 回应网游管理办法
- 团委量化管理办法
- 园区巡检管理办法
- 固体试剂管理办法
- 国企承包管理办法
- 国企高管管理办法
- 国外彩票管理办法
- 国标电气管理办法
- GB/T 41021-2021法庭科学DNA鉴定文书内容及格式
- 危险化学品重大危险源企业安全专项检查细则
- 健康教育专兼职名单表
- DB23T 2583-2020 固体矿产勘查放射性检查技术要求
- Q∕SY 17001-2016 泡沫排水采气用消泡剂技术规范
- 上海市智慧城市发展水平评估报告
- 空调设备维护保养制度(3篇)
- 广东江门市生育保险待遇申请表
- 检验科生物安全风险评估报告
- SYNTAX评分计算方法(1)
- 2020版北京刑事诉讼格式文书七律师会见犯罪嫌疑人被告人专用介绍信
评论
0/150
提交评论