




已阅读5页,还剩74页未读, 继续免费阅读
(计算数学专业论文)卷烟辅助配方系统数据库设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 卷烟辅助配方系统数据库设计 作者简介:薛东剑,男,1 9 7 7 年1 0 月出生,2 0 0 4 年9 月帅从于成都理t 大学王 玉兰副教授,j 。2 0 0 7 年6 月状硕士学位。 摘要 数据库技术从诞生到现在,不到半个世纪的时间里形成了坚实的理论基础、 成熟的商业产品和广泛的应用领域,它的发展已经成为先进信息技术的重要组成 部分,是现代计算机信息系统和计算机应用系统的基础和核心。数据库设计的好 坏卣接关系剑系统的运行性能。 本文作为“卷烟辅助配方系统”项目中的数据库没计部分,是在深入学习关 系数据库设计理论之后,通过分析、比较,找出各自设计的特,_ 及优缺点,在川 渝中烟工业公司的原有数据库分析的基础上完成了卷烟辅助配方数据库系统的 设计。此数据库的设计遵循关系数据库设计规范,本着从概念结构设计到逻辑结 构设计再到物理结构设计的步骤来进行的,同时通过规范化不仅使数据库结构清 晰、简洁,而且减少了异常的发生,提高了系统的性能。在强调数据完整性、数 据一致性的前提下着重历史数据的使用,而且为了减少网络数据流量、提高系统 的安全性,在本数据库的设计中还广泛的使用了视图与存储过程。 此数据库的建立将很大程度上消除r 在手t 文件系统巾存在的数据不一致 性,提高了技术人员的效率,并解决了对卷烟基础信息的维护和历史配方信息的 保存,为技术人员配方提供了依据,同时对配方产品设计的数学建模提供了数据 支持。此系统设训实施之后,除满足现阶段卷烟产品设计人员的要求,还将为数 字化产品辅助设计的下一步研究、开发等工作提供了基础资料。 关键词:火系数据库设计、e - r 模型、关系数据库规范化、卷烟辅助配方 成都理i 人学硕士学位沧文 t h e d e s i g no fc i g a r e t t ea s s i s t a n c ef o r m u l a t o r s s y s t e m a b s t r a c t d a t a b a s et e c h n o l o g yh a sf o r m e ds o l i dr a t i o n a l e 、m a t u r ec o m m e r c i a lp r o d u c ta n d w i d e s p r e a da p p l i c a t i o nd o m a i ni nh a l fc e n t u r yt i m es i n c ei tw a sb o r n ,a t t r a c t e dm o r e a n dm o r er e s e a r c h e r sj o i n i th a s a l r e a d yb e c o m et h ei m p o r t a n t c o n s t i t u e n to f a d v a n c e di n f o r m a t i o nt e c h n o l o g y , a n di tw a st h ef o u n d a t i o na n dt h ec o r eo fm o d e m c o m p u t e ri n f o r m a t i o ns y s t e ma n dt h ec o m p u t e ra p p l i c a t i o ns y s t e m t h ed e s i g no f d a t a b a s ei sd i r e c t l yr e l a t e dt ot h ef u n c t i o no fs y s t e m a sap a r to fd a t a b a s ed e s i g ni n ”t h ec i g a r e t t ea s s i s t a n c ef o r m u l a t o r s s y s t e m p r o j e c t ”,t h i sa r t i c l ea n a l y z e da n df o u n do u tt h ea d v a n t a g ea n dd i s a d v a n t a g eo fs y s t e m , a n di ta l s oc o m p a r e dt h ec h a r a c t e r i s t i ca f t e rr e s e a r c h i n gt h et h e o r yo fr e l a t i o n a l d a t a b a s ed e s i g n i n gs y s t e m o nt h eb a s i so fo l dd a t a b a s e ,an e wo n ei sb u i l tu p + t h e d e s i g no ft h i sd a t a b a s et h a tb e g i n st on o r m a l i z a t i o nf r o ml o wt oh i g hc a nm a k et h e s t r u c t u r em o r ec l e a ra n ds i m p l e ,a n di ta l s or e d u c et h ea b n o r m i t ya n di m p r o v et h e c a p a b i l i t yo fs y s t e m t h i sd a t a b a s ee m p h a s i z e dt h eu s eo fh i s t o r yd a t ao nt h eb a s i so f t h ed a t ai n t e g r i t ya n dd a t ac o n s i s t e n c e ,w h e ni td e d u c e dt h en e t w o r kt r a f f i c t h eu s e o fu s e rv i e ws i m p l i f i e dt h eu s e r sm a n i p u l a t i o na n ds e c u r e dt h ed a t a a tt h es a m et i m e , t h ed e s i g np r o v i d e dl o g i c a li n d e p e n d e c ef o rt h er e c o n s t r u c t i o no fd a t a b a s e t h eg o a lo ft h i sd a t a b a s el i e si nt h es o l u t i o nt ot h ec i g a r e t t eh i s t o r yf o r m u l a i n f o r m a t i o np r e s e r v a t i o n ,p r o v i d e st h eb a s i sf o rt e c h n i c a lp e r s o n n e l l sp r e s e n tf o r m u l a , a tt h es a m et i m ep r o v i d e st h ed a t as u p p o r tt ot h ef o r m u l ap r o d u c td e s i g nm a t h e m a t i c s m o d e l t h ed a t a b a s ee s t a b l i s h m e n tg r e a t l yd e g r e ee l i m i n a t e dt h ed a t an o n - u n i f o r m i t y w h i c he x i s t si nt h em a n u a lf i l i n gs y s t e m ,e n h a n c e dt e c h n i c a lp e r s o n n e l se f f i c i e n c y , a f t e rt h i ss y s t e m d e s i g ni m p l e m e n t a t i o n ,n o to n l ys a t i s f i e sc i g a r e t t ep e r s o n n e l s r e q u e s to fp r e s e n ts t a g e ,b u ta l s op r o v i d et h e b a s i cd a t af o rt h ed i g i t i z e dp r o d u c t a s s i s t a n c ed e s i g no f n e x ts t e pr e s e a r c ha n dd e v e l o p m e n t k e y w o r d s :r e l a t i o n a ld a t a b a s ed e s i g n 、e n t i t y r e l a t i o n s h i pm o d e l 、r e l a t i o n a l d a t a b a s en o r m a l i z a t i o n 、c i g a r e t t ea s s i s t a n c ef o r m u l a t o r s i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得盛壑堡工盍堂或其他教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均己在论文中作了明确的说明并表示谢意。 学位论文作者导师签名 学位论文作者签名 易z 爹 钙丽引 一年唾硼 学位论文版权使用授权书 本学位论文作者完全了解盛鳘堡王盘堂有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查| 、蒯和 借阅。本人授权盛堑堡王盍堂可以将学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:钢i 仓1 押一 年f月心日 第1 章引言 第1 章引言 目前,以关系代数理论为支撑的关系数据库被广泛的应用到各行各业,从 小型的m i s 系统到金融系统,大多数据采用关系数据库存储信息,其中的函数 依赖、规范化理论等对关系数据库的静态结构设计起到举足轻重的地位,有助于 进一步消除由于冗余引起的数据异常,同时为增强数据库系统对数据在数据库中 的含义的理解,关系数据库中大部分采用e - r 模型设计。随着大量的论文和研究 报告问世,关系数据库得到了不断完善和发展。 虽然数据库得到了广泛的应用,但由于卷烟配方数字化研究滞后,因此尚 无数据库系统为其支撑。如何利用原有的信息,并在分析原有信息的基础上,通 过合适的数据建模方法,运用函数依赖和规范化理论等创建一个稳定的数据库, 并且此数据库能科学正确地组织、存储数据;并能高效地获取和处理数据,是本 次研究面临的主要挑战。数据库设计是一个发现应用实体、联系和约束,以及将 应用实体联系和约束映射到所给商品数据库的数据结构中去的过程,除此之外数 据库的设计还关系到系统运行性能,必须充分考虑数据的一致性、完整性、安全 性、可伸缩性。在此还就数据库安全问题进行了讨论和研究。此论文的研究成果 除满足现阶段卷烟产品设计人员的要求,而且将为数字化产品辅助设计系统( 第 二期:产品设计) 奠定了基础。 1 1 选题依据 随着信息资源急剧增大,人类越来越离不开信息,但人脑在记忆信息、快 速处理信息方面的能力较弱,而计算机信息存储量大、处理速度高、传输速快、 逻辑推理比较严密,信息加工能力强,这样如何科学正确地组织、存储数据,如 何高效地获取和处理数据,这样由早期的文件管理系统发展起来的关系数据库逐 渐成为一种理想的数据库管理技术。 设计信息系统的目的是实现将数据转换为信息并且管理数据和信息,一个信 息系统的性能取决于三个因素:数据库设计和实现、应用程序设计和实现及管理 过程。在这三个因素中数据库的设计无疑是最重要的。数据库系统的一个主要目 的是为用户提供数据的抽象视图,而隐藏数据存储和操作的细节。与原有的手工 操作相比较,数据库是由逻辑上关联的数据组成的,并且存储在一个数据“仓库 室”里,这样很大程度上消除了在手工文件系统中存在的数据不一致性,使资源 得到共享,提高了技术人员的效率。 在我国加入世界贸易组织和签署烟草控制框架公约后,中国烟草业正面 成都理工大学硕士学位论文 临着愈来愈严峻的竞争压力和社会压力,在新的形势下,为了推进科技进步与创 新,各个卷烟厂都努力向卷烟计算机信息化管理迈进,已基本形成了对历史原料 管理的信息系统和财务统计的财务管理系统,但是配方计算机管理还是刚刚起 步,配方设计工作与计算机辅助如何更有效的结合,仍需要付出更多的努力进行 探索,为了使产品有更快速的市场应变能力和市场竞争力,不断稳步提高产品的 质量,加快产品的开发进度,确保名优畅销产品的长盛不衰,卷烟行业纷纷提出 了“卷烟产品进行数字化设计”的思路,希望利用信息技术辅助进行卷烟产品设 计,通过进一步的数字化产品辅助设计系统的开发和实施,计算机数字化技术将 为企业的现代化建设带来一个新的飞跃。 鉴于目前在配方设计、化学分析等工作一直采用传统的人工录入、文档记录 等操作模式,出错率高、效率低。这样就急需一套数据库管理软件以提高配方自 动化处理程度,通过此配方数据库系统可以实现卷烟中基础数据的管理、配方数 据的管理和产品设计等功能,从而结束以往的手工操作所产生的弊端,提高了工 作效率。此数据库的建成将实现对烟叶、香精香料、卷烟辅助材料、叶组配方设 计、香精香料配方设计、辅料设计等的维护和管理,并实现报表打印、数据导入 和更新,用户权限管理等功能,为配方产品设计建立数学模型提供数据支持。此 辅助配方系统的最终建成将标志着川渝中烟工业公司的工艺技术迈入了计算机 辅助设计和计算机辅助生产的新里程。 1 2 现状分析 1 2 1 数据库技术发展现状 数据库技术从2 0 世纪6 0 年代中期产生到现在仅仅三十多年的历史,就经 历了三代的演变,造就了c w b a c h m a n 、e e c o d d 和j a m e sg r a y 三位图灵奖得 主;并发展成了以数据建模和d b m s 核心技术为主、内容丰富、领域宽广的- f 7 科学;带动了一个巨大的软件d b m s 产品及其相关工具和解决方案。随着商用 数据库产品的巨大成功和数据库技术的广泛应用,刺激了其它领域对数据库技术 需求的迅速增长,新的应用领域不断出现有利地推动了数据库技术的研究与发 展。总之充分地开发与利用大量信息资源,对信息进行识别,存储、处理与传递, 或为决策提供依据,是发展数据库技术的主要目的。 初级的数据库系统主要是以i m s 为代表的层次数据库系统和以d b t g 报告为 标准实现的网状数据库系统。由于层次数据库系统和网状数据库系统的应用涉及 到许多与系统实现有关的低层细节问题,使应用有时变得十分复杂,因而限制了 它的进一步发展。1 9 7 0 年,e e c o d d 提出了关系数据库的概念,奠定了关系数 2 第1 章引言 据库发展的基础。随着关系代数、关系演算理论、依赖理论和规范化理论等的引 入,标志着关系数据库理论的日趋完善和数据库技术走向成熟。随着计算机科学 技术的进一步发展,数据库技术与计算机网络、软件工程、人工智能、面向对象 技术等的相互结合,使数据库技术进入了高级发展阶段。 1 2 2 卷烟辅助配方系统研究现状 近年来各个卷烟厂纷纷开始实施会计电算化计算机网络建设,开始了企业 信息化的征程。目前,中国烟草业已建成并投入运行的信息系统主要包括:国家 局的办公自动化系统、生产管理系统、卷烟交易系统、财务管理系统、科技管理 系统、专卖管理系统、生产计划管理系统、卷烟交易及结算系统、销售管理系统、 e r p 系统、m i s 系统、仓储物流系统、进销存系统等。但在卷烟配方管理过程中, 还没有很好的数据库为其支撑。 目前川渝中烟工业公司已有了对原材料管理的m i s 系统和对财务进行核算 的财务系统。m i s 系统能够实现对烟叶、香精香料的产地、年度、等级等基本属 性及卷烟辅助材料等的入库登记、查询管理等功能,而财务系统可以对烟叶、香 料、辅料的价格等进行管理。但这些信息系统中存储的都是些信息“孤岛”,无 法做到信息资源的共享。同时在配方技术中心中的配方设计、化学分析等工作依 然采用传统的人工录入、文档记录等操作模式,人力耗费相当大,且这些数据不 能共享,需要数据的重复录入;内部管理效率比较低,报表纷繁复杂,去向不一, 报表与报表之间数据重复;自动化程度低,统计完全靠手工,与现代化的生产设 备不相适应;并且绝大数的报表打印等功能亦是由业务人员手工提供的,然后再 输入到计算机制成报表,劳动量重复,信息处理和传递的速度太慢,不能够对计 划的变更做出迅速的反应,对历史配方数据查询极不方便,导致不能够为高层领 导提供决策支持。理论上来说,每个文件记录里的内容在逻辑上应该是相互联系 的,如果数据量相对很小,并在公司也没有那么多的报表需求时,采用手工的基 本能满足要求,但是随着企业规模的扩大,报表的要求也越来越复杂时,采用手 工方式其人力耗费就相当大,并且这些问题还会持续增长,而且文档记录的查询 统计工作极为不便,同时同一数据可能被保存在不同的地方,这样就会造成数据 冗余,当保存在不同地方的同一数据的各个版本相互冲突时,数据不一致就产生 了,准确性也会大大降低。 3 成都理工大学硕士学位论文 1 2 3 研究内容 对于给定的应用环境,构造一个最优的数据库模式,并据此建立一个既能反 映现实世界信息和信息联系,又能被选用的d b m s 所接受的数据库,并且使此数 据库既能有效、安全、完整地存储大宗数据,又能满足多个用户的信息要求和处 理要求,是本文的主要研究内容。 数据库的设计应该以满足用户需求为目标,本文针对当前川渝中烟工业公司 的业务现状,在考虑充分利用原有数据及与原有数据库中的数据保持一致性的基 础之上,通过设计一个数据库以解决对基础数据和配方历史数据的存储。在此数 据库的设计上本着从概念结构设计到逻辑结构设计再到物理设计的步骤来进行, 而通过数据建模来发现实体、联系和约束,并通过e r 图将实体、联系和约束映 射到数据库的结构中,及在数据表的关系处理上如何采用规范化理论来对关系建 模是本文的主要研究重点。同时在此数据库的设计上还充分考虑了用户对系统的 性能要求,如系统支持的终端个数,精度等,同时考虑整个系统的安全性、效率、 一致性、可用性及灵活性,并从长远规划出发,进行整个平台开发和设计。 在此卷烟辅助配方系统的设计上采用两层的c s 结构,此系统主要由3 个 部分组成:应用程序端、中间驱动和数据库端,中间驱动的程序或引擎通常也称 为“中间件”,是应用程序和数据库之间交流的必要通道,在此主要由d e l p h i 提 供给用户使用。前台应用程序由d e l p h i 语言开发,而数据库采用s q l s e r v e r 2 0 0 0 数据库管理系统来实现,此数据库设计部分既是本文的重点,为了减少网络数据 流量及方便从m i s 与k 3 财务系统提取数据,广泛的使用了存储过程,为了满足 用户的查询及报表打印需求,部分采用了视图。 4 第2 章系统设计相关基本理论 第2 章系统设计相关基本理论 数据库设计除了方法与工具之外,需要有理论作为指南,关系数据库是以关 系代数为理论支撑的,它利用关系来描述现实世界,一个关系既可用来描述一个 实体及其属性,又可以用来描述实体间的联系。关系模式是用来定义关系的。一 个关系数据库包含一组关系,定义这些关系的关系模式的全体就构成了该数据库 的模式。而关系数据库中的规范化理论,是目前很活跃的一个研究领域。关系数 据库的规范化所研究的是关系模式中各属性之间存在的约束( 相关性) 的性质,及 其对逻辑模式性能的影响,探讨逻辑模式的设计原则和实现这些原则的设计算 法,以便设计出性能良好的数据库模式,并为逻辑模式设计自动化提供基础,规 范化的目的是消除数据依赖中不合适的部分,迸一步消除由于冗余引起的数据异 常,规范化不能够减少数据容余;相反,它通过生成有控制的容余来连接数据库 表。规范化的过程就是用更结构更规则、更合理的一组关系模式来取代原有一级 关系模式,即从原有的一组关系模式通过分解( 投影) 和合并( 连接) 等操作得到满 足一系列条件的一组关系模式。 2 1 数据库的体系结构 为了使用户能抽象地访问数据,逻辑地组织数据,高效最佳地存储数据,数 据库系统提供了三级模式结构:外模式、概念模式和内模式。在数据库的发展过 程中美国国家标准化协会( a n s i ) 标准规划和需求委员会( s p a r c ) 提出了一 些关于数据库系统的标准术语和一般体系结构的规范,即描述数据的三个不同层 次,这些层次形成了一个三层体系结构,包括外部层、概念层和内部层。用户从 外部层观察数据,d b m s 和操作系统从内部层观察数据,概念层提供内、外部层 的映射和必要的独立性。 外部层 概念层 内模式 物理数据 图2 - 1a n s i - s a p r c 体系结构图 崮 成都理工大学硕士学位论文 在此外部层描述每一个与用户相关的数据库部分,由若干数据库的不同视图 组成,对同一个数据,不同的视图可能会有不同的表达方式。而概念层是数据库 的整体视图,这一层描述了哪些数据存储在数据库中,以及数据之间的联系,概 念层描述所有的实体、实体的属性和实体间的联系,数据的约束,数据的语义信 息,安全性和完整性信息。概念层支持所有的外部视图,只要对用户可访问的数 据包含在概念层或者可由概念层导出,然而,这层一定不能包括任何依赖于存储 的详细信息。内部层包括为了得到数据库最佳运行特性而采用的物理实现方法, 它包括在存储设备上存储数据所使用的结构组织和文件组织,这一层描述数据是 如何存储在数据库中的。及它与操作系统的访问方式接口,以便将数据存放在存 储设备上,建立索引、索引数据等。内部层之下是物理层,物理层可能在d b m s 的指导下受操作系统的控制。然而,d b m s 和操作系统在物理层上的功能分割并 不是十分清晰,并且因系统而异,所包含的内容只有操作系统掌握。三层体系结 构的目的是将用户的数据库视图与数据库的物理描述分离开。每个用户能够访问 相同的数据,但各自定义视图,每个用户改变数据视图,但这些改变不应该影响 其他的用户。也不应该要求用户直接处理数据库物理存储的细节。数据库管理员 应该能够在不影响用户视图的情况下修改数据库存储结构。数据库的内部结构不 应该受存储物理变化的影响,同时在不影响所有用户的情况下d b a 可以修改数 据库的概念结构。 2 2 数据库建模 数据库模型是数据库中用来表示数据结构和数据联系的逻辑概念的集合,数 据库模型可以分为两类:概念模型和实现模型。概念模型着重的是数据表达的逻 辑特性。如实体联系( e - r ) 模型。使用三种联系来描述数据之间的联系:一对 多、多对多和一对一。实现模型和概念模型相对应,它强调的是数据是如何在数 据库中描述的,或者数据结构如何去贯穿对已建模型的描述。实现模型包括层次 数据库模型、网状数据库模型、关系数据库模型和面向对象数据库模型。网状数 据库和层次数据库已经很好的解决了数据集成和共享的问题,但是在数据独立性 和抽象性上仍然有很大的欠缺,后来关系数据库很好的解决了这些问题,并在以 数学理论为支撑的前提下提出了数据库设计的规范化理论和衡量关系系统的准 则。 2 2 1e - r 模型介绍 实体一联系模型( e - r 模型) 是p e t e rc h e n 在1 9 7 6 年提出的用法,是用来 6 第2 章系统设计相关基本理论 描述和表达应用数据库设计的通用工具,在他的论文中,c h e n 建立了该模型的 基础,此后,c h e n 和其他许多人又对它进行了扩展和修改。e r 模型的关键元素 是实体、属性、标识符和联系。e r 图给出记录数据库设计的表示方法,用e r 图 可以描述应用的重要性,然后可以将它转换成特定的数据库模式。e r 模型的基 本概念是实体类型,实体类型代表现实世界中具有相同属性的一组对象,这些对 象在企业中能独立存在。对于实体类型的存在不依赖于其他的实体类型称为强实 体类型,而弱实体类型的存在是依赖于其它实体类型的存在。一个实体类型中每 个可唯一标识的对象都被看做一个实体的实例出现。而一个或多个实体类型间的 一组关联称为联系类型,每个联系类型都用一个名字来描述它的功能。一个联系 只应标记为一个方向,这通常意味着该联系仅在一个方向上有意义。在联系中参 与联系的实体类型的数目称为度,如度为2 的联系称为二元联系。在一特定的联 系中,一个参与实体类型的某个实例,可能与另一个参与实体类型发生关联的实 例的数目称为多样性,多样性约束了实体间联系的方式,它是用户或企业建立的 规则的一种表示,在对企业进行建模时,确保发现和表示所有恰当的企业约束是 非常重要的。多元联系的多样性,在一个n 元联系中,考虑某个实体类型,当其 它( n 1 ) 个实体类型的值确定后,它可能的实例出现数目。多样性事实上由两 个独立的约束组成,即基数与参与。基数描述一个特定联系类型中一个实体最多 可参与联系的实例出现的数目。而参与性说明指的是是否所有的实体实例出现都 参与了联系。图形化的标识实体一联系模型称为e - r 图,这种图的表示没有统一 的标准,但常用长方型表示实体类,联系用菱形表示,最大基数在菱形内显示, 实体名称在长方型内部显示,联系名称在菱形附近显示,在e r 图中,属性显示 在椭圆中,并连接到它们所属的实体或联系上。在e - r 图中,多值属性是通过生 成一个新的弱实体表示多值属性和构造一个一对多联系来表示的。 实体类型或联系类型所具有的某一特性称为属性。实体类型通过属性来进行 描述,具体的属性值用来描述每个实体的实例出现,即大部分在数据库中存放的 数据,在此主要包括单值属性,多值属性和导出属性。而一个侯选关键字是一个 最小属性组,它的值可以唯一地标识每个实体的实例出现,实体类型中被选来唯 一标识每个实体的实例出现的候选关键字称为主关键字。主关键字的选择要考虑 选择属性长度最小者,以及在未来是否具有唯一性。有些情况下,一个实体类型 的关键字由几个属性组成,这些值组合起来可以唯一表识每个实体的实例出现, 但分开来却不行,在此称为复合关键字。 在关系数据库模型中的基本数据成分是实体和实体的属性,但在用职模型 时可能产生些问题,在这里主要是连接陷阱问题,即:扇型陷阱( f a n t r a p ) 和深 坑陷阱( c h a s mt r a p ) 。当用模型来表示一个实体间的联系时,如果连接某些特殊 7 成都理工大学硕士学位论文 实体的实例出现的通路不确定,这时就存在扇型陷阱,当一个模型暗示某些实体 类型之间存在联系,而这些实体的实例出现之间却不存在相应的通路,这时就存 在深坑陷阱。为了发现连接陷阱,必须确保联系被完全理解并清晰地定义。 2 2 2 关系模型 关系模型是由e f c o d d 在他的一篇具有创新意义的论文。ar e l a t i o n a lm o d e l o f d a t a f o r l a r g es h a r e d d a t a b a n k s ”中首先提出的。关系模型是基于关系的数学 概念,在此关系用表表示,采用数学术语,主要是谓词逻辑与集合理论。 1 关系代数 关系代数是一种纯理论语言,它是建立在关系上的高级运算,每个运算都以 一个或多个关系作为它的运算对象,并且生成一个关系作为运算结果。因此,关 系代数中可以出现一个套一个的表达式,这种性质称为闭包,即关系在关系代数 下是封闭的,关系运算分两类,一类是一般的集合运算如合并、相交、求差、相 减、乘积,另一类是专门的关系运算:选择、投影、连接、自然连接、求商,在 此选择和投影操作都是一元操作,它们只对一个关系进行操作,其他操作则在两 个关系上,因此被称为:元操作。 关系代数运算_二要二二二二羹三:二二构成关系代数运算体系 2 关系模式 将关系代数应用到数据库中就可以定义关系模式,所谓关系模式就是对一个 关系的描述,关系模式的一般形式: r ( u ,d ,d o m ,f ) 其中: r j 关系名 8 第2 章系统设计相关基本理论 u j 全部属性集合 d j 属性域的集合 d o mju 和d 之间的映射关系、关系运算的安全限制 f j 属性间的各种约束关系( 数据依赖) 在一般的数据库设计中主要讨论r ( u ,d 。当且仅当u 上的一个关系,满足 f 时,称为关系模式胄( u ,乃的一个关系。 r 关系的型 ,j 关系的值,每一个值称为r 的一个关系 一个关系数据库由多个关系构成,一个关系数据库对应多个不同的关系模式 关系数据库模式可表示为:s = 饵 | i = l 2 埘 。 3 关系模型 在关系模型中用关系来保存数据库所描述对象的各种信息。一个关系被表示 成一个二维表,表中的每一行对应一个单独的记录,表中的每一列则对应一个属 性,一个或多个属性的取值的集合构成域,域在关系中起着至关重要的作用,用 户可以通过它来集中定义属性取值的含义与范围。在关系中的每一行称为元组, 关系中的元素就是表中行既元组,元组的出现顺序不会造成关系的改变。关系的 结构、域说明以及对取值的所有约束,有时统称为关系的内涵( i m e m i o n ) ,元 组称为关系的外延( e x t e n s i o n ) 。关系所包含的属性的个数称为维,如有两个属 性的关系称为二元关系,则维数为2 ,与关系相对应的另一概念是关系的基数, 元组的个数称为关系的基数。关系数据库就是具有不同关系名的规范化关系的一 个集合。在关系模型中由于在物理结构上,r d b m s 将把每个关系保存在一个文 件中,所以关系有时候也称为文件,元组称为记录,属性则称为字段。 设属性4 ,鸣,。以的域分别为d l ,d 2 ,见那么集合 4 :d 1 ,4 :d 2 ,4 ,:见) 就是一个关系模式。由关系模式s 所定义的关系矗是一组从属性名到其对应的域 的映射。因此关系r 就是如下疗元组的集合: ( 4 :面,4 :如,4 :一) 其中碣ed 1 ,吐d 2 ,4e 见 疗元组的每个元素都由一个属性和该属性的一个取值组成。当把关系表示成一个 表时,通常会把属性名作为每一列的标题,每一个元组作为表中的行,以 ( 碣,吐,吃) 的形式出现,其中每个值都是取自适当的域,这样,就可以将关系 模式中的每个关系看成属性对应域的笛卡儿乘积的子集。表则是这种关系的简单 表示。设置,r ,r 为一系列关系模式,那么就可以写出关系数据库模式或者简 称关系模式r 如下:r = 纯,足,b ) 在数学关系中,元组中各个元素的顺序是很 重要的,而对于关系模型中的关系,则不一样,它明确要求属性的顺序不具备实 际意义。 9 成都理工大学硕士学位论文 关系模型的目标是实现高度的数据独立性,提供坚实的基础用以处理数据语 义、数据一致性及数据冗余。r d b m s 要求用户所感知的数据库仅以表的形式出 现,这种感知只限于数据库的逻辑结构,就是a n s i s p a c r c 体系结构的外部 层和概念层,它并不适用于数据库的物理结构,数据库的物理结构是通过多种存 储结构实现的。 除了关系模型的主要结构外,关系模型的另一重要组成部分是操作机制,它 实现了底层数据的检索与更新,而关系代数和关系演算则是这种关系语言的基 础,可以将关系代数描述为一种过程式语言,可用它告诉d b m s 如何从数据库 的一个或多个关系中构建新的关系,同样可将关系演算看成一种非过程式语言, 它用公式给出由数据库中一个或多个关系构成的新关系的定义,它用来衡量关系 语言的选择能力。但严格来说,关系代数与关系演算是等价的,即每个关系代数 表达式都有一个关系演算表达式与之对应。关系演算用来衡量关系语言的选择能 力,如果一种语言可以生成所有由关系演算推导出来的关系,就称它具有关系完 备性。大多数关系查询语言都具有关系完备性,但它们比关系代数或关系演算更 具有表达能力。 4 关系数据库语言 数据库语言是d b m s 提供的用户界面( 接口) ,是用户和数据库管理员用以完 成数据的定义、查询、更新和控制的主要工具。不同的数据模型对应不同的数据 库语言。基于关系数据模型的数据库语言称为关系数据库语言,典型代表是s o l 语言( 结构化查询语言,s t r u c t u r e dq u e r yl a n g u a g e ,简称s o l ) 。 关系数据库语言包括两个部分:数据定义语言( d d l ) 和数据操作语言( d m l ) d d l 用来读取和更新数据库。d d l 是一种帮助d b a 或用户描述和命名应用程序中 用到的实体、属性和联系以及相关的完整性和安全性约束的语言。数据库模式是 一组定义,这组定义用数据定义语言来表达,d d l 可用于定义模式或修改已存在 的模式,但不能操作数据。d d l 语句的编译结果是一组表格,存储在称为系统目 录的特殊文件中,系统目录集中存储元数据,元数据是一种描述数据库中对象的 数据,它使访问和操作这些对象变的相对容易。元数据包含记录、数据项,以及 其他所有用户感兴趣或d b m s 要求的对象的定义。理论上可以区分用于三层体系 结构中每层模式的d d l ,分别为外部模式d d l 、概念模式d d l 和内部模式d d l , 然而实际上只需用一个全面的至少能说明外部和概念模式的d d l 。d m l 提供一组 基本处理操作的语言,能支持对存储在数据库中的数据进行各种操作,这些操作 包括在数据库中插入新的数据、对数据进行修改、检索数据库中的数据、从数据 库中删除数据。用户可以使用该语言的语句表达各种数据处理要求。数据处理被 用在外部、概念和内部层,然而在内部层,必须定义更复杂的低级程序,以便进 l o 第2 章系统设计相关基本理论 行高效的数据访问,相反在较高层,重点放在易用性以及为用户提供高效的系统 界面上。d m l 中涉及数据检索的部分为查询语言,查询语言可被定义为一个高级 的、具有特殊用途的语言,用来满足对数据库中的数据的各种各样的检索要求。 d m l 通过它们基本的检索机制区分为两种类型的d m l :过程的和非过程的,两者 的区别是,过程语言必须说明怎样得到一个d m l 语句输出,而非过程语言只描述 得到什么样的输出。 2 3 关系模式的规范化理论 关系数据模式的设计是关系数据库的逻辑设计问题,是数据库应用系统设计 的核心问题,其基本理论依据是数据依赖理论和规范化理论,这两者构成了关系 数据库设计的理论体系,是数据库管理系统设计和数据库应用系统设计中最重要 的理论体系之一。下面首先介绍函数依赖及函数依赖的公理体系,接着介绍关系 模式的规范化理论和方法,最后给出关系模式的分解概念与分解方法。 2 3 1 函数依赖 函数依赖是数据依赖的一种,它反映属性或属性组之间相依存,互相制约的 关系,即反映现实世界的约束关系。在数据库的设计中函数依赖是科学解决许多 实际问题的基础,可以使用一种形式化的、严格的方法处理所研究的问题。例如, 假设彳和b 均为关系r 的属性,如果4 的每个值都是与b 中唯一一个值对应,就 称为曰函数依赖于4 ( 表示彳j b ) 。a 和b 可能是由一个或多个属性组成。函 数依赖是属性在关系中的一种语义特性。语义特性表明属性是如何和另一个属性 联系起来并确定属性间的函数依赖。当存在一个函数依赖时,这个依赖被表示成 属性之间的一个约束。如属性b 函数依赖于属性彳,对于一个给定的a 值,只能 在元组中找到唯一一个b 值与4 值对应,反过来一个给定的b 值,可能对应几个 不同的彳的值,如: 图2 - 3 函数依赖图 当一个函数依赖存在时,位于箭头左端的属性或属性组称为决定方,在此一 是曰的决定方。当4 和口是一个关系的属性组,如果曰函数依赖于4 ,但不依赖 成都理工大学硕士学位论文 于4 的任一真子集时,那么b 就完全函数依赖于4 ,也就是对于函数依赖彳号召, 如果移除彳中的任一属性都使得这种依赖不再成立,那么4 _ b 就是一个完全函 数依赖。如果移除a 中的某些属性,这种依赖依然存在,那么彳_ 口就是部分函 数依赖。 确定关系的一组函数依赖的目的是为了确定该关系必须满足的一组完整性 依赖,首先要考虑的一个重要的完整性依赖是对侯选关键字的标志,其中一个侯 选关键字被选来作为关系的主关键字,即:使用依赖确定关系的主关键字。函数 依赖和关键字的概念是规范化过程的核心内容。 1 涵数依赖的逻辑蕴涵 设有关系模式r ( u ) 及其函数依赖集f ,如果对于r 的任一个满足f 的关系 ,函数依赖x 斗l ,都成立,则称f 逻辑蕴涵z 专y ,或称x 一王,可以由,推出。 2 a r m s t r o n g 公理 若【,为关系模式r 的属性全集,f 为u 上的一组函数依赖,设,y ,z ,矿均 为尺的子集,对r ( u ,) 有: f i i ( 自反性) :若x 3 j ,则z j r 为,所蕴涵;( f :j 一柳 只( 增广性) :若x 斗y 为f 所蕴涵,则x z 专y z 为f 所蕴:( ( 烟叶阴燃速率、含梗率、平衡水分、填充性、厚度、拉力、 调制方法、发酵方法) 。 3 由于不满足2 n f 所以此关系会存在数据冗余问题:由于每种烟叶在不同的 时间测试,其烟叶阴燃速率、含梗率、平衡水分、填充性、厚度、拉力、调制方 法、发酵方法、总糖、总氮、烟碱、糖,氮、糖碱,p h 值、年份、氯、磷、一氧 化钾、焦油、烟碱、c o 、测试时间、劲头、浓度、香气质、香气量、余味、杂 气、刺激性、燃烧性、灰色、质量档次等属性值可能不同,但烟叶代码、烟叶产 地、年度、等级、类型等不会改变。故如果将此存放在一个关系中,对于不同时 间测试所得结果的存储可能会存在冗余,这里主要指对烟叶产地、年度、等级、 类型的重复存储。 4 将烟叶性质关系分解为: ( 1 ) 烟叶基本性质( 烟叶代码、烟叶产地、年度、等级、类型、安全重量、 安全库存数量) ; ( 2 ) 烟叶物理性质( 物理性质代码、烟叶代码,烟叶阴燃速率、含梗率、平 衡水分、填充性、厚度、拉力、调制方法、发酵方法) ; ( 3 ) 烟叶化学性质( 化学性质代码、烟叶代码,总糖、总氮、烟碱、糖氮、 糖碱,p h 值、年份) ; ( 4 ) 烟气化学成分( 烟气化学成分代码、烟叶代码,总糖、总氮、烟碱、糖 氮、糖,碱,p h 值、烟气化学成分代码、氯、磷、一氧化钾、焦油、烟碱、c o 、 测试时间、劲头、浓度、香气质、香气量、余味、杂气、刺激性、燃烧性、灰色、 质量档次) ; 由于物理性质、化学性质、烟气化学成分在各个时期测试的结果可能不同, 故在其中的关系中分别加上测试时间。 ( 5 ) 虽然所有单关键字的数据库表都符合第二范式,但由于在基本性质中存 有烟叶产地、等级、类型等,这样维护起来及不方便,如删除一条烟叶基本性质 记录随着就删除了一个产地、等级、类型的属性,这样可能存在将产地、等级、 类型的信息也随之删除了,直到有此烟叶的产地时才能存储此产地的信息。这样 可以通过建立产地、等级、类型等关系表来单独维护这些信息。 成都理工大学硕士学位论文 ( 6 ) 建立烟叶产地、等级、类型关系表。 ( 7 ) 在烟叶烟气化学性质中同样存在这样的问题,故可通过建立劲头、浓度、 香气质、香气量、余味、杂气、刺激性、燃烧性、灰色、质量档次代码关系来维 护此信息。 ( 8 ) 按以上分析定义,建立的关系在第一范式中,它也在第二范式中,因为 任何非主关键字属性都依赖于整个关键字,由于在此关系中,没有传递依赖,所 以关系也在第三范式中,在此数据库关系的建立中其它关系也都采用规范化进行 处理。 通过规范化分析最后形成的关系实体如下: 用户权限( 眉庄垡玛,用户密码,联系方式,用户权限,部门) ; 烟叶基本性质( 坦吐岱强,烟叶产地代码、年度、等级代码、类型代码、库 存重量、库存件数、价格、库存来源、状态代码等) ; 烟叶物理性质( 堑堡焦厦岱亟,烟叶代码,阴燃速率、平衡水分、含梗率、 厚度、填充性、调制方法、拉力、测试时间、发酵方法,测试时间) ; 烟叶化学性质( 丝堂丝厦垡翌,烟叶代码,总糖、总氮、烟碱、糖氮、糖 碱、p h 值、氯、磷、一氧化钾,测试时间) ; 烟叶烟气化学成分( 丝堂性厦岱丑,性质代码,焦油、一氧化碳、烟气烟碱, 测试时间) : 烟叶感官质量( 壁宣盐理,性质代码,香型代码、劲头代码、浓度代码、香 气质代码、香气量代码、余味代码、杂气代码、刺激性代码、燃烧性代码、灰色 代码、质量档次代码,测试时间) ; 烟叶产地( 亡地垡码,产地名称,国标代码) ; 烟叶等级( 等级岱码,等级名称,等级说明) ; 烟叶香型( 垂型岱码,香型名称) ; 烟叶劲头( 劲煞丛i 盟,劲头名称) ; 烟叶浓度( 邃廑岱亟,浓度名称) ; 烟叶香气质( 垂氢厦岱丑,香气质名称) ; 烟叶香气量:( 蚕氢量岱堡,香气量名称) : 烟叶余味( 金壁i 通,余味名称) ; 烟叶杂气( 盘氢岱亟,杂气名称) ; 烟叶刺激性( 刻邀:睦岱盟,刺激性名称) ; 烟叶燃烧性( 燃缝性岱码,燃烧性名称) : 烟叶灰色( 筮鱼岱盟,灰色名称) ; 烟叶质量档次( 厦量挡达岱盟,质量档次名称) ; 第4 章卷烟辅助配方数据库静态设计 香精香料的基本性质( 歪料盐盟,香精香料的品名、代码、生产厂家、价格、 数量) : 香精香料的物理性质( 塑理性厦岱理,属性代码,折光率、溶解度、密度, 测试时间) ; 香精香料的化学性质( 丝堂丝厦岱理,香料代码,主p h 值,测试时间) ; 香精香料的感官质量( 蕉宣蛙厦岱丑,香料代码,特性描述,测试时间) ; 卷烟基本性质( 鲞坦岱盟,卷烟的规格、卷烟中文名称、卷烟英文名称、类 型、等级、生产日期、价格) ; 卷烟物理性质( 物理性厦岱理,卷烟代码,卷烟
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年远程医疗服务在分级诊疗中的信息化建设与挑战报告
- 动漫产业链协同创新模式研究报告2025:产业融合趋势
- 江苏省泗洪县联考2025年七年级英语第二学期期末学业质量监测试题含答案
- 2025年医院信息化建设中的患者隐私保护初步设计评估报告
- 2025年工业互联网平台网络安全态势感知技术安全人才培养与职业规划报告001
- 新一代大学英语(第二版)综合教程1-U2-教师用书 Unit 2 The Magic of Wrds
- 文化创意产业园区文化创意产业园区产业创新研究报告
- 2025年医药市场前景预测:仿制药一致性评价下的产业机遇研究报告
- 金融行业数据治理与资产化在金融行业数据治理体系建设中的应用报告001
- 安全注射试试题及答案
- MOOC 有机化学-华中农业大学 中国大学慕课答案
- 2024年4月自考00840第二外语(日语)试题
- 四川省成都市成华区2022-2023学年六年级下学期期末语文试卷
- 基于微信小程序的图书馆座位预约系统的设计与实现
- 内河交通安全管理条例
- 《白癜风的预防知识》课件
- 住宅工程质量通病防治方案及施工措施
- 酱料生产知识培训课件模板
- 高墩(40m高)安全专项施工方案(专家)
- 肠梗阻护理查房(小肠减压管的应用)
- JGT266-2011 泡沫混凝土标准规范
评论
0/150
提交评论