(系统工程专业论文)概念模型的结构化表示.pdf_第1页
(系统工程专业论文)概念模型的结构化表示.pdf_第2页
(系统工程专业论文)概念模型的结构化表示.pdf_第3页
(系统工程专业论文)概念模型的结构化表示.pdf_第4页
(系统工程专业论文)概念模型的结构化表示.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(系统工程专业论文)概念模型的结构化表示.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

i 摘 要 概念模型在信息系统的开发流程中地位重要。 传统概念模型表示方法具有表达直 观的特点,但缺乏对模型概念的深入描述。传统方法表示的概念模型受人们主观因素 影响很大,给大型系统中大量概念模型的管理、使用带来了困难。对模型进行标准化 表示,是解决以上问题的方法之一,也是本文的主要内容。 本文提出了对模型的结构化表示,即从概念模型的结构出发来分析模型,通过建 立与模型领域本体相对应的框架来结构化描述模型中各个知识要素及其相互关系。本 文还引入了规范语言 xml对模型的结构化表示结果进行加工,即用该语言表示模型 概念的结构化框架。从而使模型表示结果具有 xml的可扩展性、跨平台性和互操作 性。以便模型在异构系统中传递并存储在数据库中。 本文基本内容为:首先深入分析模型结构,将模型表示为三层结构模型。然后利 用本体论来研究三层模型的基本内容,从各层内容中抽出概念本体。然后,提出用框 架进行概念模型结构化表示。最后用 xml语言描述由各概念框架组成的结构化表示 结果。 值得强调的是,概念模型结构化表示的过程中,引入 xml 使模型的标准化表示 结果有了诸多优秀特性。这有利于模型的管理和自动化分析,而这也正是有待进一步 研究的问题。 关键词: 概念模型; 概念本体; 框架; xml ii abstract traditional conceptual model plays an important role in developing progress of information management system. the traditional conceptual model is straight forward, however, lacks a comprehensive and deep description of the model concept. as the traditional conceptual model is strongly affected by humans subjective judgment, a lot of problems may arise when designing, managing or utilizing a large system. to standardize the models representation is one of the effective way to solve the above problems, also is the key point of this thesis. this thesis proposes a notion as structural model representation, which is analyzing a model from the structure point, and establishing a framework which matches the model ontology so that we can structurally describe each single element and also the relationship between these elements. this thesis introduces how xml works in processing the results of structural representation of the model as well. this means using xml to represent the structural frame of the conceptual model enable the models are easily transmitted between different systems and saved in the database. it can also contributes xmls characteristics to the representation results such as: extensibility, manipulation, and reciprocity. based on above, the main content of the thesis is listed below: the first, a comprehensive and deep analysis of models structure is given. at this stage, the model is divided into three levels. then i will select the concept ontology from each level, and the ontology theory is used to analyze the basic elements of the three levels model. next stage is using the framework to structurally represent the model. and finally, xml language is used to describe the built- up structural representation results of each conceptual framework. the important thing is, xml contributes a lot of advantages to the results of standardizing model during the process of representation the structural concept. it is conduced when managing and analyzing automation of a model, which needs further research in the future. key word:conceptual model; conceptual ontology; framework; xml 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他 个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到,本声明的法律结果由本人承 担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有 权保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和 借阅。 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密 ,在_年解密后适用本授权书。 不保密。 (请在以上方框内打“” ) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日 本论文属于 1 1 绪论 1.1 研究的背景、目的和意义 1.1.1 研究背景 现代管理信息系统或软件系统正变得越来越复杂,往往涉及到大量的对象、数据 和复杂的流程,包括人、物和环境等多种因素,且智能程度越来越高。如何快速高效 地根据用户需求和实际业务,来分析设计并最终实现系统一直是相关行业讨论和研究 的热点。研制规模庞大、结构复杂的系统,不但需要大力科学地组织系统的设计和开 发工作,特别是对那些关键的、有着广泛价值的、具有开创性的思想、方法和技术的 研究。 经典模型理论认为概念模型是由人们的经验、知识和直觉形成的系统抽象描述。 而信息系统开发领域的概念模型则特指不依赖于具体计算机系统而纯粹反映信息需 求的概念结构。管理信息系统开发的经典流程如图1.1所示1。其中概念模型在整个流 程中有重要的地位,它发挥着现实世界与计算机上运行的实际系统之间的桥梁作用。 现实 世界 面向知识的 概念模型 面向设计的 概念模型 系统的逻辑 设计 系统的实现 专业知识 拥有者为主 专业 开发者为主 专业知识人员和开发者共同完成 概念模型 系统分析和 设计人员 系统开发和 实现人员 图1.1 信息系统开发流程示意图 通过概念模型的建立,可以让系统使用人员用其熟悉的所从事领域的专业知识向 开发人员讲解对系统的需求,其过程既不违背其专业的表达习惯,而又不需要开发人 员十分精通该领域的专业知识1- 2。反过来,通过概念模型开发人员可以向使用人员 讲解系统设计,而不需要使用人员掌握软件专业的知识方法和工具。 鉴于概念模型在系统开发过程中的重要性,对模型的存储、管理便成为了系统设 2 计人员十分重视的问题。由于概念模型的具体形式受人们主观因素影响很大,给大型 系统的大量概念模型的管理带来了困难。 当今系统开发领域从两个方向解决以上问题。一是在建模时便使用标准化语言, 用标准化元素或模板来建立模型,利用统一建模语言(uml: unified modeling language)建模3便是这一思路的体现。另一方向是对非标准化语言建立的模型进行 标准化改造,即用其它语言对模型进行规范表示和描述,这就是本文所讨论的内容。 本文以可扩展标志语言(xml: extensible markup language)为描述语言,从模 型结构出发对模型进行描述,从而实现模型描述的规范化。 1.1.2 研究的主要工作与意义 本文所做的主要工作首先是通过“三层论”来探讨如何将概念模型描述的本质内 容与它的形式化表示分解开来,将模型的描述工作转化为对概念和概念间关系的描 述。然后借用知识工程和人工智能领域中“本体”的概念4,研究所要描述模型相关 领域的具体内容,抽象出该领域知识的本体。本文还应用框架理论,提出用框架理论 来构造本体的结构化描述框架,并给出具体的框架实例。最后用特定语言规范描述本 体框架(文中讨论的是以 xml语言作为标准语言来完成对基本元素的描述) 。 模型结构化描述方法的主要意义在于:结构化描述把专业模型信息以图、文、表 等一套标准化、规范化的形式表示出来,将相关领域的业务描述成概念模型,即开发 人员易懂、易用、详尽、够用的完整信息,且这些信息的表达形式本质上是与系统实 现无关。通过使用规范语言对概念模型进行结构化描述,可以改善对概念模型的管理 和应用,提高实际系统开发的效率。通过结构化方法将概念模型进行有机拆分,使之 变成一系列的模型元素,并辅以规范的模板框架加以表示,从而同时提高了概念模型 的规范性。 1.2 相关文献综述 下面就对关于 xml,概念模型,结构化建模,本体论等理论的相关内容进行综述。 1.2.1 概念模型 1)基本的模型理论 (1)模型的定义 模型是对客观实体系统(实体系统即是由客观世界中物体组成的系统)的特征要 3 素、相关信息和变化规律的一种抽象表述,它反映了系统某些本质属性。模型描述了 实体系统各要素间的相互关系以及系统与环境之间的相互作用。 模型更深刻、 更集中、 更普遍地反映所研究系统的特征。 模型有如下三个特征: 是实体的抽象或模仿 是由与分析问题有关的因素所组成 是用来表明这些因素间的关系 建模的意义在于: 客观实体系统很难作试验,或者根本不能做实验 现实虽然可以作试验,但是利用模型更便于理解 模型易于操作,利用模型的参数变化来了解现实问题的本质和规律更为经济方 便4。 从模型的特征和意义可以看出,模型是现实系统的抽象,它既反映客观实际又高 于实际。现实范围广泛内容复杂,使用模型的目的就在于通过模型认识和掌握客观世 界,并为改造客观世界提供有关信息。因此在系统分析中模型被广泛地采用。 (2)模型分类 从不同的角度观察模型,可以得出多种不同的分类方法。按模型的形式分,模型 有抽象模型和形象模型;按模型中变量的性质分,模型有动态模型和静态模型、连续 模型和离散模型、确定性模型和随机性模型等;按模型的规模分,模型有宏观模型、 中观模型、微观模型;按模型的用途分,模型有工程模型、科研用模型,管理模型等。 在此,我们就模型的形式对模型进行细分。 抽象模型:抽象模型没有具体的物理结构,只是用数字、字符或运算符号来表 示的式子、图形或表格。具体细分,抽象模型可分为数字模型、图形模型、计算机程 序和概念模型。 形象模型:形象模型分为模拟模型和实物模型。形象模型的特点是有物理结构 的模型,故又成为物理模型。具体细分,形象模型又分为模拟模型和实物模型5。 2)概念模型 概念模型是通过人们的经验、知识和直觉形成的,这种模型往往最为抽象,即使 在缺乏资料的情况下,也可凭空构想一些资料,建立初始模型,再逐渐扩展而成。它 们在形式上可以是思维的、字句的或描述的。当人们试图系统地想象某一系统时,就 4 用到这样的模型6。 概念模型不依赖于具体计算机系统而纯粹反映信息需求的概念结构。具体来说是 用专业的建模方法与理论,通过对数据进行抽象处理(如:聚集和概括) ,由开发人 员与系统使用者合作,将专业知识领域的概念(包括:概念名,概念定义,概念属性 等) ,概念间关系等根据用户需要的功能分析所得的实现流程来表示的抽象结构。该 抽象结构最后通常是以图形的方式来加以描述和表达的。简而言之,它是对真实世界 中的概念的描述。 完善的概念模型对信息系统的顺利开发有十分重要的意义,发挥着现实世界到系 统之间的桥梁作用,也是专业的开发者和系统使用者之间的沟通平台。通过建立实际 概念模型,可以使系统使用者向开发人员讲解所从事领域的专业知识而不违背使用者 的表达习惯,又不需要开发人员精通该专业知识。反过来,通过对概念模型的执行, 开发人员可以向系统使用者讲解系统设计和开发的专业问题,而不需要使用人员具备 软件专业知识7。 本文讨论的概念模型是在构造管理信息系统的过程中生成的概念模型,故考虑将 文中讨论的概念模型对象默认为管理信息系统的概念模型。在后面的部分中,如果没 有特别说明,出现的概念模型一词均指管理信息系统的概念模型。 概念模型图等传统概念模型表示方法具有表达直观的特点,但同时也存在着对模 型概念缺乏深入描述, 具体图形受绘制者的主观因素影响等诸多不足。 针对以上问题, 本文提出了基本概念描述框架,以及基于此框架的用 xml表示概念模型的方法。用 xml 表示的概念模型,实现了模型的概念描述和可视化表达相分离,消除了主观因 素对模型的影响,同时还便于模型的传输和自动管理分析。 3)概念建模的一般方法 如前所述,传统的概念建模方法明确提出建模的三个阶段,即分析- - 描述- - 验证 三个步骤,其中第二个阶段又分成了结构化描述和对象化描述两个步骤,每一个阶段 和步骤的具体工作如下所述: (1)概念模型分析 建模的第一步就是获得相关的信息,概念模型分析首先要确定概念建模的范围, 目标和要求,也就是确定我们要描述什么内容,描述到什么程度。然后是收集相关领 域的知识,重要是到从什么地方获取知识- - 也就是知识源的问题。知识获取源分为两 类:专家和权威数据源。 5 (2)概念模型描述 结构化描述 结构化描述是指用结构框架对一类知识进行描述的方法,描述对象包括问题领域 中的实体、 行为和事务等概念及相关信息, 描述结果则是面向领域的结构化概念模型。 面向领域的概念模型是专业人员和技术人员相互交流的基础,它支持系统的需求分 析,是系统开发早期的重要阶段性成果。 对象化描述 概念模型对象化描述是在结构化描述的基础上对起其内容进行分析与处理,按照 建模的要求将需求表示成符合开发人员理解和使用的形式,它的主要工作是将事务结 构化描述中所定义的实体,过程和实物等概念信息,用对象化的建模规范进行表示。 对象化描述的产品是基于系统开发规范的对象化概念模型,它支持系统的逻辑设计。 对象化概念模型是系统开发人员中的不同技术人员对需求问题进行一致交流的基础。 面向领域的概念模型和面向设计的概念模型都支持重用性。面向领域的独立与具体的 实现的概念模型可以有效的充当重用表示法8。 4)概念模型验证 概念模型的正确性是系统质量的基本保障。概念模型的正确性有三方面的含义: 语法的,语意的和语用的。为保证概念模型的正确性,需要对概念模型进行验证。概 念模型是由静态结构与动态描述两部分组成的。静态结构的内容比较容易理解和检 查,动态描述的内容则是由于其复杂性难于通过阅读式审查发现其中的瑕疵。而利用 可执行模型在人机交互条件下验证概念模型的动态部分是很有意义的。可执行验证是 一种人机交互的验证,概念模型按照过程逻辑进行“执行” ,其结果正确性以来于领 域专家的判断。概念模型要解决领域知识和信息的理解问题,即不能直接将概念模型 的“执行”过程直接展现给领域信息源,而应提供更加直观的,熟悉的概念与形式来 表现概念模型的执行” ,如提供演示等。 1.2.2 本体论- - - ontology 1)什么是本体论 本体理论是随着知识工程的兴起和人工智能系统的开发而发展起来的,在这些系 统开发中,首要的一项工作就是收集相关领域的知识9。长期以来,开发这些知识是 为了解决特定的问题,也就是这些收集的知识和应用及具体的应用环境密切相关。这 样的一个好处是在解决问题的时候只需要考虑到领域中相关的知识,但是也带来了一 6 个问题,当应用发生了变化的时候,这些知识不可能为其它的应用系统所重用。因此, 那些与具体事务独立的知识开发,也就是领域本体的开发,逐渐成为九十年代以来的 一个热点。独立于事务的本体开发,为知识重用、系统互通和互操作带来可能10。 (1)本体论的定义 最初人们对本体的理解并不完善,这些定义也出在不断的发展变化中,比较有 代表性的定义如下: 本体是对于“概念化”的某一部分的明确的总结或表达。本体在不同的场合分 别指“概念化”或“本体理论” 。本体是对于“概念化”的明确表达。 本体是用于描述或表达某一领域知识的一组概念或术语。它可以用来组织知识 库较高层次的知识抽象,也可以用来描述特定领域的知识。 本体属于人工智能领域中的内容理论,它研究特定领域知识的对象分类、对象 属性和对象间的关系,它为领域知识的描述提供术语。 从以上定义我们可以知道,本体通过对于概念、术语及其相互关系的规范化描述, 勾画出某一领域的基本知识体系和描述语言11。 (2)本体的构造原则和方法 根据本体形式化程度不同,可以将本体分为严格形式化本体、半形式化本体和结 构化本体。根据本体的描述对象的不同,可以将本体分为领域本体、通用本体、问题 求解本体和知识表示语言本体等。 本体作为重用、互通和互操作的基础,必须经过精心的设计和构造,才能实现以 上的目标。t.r.gruber 提出了指导本体构造的五个原则。 清晰性,本体必须有效的说明所定义术语的意思。 一致性,本体应该是一致的,也就是说,它应该支持与其定义相一致的推理。 可扩展性,本体应该为可预料到的事务提供概念基础。它应该可以支持在已有 的概念基础上定义新的术语,以满足特殊的需求,而无需修改已有的概念定义。 编码偏好程度最小, 概念的描述不应该依赖于某一种特殊的符号层的表示方法。 因为实际的系统可能采用不同的知识表示方法。 本体约定最小, 本体约定应该最小, 只要能够满足特定的知识共享需求即可。 这 可以通过定义约束最弱的公理以及只定义通讯所需的词汇来保证。 uschold内容与形式分离;不同系统间方便的信息传输通用数据 交换格式 ;较好的保质性。 3)可扩展标志语言的相关技术16 xml 并不是单独存在的,因为 xml不止是用于一种数据格式的使用,它需要与 多种相关的技术相互作用。xml 的标准有一连串的“子标准”组成,它们共同定义 和描述了文件表现和使用的各个层面。这些技术包括:xlink 与 xpointer(设置 xml的 超链接)、dom (document object model:文件对象模型,存取、操作文件的内容)、 namespaces 解决不同元素有相同名称的问题), xhtml(下一代的 html)等。 (1)文档定义模型 dtd(document type definition) dtd是定义文档类型的架构(schema),比如说 dtd可用来指定相关文件必须包 含固定结构式的标签,dtd 在 xml 应用程序发展时就决定好架构,xml 文件也可 10 以不用 dtd就能处理。也这样的话,储存在文件内的信息即会失去。dtd 一般要了 解这些文件。 (2)可扩展样式语言 xsl xml文件的版面既不在文件内定义,也不在 dtd 内定义。 xml的基本原则之一 是内容绝不会与其呈现有关。 文件如何呈现是在以 xs 以或是 css)建立样式表单时决 定的。一份文件可以有许多不同 xsl 样式表单,使其具有不同的文件呈现。xsl 同 样也支持不同的输出媒体,例如屏幕显示、打印机输出等。除此之外,xsl 可以将 xml 文件转换成 html 文件。如果是在服务器端进行,某些了解 html 但不了解 xml 的终端装置也可以支持。xsl 即可扩展样式表语言(extensible stylesheet language)。 xsl能够改变及转化一种 xml格式的 xml数据, 使其变为另一种 xml 格式。 考虑这样一个例子, 相同的一个 xml文档需要分别用 html, pdf 和 postscript 等形式来演示。如果没有 xml 得帮助,那么这个 xml 文档只能人为的进行复制, 然后在人为的分别转化成这三种格式。相反,xsl提供了一个已定义好的样式表,通 过这个结构就完成上述的事务。因此如果一个 xml文档需要被转化成另一种表示形 式,xsl是一种好方法。而 xpath是另外一个独立的技术规范,但它为 xslt 大量使 用。xpath 技术规范定义了一个 xml 文档中的特定条目该如何定位。这是通过参考 xml 文档中的特定节点(node)来完成的。在 xpath 的技术规范中,一个 xml 文档 被认为是一个节点树。树中每个节点都可通过详细的描述该节点在树中的位置进行存 取操作.它在 xsl, xslt 应用将被大量的使用。 (3)xpointer 与 xlink 链接对象至 xml 文件的传统做法是由 xlink 与 xpointer 定义。与 html 的 处理相类似,xml 利用 xlink 来与文档链接,用 xpointer 来确定文档个别部分 的位置。下列链接状态支持比传统 html 链接多:双向链接;扩展 l: n 链接(例如 链接到相同文件的数个版本);间接性链接;指标定址(链接亦可指定文件内部的 某些位置)。 (4)xml查询语言 xql(xml query language) xql 目前仍为 xml 文件可用的查询语言之一。就如同 sql 对于关系式数据一 样,xql 可用来从 xml 数据源等数据库提取 xml 文件或部分文件。xql 指令集类 似 xsl句型语言,可让文件中的某些要素被检选出来。xql另一方面可在数据来源 完整的文件类型组合中应用这些指令。这也包括 join 操作的特殊操作元,可让外部 11 文件之间产生相互关系。 (5)xml schema xml架构工作底稿可对付 xml最严重的弱点之一,也就是缺少数据类型。虽然 xml dtd(文档类型定义)允许指定文件等级的标签与结构, 文件要素内容与属性值仍 是纯文字(字符串)。xml架构将数目、日期、时间等类型加入 xml之内,并且允许 使用者定义数据类型。xml 架构另外也支持模块化。模块化能使架构更容易重复使 用。xml架构本身 xml是由写成的,因此可使用 xml工具来处理。 xml schema 相比 dtd 有如下优点或特点: 一致性:xml schema 本身也是一种 xml文件,不像 dtd 拥有自己的定义语 法,dt d语法复杂晦涩,而 xml schema 清晰直观,可以被现有的 xm l编辑制作 工具所编辑、被 xml 语法分析器所解析、被 xml 应用系统所利用,既有投资得到 了最大程度的保护。 扩展性:虽然 dtd 中也定义了一些数据类型,但那都是针对属性类型而定义 的,而且类型非常有限。schema 对 dtd 进行了扩充,引入了很多内置和派生数据类 型。 易用性:dom(document object model)和 sax(simple api for x ml)。只是对 x ml 实例文档有效,对于 dtd 无能为力,而 schema 本身也是一种 xml 文件, 可以直接用 dom 和 sax 访问。 规范性:schema 提供了一套完整的机制以约束 xml 文档中置标的使用, schema 利用 元素的内容和属性来定义 xml 文档的整体结构,如哪些 元 素 可 以 出 现 在文档中、元素间的关系是什么、每个元素有哪些内容和属性、以及元素出现 的顺序和次数等等,有很强的规范性。 互换性:可根据需要设计适合自己应用的 schema,并且可以同其他人交换彼 此的 schema。利用 schema 书写 xml文档,验证文档的合法性。另外,通过映射机 制,还可以将不同的 schema 进行转换,以实现更高层次的数据交换。 (6)文档对象模型 dom(document object model) 文档对象模型是一种用于 html 与 xml 文件的 api(应用程序接口),可使应用 程序游移于文件的内部结构,进行查询、增加、修改或删除个别要素或属性。dom 被设计成旨在适用于任何的程序语言,比如 microsoft office 2000 与其他厂商就支持 这种类型。 12 1.3 全文安排 本文的主要内容为研究用 xml来辅助概念模型的结构化建模。第 1 章为绪论, 介绍本文研究的背景、目的和意义,并对相关文献进行综述外,其它各章的研究内容 如下: 第二章引入三层论,将概念模型划分为概念层,信息层,表示层三个层次,研究概 念模型的层次划分。 第三章研究用框架描述模型的概念元素。 引入本体论, 构造具体领域的知识本体, 从而构造出与元素相对应的概念框架。 第四章研究用 xml描述概念框架,从而描述整个模型。 第五章全文总结。 在对全文研究内容进行总结的基础上, 提出进一步研究的方向。 13 2 模型结构分析 对概念模型进行结构化描述的前提条件是描述者十分清楚模型结构。模型结构可 以理解为模型各个元素的意义和模型各元素之间的关系。结构化的实质是将整体拆分 为元素的过程,将模型按照其构建的机理进行拆分得到满足需求的元素和元素间关系 的集合。结构化过程就是从整体分解到部分,从宏观剖析到微观的过程。模型结构分 析就是认识和剖析模型元素和元素间关系的工作。分析的思路是将模型的外观和内容 相分离, 将模型的基础内容和扩展内容相分离, 将模型的不变内容和可变内容相分离, 并对分离后的结果再分析,得到更为细致分离结果的一个循环往复的过程,直至最后 得到满足需要的分析结果。 本章讨论的内容是分析模型得到模型元素极其之间的关系集合,为后面对模型的 结构化描述做好准备工作。 2.1 三层论 2.1.1 概念模型的实质 由绪论中关于概念模型的叙述可知,概念模型是一种抽象模型。在管理信息系统 的概念模型中,设计者使用各种表示或描述方法对相关领域的知识和概念进行描述, 其结果按照一定的规范组合起来,形成对整个系统功能或其它方面特征的说明。概念 模型的意义与模型中的知识概念密切相关,其表现形式与使用者或系统开发人员使用 的概念描述方法相关。概念定义不同,模型各元素的意义不同,各元素间关联不同, 模型的外型不同。因此,正确理解模型中概念的意义及相互关系是理解模型的关键。 在管理信息系统的开发过程中,概念模型是一种最初级,最抽象的模型。在将现 实世界抽象表示成模型的过程中,设计者提取问题领域中对模型目标有影响的一些关 键知识,概念、关系,并用事先约定的形式化方法表示或描述这些概念,最后在表示 媒介中加以展现。 概念模型是一种非规范性的,以问题领域的知识或概念为核心的,初级的系统模 型。在构造系统概念模型的过程中,模型要素化、模型关系化、模型形式化是三个关 键步骤。而这三个步骤都是通过对概念的操作来完成的。需要强调的一点是,此处的 “概念”是一个宽泛的集合,它可以是经验,知识甚至是直觉。综上可得出一个结论: 14 概念模型的核心是概念。 然而概念模型不等同于模型中出现的所有概念的简单总和。“概念” 是相对抽象的, 在将现实世界向目标系统转化的过程中,它是用来讨论和描述现实世界的基本元素。 同一概念在不同的环境和情况下有不同的具体的表现形式(特别是数量表示) ,将此 观点放到狭义的范围中讨论,则可以理解为同一个概念有不同的参数,由此产生了不 同性质。同一概念具体表现不同,实质是概念的具体环境、范围和概念约束不同,概 念信息不同。因此,概念模型意义,可以理解为由两部分组成,分别是 “概念”和“信 息” 。 除了意义外,模型还包括其意义的形式化表示。因为模型是对现实系统的表示, 故模型离不开形式。模型形式化是通过使用符号、图形或其它媒介载体将模型意义从 大脑思维转变为物理表示,并为其它人理解。传统的模型表达方法为图形、文档。 综上所述,本质上概念模型是由模型意义和模型表示两部分组成,而意义是由基 本概念加概念信息组成的。最后,可得出如下表达式: m=c+in+p 其中,m表示概念模型,c表示模型概念,in表示模型信息,p表示模型的外 观表示。 2.1.2 概念模型的三层模式 上节讨论得出:模型由三个部分组成,现在利用结构思想来分析模型的具体结构, 即从模型概念出发分析三部分所有具体要素间的相互关系。模型由三部分组成是根据 概念模型本质得出的结论。实际管理信息系统的概念模型中,三部分是有机结合的, 彼此相互依存而无法人为分离的(为方便以后讨论将此性质称为模型三部分的不可分 割性) 。然而对模型的分析或处理工作要求将模型的本质、内容及形式相互分离,以 获得对模型由现象到本质的深入认识。 本节将着重讨论模型三部分分离的意义和关于分离方法的基本思路。在此提出一 个思路:将模型拆解为各种要素组合,分析各类要素间的相互关系,通过分析这些关 系来明晰模型结构。 1)各类要素关系分析 根据上节提出的概念模型的组成:m=c+in+p可知三部分在模型中起不同的作 用,相互之间有着紧密的联系。概念在整个模型(注:此处的模型指概念模型,为简 15 便起见,下文中如无特别说明,模型均指概念模型)中占有核心地位,如果模型概念 被抽换或取消,则与概念相关的信息和形式化表示就失去了意义。 假设将模型三部分完全分离,概念信息和符号都是以独立形式存在的,讨论三部 分间的关系。首先信息和表示依存于概念。 若模型各概念已明确,则需根据概念定义填入信息(如物理系统中某物理量的参 数值。信息的意义完全依赖于其所属的概念宿主,即某概念 c 的信息可表示为 in= inf(c); 则i=inf(c1), inf(c2),inf(cn); 概念与信息间关系可以用图 2.1 表示: c1 inf3 inf4 inf2 inf1 c4 c3 c2 c inf 概念信息 inf(c1) inf(c2) inf(c3) inf(c4) 图 2.1 模型概念与模型信息关系示意图 此外,每个概念都需要用一定的方法表现在媒介上,成为物理化概念。如:图形, 文字等表示方法是人工定义的。表示与概念是一一对应的,双方的对应关系是规 范且事先约定的,称为表示系统。概念、信息、表示系统三者关系如图 2.2 所示: c1 inf3 inf4 inf2 inf1 c4 c3 c2 c inf 概念信息 inf(c1) inf(c2) inf(c3) inf(c4) psys p2p1p3p4 符号系统 符号 图 2.2 模型意义与模型表示关系示意图 16 用符号可表示为: pn=psyscn,inf(cn); p=p1,p2,pn; 2)三层模型 上节对三部分关系的讨论有一个前提:模型的概念信息和符号是相互分离以独立 形式存在的,但现实概念模型中“概念” 、 “信息” 、 “符号”三部分间具有不可分割性, 故无法直接分离原模型的三部分。 关于分离方法的一大思路是找一个人为定义的,规范的中间模型来替代原模型, 它是原模型和分离结果间的桥梁。它最大限度的保留原模型的内容,且基于以上分析 的三部分之间关系,将三部分明确分开。 中间模型是结构性模型,它具有三层结构,由核心层- - 概念层、附加层- - 信息层和 表示层组成。与每个概念模型都有“概念” 、 “信息” 、 “表示”三部分不同的是以上三 层是结构性的中间模式所特有的。 “层”是结构性模型中的概念,它表示中间模型中 的子结构,由模型中的相似内容组成的。由于中间模型鲜明的三层结构性以后将中间 模型称为三层模型 三层模型有下列特点: (1)原模型与三层模型的概念及概念间关系不变。 (2)三层模型的“概念” 、 “信息” 、 “表示”三部分分属于三个层次,并在层次中 以集合的形式存在。 2.2 构造三层模型 2.2.1 层次分离方法 1)概念集、信息集、模型符号集 上节已经讨论过用三层模型来替代原模型,三层模型是“概念” 、 “信息” 、 “表示” 相分离的层次结构模型,可用来替代原模型作为研究对象。 但上述的三部分直是人们脑海中的抽象观念,因此需要将“概念” 、 “信息” 、 “表 示”实体化,使之成为讨论和操作的有形对象。在此,将“实体化”定义为:给抽象 观念赋以数量、物理性质,使之成为可操作可比较可数学运算的实体对象的过程。实 体化是大脑中的抽象观点想现实存在的狭义延伸,是个“物化”和“固化”的过程。 17 以货币这一概念为例,抽象的货币挂念是“货币是商品交易行为中的等价物” ,而实 体化后的货币概念则是有物理形状和质量的纸币。在此将实体化后的概念称为原子概 念,原子概念拥有属性、状态,以个体形式存在。原子概念有数量性,并可以用图形 符号加以表达。 概念是描述的核心内容。将模型概念实体化后,模型被视为可分解的,被分解为 原子概念和相关信息的结合。将模型所有概念的实体化结果组成的集合成称为模型概 念集,即模型所有的概念原子组成概念集。所有模型原子概念的信息组成了模型的信 息集。形式化表示原子概念的符号系统则构成模型符号集。三集合是对模型进行有机 分拆的结果,也是三层模型各个结构层次的内容。 2)分离方法 生成三层模型最重要的工作是从原模型中分离出三个集合,作为三层模型各个层 次的内容。在此将从原模型中得出三个集合的过程定义为模型的层次分离过程。 在寻找分离方法前,应首先了解模型的产生过程,因为分离是该过程的逆过程。 模型产生的过程可归纳为三个步骤: (1)明确模型概念; (2)确定概念间关系和具体 信息; (3)进行形式化的模型描述,概念与符号相对应。 该过程如下图: 概念信息 概念模型详细概念集概念集 符号映射 图 2.4 概念模型建模过程示意图 据此,集合分离过程可理解为以上过程的逆过程。集合分离第一步是分析找出模 型涉及到的各主要概念及其子概念,找出概念之间准确的相互关系。将每个概念和它 们的具体信息用图形符号表示出来的过程称为形式化,概念和符号是映射的关系,但 是在概念模型中表示概念的符号的形式化往往是灵活的,它可以画成不同的样式,表 以不同的风格。 3)分离的意义 分离的实质是从原模型中抽取出概念的等价形式,该等价形式最大限度地反映了 模型概念的意义和概念间关系。便于将模型规范地表示为以概念为核心的三层模型, 实现对模型的有效分析和灵活处理。分离使不同模型的相互融合成为可能,同时还有 利于模型的自动化处理。 18 2.2.2 层次分离方法示例 现以实际模型为例,对模型的层次分离过程进行说明。该模型是用概念模型图表 示的,如图: 解释:概念模型图即是以图形方式表现的概念模型 tv 冷轧 热轧产 品 冷轧热轧 时间 检化验 tv 检化验 天月年 合同洲国家单位 产线 钢种 出纲记号 机械性能 物理性能 机械物理性能 判定结果 卷曲温度 终轧温度 工艺参数 1 n 1 1 1 1 1 n 1 1 n 1 n n n 其它参数 图 2.5 轧钢过程概念模型图 该图给出的是一个表示轧钢过程的概念模型,包括冷轧和热轧两个部分17。 (1)生成概念集 模型图中所有涉及到的概念组成的集合称为模型的概念集,图中概念是用特定符 号明确标注的名词词汇,彼此间相互关联。图中所示的概念实体,根据各自不同的表 示符号分为不同的类型。以此图为例,矩形表示的是实体性概念,即从现实世界的实 物抽象而得的以个体形式存在, 附有物理或其它性质的概念实体。 关系表示实体之间、 实体集之间的联系,联系分很多类型,一般的联系用菱形表示,其它类型的联系用其 它符号表示。实体、实体概念间关系的静态特征称为属性, 用椭圆表示属性。 由该图得出概念集的方法是:遍历图中所有节点元素(矩形,椭圆形)和节点间 关系,登记元素和关系的定义,找出所有理解模型所需的概念,记入集合形成概念集, 记入时概念按类型分类。用表 2.1 表示该图概念集(注:概念集中每个概念的信息除 了下表中的“概念标号” , “概念名”和“概念类型”外,还应包括对概念定义的解释 和与本概念有关的所有其它概念的列举, 由于下表只是示范, 所以对此两项内容省略。 在正式概念集表格中务必将每个概念此两项信息的具体内容完整列出) : 19 表 2.1 轧钢过程模型图概念集 概念标号 概念名 概念类型 概念 标号 概念名 概念 类型 1 热轧 实体 17 其它参数 实体 属性 2,3 冷轧,冷轧普板 实体 18,19 机械性能,物理性能 实体 属性 4,5 钢种,出钢记号 实体 20 卷曲温度 实体 属性 6,7,8,9 洲,国家,单位合同 实体 21 终轧温度 实体属性 10 产线 实体 22 机械物理性能 实体属性 11,12,13,14 时间,年,月,日 实体 23 工艺参数 实体属性 15,16 检化验 1,检化验 2 实体概念 间关系 24 判定结果 实体属性 (2)登记信息集 在此信息集划分为两种:包括基本信息集和扩展信息集,前者是图中明确给出的 文字符号信息(如概念名) ,后者则是关于图中概念和概念间关系的描述信息,扩展 信息集中概念信息的条目即描述内容是由概念描述框架决定的。拿出图中每种概念的 一个实例来做说明,得到表 2.2 表 2.2 轧钢过程模型图信息集(例) 概念 标号 基本信息 扩展描述信息 4 概念名:钢种;概念 类型:实体 关联概念 a:出钢记号,关联概念标号:5 15 概念名:检化验 1; 概念类型:关系 连接对象 a:冷轧,概念标号:2;连接对象 b:冷轧普板,概念标 号:3;数量映射关系:a:b=1:n;相关属性概念:机械物理性能,概 念标号:22 17 概念名:机械性能; 概念类型:实体属性 所属对象:检化验 2,概念标号:16 (3)生成符号集 登记图中用到的所有符号类型,包括其外形,所表示对象的意义等;以上内容组 成了符号系统。该模型的符号集如表 2.3。 20 表 2.3 轧钢过程模型图符号集(例) 图形 文字 概念种类 形状 颜色 大小 随需求 扩充 位置 字体 大小 随需求 扩充 实体 无 随需求 矩形 框内 随需求 随需求 属性 无 随需求 椭圆框 左侧 随需求 随需求 实体概念间 关系 无 随需求 菱形正 中 随需求 随需求 21 3 模型本体的概念框架 前一章讨论了结构化描述概念模型的第一个步骤:对概念模型的结构化分析。由 相关内容可知,概念模型结构化分析的结果是:模型的概念集、信息集、表示集,而 三集合的核心是概念集。对概念模型的描述主要是对概念集中概念和知识的描述,如 何有效地描述开发人员输入的概念和信息,是结构化描述概念模型要解决的重点问 题。 解决概念和信息描述问题的一大思路是,根据本体理论分析概念模型领域的概念 知识得出领域本体,通过框架表示法结构化描述领域本体,构造各本体的规范表示框 架。上述方法中,本体理论与概念框架理论紧密结合使用。本体框架是指根据框架 理论构造的概念集合中概念本体的结构化描述框架。 模型中的所有概念均可用单个 或重用的本体框架来描述。 结构化描述框架是以框架理论为基础的结构化知识表示 方法,它是一种规范的描述方法,包括描述内容的规范和描述结构的规范。而本体 是用来表达某一领域知识的一组概念和术语, 它可以用来组织知识库较高层次的知 识抽象, 也可以用来描述特定领域的知识。模型中的本体可以理解为概念集中一个 概念子集,用该子集内的概念,术语的组合或扩展可替代概念集中除该子集外的其 它概念。 采用此方法的原因是,首先概念本体可以规范化描述概念知识,其次框架表示法 具有结构性、继承性和表达方式的自然性等优点。因此,可用本体框架来结构化描述 模型概念和信息。简而言之,上述方法就是通过本体理论抽象出概念本体作为描述内 容,通过框架表示法将这些内容表示出来,这就是模型、本体、框架三者之间的关系。 也是本章讨论的主要内容。 3.1 模型的概念本体 绪论中介绍了本体论的基本知识:本体是关于知识表达、共享、集成和开发的理 论和方法。构造模型概念的本体,对规范特定领域知识概念,明确知识间的关系和结 构,提高概念间的互通性、重用性有重大意义。概念本体规范描述某知识领域内的概 念和术语,从而组织较高层次的知识抽象来描述某领域的基本知识体系。本节讨论的 主要内容是,应用本体理论来构造模型的概念。 22 3.1.1 模型概念本体的构造方法 在构造模型概念本体前,需要根据三层论分离出模型的概念实体。一个具有特定 功能的系统,其概念模型包含很多概念,且概念间的关系很复杂,需要深入了解概念 间的各种联系。模型的概念本体是概

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论