标准语义知识库 第3部分:语义集成技术要求 征求意见稿_第1页
标准语义知识库 第3部分:语义集成技术要求 征求意见稿_第2页
标准语义知识库 第3部分:语义集成技术要求 征求意见稿_第3页
标准语义知识库 第3部分:语义集成技术要求 征求意见稿_第4页
标准语义知识库 第3部分:语义集成技术要求 征求意见稿_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1GB/TXXXXX—XXXX标准语义知识库第3部分:语义集成技术要求本文件规定了标准语义知识库与应用场景对象语义集成的集成前准备、集成实现、集成后处置的要本文件适用于标准语义知识库与数据库、文档、模型、软件等应用场景对象的语义集成工作,为标准语义知识库在现实场景中的集成应用提供参考。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T36344信息技术数据质量评价指标GB/TXXXXX—XXXX标准语义知识库第1部分:标准内容语义化表达通用要求GB/TXXXXX—XXXX标准语义知识库第2部分:数据接口要求3术语和定义GB/TXXXXX—XXXX《标准语义知识库第1部分:标准内容语义化表达通用要求》、GB/TXXXXX—XXXX《标准语义知识库第2部分:数据接口要求》界定的以及下列术语和定义适用于本文件。3.1语义集成semanticintegration语义集成是指将来自不同来源、具有不同结构和含义的数据整合到一个统一、一致的语义框架中的过程。3.2应用场景对象applicationscenariosobject应用场景对象是特定业务或技术场景中的核心数据实体。在本文件中,应用场景特指标准相关的业务或技术场景,应用场景对象包括数据库、文档、模型和软件。4总体要求4.1语义集成过程语义集成应包括集成前准备、语义集成实现、集成后处置,示意图见图1。——集成前准备包括需求分析与规划,其中规划包括应用场景对象语义化表达单元模型构建和应用场景对象语义化表达规则确定。——集成实现包括接口调用、集成和存储,其中集成包括语义化表达模型融合和语义化表达内容数据融合,软件应用场景对象的语义集成见附录A,其他应用场景对象可参照该示例。GB/TXXXXX—XXXX2——集成后处置包括集成评估、集成维护与追溯记录。图1语义集成示意图4.2基本要求在各类实际应用场景(航空航天、桥梁建设、生活服务等)中,应用场景对象可分为数据库、文档、模型和软件。标准语义知识库与应用场景对象集成应符合以下要求:——应用场景对象应开放、可集成,应能语义化,进行标签标注;——结构化的应用场景对象(如数据库)与被集成的标准内容语义化表达单元宜有相同的标签;——非结构化的应用场景对象(如文档、软件、模型)需要与标准语义知识库进行语义集成的,可通过接口调用方式集成,也可通过将内容转化为结构化的数据库,再与相关标准内容语义化表达单元集成;——当标准内容语义化表达单元变更时,应使应用场景对象与其集成的相应内容也随之变更。注:标准与机器的集成是通过软件进行集成的。5集成前准备5.1需求分析集成前,应明确集成的主要目标,确定集成后的具体应用场景,严格界定需要集成的知识领域范围,划定相关概念、属性和关系的边界并制定明确的质量评估要求。通过语义集成,用户可以及时获得标准内容语义信息更新通知,确保应用场景对象的合规性。各类对象与标准语义知识库进行语义集成后的功能如下:a)数据库类对象与标准语义知识库进行语义集成后,用户可以建立本地的语义知识库;b)文档类对象与标准语义知识库进行语义集成后,用户无需手动更新,包含标准内容的文档能随着相应标准的更新而自动更新;c)模型类对象与标准语义知识库进行语义集成后,用户无需依靠人工校验和机器硬编码审核模型,可以进行自动检索比对和校验,消除模型与标准要求的冲突;d)软件类对象与标准语义知识库进行语义集成后,用户无需详细了解底层的控制逻辑和数据结构,可以通过语义查询来查询和控制软件,实现软件功能。5.2识别应用场景对象的标准关联内容集成前,应按照GB/TXXXXX—XXXX《标准语义知识库第1部分:标准内容语义化表达通用要求》中第6、7章的规定,识别应用场景对象与标准关联的内容,包括与标准关联的通用类内容及专用类内容。示例:应用场景对象是《RTU-ECAT远程IO通讯模块操作手册》的文档,文档中规定“模GB/TXXXXX—XXXX35.3应用场景对象语义化表达单元模型构建5.3.1应用场景对象的通用类内容语义化表达单元宜按照GB/TXXXXX—XXXX《标准语义知识库第1部分:标准内容语义化表达通用要求》中8.3的规定进行规范,应带有规范的标签。示例:应用场景对象需要表达一段关于标准发布日期语义内容,则应用场景对象语义化表达模型规划时应至少对5.3.2应用场景对象的不同类型的内容(术语、符号、分类、试验、规范、规程、指南、评价)语义化表达单元应带有规范的标签。5.3.3应用场景对象的术语类内容语义化表达单元应包括中文术语、英文术语、定义、专业领域、术语条目来源,应有规范的标签。中文术语宜包括首选术语、许用术语、拒用术语,英文术语宜包括缩略语,定义宜包括术语示例。5.3.4应用场景对象的符号类内容语义化表达单元应包括编码、符号、名称、说明、符号引用,应有规范的标签。符号宜包括图形符号、文字符号、图形标志,名称宜包括中文名称、英文名称,符号引用宜包括摘录、代替、采用。5.3.5应用场景对象的分类(过程)类内容语义化表达单元应包括原则、分类过程、分类方法、分类维度,应有规范的标签。分类过程宜按照步骤分类,分类方法宜按照方法分类,分类维度宜按照维度分类。5.3.6应用场景对象的分类(结果)类内容语义化表达单元应包括类目代码、类目名称、类目等级、类目含义(说明),应有规范的标签。5.3.7应用场景对象的试验类内容语义化表达单元应包括范围/要求、工具/方法、试验步骤、实验数据、结论/报告,应有规范的标签。实验数据宜包括数据规则、结果表示、计算方法,结论/报告宜包括试验对象、结果/异常、时间。5.3.8应用场景对象的规范(产品)类内容语义化表达单元应包括限定条件、指标项,应有规范的标签。指标项宜包括指标值、取值范围、计量单位。5.3.9应用场景对象的规范(过程、服务)类内容语义化表达单元应包括维度要求、证实方法,应有规范的标签。证实方法宜包括方法名称、方法描述、建议指标、选择依据、输入参数、输出参数。5.3.10应用场景对象的规程类内容语义化表达单元应包括范围、程序确立、程序指示、追溯/证实方法,应有规范的标签。程序确立宜包括阶段,阶段宜包括步骤,程序指示宜包括行为指示、转换/结束条件,追溯/证实方法宜包括方法名称、方法描述,方法描述宜包括建议指标、选择依据。5.3.11应用场景对象的指南类内容语义化表达单元应包括范围、总则、需考虑维度,应有规范的标签。需考虑维度宜包括具体需考虑要点。5.3.12应用场景对象的评价类内容语义化表达单元应包括原则、评价指标、评价指标值取值规则、评价结果计算、评价报告、评价结果应用、评价活动组织实施,应有规范的标签。5.4应用场景对象语义化表达规则确定5.4.1应用场景对象的语义化表达规则应从标准语义知识库直接调用或进行本地构建。5.4.2进行语义化表达规则本地构建时,应用场景对象的通用类语义化表达单元之间通过“主从”关GB/TXXXXX—XXXX4系或“同等”关系进行语义关联,语义关联形式应符合“通用语义化表达单元1”+“其他通用语义化表达单元2”+“其他通用语义化表达单元n”形式。通用语义化表达单元通过唯一标签实现明确的标识,不同单元之间的关联关系应具备双向性和可追溯性,即根据一个单元应能追溯其他相关单元。示例:应用场景对象“标准信息平台”软件中,需要表达一段关于标准发布日期的语义内容,在获取内容语义调用标准内容语义化表达规则,生成语义内容“标准号为GB/T22373-2021的《标准文献5.4.3进行语义化表达规则本地构建时,应用场景对象的专用类语义化表达单元应满足表达顺序性和语义完整性:——表达顺序性:应考虑专用类语义化表达单元之间的相互关系和排列顺序。不同类型内容各个专用语义化表达单元之间存在特定的先后顺序,应按照5.3.3-5.3.12中所列表达单元的先后顺序进行排列。——语义完整性:应能够全面、准确地捕捉和表达概念、实体、关系和属性等语义知识的能力。完整的语义知识表达能够覆盖特定领域或通用领域的所有重要内容语义化表达单元,并且能够清晰地定义这些单元之间的相互关系。5.5评估在进行语义集成前,应对应用场景对象语义化表达模型进行评估,应遵循以下原则:——正确性,进行应用模拟验证,确认需求应真实反映用户需求;——完整性,拟建立的语义化表达单元模型应覆盖所有功能和非功能需求;——一致性,拟建立的语义化表达单元模型之间是应协调一致;——可行性,技术、成本、时间应能够实现;——可测试性,需求应能被验证。6集成实现6.1面向数据库对象的语义集成6.1.1接口调用6.1.1.1通信方式作为数据调用方,数据库这类结构化的应用场景对象应和被集成标准语义知识库建设方协商合理的通信方式,包括通信协议、接口模式、接口实现方式。6.1.1.2接入与授权应向被集成语义知识库建设方申请身份认证,并获得授权。6.1.1.3标准语义化表达单元查询查询应符合下列要求:GB/TXXXXX—XXXX5——应向被集成语义知识库建设方发送标准号、标准名称、标准语义化表达单元类型以及单元值等部分或所有参数进行标准语义化表达单元的精确或模糊查询;——发送的参数应至少包含标准号、标准名称中的一个;——按需从返回的接口响应状态、标准号、标准名称、通用和专用语义化单元键值对、接口返回时间中,选择数据内容在应用场景对象中进行实例化。6.1.1.4标准语义化表达单元订阅订阅应符合下列要求:——应向被集成语义知识库建设方发送标准号、标准名称、标准语义化表达单元类型、响应频率、订阅状态等部分或所有参数进行标准语义化表达单元订阅;——发送的参数应至少包含标准号、标准名称中的一个;——按需从返回的接口响应状态、订阅状态、订阅结果中,选择数据内容在应用场景对象中进行实例化。6.1.1.5标准语义化表达单元推送推送应符合下列要求:——应向被集成语义知识库建设方发送标准号、标准名称、标准语义化表达单元类型、响应频率、历史记录的更新时间等所有参数接收标准语义化表达单元推送;——发送的参数无必选参数;——按需从返回的接口响应状态、标准号、标准名称、标准数据版本号、通用和专用语义化单元键值对、推送状态、接口返回时间中,选择数据内容在应用场景对象中进行实例化。6.1.1.6标准语义化表达单元转换转换应符合下列要求:——应向被集成语义知识库建设方发送标准号、标准名称、标准语义化表达单元列表、目标表达方式等部分或所有参数将标准语义化单元转化为图谱、向量等表达方式;——发送的参数应至少包含标准号、标准名称中的一个;——按需从返回的接口响应状态、转换后的语义单元列表、接口返回时间中,选择数据内容在应用场景对象中进行实例化。6.1.1.7标准语义化单元计算计算应符合下列要求:——应向被集成语义知识库建设方发送标准号、标准名称、标准语义化表达单元列表等部分或所有参数对标准语义化单元关联关系进行查找与溯源;——发送的参数无必选参数;——按需从返回的接口响应状态、标准号、标准名称、标准语义化单元列表、接口返回时间中,选择数据内容在应用场景对象中进行实例化。6.1.2集成6.1.2.1集成方法集成方法包括以下三种:GB/TXXXXX—XXXX6——集中式语义集成:将标准语义知识库与数据库应用场景对象的语义合并统一,需要完成模型融合(6.1.2.2)与数据融合(6.1.2.3);——联邦式语义集成:标准语义知识库与应用场景中的数据库对象的语义同时独立存在,不进行合并,使用语义时按需选择;——混合式语义集成:根据需求,部分数据进行集中式语义集成,其他数据进行联邦式语义集成的一种混合方式。包括标准号、中文标准名称、规范性引用文件具体要求,是基于GB/T1.1-2009创建的。现在,标准语义知识库中,标准编写规则已更新为GB/T1.1-20示例2:联邦式语义集成示例:在本地建有一个数据库,数据库中包含了质量管理体系相关内容语义化表达单元,是基于GB/T19001-2008(等同采用ISO9001:2008)构建的,现在标准语义知识库中质量管理体系标准更新了ISO9001:2015版本,但实际运行及转版过程中,仍存在两个标准按需使用情况,则采用联邦式集成,数据库同时保留GB/T6.1.2.2语义化表达模型融合6.1.2.2.1映射语义化表达模型映射是将语义知识库中语义相似度较高的字段建立对应关系,主要的映射类型包括:等价映射、子类映射、部分映射和复杂映射,见表1。表1概念映射类型模型映射应遵循以下原则:a)保真性:应严格基于领域的真实含义,确保概念、关系及约束在语义层面的一致;b)最小承诺:应聚焦于实现目标或集成所需的最小必要关系,避免冗余或推测性关联;c)可追溯性:应文档化其逻辑依据、约束条件及变更历史,确保可追溯与可验证。模型映射流程应按照图2的规定进行。模型映射实现方法应是基于术语的方法,还应引入专家进行映射确认,并保持及时更新修正映射错误。图2模型映射实现流程图6.1.2.2.2合并语义相同的字段应进行合并,应设置冲突解决方案,应根据来源、时间戳自动判断合并策略。GB/TXXXXX—XXXX7源合并策略,选择来源更正规的标准语义知识库将概念合并6.1.2.3语义化表达内容数据融合应建立数据冲突处理机制,出现值冲突时选择创建复合值或保留多个值。属性冲突时应选择等同还是替代。关系冲突时应选择统一的关系描述。示例:本地数据库存储的GB/T1.1标准为2009年发布,而标准语义知识库中GB/T1.1标准已经更新到GB/T6.1.2.4工具可采用自动化或半自动化的工具进行语义集成。——模型映射可使用Protégé、TopBraidComposer等本体建模工具;——语义化表达内容数据融合可使用DiffKit、DeltaXML等数据差异可视化工具。6.1.3存储集成的语义信息数据存储应满足以下要求:——应包括原始存储和处理存储,并提供统一访问端口;——应对语义信息数据实施访问控制等安全措施,确保有权限的用户才能访问相关数据;——应单独存储,不影响原始数据;——因语义信息数据包含原始数据内容,语义信息数据的防护级别、防护手段应与原始数据相同;——当原始数据因使用需求下线、到达保存期限等原因删除时,语义信息数据应同步删除;——宜支持语义信息数据的脱敏展示;——应对语义信息数据进行备份并定期更新。6.2面向模型、软件、文档对象的语义集成6.2.1接口调用6.2.1.1通信方式作为语义化表达内容数据调用方,模型、软件、文档等应用场景对象应按照GB/TXXXXX—XXXX《标准语义知识库第2部分:数据接口要求》规定的接口要求向标准语义知识库发起接口调用请求、接受推送信息。发起接口调用请求时,应采用同步方式或者异步等待方式返回处理结果和状态。接受标准的更新提醒、标准化单元与过程提醒及标准语义信息同步更新等推送内容时,应向服务方返回确认信息。6.2.1.2接入与授权向被集成语义知识库建设方进行语义集成前应进行身份认证以获得授权。应设定合理的接口调用请求频率。6.2.1.3调用接口调用应符合6.1.1.3-6.1.1.7要求。6.2.2存储按需进行数据存储,数据存储应符合6.1.3要求。GB/TXXXXX—XXXX87集成后处置7.1集成评估7.1.1一般要求集成操作结束后,应按照GB/T36344《信息技术数据质量评价指标》规定的要求以及本文件8.1.2-8.1.6的规定对集成语义信息数据质量评估,即对定义的处理结果的进行验证及评估,将不满足要求的结果反馈给数据源修改后重新获取。7.1.2语义信息数据一致性语义信息数据的一致性应从缺失数据情况、遗漏的重要信息情况、错误数据情况等方面进行分析,保证集成数据在数据格式、数据结构、语义等方面的一致性以及与基础数据标识的一致性。7.1.3语义信息数据完整性集成的语义信息数据应数据完整,不存在空值,字段无缺失,维持对象本身数据完整性和不同对象之间约束数据完整性。7.1.4语义信息数据准确性集成的语义信息数据的内容、格式应正确,与其对应的客观实体的特征保持一致,确保数据的真实性和完整性,避免集成错误或误导性信息,保证集成数据的准确性。7.1.5语义信息数据时效性应确认数据更新频率与要求一致,时间戳准确无误,历史版本可追溯。7.1.6语义信息数据可拓展性为了一些特殊应用场景,集成的语义信息数据通过对象定义属性的增加进行下列扩展:——增加新的元数据元素;——增加新的元数据实体;——对现有元数据施加更严格的可选限制。7.2集成维护集成维护应符合以下要求:——建立正式的需求变更管理流程,对于新的或变更的需求导致需要更新语义信息数据集成标准的,应通过变更管理流程更新语义信息数据集成标准,保证语义信息数据集成标准与实际语义信息数据需求的一致性;——及时跟踪语义信息数据应用的运行情况,监控语义信息数据应用和语义信息数据需求的一致性,同时对提出的需求变更进行管理,确保设计和实施的一致性;——应制定语义知识库运行维护管理制度,配备管理人员,定期分析应用日志、数据库日志和等运行日志;——应开展定期的软件维护与接口维护。7.3追溯记录GB/TXXXXX—XXXX9针对语义信息数据在大型系统内流转,或组织机构内部不同系统内流转的情况,追溯记录的主要内容包括但不限于:a)面向数据库对象的语义集成过程中的标准内容语义化表达单元模型变更内容、数据融合前后标准内容语义化表达单元数据内容;b)面向模型、软件、文档对象的语义集成过程中的接口调用参数、访问路径、返回内容;c)访问的服务器IP、位置、所属组件、操作时间等;d)操作账号或操作人、操作接口。8数据安全数据安全应贯穿语义集成数据获取、传输、存储、使用、迁移及销毁各环节:a)数据获取应在语义信息产生时标记敏感度等级,并要求采集方向提供方明确告知去向及用途;b)数据传输应采用加密技术保障鉴别信息和各类语义数据的传输保密性,并具备检测和恢复数据完整性的能力;c)数据存储应提供安全的密码算法配置功能,实施磁盘保护或碎片化存储措施,建立完整性检测与告警机制,同时确保本地备份与恢复功能;d)数据使用应实施严格的访问授权与验证机制,限定数据在专用功能范围内使用;e)数据迁移应预先评估网络安全能力,制定完善的迁移方案与风险控制措施,并做好数据备份;f)数据销毁应建立审批监督机制,采用不可逆的销毁方式,并保留至少6个月的销毁日志。GB/TXXXXX—XXXX(资料性)标准语义知识库与污水处理厂软件语义集成示例污水处理厂希望控制系统实现PLC(可编程逻辑控制器)程序标准化,确保软件合规运行。本次集成属于非结构化的软件类对象与标准语义知识库进行语义集成,集成及应用主要过程有下列内容。a)按照5.1要求,进行需求分析。明确污水处理厂集成的主要目标是确保软件合规性,集成后的具体应用场景是获取PLC(可编程逻辑控制器)程序数据、对比数据是否在标准范围内,返回合规性检查结果,本次集成涉及污水处理厂的各个设施设备的规范要求,以及污水处理的各项指标要求,用户期望无需详细了解底层的控制逻辑和数据结构,可以通过语义查询来查询和控制软件,实现软件功能。b)按照5.2要求,识别应用场景对象的标准关联内容。以软件中的“水质监测”为例,识别到软件中“水质监测执行GB18918—2002《城镇污水处理厂污染物排放标准》”。因此,关联的通用类内容是“标准号”,“中文标准名称”、“标准状态”等;关联的专用类内容是规范类标准包含的“指标项”、“指标值”等。c)按照5.3要求,进行应用场景对象语义化表达单元模型构建。以“水质监测”为例,按照5.3.8规范类内容语义化表达单元模型要求,为识别的标准关联内容建立模型,包括“化学需氧量(COD)”、“生化需氧量(BOD5)”、“悬浮物(SS)”、“动植物油”等指标项,这些指标项还应包括指标值、取值范围、计量单位,例如“化学需氧量(COD)”指标项的指标值是“一级A标准不低于50mg/L,一级B标准不低于60mg/L,二级标准不低于100mg/L,三级标准不低于120mg/L。”,取值范围是“不低于”,计量单位是“mg/L”。d)按照5.4要求,同步标准语义知识库的语义化表达规则到本地知识库。e)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论