DB12∕T 1449-2025 电子公文数据智能化管理规范_第1页
DB12∕T 1449-2025 电子公文数据智能化管理规范_第2页
DB12∕T 1449-2025 电子公文数据智能化管理规范_第3页
DB12∕T 1449-2025 电子公文数据智能化管理规范_第4页
DB12∕T 1449-2025 电子公文数据智能化管理规范_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240.01

CCSL70

12

天津市地方标准

DB12/T1449—2025

电子公文数据智能化管理规范

Intelligentmanagementspecificationforelectronicofficialdocumentdata

2025-06-04发布2025-07-05实施

天津市市场监督管理委员会发布

DB12/T1449—2025

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

本文件由天津市人民政府办公厅提出并归口。

本文件起草单位:天津市人民政府办公厅。

本文件主要起草人:曹迎黎、贾文博、高丽慧、李磊、刘洋、王琪、张文婷。

1

DB12/T1449—2025

电子公文数据智能化管理规范

1范围

本文件规定了电子公文数据智能化管理的基本功能规范,包括资源管理要求、应用管理要求、安全

要求等。

本文件适用于机关、企事业单位、社会团体对于电子公文资源管理的规划、设计、开发、部署和应

用,建设单位可依据本规范对开发商提出建设要求。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T33190电子文件存储与交换格式版式文档

GB/T41867信息技术人工智能术语

3术语和定义

GB/T41867界定的以及下列术语和定义适用于本文件。

3.1

电子公文electronicofficialdocument

以数字形式存储于磁盘、光盘等媒体,依赖计算机系统阅读、处理并可在通信网络上传输的公文。

3.2

版式fixedlayout

将文字、图形、图像等多种数字内容对象按照一定规则进行版面固化呈现的一种格式。

3.3

人工智能artificialintelligence;AI

人工智能系统相关机制和应用的研究和开发。

4缩略语

下列缩略语适用于本文件。

OFD:开放版式文档(OpenFixedlayoutDocument)

AI:人工智能(ArtificialIntelligence)

OCR:光学字符识别(OpticalCharacterRecognition)

NLP:自然语言处理(NaturalLanguageProcessing)

5技术架构

5.1标准技术框架

2

DB12/T1449—2025

电子公文数据智能化管理规范基础资源依托于国产化软硬件,核心分为资源管理、应用服务和安全

要求,并且可以通过接口方式为各类业务系统提供文件搜索、智能写作、智能问答、智能对比、智能纠

错等方面赋能。详见图1标准技术框架图。

终端用户业务系统调用

标准安全支撑

领导办公人员社会公众协同办公系统(OA)……

规范体系用户体系

使用

版式软件流式软件检索服务目录服务推送服务

API接口

WEB端客户端标签服务校对服务……大语

格式安全言模

规范存储智能搜索智能阅读智能写作其他智能应用型

数据多维度检索智能阅读模板引用智能校对智能查重

关联阅读智能问答

应用以文搜文范文样例引用素材引用

公文借阅智能对比

......自然

标识安全…………智能成文…………

规范传输语言

处理

数据

目录管理元数据管理标签管理模板管理范文管理敏感词管理素材管理

管理

归档安全

知识

规范阅读数据基础信息库目录信息库元数据库共享资源库业务过程库模板库基础样本库

存储图谱

非结构化数据结构化数据

数据采集标准化处理

元数安全

据规电子文件采集纸质件采集标准格式转换公文元数据提取

外发版式

范数据第三方数据接入数据质量检测公文合规性检测智能文字识别

处理

采集……

数据接入实时同步定时同步离线上传OCR

……

基础资源国产计算资源国产操作系统国产存储资源国产网络资源国产安全设备

图1标准技术框架图

5.2标准功能结构

电子公文数据智能化管理规范功能结构主要分为资源管理要求、应用管理要求和安全要求,详见图

2标准功能结构图。

数据采集

资源管理要求数据存储

数据管理

智能搜索

智能查重

智能问答

应用管理要求智能阅读

电子公文数据智能化管理

智能写作

智能对比

终端联动

存储安全

文档使用安全

安全要求

文档传输安全

系统安全

图2标准功能结构图

3

DB12/T1449—2025

6资源管理要求

6.1数据采集

6.1.1电子文件采集

电子文件采集通过实时传输、定时同步两种方式获取业务系统增量数据,离线上传采用手动

上传方式获取历史数据与个人终端数据。

电子文件数据采集过程中检测电子文件格式是否满足GB/T33190格式要求,对不符合格式要

求的电子文件统一格式转换。

应包含表1中列出的功能。

表1电子文件采集功能

序号功能指标功能要求约束

采用手动上传方式,选择目标文件(单个文件/含有目录结构的文

1文档上传必选

件夹)上传

非可视化界面操作,通过系统配置,对接第三方系统,进行实时

2自动采集必选

同步或定时采集数据

通过页签筛选不同入库状态,并可根据各个文档详细处理状态进

3文档列表必选

行相应操作

对非OFD格式的文件进行格式转化,包括pdf、doc、docx、wps、

4格式转换必选

jpg、jpeg、png、bmp、tif、tiff、xls、xlsx等

6.1.2纸质件采集

纸质件采集,纸质件扫描为图片后利用OCR技术完成文字识别,采用标准化处理技术获取文

件中元数据、关键词、标签等信息。

纸质件材料在数字化过程中,应根据GB/T33190格式要求统一格式转换。

应包含表2中列出的功能。

表2纸质件采集功能

序号功能指标功能要求约束

自动识别文件格式(JPG/JPEG/PNG/BMP/单层OFD/单层PDF),并

1OCR调用智能文字识别引擎进行文字识别,保存为三层OFD文件进行必选

入库

扫描后的纸质件标准化处理,并自动获取文件关键词及元数据等

2标准化处理必选

信息

3格式转换扫描后图片格式文件统一转换为OFD版式格式必选

6.1.3第三方数据接入

第三方数据采用线下数据包导入方式,利用标准化处理技术提取元数据、关键词、标签等信

息,并按照GB/T33190格式要求统一格式转换。

应包含表3中列出的功能。

4

DB12/T1449—2025

表3第三方数据接入功能

序号功能指标功能要求约束

手动上传方式,选择目标文件(单个文件/含有目录结构的文件夹)

1文档上传必选

上传

2标准化处理自动获取文件关键词及元数据等信息,并转换识别为双层OFD格式必选

6.1.4数据质量检测

对采集的电子文件进行质量检测,预先排查并提供检测报告。检测包括:1)合规性检测:检

测电子公文是否为OFD格式,是否为合规的OFD文件;2)真实性检测:检测签名、签章是否完整,是

否有效;3)完整性检测:检测核心元数据是否完整,元数据是否具有连续编号;4)可用性检测:元数

据是否可以正常访问,内容是否可正常打开。

应包含表4中列出的功能。

表4数据质量检测功能

序号功能指标功能要求约束

1质量检测对采集的电子文件进行检测,检测通过后方可入库必选

针对检测异常的电子文件,进行人工处理,如添加元数据、标签

2人工处理必选

6.2数据存储

6.2.1结构化数据存储

自动提取电子文件的元数据、标签、关键词等信息,针对内容分词、分段、分句,以多维结

构化方式进行结构化存储。

应包含表5中列出的功能。

表5结构化数据存储功能

序号功能指标功能要求约束

1结构化数据存储非可视化界面操作,由研发通过代码配置必选

6.2.2非结构数据存储

通过数据采集的电子文件以及扫描件格式文件,采用标准化处理后以OFD格式进行存储。

应包含表6中列出的功能。

表6非结构化数据存储功能

序号功能指标功能要求约束

1非结构化数据存储非可视化界面操作,文件上传后会根据设置规则分级分类存储必选

6.2.3分库存储

分库存储,一个原文库+N个主题库,主题库包括:基础信息库、目录信息库、元数据库、共

享资源库、业务过程库、模板库、样本库等。

5

DB12/T1449—2025

应包含表7中列出的功能。

表7分库存储功能

序号功能指标功能要求约束

1新建库支持添加主题库、专题库、部门库、个人库等功能必选

2库权限管理设置库范围内文档的前台查看、复制、打印、下载等权限必选

3展示文库列表展示已有文库名称、类型、所有者必选

4库重命名对文库名称进行修改必选

5转移所有权设置文库负责人必选

6安全设置设置文库脱敏规则、是否开启水印必选

7是否前台展示设置文库是否在前台展示可选

8删除删除库,仅允许删除空库必选

设置前台可展示哪些文库检索条件,包括:分类标签、文档类型、

9库的检索条件配置必选

目录等

6.3数据管理

6.3.1目录管理

目录管理,新建、管理(包括权限范围内的修改、删除、重命名、权限设定等)个别类目及

其子类,按层级组织方式组织分类,不限制分类方案的层级数目。

应包含表8中列出的功能。

表8目录管理功能

序号功能指标功能要求约束

1新建目录在指定文库下创建目录必选

2新建子目录创建子目录必选

3移动目录调整目录/子目录位置必选

4删除目录删除目录,仅允许删除空目录必选

5设置目录权限设置该目录范围内文档的前台查看、复制、打印、下载等权限必选

6目录重命名对目录名称进行修改必选

7子目录重命名对子目录名称进行修改必选

8下载下载目录下的所有文档必选

6.3.2元数据管理

元数据管理,元数据分为核心元数据与扩展元数据,元数据管理包括自动识别、采集、解析、

分类、存储、维护(修改、更新、删除)、备份恢复、批量导入导出以及元数据与文件类型的配置管理。

应包含表9中列出的功能。

6

DB12/T1449—2025

表9元数据管理功能

序号功能指标功能要求约束

1新增元数据新增元数据,或从已有元数据中关联必选

2编辑元数据修改元数据相关信息必选

3删除元数据删除该元数据,同时解除该元数据在元数据类型中的关联必选

4导入元数据通过导入数据表格批量新增元数据可选

5导出元数据通过表格导出当前选择类型中的全部元数据可选

6.3.3标签管理

标签管理,标签可分为3类:基础标签、组合标签、业务标签。在实际的分类定义中,支持

自定义扩展分类,分类定义有:要素分类、业务分类、专题分类、应用分类等。

应包含表10中列出的功能。

表10标签管理功能

序号功能指标功能要求约束

按标签类别展示分类标签,支持查看标签的子分类;支持分类名

1标签列表必选

称检索;支持对分类标签操作,包括新建子分类、重命名、删除

2新建分类新建分类标签必选

3重命名分类标签对分类名称进行修改必选

4新建子分类在选择上级分类下新建子分类必选

5删除分类标签将分类标签及分类下子分类一并删除必选

6导入分类标签通过导入数据表格批量新建分类标签可选

7导出分类标签通过表格导出当前列表全部标签可选

6.3.4模板管理

模板管理分为预置模板与自定义模板。

应包含表11中列出的功能。

表11模板管理功能

序号功能指标功能要求约束

1查看模板点击某个模板,查看模板样式及内容必选

2选择公文类型点击选择行政公文或事务公文,展示相应的公文模板必选

3插入/应用模板将公文模板插入到正文中,进行套版写作必选

4下载模板支持将模板下载至本地必选

6.3.5范文管理

7

DB12/T1449—2025

范文管理,数据采集过程中进行收集、分类、整理,通过自定义分类上传保持范文样例的规

范性、可靠性与实时性。

应包含表12中列出的功能。

表12范文管理功能

序号功能指标功能要求约束

在后台自定义创建范文子分类,支持上传、下载、移动和删除范

1自定义分类上传必选

文样例文件

2关键词搜索根据输入的关键词进行搜索匹配必选

3筛选支持选择筛选范围,对应显示符合的范文必选

4重置点击重置可清空筛选项,恢复到默认全部选中状态必选

5查看范文原文点击某个标题后可以浏览范文内容必选

6.3.6敏感词管理

包括敏感词管理与敏感词设置,敏感词管理对敏感词进行查看、添加、修改与删除的维护,

敏感词设置对适用范围、文件类型、处理方式进行配置与管理。

应包含表13中列出的功能。

表13敏感词管理功能

序号功能指标功能要求约束

以敏感词类型为维度展示敏感词列表,支持对列表中的具体敏感

1敏感词类型列表必选

词类型操作,包括:编辑、删除,支持按条件检索敏感词类型

2新增敏感词类型新增敏感词类型必选

3编辑敏感词类型修改敏感词类型名称必选

4删除敏感词类型删除敏感词类型(删除将导致相关内容脱敏失效)必选

5添加敏感词在对应敏感词类型下添加新的敏感词必选

6编辑敏感词编辑某敏感词类型下的敏感词必选

7删除敏感词删除某敏感词类型下的敏感词必选

8批量导入敏感词通过导入数据表格批量新增敏感词及所属敏感词类型必选

6.3.7素材管理

素材管理,允许添加素材、删除素材,针对素材添加标签。

应包含表14中列出的功能。

表14素材管理功能

序号功能指标功能要求约束

1添加素材添加素材必选

2删除素材删除素材必选

8

DB12/T1449—2025

3素材标签管理指定素材分类及标签必选

7应用管理要求

7.1智能搜索

7.1.1多维度检索

多维度检索,检索维度包括:文件类型、文件主题、文件时间(起草时间、发布时间等)、紧急程

度等。

7.1.2以文搜文

以文搜文,采用NLP技术分析文档内容,利用AI技术查询相似文件。

7.2智能查重

7.2.1智能查重,通过自然语言处理和语义理解技术进行文件内容查重。

7.2.2应包含但不限于表15中列出的功能。

表15智能查重功能

序号功能指标功能要求约束

1上传文档上传本地文档必选

2选择范围支持指定文库、主题和时间范围进行智能查重必选

3重复率显示重复率数据必选

4查重结果列表显示查重结果列表,包括重复率、原文标题、重复内容必选

5筛选重复率根据筛选重复率对应显示重复段落必选

6查看相似文档原文在查重结果列表中点击标题即可查看原文必选

7.3智能问答

7.3.1智能问答利用AI技术与NLP技术,根据问题的语境和意图提供准确、全面的答案。

7.3.2可包含但不限于表16中列出的功能。

表16智能问答功能

序号功能指标功能要求约束

1推荐问题点击某一个预置推荐问题,触发指令,系统进行回答可选

2自主发问在下方输入框输入内容进行提问,系统进行回答可选

点击新主题图标,即清空上方所有问题及回答,重新开始,保留

3清空可选

推荐语

4插入支持将生成结果插入到在线编辑的文档中可选

5复制复制回答内容,同时支持快捷键ctrl+c复制可选

7.4智能阅读

9

DB12/T1449—2025

7.4.1智能阅读

智能阅读,通过AI技术与NLP技术分析与理解文件内容形成摘要、元数据、附件、关键词、

高频词、标签、系列文件、相关文件等信息。

应包含但不限于表17中列出的功能。

表17智能阅读功能

序号功能指标功能要求约束

支持在线阅读文档,支持翻页、放大缩小、旋转、切换视图等,

1在线阅读必选

可收藏文档到个人收藏夹,根据权限也可进行下载和打印

2文档信息支持展示该文档的各类元数据信息列表必选

3附件查看支持公文中含有附件,可展示并通过浏览器直接查看或下载必选

7.4.2关联阅读

关联阅读,通过AI技术与NLP技术分析与理解文件内容利用知识关联,快速关联人名/地名/

机构名/文件/会议/专业术语等内容。

应包含表18中列出的功能。

表18关联阅读功能

序号功能指标功能要求约束

1知识提取支持展示该文档包含的机构、人物、事件等的实体信息必选

2相关文档支持展示与该文档相关的文档列表必选

3系列文件展示该文档相关的系列文件,若无则不展示可选

7.4.3公文借阅

公文借阅包含借阅申请、借阅审批、借阅管理、文件归还与借阅查询。

应包含表19中列出的功能。

表19文档借阅功能

序号功能指标功能要求约束

支持对无权限查看的文档提交借阅申请,应包含借阅申请、借阅

1提交借阅申请必选

审批、借阅管理、文件归还与借阅查询等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论