




已阅读5页,还剩94页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
金税三期工程 金税三期工程 数据架构蓝图设计方案 v1.0 汇报人:总体规划设计项目组 1 金税三期工程 目 录 1、概述 2、数据分布 3、数据交换与共享 4、元数据 5、数据治理 6、通用数据标准 2 金税三期工程 数据架构的目标 p以科学的信息资源观和规划理念,基于合理设计 的应用系统的体系结构,并以信息利用能力为目标 ,构建全局化、规范、统一的数据架构,提高应用 系统运行性能,提升税收数据的分析利用价值 信息资源(information resources)与人、财、物资源一样,都是企业的重要资源, 3 金税三期工程 1.功能性:满足当前应用的需要。 2.灵活性:适应应用功能在一定范围内的调整和扩展。 3.长期性:业务数据一旦形成,保证在后续任意时段的可利用。 4.前瞻性:为后续新业务提供支持。 5.增值性:服务社会,服务国民经济。 数据架构规划原则 增值性 前瞻性 功能性 灵活性 长期性 数据架构规划 4 金税三期工程 数据架构定位 1、数据架构位于应用架构和基础技术架构之间,承上启下。 2、应用架构的输出,是数据架构重要、核心的输入;数据架构规 划是应用架构落地过程中的重要支撑。 3、数据架构中数据逻辑 分布尽量遵从于业务 架构和应用分布。 4、数据架构中的数据物理分布是从技术视 角看逻辑 分布,结合数 据库技术、灾备等,给出相应的规划方案。 5、数据物理分布中的技术发 展可能带来数据逻辑 分布的优化,从 而促进应 用架构的完善和改进。 5 金税三期工程 架构规划内容 数据架构规划的关键内容包括数据分类、数据逻辑分布、数据物理分布、数据共享交 换、数据治理、数据标准 数据架构规划内容 n数据分类 从多个角度包括业务、数据生命周期和数据本 身特点对税收产生的数据进行分类,从而分数 据的分布夯实基础; n数据逻辑分布 从逻辑的角度对业务环节产生的数据进行合理 的规划; n数据物理分布 基于逻辑分布和应用架构的划分,从技术的角 度对数据的落地进行详细的规划、分析和合理 布局,支撑应用落地和解决全国大集中性能问 题; 数据交换共享 从总局与外部,总局与省局,总局内部各部门 间出发,规划数据交换共享的机制和内容 数据治理 从数据的生命周期管理、数据质量管理和数据 安全三面进行规划; 数据标准 简单规划数据标准内容体系; 6 金税三期工程 工作思路 7 金税三期工程 现状分析 p缺乏统一的规划,多以迅速实现功能为主要目的,缺乏从全局的考虑,造成了 数据孤岛、多头采集、业务数据分散、标准不一等问题。 p数据达不到全面性、规范性、一致性的要求,降低了内部管理的效率,不能为 决策分析提供严谨、全面、细致的数据基础; p数据的实时监控能力不强,缺乏掌握全面、及时信息的渠道,无法满足“信息 管税”的业务发展趋势,缺少对全国数据的高效利用、业务集成度要求不断提高 的支持。 8 金税三期工程 数据架构的需求 1.全国国地税税收生产数据在总局集中存储和处理,生产数据的第 一次落地点在总局。 2.满足应用系统间的松耦合性,实现应用系统间的故障隔离。 3.建立数据共享、交换的机制,明确数据内容,保障数据的时效性 。 4.建立数据全生命周期管理机制,保证系统持续稳定高效地运行。 5.建立完备的数据仓库体系,为面向管理决策的应用奠定基础。 9 金税三期工程 目 录 1、概述 2、数据分布 3、数据交换与共享 4、元数据 5、数据治理 6、通用数据标准 10 金税三期工程 目 录 p数据分布 数据分类 数据分布内容 典型场景 11 金税三期工程 p 按业务环节进行分类 数据分类方式 数据分类 税务数据分类就是满足各种数据对数据组织的要求,并独立于具 体的数据模型和数据分布 p 按生命周期进行分类 p 按数据结构进行分类 12 金税三期工程 举例:按业务环节进行分类 业务环节数据子类数据内容描述 税务登记法人基本信息法人的基本信息、状态和关系 税务认 定税(费)核定信息纳税人应纳 税(费)的税(费)种、税(费)目、税(费)率、征期类型、申报期 限、纳税(费)期限、征收方式、预算科目、预算级次、金库名称等信息 税收优惠优惠信息纳税人享受的各类优 惠信息,包括减(抵)免税、税前扣除、增值税即征即退等信 息 发票税务机关进销 存信息税务机关的库存信息,包括发票计划、入库、调拨 、核销等信息 凭证信息发票计划表、发票出入库单 等 申报申报信息各种申报记录 ,包括自行申报、委托代征申报、代扣代缴申报、个人所得税申报等 征收应征信息应该 征收的税费信息 计会统税收计划信息各类税收收入、规费 收入计划明细 税务稽查稽查案件信息税务稽查案源、案件的基本信息 法制违章类文书责令限期改正通知书等 评估审计过程信息纳税评估流程数据、国际情报交换流程数据、特别纳 税调整流程数据、纳税人纳税 信誉等级认 定流程数据 纳税服务拓展业务 信息通过纳 税服务渠道向纳税人采集的民意调查 、服务评 价、投诉举报 等信息 外部门交换外部门信息从银监 会、组织 机构代码中心、工商、公安、统计 、海关、国库、银行等外部门交 换到税务系统的业务 数据,包括税款上解入库信息、企业财务报 表、企业银 行账号 、组织 机构代码、工商登记、海关报关单等信息 ca认证身份认证 信息内外部业务 工作平台对税务人员和纳税人进行身份认证 所需的各类信息 决策支持分析主题数据按照各个分析主题进 行组织 的业务 数据 13 金税三期工程 举例:按生命周期进行分类 生命周期数据子类数据内容描述 渠道数据 身份认证 信息 内外部业务 工作平台对税务人员和纳税人进行身份认证 所需的各类信 息 比对差异信息税务系统与外部门数据进行比对后产生的差异信息 生产数据 法人基本信息法人的基本信息、状态和关系 自然人基本信息自然人的基本信息、状态和关系 扣缴义务 人信息扣缴义务 人的基本登记信息 税务机关进销 存信息税务机关的库存信息,包括发票计划、入库、调拨 、核销等信息 统一视图 基于税务整体企业级 数据模型组织 后的细粒度业务 数据,并按照(法人、自然人、发票、风险 、税务机构、法规、第三方信息等领域)梳理并整合成统一的数据视图 管理决策 分析数据 分析主题数据按照各个分析主题进 行组织 的业务 数据 指标维 度数据 用于数据分析的各类指标和维度数据,包括税源分析指标、征管质量与数 据质量分析指标、成本分析指标、社会满意度分析指标等 税源分析汇总 数据 包括收入分析、宏观税源分析、微观税收分析、重点税源分析、税收收 入趋势 分析、税源管理能力平均分析等。 报表数据 税务系统产 生的各类涉税报表数据,包括税收征管、流转税、所得税、 计会统、国际税收、税收法制、税务稽查、出口退税等9类报 表的明细 数据 历史数据 在线历 史数据征管操作数据的在线历 史库 离线归 档数据按归档年限进行归档的各类业务 明细数据和统计 数据 14 金税三期工程 举例:按数据结构进行分类 生命周期数据子类数据内容描述 结构化数据业务 数据存储在关系数据库中的各类 生产数据和分析数据 非结构化数据xml凭证按xml结构保存的各类文书 凭证信息 影像资料通过影像设备 采集的各类 文书凭证的影像信息 内外网站多媒体资料包括pdf文件、图片、语音 、视频 ,地理信息等 15 金税三期工程 目 录 p数据分布 数据分类 数据分布内容 典型场景 16 金税三期工程 p分析应用系统划分、各个应用系统的特性 p分析应用系统之间的数据关系 p结合数据分类,将数据划为不同的数据存储集合 ,形成数据的合理分布架构 数据分布 数据分布 数据的物理分布 数据的逻辑分布 17 金税三期工程 数据逻辑分布原则 p当期数据与历史数据分离 p操作数据与查询数据分离,减少生产系统压力 p生产数据与分析数据按不同的数据组织方式分离 p体现数据的生命周期管理需求:数据的产生、数据的采集 、数据的加工,数据的利用和数据的归档几个阶段 18 金税三期工程 数据逻辑分布框架图 19 金税三期工程 数据逻辑分布框架图 记录当期业务活动 发生过程和结果的 数据 包括与当期操作数据的同构但保留更 长时间的数据、实时查询统计和报表 所需辅助数据、税源管理数据、按各 省清分后的数据 通过影像设备采集的各类文 书凭证的影像信息和在业务 环节中采集或生成的原始业 务凭证资料电子明细信息 具有高业务价值 、跨各业务域被 共享使用的核心 数据 面向业务 主题、集 成的、历 史的细粒 度数据 面向管理决策分析主 题、集成的、历史的 、按多个维度深度加 工的数据 包括在线操作历 史数据、脱机存 放的历史数据 描述流程、信息和对象的数据, 涉及数据的技术属性、业务定义 以及操作特征 20 金税三期工程 术语说明 p 生产数据: n 当期操作数据:记录当期业务活动发生过程和结果的数据; n 近期操作数据:包括与当期操作数据同构但保留更长时间的数据、实时查 询统计和报表所需辅助数据、税源管理数据、按各省清分后的数据; n 主数据:具有高业务价值、跨各业务域被共享使用的核心数据; n 凭证数据:在业务环节中采集或生成的原始业务凭证资料电子明细信息; n 影像数据:通过影像设备采集的各类文书凭证的影像信息; p 分析型数据: n 统一视图:面向业务主题、集成的、历史的细粒度数据; n 管理决策分析数据:面向管理决策分析主题、集成的、历史的、按多个维 度深度加工的数据; p 历史数据:包括在线操作历史数据、脱机存放的历史数据; p 元数据:描述数据的数据,即描述流程、信息和对象的数据。涉及数 据的技术属性、业务定义以及操作特征 21 金税三期工程 数据逻辑分布图 22 金税三期工程 逻辑分布数据内容描述 组成子类具体内容 渠道数据 外部交换数据 税库银数据、出口退税报关数据、组织机构代码数 据 纳税服务数据 网上税局、12366、企业端、自助终端、纳税人关系 管理 内部系统管理数据涉税数据、税务人员身份以及权限数据 征管生产数据 当期征管操作数据登记、申报、征收、发票、票证、稽查法制 凭证影像数据登记表、申报表、出口退税申请表、影像资料等 主数据纳税人基本信息、纳税人公共状态、代码数据 近期征管操作数据 包括与当期操作数据同构但保留更长时间 的数据、 实时查询统计 和报表所需辅助数据、风险处 理数据 、 按各省清分后的数据 管理决策数据 统一视图 法人、自然人、税务机关、大企业、发票、财产、 外部信息、知识库 管理决策分析数据数据仓库数据、数据集市数据 历史数据 在线历史数据 征管生产数据在一定规则下迁移成历史业务明细数 据 离线归档数据历史业务明细数据在一定规则下迁移成归档数据 23 金税三期工程 数据物理分布原则 p 生产数据和分析数据分离 p 结构化数据和非结构化数据分离 p 不同生命周期的数据分别存放 p 数据大集中的性能分担 降低当期交易数据库的数据量 根据业务内聚性,同一业务域的数据尽量放在同一库中 满足业务操作的同时,平衡数据查询的代价 在分的同时,平衡数据交换和共享的代价 在合的同时,平衡应用分包管理的复杂度 24 金税三期工程 物理分布设计的关注点 1.数据的生命周期,与各层的对应 2.如何保障申报征收/发票业务的效率,满足高并发性 3.查询效率如何解决 4.在数据共享和交换时,如何保证业务的连续性,解决应用系统 间的故障隔离问题 5.如何解决省局决策分析和其他增值业务的数据获取、使用的问 题。 6.与数据模型、数据标准的关系,支持度如何 7.关键点的技术考虑,产品选型的风险 25 金税三期工程 数据物理分布总图 etl 26 金税三期工程 数据物理分布总图 27 金税三期工程 数据物理分布总图 28 金税三期工程 数据物理分布总图 29 金税三期工程 数据物理分布总图 主数据 管理 30 金税三期工程 主数据管理内容 税务主数据是指纳税人基本信息、纳税人公共状态信息等税务核心业务实体的 数据,这些信息一般被多个应用系统共享使用。借鉴应用划分的u/c矩阵方法 ,以征管业务操作平台为例,如下表所示: 通过上面的分析我们得出,金税三期主数据为: 纳税人基本信息:纳税人识别号、纳税人名称、登记注册类型等; 纳税人基础状态信息:纳税人登记状态、增值税一般纳税人资格、纳税人信用等级、 防伪税控纳税人资格、出口退税纳税人资格、是否具有其它资格、定期定额征收、减免 优惠标志、稽查案件未结、违法违章未处理等 ; 代码 31 金税三期工程 主数据管理方案 如图所示,各系统间已与主数据库建 立发布和订阅的实时数据同步。 1. 某个业务系统触发对主数据的改动 ; 2. 主数据管理系统将整合之后完整、 准确的主数据分发给所有有关的应 用系统; 3. 任何系统在主数据库改动纳税人信 息等主数据后,主数据库向其它系 统传递新的纳税人信息等主数据。 所有数据更新在实时的情况下进行 。 4. 新的应用系统可以直接使用主数据 库,获取完整全面的纳税人基本信 息等主数据。并可以在主数据库中 直接添加、修改数据,通过发布和 订阅把修改数据传递给其它系统 5. 各系统间的纳税人基本信息等主数 据实时地同步,保证了数据的完整 和一致 32 金税三期工程 数据物理分布-核心生产库说明 33 金税三期工程 数据物理分布-核心生产库说明 34 金税三期工程 数据物理分布-核心生产库说明 35 金税三期工程 数据物理分布-核心生产库说明 36 金税三期工程 数据物理分布-核心生产库说明 37 金税三期工程 征管生产数据库群(一) p 属前台生产数据,通过各种渠道从纳税人处采集,包括相关流程数据,覆盖税务登记 、认定、优惠、申报、征收、发票内外部管理、个税等业务环节; p 业务环节中产生的各类凭证,独立存储在凭证库中; p 面向增、删、改类型操作,特点为数据量大,增长快,交易并发量高,访问更新频繁 ,事务小,需要实时响应; p 支持纳税人管理、申报征收、发票管理应用; p 申报征收库当前设计是一个库,后续将根据大集中试运行后的性能状况决定是否按区 域分库,最小单位为省。 38 金税三期工程 征管生产数据库群(二) p 后台生产数据,主要由税务人员在处理风险类业务时采集,以流程类数据为 主,覆盖评估审计、纳税人信用等级、稽查、法制等业务环节; p 业务环节中产生的各类凭证,独立存储在凭证库中; p 面向增、删、改类型操作,特点为数据量小,增长缓慢,访问更新频度低; p 支持纳税评估、稽查、法制应用; 39 金税三期工程 征管应用数据库群(三) p 以会计账务数据为主,数据量很大,增长快,访问更新频度低; p 业务环节中产生的各类凭证,独立存储在凭证库中; p 支持税收会计核算应用; 40 金税三期工程 p 存储的数据包括: n 同征管操作数据保持同结构、保留时间较长的数据,征管操作数据实时复制而得 n 税源管理数据 n 实时查询辅助数据,如报表基础数据、统计基础数据等 n 按省局清分的数据 p 分担操作数据库的查询、统计业务,减少操作型数据库压力 n 实时性要求不高的定制报表 n 实时跨系统查询统计 n 应用系统和跨系统大数据量的批量计算 近期征管操作数据库 41 金税三期工程 征管操作-凭证处理 p 凭证是进行税务活动时需要使用或产生的各类单证信息 p 凭证信息分为后续税务活动需要频繁访问的关键业务数据和使用频度低的其它数据 p 关键业务数据以结构化进行存储,同时全部凭证信息以xml格式存储在凭证库 p 凭证库中的信息需要定时抽取到近期操作数据库中,并解析为结构化数据 p 近期操作数据库中的结构化凭证数据定时抽取到统一视图 42 金税三期工程 数据物理分布总图-分析型数据说明 43 金税三期工程 分析主题 纳税人分布主题 申报征收主题 企业经营主题案件稽查主题 公 共 维 度 主题私有维度 n+x+y个月的统一视图 星型模型 外部信息交换数据 风险业务模型 风险评分模型 风险分析模型 分类业务模型 纳税人分类模型 类群分析模型 管 理 决 策 数 据 仓 库 生 产 数 据 其它业务模型 税收预测模型 指标关联性模型 规则业务模型 税收业务指标 风险、信用指标 x+y个月征管应用数据库 影像凭证资料库网络发票数据库 各渠道应用数据库 省级遗留系统系统数据库 法人数据 管理认定数据发票业务数据 违法违章数据信用评定数据 申报缴款数据 风险评估数据 自然人数据 基本信息数据家庭关系数据 财产数据信用评定数据 收入数据 风险评估数据 经营信息 税务机关 纳税人分布税收收入分布 出口退税重点税源 一般纳税人情况 比对信息 数据字典业务指标字典分析维度字典etl流程数据数据生命周期数据指标/维度映射数据元数据 政策数据法规数据业务经验数据 业务指标数据分析算法数据 标准数据 挖掘算法数据 财产 财产内容财产分布财产流动 发票 系统管理外部信息 发票生命周期发票票面信息发票加密信息 知识库 总局分析型数据 查询统计 管理决策数据集市(共享数据逻辑汇总应用个性数据) 征管状况 分析 报表管理绩效管理风险管理政策管理知识管理 44 金税三期工程 管理决策数据与应用架构关系 p整体设计思想 基础数据共享,一数多用,以数据规划视角,物理集中存储在 统一视图和数据仓库中; 应用的个性化数据,物理单独存放在数据集市中,并且用逻辑 视图汇总应用所需基础共享数据; 查询统计 管理决策数据集市(共享数据逻辑汇总应用个性数据) 征管状况 分析 报表管理绩效管理风险管理政策管理知识管理 45 金税三期工程 查询统计逻辑视图 自然人视图法人视图税务机关视图 决策应用与决策数据的对应 征管状况分析逻辑视图 税务机关视图数据仓库分析主题 报表管理逻辑视图 税务机关视图 绩效管理逻辑视图 系统管理视图数据仓库绩效模型 风险管理逻辑视图 数据仓库风险模型法人视图税务机关视图 税务机关视图 逻辑视图 自然视图 逻辑视图 系统产生数据 数据仓库风险模型知识库视图业务规则模型 政策管理逻辑视图 逻辑视图 知识库视图 知识管理逻辑视图 视图深加工产生数据 系统产生数据视图深加工产生数据 系统产生数据视图深加工产生数据 系统产生数据视图深加工产生数据 数据仓库标准数据 数据仓库其他业务模型 数据集市的数据内容 46 金税三期工程 关注焦点问题-查询 47 金税三期工程 应用逻辑架构 48 金税三期工程 数据物理分布与应用的对应 49 金税三期工程 数据物理分布与应用的对应 行政办公平台 征管业务处理平台 纳税人管理、个人明细管理、申报征收 发票管理、核算、评估审计、稽查、法制 外部统一交换纳税服务平台、统一门户 纳税服务平台和统一门户 管理决策平台 50 金税三期工程 渠道数据库与子系统对应关系 总局 外部 应用 业务 数据 库 总局 内部 中心 数据 库 总局 纳税 人ia 中心 数据 库 总局内 网网站 数据库 总局 内网 平台 系统 数据 库 总局 外网 网站 数据 库 总局外 部应用 平台和 前置系 统数据 库 税库 银系 统数 据库 总局与 工商等 外部门 信息交 换数据 库 省局 工商 交换 数据 省局 内网 平台 系统 数据 库 省局 内部 中心 数据 库 省局纳 税人i 中心 数据库 呼叫中心 大厅 短信 内部门户 网站 前置受理 身份认证 数据集成 税库银 外部门交 换 网上税局 业务工作 门户 应用集成 自助终端 数 据 库子 系 统 51 金税三期工程 生产数据库与子系统对应关系 纳税人管 理数据库 申报征收 数据库 自然人个 税数据库 发票数据 库 网络发票 数据库 计会统数 据库 评估审计 数据库 稽查数据 库 法制数据 库 行政办公 数据库 纳税人管 理子系统 申报征收 子系统 发票管理 子系统 计划 会计 评估审计 子系统 稽查子系 统 法制子系 统 综合办公 人事管理 财务管理 纪检检查 数据库 子系统 52 金税三期工程 目 录 p数据分布 数据分类 数据分布内容 关键流程 53 金税三期工程 关键流程-税务登记 54 金税三期工程 关键流程-涉税审批 55 金税三期工程 关键流程-记帐 56 金税三期工程 关键流程 57 金税三期工程 关键流程 58 金税三期工程 关键流程 59 金税三期工程 关键流程-凭证 60 金税三期工程 目 录 1、概述 2、数据分布 3、数据交换与共享 4、元数据 5、数据治理 6、通用数据标准 61 金税三期工程 数据交换与共享策略 p 主数据共享采取推送(订阅)方式,保持数据的实时性、一致性; p 征管核心数据库间共享采取推送(订阅)或服务调用方式,对于交 互频繁、数据量大的采取推送方式(采用数据库复制技术),对于数据量 较小的采取服务方式。 p 从生产数据采取etl方式抽取到统一视图中 p 总局到省局数据下发(主数据除外)建议采取etl方式 62 金税三期工程 数据交换与共享示意图 63 金税三期工程 数据物理分布总图-核心库间数据关系 核心交易库 的数据共享 64 金税三期工程 数据物理分布总图-核心库间数据关系 核心交易库 的数据共享 65 金税三期工程 数据物理分布总图-核心库间数据关系 核心交易库 的数据共享 66 金税三期工程 总局数据交换与共享概览 67 金税三期工程 外部门统一交换 外部门统一交换实现税务机关和其他政府部门之间实现数据共享和数据交换。 主要包括财政、银行、国库、工商、技监、海关、外汇管理、公安、统计、劳动 和社会保障、邮政、民政、国土管理、房产、法院等政府部门。 两级交换:总局一级和省局一级。 系统包括:外部信息交换系统和税库银系统。 系统平台部署 外部信息交换 系统 外部统一交换平 台 总局/省 局 税库银系统 外部统一交换平 台 总局 68 金税三期工程 外部门统一交换 基 于 消 息 中 间 件 的 数 据 传 输 69 金税三期工程 税库银(税银) 70 金税三期工程 外部信息交换 71 金税三期工程 总局与省局 数据下发(总局到各省) 总局下发支撑生产数据 总局下发支撑决策数据 数据集中(各省到总局) 省局遗留系统数据和自有系统数据(如果总局需要) 省局交换的第三方数据(如果总局需要) 技术平台部署 数据库复制数据集成平台总局 etl/elt数据集成平台总局 基于消息中间件数据集成平台 总局/省 局 72 金税三期工程 征管数据清分下发 73 金税三期工程 主数据清分下发 主数据:代码、纳税人基本信息、纳税人基本状态 74 金税三期工程 总局与省局 75 金税三期工程 总局与省局 源数据库目标数据库传输 数据内容传输 方式传输频 度 备 注 总局纳税人ia中心 数据库 省局纳税人ia分中心数 据库 单省的纳税人外网身份认证 和 信息 ldap清分准实时清 分 总局ia中心数据库省局ia中心数据库单省的操作人员的身份认证 和 信息 ldap清分准实时清 分 总局纳税人管理数 据库(n个月) 省局主数据库单省的纳税人基本信息和代码 信息 数据库复制准实时清 分 总局近期征管操作 数据库() 省局征管应用业务 操作 数据库 单省的总局应用大集中的征管 业务 各环节 数据。 etl或者数据库复制 或者文件方式 每n小时/ 每天 清 分 总局影像库省局影像库单省的纳税人外网办理涉税事 宜时,提供的影像资料。 每n小时/ 每天 清 分 总局n+x+y个月的 统一视图 省局统一视图 和管理决 策数据库 单省的总局统一加工的分析结 果数据。 或者文件方式每天清 分 管理决策数据仓库省局统一视图 和管理决 策数据库 单省的总局统一加工的分析结 果数据。 或者文件方式每天清 分 总局凭证库省局凭证暂 存库单省的纳税人凭证暂 存数据。基于消息中间件每n小时/ 每天 集 中 省局工商交换数据总局与工商、公安、统 计、海关等外部们信息 交换数据 省一级交换的外部门数据,包 括工商等。 基于消息中间件每n小时/ 每天 集 中 省局增值税防伪税 控库(遗留) 总局增值税防伪税控集 中库 纳税人的增值税发票的开具信 息;发票存根联、抵扣联信息 。 基于消息中间件每n小时/ 每天 集 中 增值税交叉稽核库 (遗留) 总局增值税稽核集中库省局比对的交叉稽核结果信息。基于消息中间件每n小时/ 每天 集 中 76 金税三期工程 总局一级 征管数据库群之间:征管操作数据库群之间;操作数据库与镜像库之间 操作型与分析型之间:当期操作数据库、近期操作数据库、统一视图、数据仓库 、数据集市之间 内部系统与渠道之间:内部系统与内外部渠道系统(网上办税厅、网站)之间 技术平台部署 数据库复制数据集成平台总局 etl/elt数据集成平台总局 service调用应用集成平台 总局/省 局 77 金税三期工程 征管数据库群之间 78 金税三期工程 内部系统与渠道之间 79 金税三期工程 总局操作型与分析型之间 80 金税三期工程 交换实现手段总结 分类子分类交换手段交换特点 外部门 外部门交换基于消息中间件批量 税库银基于消息中间件实时/批量 总局与 省局 ia中心之间ldap复制实时 主数据下发数据库复制实时 生产数据下发etl或者数据库复制或者文件方式批量定时 分析数据下发etl或者文件方式批量定时 省局数据集中基于消息中间件批量定时 其他service调用实时 总局内 部 主数据同步(包括外网)数据库复制实时 共享数据(非主数据)同步数据库复制实时(定时批量) n库到n+x库数据库复制实时 申报征收镜像、发票镜像数据库备份实时 内、外网批量etl批量定时 oltp(n+x库)到olapetl批量定时 历史数据迁移etl批量定时 其他service调用实时 81 金税三期工程 目 录 1、概述 2、数据分布 3、数据交换与共享 4、元数据 5、数据治理 6、通用数据标准 82 金税三期工程 元数据管理 83 金税三期工程 元数据管理方案 84 金税三期工程 元数据管理实施策略 1.金税三期项目实施中,元数据管理涉及从数据抽取到数据展示 的整个过程,是金税三期方案实施过程中十分重要的一环。 2.本方案将在源系统、etl、数据仓库、前端展现几个方面进行元 数据管理,建议实现策略是:从分散管理向集中管理逐步过渡。 3.在分散管理阶段,etl过程主要通过etl工具进行元数据管理。 4.在数据仓库环境中,通过数据字典、仓库建模工具(可以提供 更高层的与特定业务相关的语义)和etl工具进行元数据管理。 5.在前端展现部分,通过前端展现工具进行元数据管理。 6.在集中管理阶段,通过建立标准的元数据交换格式,采用专门 的元数据管理工具,实现元数据的集成管理。 根据金税三期大集中的战略,金税三期元数据管理最终实现集中式管理。 85 金税三期工程 目 录 1、概述 2、数据分布 3、数据交换与共享 4、元数据 5、数据治理 6、通用数据标准 86 金税三期工程 数据生命周期管理实施方法 87 金税三期工程 数据生命周期管理分类与分层管理 数据分类描 述 渠道数据一般是为了改善服务的响应时间 而将其暂时 存储在本地的,一般存储在外置的磁 盘阵 列中 当期征管数据数据库中的生产数据是实时 性要求最高的,按照数据生命周期管理的理念要存储 在高速磁盘阵 列中 近期征管数据数据库中数据是实时 或者准实时 ,一般存储在高速磁盘阵 列中 数据仓库 或者数据集市中的 决策支持数据 数据仓库 或者数据集市中的决策支持数据数量巨大,对实时 性的要求不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025黑龙江黑河爱辉区中心敬老院招聘工作人员13人考前自测高频考点模拟试题(含答案详解)
- 2025广西南宁市武鸣区乡村振兴局招聘公益性岗位工作人员1人模拟试卷及答案详解(历年真题)
- 2025广西贺州市富川瑶族自治县公安局第一次公开招聘警务辅助人员8人模拟试卷及答案详解1套
- 2025春季内蒙古包头市第四医院人才引进9人模拟试卷及答案详解(必刷)
- 2025贵州黔东南州镇远县青溪司法所招聘1人考前自测高频考点模拟试题含答案详解
- 2025江苏东南大学招聘5人考前自测高频考点模拟试题及答案详解(典优)
- 2025年新乡市开发公益性岗位安置就业困难毕业生25人考前自测高频考点模拟试题及答案详解(考点梳理)
- 2025金沙县城乡建设发展集团有限公司考前自测高频考点模拟试题附答案详解(突破训练)
- 2025年大兴安岭塔河县公安局公开招聘警务辅助人员80人模拟试卷及完整答案详解1套
- 2025国网新源集团有限公司第二批高校毕业生录用人选的模拟试卷附答案详解(考试直接用)
- GB/T 8017-2012石油产品蒸气压的测定雷德法
- GB/T 15382-2021气瓶阀通用技术要求
- 零星工程维修合同
- DB37-T 4328-2021 建筑消防设施维护保养技术规程
- 防盗门安装施工方案50173
- 传染病布氏菌病 课件
- 航空器紧固件安装及保险课件
- 初始过程能力研究报告-PPK
- 普通话班会课市公开课金奖市赛课一等奖课件
- DB32-T 3129-2016适合机械化作业的单体钢架塑料大棚 技术规范-(高清现行)
- 摄影器材公司销售和顾客服务质量管理方案
评论
0/150
提交评论