云平台数据管理项目总体技术方案_第1页
云平台数据管理项目总体技术方案_第2页
云平台数据管理项目总体技术方案_第3页
云平台数据管理项目总体技术方案_第4页
云平台数据管理项目总体技术方案_第5页
已阅读5页,还剩129页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、云平台数据管理项目总体技术方案目 录 TOC o 1-4 h z u HYPERLINK l _Toc41201125 第1章 整体方案 PAGEREF _Toc41201125 h 4 HYPERLINK l _Toc41201126 1.1 项目需求理解方案 PAGEREF _Toc41201126 h 4 HYPERLINK l _Toc41201127 1.1.1 项目背景 PAGEREF _Toc41201127 h 4 HYPERLINK l _Toc41201128 1.1.2 项目概述 PAGEREF _Toc41201128 h 5 HYPERLINK l _Toc41201

2、129 1.1.2.1 项目现状 PAGEREF _Toc41201129 h 5 HYPERLINK l _Toc41201130 1.1.2.2 项目目标 PAGEREF _Toc41201130 h 8 HYPERLINK l _Toc41201131 1.1.2.3 项目内容 PAGEREF _Toc41201131 h 8 HYPERLINK l _Toc41201132 1.2 总体设计方案 PAGEREF _Toc41201132 h 9 HYPERLINK l _Toc41201133 1.2.1 总体定位及目标 PAGEREF _Toc41201133 h 9 HYPERLI

3、NK l _Toc41201134 1.2.1.1 项目总体定位 PAGEREF _Toc41201134 h 9 HYPERLINK l _Toc41201135 1.2.1.2 项目总体目标 PAGEREF _Toc41201135 h 10 HYPERLINK l _Toc41201136 1.2.2 总体设计思路 PAGEREF _Toc41201136 h 11 HYPERLINK l _Toc41201137 1.2.2.1 项目总体建设思路 PAGEREF _Toc41201137 h 11 HYPERLINK l _Toc41201138 1.2.2.2 树立满足“自上而下”与

4、“自下而上”全局化用户应用的建设理念 PAGEREF _Toc41201138 h 11 HYPERLINK l _Toc41201139 1.2.2.3 构建成熟完善的数据治理体系 PAGEREF _Toc41201139 h 12 HYPERLINK l _Toc41201140 1.2.2.4 搭建涵盖数据“采、存、通、用”全生命周期的一体化生态技术平台 PAGEREF _Toc41201140 h 12 HYPERLINK l _Toc41201141 1.2.3 设计原则及约束 PAGEREF _Toc41201141 h 13 HYPERLINK l _Toc41201142 1.

5、2.3.1 总体设计原则 PAGEREF _Toc41201142 h 13 HYPERLINK l _Toc41201143 1.2.3.2 总体设计约束 PAGEREF _Toc41201143 h 15 HYPERLINK l _Toc41201144 1.2.4 总体应用架构设计 PAGEREF _Toc41201144 h 16 HYPERLINK l _Toc41201145 1.2.5 总体数据架构设计 PAGEREF _Toc41201145 h 17 HYPERLINK l _Toc41201146 1.2.5.1 数据框架设计 PAGEREF _Toc41201146 h

6、18 HYPERLINK l _Toc41201147 1.2.5.2 数据框架细化设计 PAGEREF _Toc41201147 h 19 HYPERLINK l _Toc41201148 1.2.6 总体集成架构设计 PAGEREF _Toc41201148 h 21 HYPERLINK l _Toc41201149 1.2.7 系统部署架构设计 PAGEREF _Toc41201149 h 23 HYPERLINK l _Toc41201150 1.2.8 系统安全设计 PAGEREF _Toc41201150 h 25 HYPERLINK l _Toc41201151 1.2.9 非功

7、能性设计 PAGEREF _Toc41201151 h 29 HYPERLINK l _Toc41201152 1.2.9.1 性能设计 PAGEREF _Toc41201152 h 29 HYPERLINK l _Toc41201153 1.2.9.2 可靠性设计 PAGEREF _Toc41201153 h 37 HYPERLINK l _Toc41201154 1.2.9.3 可用性设计 PAGEREF _Toc41201154 h 37 HYPERLINK l _Toc41201155 1.2.9.4 易用性设计 PAGEREF _Toc41201155 h 37 HYPERLINK

8、l _Toc41201156 1.2.9.5 可维护性设计 PAGEREF _Toc41201156 h 38 HYPERLINK l _Toc41201157 1.2.9.6 可扩展性设计 PAGEREF _Toc41201157 h 39 HYPERLINK l _Toc41201158 1.2.9.7 可伸缩性设计 PAGEREF _Toc41201158 h 40 HYPERLINK l _Toc41201159 1.2.9.8 可移植性设计 PAGEREF _Toc41201159 h 40 HYPERLINK l _Toc41201160 1.2.10 平台层设计 PAGEREF

9、_Toc41201160 h 41 HYPERLINK l _Toc41201161 1.2.10.1 平台层整体架构 PAGEREF _Toc41201161 h 41 HYPERLINK l _Toc41201162 1.2.10.2 平台层优化整体要求 PAGEREF _Toc41201162 h 41 HYPERLINK l _Toc41201163 1.2.10.3 云计算支撑平台搭建方案 PAGEREF _Toc41201163 h 42 HYPERLINK l _Toc41201164 1.2.10.4 大数据支撑平台搭建方案 PAGEREF _Toc41201164 h 46

10、HYPERLINK l _Toc41201165 1.2.10.5 平台层整合及适应性改造 PAGEREF _Toc41201165 h 48 HYPERLINK l _Toc41201166 1.2.10.6 平台层系统集成及上线保障 PAGEREF _Toc41201166 h 49 HYPERLINK l _Toc41201167 1.2.10.7 数据备份 PAGEREF _Toc41201167 h 60 HYPERLINK l _Toc41201168 1.2.10.8 数据恢复 PAGEREF _Toc41201168 h 61 HYPERLINK l _Toc41201169

11、1.2.11 数据层设计 PAGEREF _Toc41201169 h 62 HYPERLINK l _Toc41201170 1.2.11.1 数据层体设计方案 PAGEREF _Toc41201170 h 62 HYPERLINK l _Toc41201171 1.2.11.2 数据平台优化方案 PAGEREF _Toc41201171 h 74 HYPERLINK l _Toc41201172 1.2.12 应用层设计 PAGEREF _Toc41201172 h 109 HYPERLINK l _Toc41201173 1.2.12.1 应用层总体设计方案 PAGEREF _Toc41

12、201173 h 109 HYPERLINK l _Toc41201174 1.2.12.2 主体画像优化设计方案 PAGEREF _Toc41201174 h 112 HYPERLINK l _Toc41201175 1.2.12.3 纳税遵从分析优化设计方案 PAGEREF _Toc41201175 h 116 HYPERLINK l _Toc41201176 1.2.12.4 税收动态展示优化设计方案 PAGEREF _Toc41201176 h 123 HYPERLINK l _Toc41201177 1.2.12.5 应用开发方案 PAGEREF _Toc41201177 h 128

13、整体方案项目需求理解方案项目背景云平台数据管理项目基于大数据技术和理念,以云平台为基础,集中、拓宽和整合内外部数据资源,统一规范数据应用范畴,为各需求主体提供更为全面丰富的决策和参考支持,构建开放协作的税务数据生态环境。项目自开工建设以来,始终以“用数据服务征管方式转变”为建设主线,在大数据算法应用、海量用户支持、关系云图、风险动态积分、用户画像等方面进行了积极探索、实践,出色完成了设定任务,达到了预期效果。目前,云平台数据管理项目已从验证阶段转为生产应用阶段,实现了以数据为中心,以技术基础平台为依托,以分析类应用实现为目标,涵盖数据“采、存、通、用”全生命周期的一体化生态系统,是大数据、互联

14、网、云计算等理念、方法论、技术手段和解决方案的集成展现。在云平台数据管理项目建设完成的基础上,总局云平台数据管理升级完善及运维和机构改革软件服务工作的主要任务是:以云平台数据管理项目建设内容为基础,做好现有硬、软件运行维护与优化升级;进一步拓宽数据集成范围、拓展数据应用、深度挖掘数据价值;根据机构改革后云平台数据管理工作的新内容、新要求,对数据层、应用层进行调整、优化,保障云平台平稳运行;有力加强数据治理、提高数据质量,满足当前数据管理工作需要,支撑各类型数据应用工作需求,助力推动征管模式变革和各项税收政策改革,最终形成推动数据管理思维变化,营造良好税收数据生态。项目概述项目现状前期建设成果云

15、平台数据管理项目以云平台为基础,以云服务器软件、负载均衡软件SLB、对象存储软件OSS、大数据计算服务软件ODPS、数据可视化引擎DataV等18款大数据产品为依托,构建了以数据治理为核心、以一体化云平台为载体、满足各类用户需求的税收大数据平台。主要完成平台层、数据层、应用层的建设:1.平台层建设。主要包括计算存储和网络设备、系统软件工具集、安全及运维监控管理的建设,从硬件和技术层面有效解决传统技术结构不足以支撑海量数据及非结构化数据分析应用需求的矛盾,搭建灵活、可随时调用计算资源的数据云环境,并构建完整的三层服务模式。通过建设IaaS层,为全国数据大集中环境提供包括CPU、内存、存储、网络、

16、操作系统等基础设施资源,提高资源的利用率,降低采购成本;通过建设PaaS平台,基于IaaS提供的能力,以服务的方式提供计算平台和软件组合,为最终用户提供云环境下的应用开发、部署和运行平台,解决应用软件开发的规范化问题,降低系统运行维护成本;通过建设SaaS层,全国数据大集中环境为总局、省局、纳税人、相关部门提供个性化的数据服务。2.数据层建设。通过构建数据治理体系和开展数据分析处理,将云平台和工程规划范围内的其他数据平台集于一体,使金三生产系统数据、总局保留软件数据和多来源的外部交换数据相互贯通,实现各类数据的集中定义和管理,为建立统一数据视图、数据集市、各类分析业务的定义、指标和规则定义以及

17、数据集成定义提供语义基础,同时提供对各类数据的审核管理和维护机制,维护数据的完整性、准确性以及一致性,实现数据生命周期管理、数据标准、数据审计等各项功能。通过数据治理过程,使得数据标准、数据内容以及数据质量都能够得到持续的提升,保证数据资产的长久价值。(1)基础层完成了对税务数据、外部数据和互联网数据三类数据的集成,共集成了六千余张表,同时完成了数据清洗、数据标准化以及非结构化数据转结构化数据等操作。(2)中间层完成了四大主题库和标签体系的建设。四大主题库分别是:组织库(法人和法人分支机构),涉及模型近200个;自然人库,涉及模型近百个;税务机关库,涉及模型近200个;关系库(单位纳税人之间、

18、单位纳税人与自然人之间),涉及模型几十个。同时构建了企业、自然人、税务机关标签体系,包含:企业标签(一般纳税人标签、小规模纳税人标签、千户集团标签)、自然人标签、税务机关标签。(3)模型层完成了面向应用的数据模型构建。在建设模型层的过程中,以构建面向应用类数据模型和构建分析挖掘类分析模型为原则,基于税收动态监控、票流分析、关系云图、增值税发票查询分析系统等应用共设计数百个数据模型,上千个指标口径。3.应用层建设。基于全务数据,建立多层次、多类型、多渠道的数据服务体系,为总局各司局和省局不同类型用户提供多维数据服务,满足各级税务机关在决策、管理、执行、研究等方面的工作需求。应用层前期建设立足于税

19、收业务特点、现状和需求状况,重点选取部分应用进行验证性和示范性开发。已开发用户画像、票流分析、纳税人关系云图、纳税人关系分析、增值税发票查询分析系统、风险情报系统、单管户查询、企业信息自助查询、数据资源需求管理、数据质效考核、税收动态监控大屏版、税收动态监控桌面版、云平台访问监控以及涉税专业服务动态监控等应用。4. 数据治理工作主要从五个方面开展:元数据管理、数据资产管理、数据标准管理、数据质量管理和数据安全管理。在数据标准方面继承了国家标准化内容,把控数据建设标准。同时结合业务需要积累并整理了核心征管系统业务表单和物理表的对照关系,形成了包含:核心征管系统、个税系统、防伪税控系统、外部交换系

20、统、出口退税系统等业务系统的数据字典。在数据质量方面制定数据质量规则指标二百多项,推动全国数据质量持续优化。5.数据服务云平台数据管理项目运行一年以来,为总局多个业务司局提供数据加工服务;承接总局稽查局的选案工作;承接纳税服务司纳税信用等级评定指标调整测算工作,为信用评价指标调整提供数据依据等;开展新办企业预警模型、非正常户预警模型、进销不匹配模型等指标设计测算工作。项目承接内容云平台数据管理升级完善及运维和机构改革软件服务项目是在云平台数据管理项目建设成果基础上,做好云平台数据管理升级完善及运维工作与机构改革涉及云平台调整优化工作两项内容:云平台数据管理升级完善及运维工作1.以云平台数据管理

21、项目的建设内容为基础,对整个云计算支撑环境和大数据平台提供运行维护,包括日常巡检和监控,故障综合分析及应急处理、性能持续优化等服务,从而保障云平台平稳运行,提供高质量高标准的数据服务,实现对数据资源的全面采集、统一存贮、有效管理、深度挖掘和创新应用的目的。2.运行维护云平台系统,包括应用问题处理、应用功能完善、应用支撑、新增功能需求开发等,以保障总局应用系统和向全国各省局开放大数据应用系统平稳运行和完善升级。3.在云平台数据集成范围及链路基础上,扩大数据采集集成范围,改善数据集成链路,进一步提高云平台数据的完整性、及时性与准确性。4.基于数据应用需要,设计数据存储和计算模型,进行大数据量、复杂

22、的计算,利用计算能力挖掘数据潜在价值。5.落实云平台数据治理工作规范、要求,做好元数据管理、数据质量管理、数据资产管理、数据安全管理等工作,开发和优化配套数据治理工具,为开展数据治理工作提供支撑。机构改革涉及云平台调整优化工作根据税务机构改革后各税收业务系统变化、税费数据范围扩大等情况,及时调整、优化云平台数据管理项目有关内容,确保云平台的平稳运行,为各需求主体提供丰富、全面、准确的数据服务和数据应用。项目目标本项目旨在根据业务需求,对平台层、数据层、应用层实施有效的运行维护,完成云平台整体升级优化完善,并根据机构改革要求及进程完成云平台调整优化各项工作,保障云平台平稳运行。1.做好云平台数据

23、管理项目升级完善工作,包括:基于云平台开发、开放更多数据应用,丰富优化云平台的现有功能应用场景,创新应用功能,提升云平台数据管理项目的应用价值和潜能等内容。根据国家与各省局需要,做好云平台应用的增加及数据开放范围的扩大工作。对各司局的迁移软件,做好技术及软件方面的对接工作,满足其数据库创建、扩容、变更等需求。2.做好云平台数据管理项目的运行维护与数据治理工作,包括应用系统日常巡检和监控、故障综合分析及应急处理、性能持续优化等服务,以保障云平台数据管理项目平稳运行。对云平台的硬件扩容提供相应的技术支持,做好对机器的版本升级和应用的性能测试等工作,保障数据处理和各类应用能够正常适应新的硬件平台。按

24、照关于数据治理组织机构、流程制度以及配套支撑工具等要求,做好元数据管理、数据标准、数据模型,数据质量、数据安全等工作,强化数据治理能力,提高数据管理水平,确保整体数据环境可靠、高效、安全,有力支撑征管改革和税制改革。3.做好机构改革涉及云平台调整优化工作,根据国家制定的国合并改革方案,在完成金三系统合并、调整与地方税费全国集成基础上,完成云平台数据层、应用层的相应调整优化与功能开发工作,以保障数据及时、准确集成至云平台,并按照最新的需求展示和供应数据。项目内容云平台数据管理升级完善及运维和机构改革软件服务工作,重点需要完成对云平台数据管理项目的运行维护、对已有功能的优化完善及新增数据需求、应用

25、功能的处理与设计开发以及机构改革涉及云平台调整优化有关工作。重点包括但不限于以下内容:云平台数据管理升级完善及运维和机构改革软件服务项目是在云平台数据管理项目建设成果基础上,做好云平台数据管理升级完善及运维工作与机构改革涉及云平台调整优化工作两项内容:总体设计方案总体定位及目标项目总体定位云平台数据管理项目是工程第二阶段的重要组成部分,项目基于目前最新的大数据处理技术手段和理念,借助金三全面上线的有利契机,以大数据云平台为基础,集中、拓宽和整合内外部数据资源,统一规范数据应用范畴,为各需求主体提供更为全面丰富的决策和参考支持,构建开放协作的税务数据生态环境。项目定位集中体现了基础性、创新性和示

26、范性。基础性。一是构建硬件基础,通过搭建灵活的、可随时调用计算资源的数据云环境,从硬件和技术层面有效解决传统技术结构不足以支撑海量数据及非结构化数据分析应用需求的矛盾。二是夯实管理基础,以打造成熟完善的数据治理体系为重点,为保障数据资产质量提供支撑。三是提供应用基础,为各司局、省局自行开发应用项目提供基础数据和工具,鼓励多样性应用开发。创新性。一是数据利用创新,遵循总体架构要求,继承前期建设成果,在保持四大应用系统总体格局不变的情况下,实现数据全国大集中。二是管理思维创新,整合数据资源和管理资源,以统一平台来解决之前总局各司局数据利用各自为政、重复建设、标准不一致、成果不能共享等问题。三是服务

27、模式创新,体现“众包协助”要求,以提供基础数据服务为主,形成数据统一加工和应用多样开发结合的格局。示范性。为全国各省局数据开发利用提供从硬件建设、数据治理和应用开发的示范性模板,推进全收数据利用水平提升。云平台数据管理项目实现了税收征管数据的全国集中和规范管理,为各级税务机关提供了强大计算处理能力,有机整合大数据技术,全面集成内部数据、积极拓展外部数据、强化数据治理能力,实现了数据的过程监控;建立了税务数据的资产化管理模式,并以用户为核心提供差异化的数据服务,形成了开发协作的税务数据生态环境。同时,加强外部数据交换,实现了税务数据与外部门数据的有效共享整合,为国家信息共享化建设提供了税务方案。

28、云平台数据管理项目升级完善及运维和机构改革软件服务项目以云平台数据管理项目的建设内容为基础,根据的业务需求和国合并工作要求,对平台功能进行持续性升级完善,集中、拓宽和整合内外部数据资源,统一规范数据应用范畴,提升数据治理能力,为各需求主体提供更为全面丰富的决策和参考支持,并提供必要的基础运维,保障云平台正常运行。项目总体目标(1)建立税务数据的资产化管理模式。整合全国的税务数据资源,充分利用第三方、互联网等外部数据资源,形成一个全覆盖、高质量的税务数据大集中环境,将数据作为一种资产进行集中的管控,为深度的数据分析、利用、监管提供基础支撑。(2)强化数据治理能力。建立完整的数据治理体系,形成相应

29、的治理组织机构、流程制度以及配套支撑工具,对于数据的标准、模型、采集、集成、安全等方面进行统一管控,确保整体数据环境可靠、高效、安全。(3)积极拓展和有效利用第三方涉税信息。形成系统全面的工作机制,充分调动所有协税护税力量,通过在控制环节、工作步骤等方面的设计,从而提高第三方涉税信息的应用效果。一方面进一步扩大第三方涉税信息交换部门数量,同时充分考虑对互联网数据的抓取,另一方面创新第三方涉税信息利用环节。(4)有机整合大数据技术,提升分析能力。根据目前税务的数据现状,有机整合大数据技术和传统数据分析技术,建立多模式混合的数据分析支撑环境,提供包括传统OLAP分析环境、大数据分析环境、税务模型算

30、法环境、指标体系、查询等多种机制,满足不同类型用户的分析需求。(5)以用户为核心提供差异化的数据服务。围绕总局、各司局、省局、外部门、社会公众等不同类型用户的数据服务需求,基于全国数据建立多层次、多类型、多渠道的数据服务体系,满足各类用户在决策、管理、执行、研究、公众服务等不同性质的工作要求。(6)在全务系统内形成开发协作的税务数据生态环境。依托建设完成的大数据云平台,为全务系统提供统一的数据服务云,建立一个开放协作式的数据生态环境,有效吸纳总局和各省局在数据分析利用方面的先进经验,聚集专业人才,逐步形成一种相互促进学习的良性互动格局,有效推动全务系统在数据分析利用方面的能力提升。(7)有效支

31、撑征管改革和税制改革。在上述目标的基础上,通过总局大数据平台统一的监督、分析和评价功能以及基于大数据的税收信用信息的不断完善,为前台征管业务流程优化提供决策依据,有效支撑征管改革;同时通过融合了其它相关政府部门数据的税务大数据云平台,逐步建立纳税人的财产、收入和信用监管体系,为税制改革打下坚实基础。总体设计思路项目总体建设思路云平台数据管理项目建设的主体思路是以数据治理为核心,以一体化的云平台为载体,打造满足各类用户需求的应用体系。树立满足“自上而下”与“自下而上”全局化用户应用的建设理念立足全局视角,综合考虑数据平台和数据治理体系的建设,树立“自上而下”、“自下而上”兼顾的设计理念。既能够适

32、应快速开发要求,从单个或若干数据应用出发,只采集应用所需数据,构建底层数据平台支撑,快速实现效果预期,以应对税制和征管改革背景下数据、应用不断变化的需求,降低建设风险。又能够支持在全面采集相关数据、分析加工处理的基础上,形成完备的数据平台及数据治理体系,进而向上支撑各类数据应用的开发,形成统一、精炼的数据体系和完备的数据治理体系。两种理念结合,最终保证数据模型设计和数据治理规划的可扩展性及可复用性,同时以支撑成熟先进数据应用为重点和优先,构建数据平台、数据治理体系及数据应用,反复迭代、上下贯通、逐步扩展。构建成熟完善的数据治理体系数据治理体系是大数据有效利用的根本保障,在项目建设过程中,要着力

33、建立一套完整的数据治理体系,形成相应的治理组织机构、制度、流程以及相应的支撑工具,以数据治理制度为经、以数据治理工具为纬,对数据的安全、质量、模型、操作、备份等方面进行统一管控,以保证数据的高可用、高质量、高可靠、高安全。搭建涵盖数据“采、存、通、用”全生命周期的一体化生态技术平台云平台数据管理项目建设以数据为中心,以分析类应用实现为目标,构建涵盖数据“采、存、通、用”全生命周期的一体化生态技术平台。其中“采”和“存”重点解决数据来源的问题,通过各类数据工具实现数据的及时采集、集中存储;“通”重点解决数据数据质量问题,通过数据治理工作,统一各种来源数据的标准,提供基础处理工具,将数据资源转化为

34、数据资产,变“数据”为“信息”;“用”重点解决数据价值转化的问题,通过开展各类开发应用,为各司局和省局开展个性化研究提供支撑。(如图)。设计原则及约束总体设计原则大数据云平台建设与开发,需要协调“整体与局部、集中与分散、先进与实用、近期与长远、统一与个性”之间的矛盾,涉及到数据库、数据仓库、联机分析处理(OLAP)、数据挖掘等多技术、多学科的交叉,是一项复杂的工程。项目建设应遵循“整体规划、大胆创新、分步实施、统一规范”的总体原则,在总体规划上要体现体系化、规范化,在具体设计上体现前瞻性、创新性,在项目实施中分步骤、保重点,按照工程计划逐步实现建设目标。大数据云平台建设与开发应满足但不限于以下

35、原则要求:实现结构上稳定、灵活、可扩展底层的数据治理和上层应用开发在架构上保持松耦合。上层应用可根据用户需求不断开发、优化或调整,数据资源层提供标准化接口,以服务的形式封装数据,屏蔽底层物理数据库信息和数据结构,增强系统灵活性,在充分满足现有需求的基础上兼顾后期发展,在相对稳定的架构下,选择成熟的产品与技术,满足税务未来(5年)业务需求及技术的发展变化。设计上开放、一致、安全在设计时从纵向、横向、前向、后向多维互联角度充分考虑,建立完整的数据管理体系,遵守统一的数据源、统一的数据模型、统一的数据接口、统一的接口标准等原则,保障数据的一致性。同时兼顾系统的开放性,充分考虑各类应用需求,包括大数据

36、应用、传统数据应用,涵盖统计监控、宏观决策、微观分析、公众服务等。且不设置应用总集成概念和实体,以利于各司局、部分省局及其他相关主体自主开发各类应用。此外设计上也不局限于分析类应用,可尝试海量并发查询类应用等应用模式。最终实现对敏感数据与应用访问的权限控制和轨迹跟踪,加强核心数据的管控,确保系统数据安全。管理数据权限并实施数据访问控制,针对各应用系统组织实施安全审计。标准上规范、易懂、通用完善业务、技术、管理标准规范体系,包括制定和推广总体标准、信息系统标准、管理标准和业务规范等,确保各类命名规范,业务规则定义,度量方式等的规范性和通用性,并使用统一的业务语言进行描述,易于业务人员和技术人员的

37、理解使用。同时建立配套的运行维护和数据治理机制,保障系统的有机生命力,支撑业务发展的需要。用户体验上友好、便利、易用基于SOA架构开发数据应用,在技术选择上,充分利用云计算、大数据等前沿应用技术的最新成果,借助云的灵活性,更好的满足税务行业可变业务的需求,借助云的敏捷性,更快的响应业务要求,通过大数据提供的海量数据处理能力,更充分的挖掘税收数据的价值。在业务展示上充分利用数据可视化新技术,借助于图形化手段,从不同的维度观察数据,从而对数据进行更深入的观察和分析。在数据应用集成层提供丰富的数据分析工具,支持模块的拖拽和自由组合。总体设计约束总体设计包括总体架构设计和数据治理机制设计两个部分。总体

38、设计要求设计目标根据本项目架构要求和项目架构约束,完成云平台数据管理升级完善及运维和机构改革软件服务项目的总体设计。设计要求总体设计在现运行的云平台数据管理项目上进行优化完善,包含应用、数据、技术、集成、部署等方面的框架,也包括设计管控的体系。一方面,作为框架,总体设计要求定义应用、数据、技术、集成、部署等架构的目标蓝图,还包括相关模型,及各部分的指南、设计准则,项目需要根据总体设计的约束来实现其应用;另一方面,作为设计管控,它指明了项目在进行项目实施的时候需要遵守的标准、规范,可以参考的相关架构资源以及需要遵守的架构管控流程,以确保项目的实施符合云平台数据管理升级完善及运维和机构改革软件服务

39、项目的总体规划。总体设计主要由应用设计、数据设计、技术设计、集成设计、部署设计、标准规范、架构管控体系等组成,这些总体设计的内容将构成对项目设计方面的约束,项目需要在这些设计的约束下进行业务需求分析、设计以及实现以完成项目的目标。设计约束遵循本项目总体设计要求和项目设计约束。数据治理机制设计目标根据数据本项目数据治理要求与约束,完成国家数据治理机制建设。设计要求数据治理涵盖了人员,流程和技术,是一系列改变数据使用行为的过程,它从根本上改变业务和信息技术的使用方法。在内容上,要求实现元数据管理、数据标准管理和数据质量管理三个方面的机制和流程建设。设计约束遵循本项目数据治理机制要求和约束。总体应用

40、架构设计根据招标文件中要求,云平台数据管理项目是以大数据云平台为基础,集中、拓宽和整合内外部数据资源,统一规范数据应用范畴,为各需求主体提供更为全面丰富的决策和参考支持,构建开放协作的税务数据生态环境。主要包括平台层建设、数据层建设和应用层建设。云计算支撑平台:系统搭建灵活、可随时调用计算资源的数据云环境,并构建完整的三层服务模式,包括计算存储和网络设备、系统软件工具集、安全及运维监控管理的建设,从硬件和技术层面有效解决传统技术结构不足以支撑海量数据及非结构化数据分析应用需求的矛盾。大数据支撑平台:大数据支撑平台是用于各项数据相关工作的云计算产品和大数据工具软件集合,利用现有或者采购的相关软件

41、产品,构建数据治理体系和开展数据分析处理,将大数据云平台和工程规划范围内的其他数据平台集于一体,使的金三生产系统数据、总局保留软件数据和多来源的外部交换数据相互贯通,持续提升数据标准、数据内容以及数据质量,实现数据“好用、足用”的目标。应用平台层:在全收数据大集中和外部数据扩展基础上,为总局和各司局及部分省局提供方式灵活、内容丰富的自主应用开发的平台。本项目实现主体画像、全国视角的纳税人遵从分析和税收动态展示3类验证和示范应用。 总体数据架构设计根据总局数据层平台的要求,我们将需求细分为数据集成、数据治理、主体汇总、数据应用等4个技术支撑平台,以承担所有数据活动涉及的数据获取、模型组织、信息加

42、工、质量管理、结果展现等处理功能。数据框架设计1 数据集成负责数据集成,通过调度控制和规则管理实现对数据集成的任务管理,数据集成平台将源数据(核心征管、电子税务、出口退税、外部数据等)通过ETL/数据复制的数据加工、清洗、转换,完成从源数据数据准备区统一数据视图。加工中出现的错误预警提交给数据治理平台的数据质量管理应用。2 数据汇聚汇聚数据是将基础数据区的数据按照纳税人、业务日期、业务状态等维度进行的轻度汇总的事实表和事实表关联的维度表。3 数据应用由查询统计、征管状况分析、报表管理、风险管理、政策评估、绩效管理、知识管理、税收收入核算分析系统、电子档案管理等部分和日常应用管理组成。本包负责:

43、查询统计、征管状况分析、报表管理、税收收入核算分析系统、电子档案管理的建设和大数据平台的日常应用管理建设。4 数据治理负责环境的数据治理,它是结合数据治理相关的组织、制度和流程和数据标准完成对数据的治理,治理内容包括:数据质量的管理、元数据的管理、数据生命周期的管理、以及数据审计管理等。数据框架细化设计1、基础数据层基于目前总局数据状况,数据采集的源头主要包含:各类税收业务系统数据、外部交换数据、互联网开放数据。税收业务系统:税收业务系统是本次数据体系中最主要的数据源头,税务业务相关的数据主要从这些系统中获取。核心征管系统数据覆盖13个业务域的业务数据,同时发票数据和出口退税数据虽然系统还没有

44、统一,但是会统一采集到核心征管数据体系内。交换数据:交换数据分为两个部分,总局统一交换数据和各省局交换数据。在基础数据层会单独规划交换数据域,统一规划数据交换模型,将总局交换数据中数据价值度高、数据质量高、数据稳定性好的数据和选取几个省局的交换数据,合并数据结构,采集到统一的数据交换域。互联网数据:互联网是一个开放式的数据源,在本次数据体系和应用的建设中,需要依赖互联网的开放数据作为应用的基础数据,参与税务数据价值挖掘过程中。互联网的数据获取会利用平台的爬虫工具,定向的获取互联网数据。本次需要建设互联网爬数的平台,能够满足甲方不断增加数据源,调整数据爬取深度的要求,满足爬取数据从非结构化到结构

45、化存储的要求;2、数据中间层数据中间层的建设主要的目的是将采集和整理后的基础数据,以某个主体或者关系,将数据联系起来。设计扩展性强的数据模型,随着原始业务数据的逐步丰富,不停丰富主体的描述、行为及管理类的数据。 数据中间层在整个数据体系建设中起到通的作用,以主体维度联通各种来源数据。联通后的中间层数据,将提供给下游模型和挖掘应用更丰富、更标准、更易用的生产原料。总局大数据云平台将具有强大得数据计算和存储能力。基于平台的能力和互联网数据建设的设计思路,在数据中间层的建设中不会做复杂的业务逻辑加工,保留业务的事实明细数据。增强数据中间层的扩展性和复用性,业务逻辑的加工放在应用和挖掘层完成。这样会压

46、缩整个数据处理的过程,同时有利于数据口径的统一和数据质量的控制。基于目前总局对于大数据应用的要求,本次数据中间层的建设将着重三个主体库的建设:企业库、自然人库、关系库。3 数据挖掘层数据挖掘是指利用打通后的数据,针对需要数据支撑的业务,进行数据模型的建设和数据价值的挖掘。基于本次云平台数据管理项目的业务需求,数据模型和挖掘将包含征管分析模型、企业风险控制模型、个人风险控制模型、企业标签体系模型、自然人标签体系模型。征管分析模型:基于目前总局对于征管工作所规划的指标体系,提炼出当前业务状态下最关键和重要的指标,对这些指标进行数据建模,每日生产出数据指标数据,并持续跟踪指标的变化情况,为征管工作分

47、析应用提供数据支撑。 企业标签体系模型:针对目前总局对于企业征税管理的需要,设计对企业进行分类、刻画的描述标签,制定标签业务含义及数据算法,通过对企业库的数据进行数据挖掘,获得刻画企业的标签数据。自然人标签体系模型:针对目前总局对于自然人征税管理的需要,设计对自然人进行分类、刻画的描述标签,制定标签业务含义及数据算法,通过对自然人库的数据进行数据挖掘,获得刻画自然人的标签数据。总体集成架构设计集成架构设计的实现目标如下:跨系统的全局性应用集成环境,形成所有系统需要共同遵循和使用的各类标准、框架以及平台。针对大数据云平台系统规划的各类应用,实现在应用集成环境上形成统一的应用环境,明确单一系统同应

48、用集成环境之间的关系。完成数据集成的环境设计。基于数据架构中数据集成的需求,定义出数据集成环境,根据不同的场景来明确数据集成的应用模式。全局性的界面集成环境,给未来的系统建设提供统一的界面层开发标准及集成框架环境。基于安全架构的规划内容,从认证、授权等各个层面来定义出应用系统同安全体系之间的集成机制。根据本项目的系统集成需要,在本系统中实现三种方式的集成,界面集成、应用集成、数据集成。界面集成界面集成主要是利用框架和相关标准实现对各应用系统界面整合,形成面向最终用户的统一视图,提供所有业务系统的统一入口,用户一次登录就能够获取其在各应用系统中被授权的操作功能,实现面向用户的业务岗责来组织操作功

49、能资源。应用集成应用集成主要是利用统一的集成机制实现云平台大数据管理系统内部服务构件的集成,以及本系统与税局内部其它应用系统、外部门应用系统间的业务交互。数据集成数据集成主要从数据的层面来解决云平台大数据管理系统内部,以及云平台大数据管理系统与不同应用系统间的信息共享机制,解决数据层面的共享和交换问题。一、统一工作门户用来实现系统的门户集成,包括单点登录和界面集成。二、应用集成平台用来实现系统的应用接口调用。三、数据集成平台实现系统的数据集成。系统部署架构设计系统部署架构是根据应用逻辑架构中给出的应用定位和规划内容,规划出其具体的部署位置及相关策略。按照总局的网络、主机、应用系统等安全要求进行

50、部署,总体的系统部署策略如下图:平台应用系统网络位置地域位置部署策略说明云计算支撑平台Rop服务能力开放平台内网总局云计算支撑平台云计算支撑平台Ganglia监控平台内网总局云计算支撑平台云计算支撑平台Gbridge虚拟专有网络内网总局云计算支撑平台大数据支撑平台LVS负载均衡内网总局大数据支撑平台大数据支撑平台SequoiaDB内网总局大数据支撑平台数据服务层数据仓库内网总局数据服务层数据治理平台内网总局数据服务层数据抽取平台内网总局第三方数据服务支撑平台互联网创新支撑平台内网总局第三方数据服务支撑平台公共信息服务平台内网总局总局统一定制应用总局统一定制应用内网总局数据服务平台互联网创新支撑

51、平台DMZ总局数据服务平台互联网创新支撑平台缓存库DMZ总局存放非敏感数据数据服务平台公共信息服务平台内网总局统一工作平台统一工作门户内网总局统一工作平台单点登录内网总局系统安全设计根据云平台大数据管理系统安全等级设计定为三级,最终级别以的定级结果为准,系统在设计上和部署上要不低于三级等级保护的标准。根据本项目安全要求,针对云平台大数据管理系统采用的安全技策略和对应的技术措施如下所示:安全策略技术措施物理安全保护策略通过符合相关标准进行机房的建设和改造实现网络安全策略严格控制对云平台大数据管理系统的访问采用防火墙作为边界隔离措施,实现不同网络边界的访问控制对云平台大数据管理系统的各种攻击进行检

52、测、分析和响应采用网络入侵检测技术(IDS)禁止通过拨号对外连接通过内网管理的非法外联模块进行检测记录用户对核心征管的访问行为,并分析响应采用网络审计系统实现对网络病毒进行防范采用网络防病毒系统网络的端口和协议进行检测采用漏洞扫描系统主机系统安全策略主机的入侵防护策略、检测主机入侵攻击采用网络防病毒软件的客户端的主动防御功能加强核心数据库主机的加固和防护采用主机防护产品加强操作系统和数据自身的安全主机系统加固对主机系统存在的漏洞查找采用漏洞扫描系统防止计算机病毒入侵主机采用防病毒系统对操作系统和数据的日志进行分析,查找非法调用采用主机与数据库综合审计系统应用安全策略加强应用系统自身的强壮性开发

53、时对安全需求进行分析、采用安全架构设计、安全编程对程序的代码进行检测,查找程序漏洞采用应用系统漏洞扫描和代码审计对核心应用系统进行双因子认证采用身份认证体系数据安全策略防止数据丢失、错误和非法篡改采用数据备份与恢复体系和相关技术保障关键业务数据的传输安全采用服务器密码机对核心业务数据进行加密传输和数字签名总局和省局之间批量数据传输的安全采用网络加密机(只在传输批量数据时使用)局域网内服务器和服务器之间的数据传输安全采用协议进行安全传输终端安全策略对进入内网的终端进行控制采用内网管理系统的准入控制模块防止计算机病毒进行对终端入侵安装防病毒客户端防止对个人终端的非法访问采用桌面防火墙云平台大数据管

54、理系统部署在总局的内网安全域。总局内网安全域进一步划分如下:安全域描述核心交换安全域该区域实现各省局和南海灾备中心的接入,并进行数据的高速转发。核心交换安全域有两台万兆核心交换路由器和两台配置相同的具有高速转发能力的高性能万兆交换机,配置双机热备。核心层交换机分别通过光纤链路连接内网各个功能区的汇聚设备,实现纯三层互联结构,提供设备冗余和链路冗余。该安全域分别通过防火墙系统、ACL及VLAN实现和其他区域访问控制策略。内网DMZ安全域内网门户服务器及系统前置机所在的区域。该安全域分别通过防火墙系统、ACL及VLAN实现和其他区域访问控制策略。应用支撑安全域主要实现应用集成和层级的数据交换。内网

55、办公安全域总局内部工作人员处理税务业务、行政办公等。和其他区域用防火墙逻辑隔离。内网管理(支撑)安全域该区域负责接入承担运营管理的服务器,如网管、安全准入、身份认证等。该区域承担着网络的运营管理和安全管理的功能,其通过双机热备的汇聚层交换机接入到核心交换机。该区域可以通过ACL和VLAN实现和交换区的访问策略。该区域根据需要可以进一步细化子安全域。物理层安全保证为云平台大数据管理系统提供服务的计算环境应按照等级保护三级的要求进行设计。机房建设和改造需要参考国家相关标准进行,如电子计算机机房设计规范(GB50057-1994)、低压配电设计规范(GB50054-1995)、建筑物防雷设计规范(G

56、B50057-1994)、电子计算机机房施工及验收规范(SJ/T30003-1993)等。网络层安全从网络结构、网络访问控制、网络安全审计等方面进行控制。系统层安全从身份鉴别、访问控制、安全审计、入侵防范、恶意代码防范、资源控制数据层安全,包括数据传输安全、数据的机密性和完整性等应用层安全,从身份认证、权限管理等方面进行控制。非功能性设计性能设计性能指标分析根据招标要求及我公司多年在数据应用项目上的经验,本项目需达到以下性能指标:编号指标项平均响应时间峰值响应时间补充说明1日常交易5秒10秒税收收入核算分析系统、电子档案管理中的交易完成平均响应时间在5秒以内,峰值响应时间不超过10秒;2简单查

57、询5秒10秒简单的查询统计、报表生成、征管状况分析平均响应时间在5秒以内,峰值响应时间不超过10秒;3复杂查询20秒=95具有涉嫌违反税收法律、行政法规行为,至评定日仍未结案或已结案但未按照税务机关处理决定改正的两年内(指税务机关确定纳税信用等级之日起向前推算两年)新发生欠缴税款情形的不能依法报送财务会计制度、财务会计报表和其他纳税资料的评定期前两年有税务行政处罚记录的不能完整、准确核算应纳税款或者不能完整、准确代扣代缴税款的B60 =分值 95但至评定日为止有新发生欠缴税款5万元以上的对办理税务登记不满两年的纳税人,不进行纳税信用等级评定C20=分值 60依法应当办理税务登记而未办理税务登记

58、的评定期内同时具备按期纳税申报率在90%以下,纳税申报准确率在70%以下,应纳税款按期入库率在80%以下,代扣代缴申报准确率在80%以下,代扣代缴税款入库率90%以下的两年内(指税务机关确定纳税信用等级之日起向前推算两年)有违反税收法律、行政法规的行为,且受到税务行政处罚的纳入增值税防伪税控系统的纳税人,一年内两次不能按期抄报税的应税收入、应税所得核算混乱,有关凭证、账簿、报表不完整、不真实的D分值20具有涉税犯罪嫌疑,已依法移送公安机关,尚未结案的两年内(指税务机关确定纳税信用等级之日起向前推算两年)有偷税、逃避追缴欠税、骗取出口退税、抗税、虚开增值税专用发票等涉税犯罪行为记录的骗取税收优惠

59、政策、骗取多缴税款退回的企业风险(信用)模型设计依据纳税信用等级评定管理试行办法,公司设计风险(信用)评估模型。表名:fx_qyfxpg表描述:企业风险(信用)评估表描述企业风险信用等级为划型和税务评估做出参考列名字段类型注释备注NSRSBHVARCHAR2(30)纳税人识别码NSRMCVARCHAR2(75)纳税人名称FXPGXMLXCHAR(2)风险项目类型PGXMLXFZNUMBER评估项目类型分值表名:fx_fxpgxmlx表描述:风险(信用)项目评估类型风险评定代码类型表列名字段类型注释备注fxpgxmlxCHAR2(2)风险(信用)项目评估类型Fxpgxmlx_mcVARCHAR2

60、(30)风险项目评估名称fxpgzcyjChar(6)风险评定政策依据LXLRRQDATE风险项目类型列入日期XYBJCHAR(1)选用标记表名:fx_nsrfxpdsx表描述:纳税人风险评定事项风险评定事项列名字段类型注释备注nsrsbhVarchar2(30)纳税人识别码dqzrnumber档期收入ljsrnumber累计收入djrqdate登记日期djzlblnumber登记资料完成比例sssxcsnumber涉税事项次数wfajcsnumber违法案件次数自然人风险(信用)模型自然人风险(信用)模型自然人风险(信用)表模型表名:fx_zrrfxpg表描述:自然人风险(信用)评估表描述自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论