【毕业学位论文】网络环境下税收征管数据处理系统设计与实现-计算机技术_第1页
【毕业学位论文】网络环境下税收征管数据处理系统设计与实现-计算机技术_第2页
【毕业学位论文】网络环境下税收征管数据处理系统设计与实现-计算机技术_第3页
【毕业学位论文】网络环境下税收征管数据处理系统设计与实现-计算机技术_第4页
【毕业学位论文】网络环境下税收征管数据处理系统设计与实现-计算机技术_第5页
已阅读5页,还剩64页未读 继续免费阅读

【毕业学位论文】网络环境下税收征管数据处理系统设计与实现-计算机技术.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分类号 密级 U D C 编号 中 南 大 学 士学位论文 论 文 题 目 网络环境下税收征管数据 处理系统设计与实现 学 科、专 业 计算机技术 研 究 生 姓 名 蒋归燕 导 师 姓 名 及 专业 技术 职务 桂卫华 教授 黄义新 高级经济师 中南大学工程硕士学位论文 摘 要 要 随着国税系统信息化建设力度的不断增强, 对各种税收业务数据的分析利用变得越来越重要,在税收信息化建设需求的推动下,税收征管数据处理系统的实现对提高数据质量,强化数据监控,提高数据共享和综合分析利用的程度有着重大意义。 本文依据系统设计原则,对系统功能 需求、业务数据分布现状、国税系统网络环境、数据采集要求进行深刻的分析;提出了系统的总体目标,通过对传统 C/S(客户机 /服务器)模型优缺点的对比,提出了基于 件对象模型)技术的三层体系结构,利用 术及 软事务服务器)开发和管理组件 ,实现事务逻辑层;针对数据集中过程中各种数据冲突,确定数据抽取方案;采用微软的 据转换服务)作为数据抽取 工具来实现数据抽取模版;完成了一个税收征管数据处理系统的设计与实现。 所开发的税收征管数据处理系统用于 国税系统对各业务系统中的征管业务数据进行抽取、转换、清洁、加载集中到省局。系统设计并实现系统维护、 任务管理、数据抽取与转换、数据汇总上传、数据集成与加载、监控管理、查询统计等功能。 系统具有通用性、多源性、性能稳定、执行效率高等特点,而且界面友好、简洁实用、在系统投入使用的试运行阶段取得了良好的成效。 关键字: 税收征管系统, 数据抽取, 三层体系结构, 中南大学工程硕士学位论文 of in of of of in of to of of to by a of of of By of ( OM to of at in as a to In to of to as of of in 南大学工程硕士学位论文 目 录 摘 要. . I . 一章 绪论. 题研究背景与问题提出 . 1 究目的和意义 . 2 内外研究现状 . 3 要研究解决的问题 . 5 文的组织 . 5 第二章 系统的需要求分析与总体设计. 7 计原则 . 7 统设计目标 . 8 据集中管理系统的总体目标. 8 管数据处理系统的设计目标. 8 统的需求分析 . 8 统功能需求 . 9 务数据分布现状分析 . 10 税系统网络环境分析. 11 据采集要求分析. 13 统的体系结构 . 14 统的 C/S 模式缺陷 . 14 基于 三层体系结构 . 15 统运行的环境 . 16 章小结 . 17 第三章 系统的业务架构及功能设计. 18 据集中管理系统的逻辑架构 . 18 管数据处理系统的组成框架及功能设计 . 20 统维护. 21 务管理. 22 据抽取. 23 据上传. 23 据加载. 24 控管理. 24 中南大学工程硕士学位论文 目 录 询统计. 25 章小结. 25 第四章 税收征管数据处理系统的实现. 26 件技术在系统中应用 . 26 务逻辑层实现技术. 27 统的组件编程模型. 28 件开发. 28 用 理组件 . 29 件技术给系统带来的好处. 31 据抽取方案的设计与实现 . 32 据抽取的概念. 32 据抽取方式分析与比较. 32 据抽取工具的选型. 34 据冲突的分析. 35 据抽取方法的应用. 37 数据数据库的设计 . 39 取模版的设计与实现 . 44 取模版的设计 . 44 据转换服务( . 45 现抽取模版 . 50 收征管数据处理系统运行实例 . 55 统登录 . 55 统配置模块. 55 控管理 . 56 章小结 . 57 第五章 结论与展望. 58 作总结 . 58 究展望 . 58 参考文献. 谢. . 63 硕士研究生期间发表论文. 64 中南大学工程硕士学位论文 第一章 绪论 1第一章 绪论 题研究背景与问题提出 湖南省国税系统信息化建设历经 20 年的发展, 经历了从无到有、 从分散到集中、从单一到整合的阶段式历程,形成 了科技化模式下的税务管理新格局1。随着网络应用在日常工作中的不断深入,税务信息存储模式将由最初的以县、区税务分局为中心,发展成以湖南省国家税务局为中心的全省数据大集中模式。在国家税务总局的总体部署和统一领导下,经过多年的系统建设,湖南国税系统的信息化工作在网络建设、设备配置、应用系统开发应用等方面都取得了较好的成绩。在税务信息化的过程中,湖南省国税局建立了包括申报纳税、税务检查和税务管理等税收征管业务处理的湖南征管系统( 现时也在试点国家税务总局推广的中国税收征管信息系统( 现有的征管系统为我省税收征管做出了巨大的贡献,同时增值税管理信息系统(金税工程二期)、出口退税、涉外企业所得税管理软件等应用系统都已推广应用多年,具备一定的应用规模和应用深度,取得了较好的应用效果。现有的征管信息系统、增值税管理信息系统、出口退税、涉外企业所得税管理软件等应用系统在满足日常税收业务管理工作的同时,也采集了大量的业务数据,在大量数据的背后隐含了十分丰富的信息和规律,而这些数据到目前为止还没有得到充分的利用,主要表现在: 1)业务数据分散在不同的应用系统中,对其 利用被限制在原有系统内,多数仅停留在简单的操作局面上。业务系统产生的业务明细数据,具有异构数据结构、不同的数据库、分布存放、备份到各种介质、数据量大等特点;不同系统间数据缺乏横向比较,共享程度低,缺乏综合利用和深层次挖掘;数据多而已经得到利用的信息太少,造成资源浪费;另外,数据采集重复造成“数出多门”,质量下降,垃圾信息增多;全面而正确的数据是有效的分析和决策的首要前提,相关数据收集得越完整, 得到的结果就越可靠。 目前湖南国税系统的数据大部分是分散而非集成的。造成这种分散的原因有多种,既受到当时技术条件的制约,又因为事务处理应用分散、数据不一致问题、外部数据和非结构化数据等原因。 2)基层单位的管理手段日益先进,上级管理机关以汇报和检查为主的传统管理模式已经落伍,于是产生了延伸监督和管理的需求,但缺乏直接参与管理监督的明细信息资料;基层单位拥有大量数据信息,上级管理部门没有或较少信息,而随着市场经济的不断完善,跨地域、跨部门的经济往来越来越多,上下级信息不对称造成的管理漏洞严重制约了税务系统整体管理水平的提高。 3)历史数据无法利用,事务处理一般只需要 当前数据,在数据库中一般也是中南大学工程硕士学位论文 第一章 绪论 2存储短期数据, 且不同数据的保存期限也不一样, 即使有一些历史数据保存下来了,也被束之高阁,未得到充分利用。目前国税业务系统保留的数据最多只有 3 年, 3年前的通过备份另行保留,但对于决策分析而言,历史数据是相当重要的,许多分析方法必须以大量的历史数据为依托,没有历史数据的详细分析,是难以把握发展趋势的。 4)后台的查询、分析和前台的实时事务处理 没有分离,在前台的实时事务处理中,用户的行为特点是数据的存取操作频率高而每次操作处理的时间短,而后台在查询、分析处理环境中,用户的行为模式与此完全不同,某个应用程序可能需要连续几个小时,从而消耗大量的系统资源。由于上述应用系统在开发时的出发点是解决前台的实时业务处理,而很多后台的查询、分析是事后需求变更而增加放在同一系统中的,而将具有如此不同处理性能的两种应用放在同一个环境中运行显然是不适当的。 究目的和意义 税务部门作为一个特殊的政府机构, 现正逐步向业务规范化, 管理信息化发展。新的环境向税务系统提出了新的需求,以计算机、网络为辅助工具,实现高效的、全面的税务电子化加强税收工作的监管,提高整个税收工作的效率和决策水平,为高层领导提供可靠的决策依据 是促进国民经济发展之必然2。在税务信息化的过程中,各种类型的商业数据库在各个阶段税务管理系统中得到了广泛应用,从 多种数据库都有采用,现阶段在用的主体税收征管系统有省国税局自行开 发的用于税收征管业务处理的湖南征管系统 (数据库系统为 同时也在运行国家税务总局推广的中国税收征管信息系统( (数据库采用 而一些专用的征管系统如增值税管理系统、出口退税系统、涉外企业所得税系统、个体定位定税系统作为征管系统的延伸和补充,在全省范围内普及应用。十余年的计算机应用, 征管系统为我省税收征管做出了巨大的贡献, 积累了大量税务管理历史数据,这些数据已经成为税务管理、决策的宝贵资源,业务的变化、系统的升级和更新换代,使得数据基于多种不同的平台和变化多样的数据结构(不同的数据库或数据文件),而全省的税收数据分散存储于十四个地市(洲)的服务器上,省国税局的管理者和决策者很难以一个统一的视图来获得整个国税局的全局信息,对税收数据的深入分析和利用受到了极大的限制。本课题研究的目的就是如何实现分阶段、分步骤地将各地税务机关沉淀的各类涉税数据抽取上来,应用数据库及数据仓库技术集中存储,并将分散数据的集中整合、加工、清洗、传递与交换,让数据真正地“流”中南大学工程硕士学位论文 第一章 绪论 3起来、“用”起来。 税务信息化在第一步实现了计算机模拟手工过程以后,其真正意义在于基于税务管理和本质,尽可能多地把以人为本的管理变成透明、客观、共享和具有价值的信息。本课题的研究主要有以下几方面的意义: 1、通过全省数据集中将各种业务 软件中简单、零散的数据,进行异类数据源整合,建立全省的数据中心,将消 除各系统间存在的“信息孤岛” ,为在数据一体化的基础上提高税收数据集中度和信息利用率,进一步促进了税务部门内业务一体化、管理一体化和制度一体化的发展进程。 2、提高监控管理水平, 改变以往上级机关对下基层的情况了解主要依据报送各种报表实现的方式,避免由于人工干预的环节和因素较多,信息的一致性、真实性、实时性难以保证而使得省局对考核、管理、决策带有相当大的主观性、盲目性。 3、通过全省征管数据中心,也改变过去关键 业务数据备份仍停留在本地备份和同城备份。有效避免自然灾害、供电问题、人为因素和病毒各方面对数据不可恢复的破坏。 4、建立数据中心后,可在此基础上开发分析 决策系统,将涉税查询与分析与实时的事务处理的生产机严格分开,既可提高查询分析的效率,又避免了查询操作对生产机响应时间的影响。 内外研究现状 自 20 世纪 80 年代中期, “数据仓库之父” 生在其建立数据仓库一书中定义了数据仓库以来,数据仓库技术紧跟 术发展,成为信息社会中获得企业竞争优势的又一关键。 据美国 场调查机构的资料表明, 幸福杂志所列的全球 2000 家大公司中 90%将数据仓库列入企业计划。数据仓库技术在税收部门的应用带来的效益是可观的。据报道,澳大利亚税务部门将数据仓库技术用于支持税收业务,系统经过 3 年的运行,投入回报率达到 1: 15。美国德克萨斯州政府税务部门采用数据仓库技术半年,每月已可带来源 600 万美元的收益,预计每年的收益将超过 8000 万美元。 国内税务系统对数据仓库的开发利用也在不断推进中, 2001 年,总局征管司牵头开发建设 统, 由神州数码公司开发, 该系统包含了征管的数据仓库系统,名为“管理层应用” ,并采取 决方案,该系统已在四川、福建、浙江、江苏、湖北、黑龙江、辽宁、山东、深圳、河南、海南等省国税局投入使用。 2002 年,总局信息中心制定了数据仓库框架整体设计 ,解决数据仓库在总局、省局、地市三层应用的前景、系统定位、业务需求、数据规范、实施平台和建设步骤等技术问题。 中南大学工程硕士学位论文 第一章 绪论 4广东省国税局和顺德国税局同时与菲奈特融通公司签约,为省、市两级应用提供产品和实施服务。 2003 年中,省局完成数据大集中,将已实现的 5 大分析主题:税收收入、出口退税、税务登记、资格认定、金税发票分析,在省局推广使用。目前该系统跑在一台 32 个 12820T 存储阵列)的高配置小型机上; 北京国税作为总局试点之一, 与蓬天公司合作建设数据仓库系统,该系统按总局要求采用 平台建设;南京地税:作为国内地税数据仓库最早的应用者,南京地税迈出了数据分析利用的第一步,由蓬天公司负责技术咨询和系统建设,南京地税利用数据仓库技术完成了查询、报表、统计等初级工作;浙江地税是第一家省级地税局上数据仓库系统。 2003 年初,在完成全省市、区、县 71个数据库的数据集中基础上,浙江地税在考察 广东国税和南京地税的系统后采用决方案,利用数据仓库技术实现全省税务数据的查询、统计和分析利用;由神州数码负责 级,菲奈特融通负责数据仓库建设,深圳国税规划 3时间完成全市数据仓库与数据质量提升项目,首期完成质量考核和纳税评估两大主题,并正式投入使用;武汉地税,天津地税的数据仓库系统由中联公司承建。 税务数据仓库系统建设有三大趋势:不求大而全,将重要分析主题做深做透;重视税款分析和纳税人评估;决策支持系统为信息系统建设核心。 在数据仓库的建设过程中,数据抽取工作有着举足轻重的作用,是建立数据仓库系统的最重要的环节之一,在一个数据仓库项目中,约有 80%的工作量都花费在此,也是建立整个数据仓库系 统中最为复杂的过程4。国外对数据仓库的研究比较早, 技术也较成熟。 许多数据库系统提供了专门的数据转换工具, 如 000 的 。另外,还有一些第三方软件开发商也推出一些产品,例如: 司的司的 司开发的抽取软件包等。国内在数据仓库方面的研究的应用起步较晚,所以目前还没有商品化的产品,大多还处于实验室阶段。 目前,国内的数据仓库系统多数采用针对系统本身设计开发的数据抽取工具,有的甚至用手工方法实现数据仓库的数据加载。当数据仓库结构发生变化或重建数据仓库时,需要重新编程实现该过程。当然,还有许多工具,如用于异构数据库系统数据转换工具,但这些工具的功能简单,只能进行简单的数据复制、添加,不能满足数据抽取的需要。 因为数据仓库的数据的按主题组织的, 不同于 机事务处理)数据库系统。数据仓库中一个表的数据往往来自于 据库中的多个表, 数据进入数据仓库前还需进行数据清理和转换 (如计算、汇总、统计等) ,这些需求是普通的异构数据库转换工具难以满足的。 中南大学工程硕士学位论文 第一章 绪论 要研究解决的问题 解决上述问题的途径是对数据进行集中管理,在集中管理的基础上进行综合分析和利用,提升数据使用层次。目前,省国税局决定先对征管信息系统、增值税信息管理系统、出口退税数据、涉外所得税数据进行集中,选择上述几类数据的原因是软件应用系统全国统一,数据格式相对规范,集中难点较小,考虑到数据集中与管理体制是一项长期性工作,数据集中的范围将随需求的增加而不断扩大,如果为每个应用系统专门开发集中管理系统,不仅通用性差,而且管理维护的工作量也会随着抽取范围的增加而增长,为此,省国税局决定研制开发一套通用的数据集中管理系统 。通过将征管数据、专用税票和专用发票等数 据按税收业务的主题进行抽取、转换、加载等处理后,建立规范统一、高度共享的综合性主题数据库。使得管理和监控更加严密,做到数据的宏观分析与微观分析相结合,全局分析与局部透视相结合,提升数据价值,全面提高税收管理水平。 税务信息化建设最终将围绕领导决策为中心而建设。数据中心的建设误区是将所有的业务数据简单地集中,致使分析决策系统得到大量无用的数据,真正需要的信息却无从获取。所以应以决策支持系统的分析主题所需的数据出发,要求各业务系统的数据模型以主题数据库、数据仓库为标准建设数据中心。数据集中管理系统是根据我省国税系统实际需要结合国家税务总局“金税三期”长期规划,它既可满足现阶段省局对税收征管的监控分析与决策支持, 也可为总局 “金税三期” 的中 “一个平台,四大系统”之一的决策支持系统提供数据准备。 而本文论述的税收征管数据处理系统相当于数据集中管理系统的 程, 将业务数据从多个操作型数据库和外部文件中抽取出来,进行清理、转换、网络传输和集成,该系统是整个数据集中过程中关键的环节,是负责完成数据从数据源向目标数据库或数据仓库转换的过程, 是实施数据资源库的重要步骤。 一个具有通用性、多源性、性能稳定、执行效率高的税收征管数据处理系统,即可作为数据集中管理系统的数据抽取、转换和加载过程的实现,也可是一个独立的数据集成转换工具。 文的组织 本论文主要讲述了税收征管数据系统处理系统的设计,业务流程,并对其中的关键技术和难点问题进行了研究,其内容组织形式如下: 第一章 绪论,是对论文内容的整体介绍,对税收征管数据处理系统研究背景、目的和意义及需要研究解决的问题进行阐述。 第二章 税收征管数据处理系统的总体设计目 标和需求分析,依据系统设计原中南大学工程硕士学位论文 第一章 绪论 6则,提出了系统设计的总体目标,对系统功能需求、业务数据分布现状、国税系统网络环境、信息采集的内容进行透彻分析。通过对传统的 C/S(客户机 /服务器)模式的优缺点分析,提出了基于 件对象模型)的三层体系结构。 第三章 税收征管数据处理系统业务架构与功 能设计,介绍了数据集中系统的逻辑架构与数据处理系统业务流程,详细讲述了系统所有模块相应功能。 第四章 税收征管数据处理系统的实现,介绍 了组件技术的特点,研究如何开发组件、管理组件,及组件技术在系统中的应用,在对数据抽取方式及抽取工具的比较后,确定了数据抽取方案,分析了数据抽取过程中数据冲突类型及相应的解决方法,完成了系统的元数据库设计。介绍了微软 据转换服务)的基本概念,详细讲述了数据抽取模版的实现过程。 第五章 结论与展望,对本文所做的设计、研 究工作进行了总结,并阐述了进一步的研究、扩展该系统所需的工作。 中南大学工程硕士学位论文 第二章 系统需求分析与总体设计 7第二章 系统的需要求分析与总体设计 税务部门的数据大集中是必然的趋势,通过征管数据处理系统可以将基层业务数据集中到省局乃至总局远程数据中心,根据需求将现有的资源进行整合,建成面向主题的主题数据库,为决策层领导层提供分析决策的工具,并可作为总局“金税三期”中的四个系统的决策支持系统的数据准备。因此在设计系统的时应做好系统的整体规划,研究确定好系统的设计原则、系统总体目标、需求分析,确保系统的先进性、可扩展性、易维护性。 计原则 1、通用性原则。要充分考虑国税各种业务系统的数据库类型,支持不同类的数据库、数据仓库系统和不同类型的数据来源,尽可能适应不同的管理模式。 2、全面性原则。站在全省的角度,完整规划、整体考虑、分步实施。充分考虑各种可能的应用对象和应用环境(如税收征管软件的版本多样化、各应用系统的架构环境和应用模式的差异) ,针对不同对象和环境进行统一规划设计,实现系统建设对应用对象和环境的全面覆盖性和适应性。 3、规范性原则。从整体、全局的高度对系统业务流程、数据流向、目的数据结构、文件命名规则按照国家税务总局制定的有关标准进行规范,使之具有更广泛的适应性和可推广性。 4、安全性原则。包括系统的安全、数据存储的安全以及数据的保密性、不可篡改性和不可否认性等一系列安全问题。在系统设计时应重点考虑国税系统的安全性要求,结合实际情况制订切实可行的安全策略与有效措施。 5、相对独立性原则。数据处理系统应作为一个相对独立的系统,通过制定统一的接口标准与多个相关系统实现无缝衔接。即作为全省数据集中系统的数据预处理模块,也可独立为通用的数据迁移数据转换异构数据库的整合的 据处理系统将面对庞大的数据流量,多种复杂的异构数据库及应用网络以及各种不确定因素的影响。系统的独立性可减少系统对外界环境的依赖,提高系统的稳定性、可靠性以及使用的信心。 6、可维护、可扩展性原则。系统的建设应是分阶段有步骤实施的,并应根据业务的调整,网络结构的变化、组织机构的变更,以及网络技术的发展进行不间断的适应性修改。系统建设必须考虑技术和税收业务方面的变化因素,在可拓展性、兼容性、可维护性等方面做出事前的规划。 中南大学工程硕士学位论文 第二章 系统需求分析与总体设计 统设计目标 据集中管理系统的总体目标 由于征管数据处理系统是数据集中管理系统的一个组成部分,因此,有必要对数据集中管理系统的整体的设计思路、组成体系、总体框架进行介绍,与税务系统以前的征管业务系统截然不同,征管系统的设计理念是面向业务流程操作的思路,其关注的重点是业务的规范和处理。而数据集中系统更加关注怎样利用现有数据进行分析的理念,增加数据的决策支持能力。因此数据集中系统总的设计目标是:通过将征管数据、专用税票和专用发票等数据按税收业务的主题进行抽取、转换、加载等处理后,建立规范统一、高度共享的综合性主题数据库,接下来,可以按不同的主题建立数据仓库。根据各方面业务发展的需要,逐步进行多角度、深层次的分析和加工,以实现分散数据的集中整合和分析利用以及数据在横向 /纵向的加工、清洗、传递与交换,让数据真正的“流”起来, “用”起来,使得管理和监控更加严密,做到数据的宏观分析与微观分析相结合,全局分析与局部透视相结合,提升数据价值,全面提高税收管理水平,实现数据共享。 管数据处理系统的设计目标 在进行全省级的征管数据集中过程中,不仅存在数据源和数据存储的多样化,及数据分布的不同地域情况,而且业务数据库中关于同一信息数据往往存在重复信息,或同一对象在命名方式或表达方式上不一致,这些数据在被加载到数据集中数据库时需要对其进行处理,去除重复数据,消除不一致现象。因此湖南征管数据处理系统的设计目标是将业务数据按照某一主题进行数据抽取、转换加载到目的数据采用 术作为核心技术开发一个具有通用性、多源性、性能稳定、执行效率高的抽取工具来实现其所需功能的。 统的需求分析 对业务的理解、对源系统的理解、以及源系统的环境(数据库平台、数据结构等等) ,是设计好一个数据处理系统的关键,在进行数据的抽取转换时需要清楚源系统和目标系统的数据结构和具体含义;我们在对系统功能需求、业务数据分布现状、国税系统的网络环境及数据采集要求的分析,参照总局综合数据管理系统数据结构规范提供的综合征管数据结构标准,与自行开发的征管系统进行对照,数据抽取模式的分析,以便设计出符合湖南国税系统各个业务系统应用现状的数据抽中南大学工程硕士学位论文 第二章 系统需求分析与总体设计 9取方案。 统功能需求 税收征管数据处理管理系统要把来自基层的征管业务数据经过集成、清洁、优化、汇总到集中数据库,所以要求系统应具备数据抽取、上传和监控、加载入库、元数据管理、 系统维护等五大功能, 在网络带宽足够的情况下考虑到主动抽取模式,即:应用程序放在省局,通过对各地、州、市业务系统数据库远程连接实现数据的抽取、转换和加载,这种抽取模式占有大量网络资源,不适用于数据量较大的数据抽取方式;另一种为被动抽取方式,即应用服务安装在地市端,省局将相应任务传输给地市级应用服务,地市级按照任务指定将业务数据从业务数据库抽取后存为文本文件,然后通过 传至省局,然后由省局统一加载到数据集中库。根据现阶段的网络环境,采用了主动抽取模式与被动抽取模式并存的方式,网络环境允许的情况逐步过渡到主动抽取模式。 1、 数据抽取 对不同种类数据通过制作模板实现数据抽取功能。该模板数据文件存放在省局,可增加、修改。模板参数文件应包括如下字段:数据源的数据库类型(同一类数据所使用数据库可以不一致) ,软件版本号、数据抽取起始截至时间、数据表名称、表中字段名称等内容。市局在抽取市级数据时,启动市级远程应用服务,根据省局模板参数表确定数据抽取内容,完成数据抽取功能。数据抽取过程中,根据抽取出来的数据内容产生一个统计表,包括数据表名称、记录数等内容的该表作为数据抽取是否完整、数据上传是否准确、数据加载是否正常的参考文件。数据抽取方式应分为自动和手工两种方式。在正常情况下,数据抽取功能的实现是透明的,无需人为干预;自动抽取遇到问题时,省级操作人员通过统计表和日志信息的比较确定抽取内容,重新抽取,或者市级操作人员完成数据抽取功能,抽取完成后上传数据。 2 、数据上传和监控 抽取出来的数据经压缩后放入 送目录,实现数据的自动上传。为检验数据上传情况,将数据上传日志写入数据库,用户通过应用程序可以浏览传输过程,发现数据上传是否成功以及未进行数据抽取上传的地区。数据上传工作以自动实现方式为主,如果由于网络故障或上传文件损坏等原因自动上传入库工作不能进行,可人工干预,重新选择有问题地区,完成数据抽取和上传工作。 3 、数据加载入库 已传输到省局的数据经过解压缩,通过数据集成功能追加到数据库中。如数据加载入库过程中出现问题,软件应具有回滚、重新加载功能。保证同一条记录不会中南大学工程硕士学位论文 第二章 系统需求分析与总体设计 10重复入库,也不会造成记录、内容的丢失。对集中数据制定转换规则。保证集中数据关键码不会重复。数据入库过程中,异常数据经过特殊处理可追加入库。对入库数据进行完整性检验。数据入库完成后,自动产生数据表名、记录个数等信息的统计表,与数据抽取产生的统计表进行比较,如果两者数据不一致,需要重新进行数据抽取上传入库。数据入库功能可通过人为干预,有选择地数据加载入库。 4、元数据管理 定义模版的数据源的位置及数据源的属性、确定从源数据到目标数据的对应规则、确定相关的业务逻辑。保存模版文件,使数据处理过程按照规定时间执行相应的模版文件,实现数据抽取、转换及加载功能。 5、系统维护 对用户进行管理,设置用户及其相关权限,让各个用户只能使用他权限范围内数据和操作,避免对其它的数据进行误操作。对系统进行初始化配置、针对新的业务需求更新模版文件。发布各地区上传数据的种类、上传时间等日常工作信息 务数据分布现状分析 业务系统产生的业务明细数据,具有异构数据结构、不同的数据库、分布存放、备份到各种介质、数据量大等特点,对数据抽取量比较大的几个系统的业务数据分布现状进行分析,有助于征管数据处理系统的整体设计与统筹规划。 1、征管信息系统数据分布 综合征管信息系统主要负责税收征管业务的信息处理,属于税务系统的核心业务。现在,综合征管信息系统采取省市集中处理模式,基层税务机关通过网络访问省级或市级远端数据库,完成日常税收征管业 务,数据主要分布在地市,部分 地区数据集中到省级税务机关。由于软件在各地的推广应用时间不同,随着软件的不断完善,造成各地应用数据库类型、软件版本号、数据集中程度等不一致,详细情况如表 2示: 表 2管系统数据分布情况表 系统名称 版本信息 数据库类型 应用操作系统 服务器地点 湖南征管信息系统 以前 T 县区局 湖南征管信息系统 000 000 市州局 中国征管信息系统 局 中国征管信息系统 州局 中南大学工程硕士学位论文 第二章 系统需求分析与总体设计 112、出口退税数据分布 出口退税管理软件在全国范围内使用,数据分布在地市局,数据库类型为 据库服务器应用平台为 3、增值税专用发票数据分布 增值税信息管理系统在全国范围内使用, 金税二期拓展后, 数据分布在地市局,数据库类型为 据库服务器应用平台为 4、涉外企业所得税数据分布 涉处企业所得税管理软件在全国范围内使用,数据分布在区县,数据库类型为(有些地方使用网络版,数据集中在区县或地市,数据库类型为: 税系统网络环境分析 数据集中对网络的稳定性、可靠性、安全性、使用效率提出很高的要求。目前,我国税务系统从总局 省局 市局 基层的网络建设已成规模,已全部联网(广域网)的单位达到了 95%以上,特别是金税工程带动了国税系统的网络建设,从带宽来看,全国税务系统中地级市的广域网带宽至少达到了 2M,有 地级市达到了 10M 或更高的带宽3。就湖南省的情况来看, “九五”以来,国税系统共进行了三次广域网建设、改造( ,该网是一个系统内部网 (不允许连接到 是国家金税工程网络的重要组成部分。已形成了上联国家税务总局、下通所有的市州国税局和区县国税局的四级树状广域网络。目前全省共有广域网网络节点 190 个,其中省局节点 1 个、市州级节点 14 个、县级节点 139 个、税务所若干个,覆盖了我省全部市州国税机关和县市分局国税机关。该网络使用分级分布拓扑结构,各分支机构通过帧中继 线路连接至各个地市局,地市局通过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论