一个“快捷高效”的税收数据分析系统的设计与实现_第1页
一个“快捷高效”的税收数据分析系统的设计与实现_第2页
一个“快捷高效”的税收数据分析系统的设计与实现_第3页
一个“快捷高效”的税收数据分析系统的设计与实现_第4页
一个“快捷高效”的税收数据分析系统的设计与实现_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一个“快捷高效”的税收数据分析系统的设计与实现摘要:为满足不同层次税务干部快捷高效取得信息的需求,本文提出采用中间事实表预加工的方式分析税收征管软件数据,设计了系统分析主题,给出了数据预处理的类型,设计了数据模型,并进一步实现了整个系统。该系统采用层级报表管理形式,提高了工作效率,加强了税收征管。随着税收征管软件的深入应用,税务系统的各项业务都离不开信息系统的支撑,依赖程度越来越强,对信息系统的要求也越来越高,不仅满足于系统强大的功能,而且对系统运行效率、操作简便性和分析能力提出了更高要求。为此,我们设计和实现了一个税收数据分析系统以满足这些需求。一、开发原理传统的OLTP系统提供的查询统计均采用在线执行方式,加上系统终端数量多,容易造成系统资源在工作时间过度被集中占用,对前台运行效率影响较大,严重时会出现死机现象。采用生产库和查询库分开的方式可以解决部分问题,但离管理快捷高效的需要尚有距离,需要有一个数据仓库来集中快速处理和分析信息。税收数据分析系统的开发原理是:以税收征管软件数据为基础,采用中间事实表预加工方式,占用系统空闲资源,利用夜间时间定时加工,提高查询效率;采用层级报表管理形式,实现省局-市局-县局-科室-组-片区-具体纳税人的“层层钻取查询”功能,促进基层单位深化应用税收征管软件的各项功能,进一步提高征管质量和效率;实现部分数据的省局集中,为上级税务机关监控下级税务机关业务数据提供有效工具。二、系统设计(一)系统分析主题系统分析主题包括:决策层信息、税收分析、税源管理、登记管理、发票管理、申报征收、文书管理、规费管理、稽查管理、单户综合信息管理10类31项。1决策层信息。专门订制产生决策层领导关注的重要决策信息,方便决策层领导及时掌握重要决策信息。2税收分析。一是集约提供各个层级收入进度、收入结构查询,方便各管理层级及时掌握收入总体情况;二是从各个角度和层级分析税收增减影响因素,提高分析能力。3税源管理。主动推送案头分析所需管理信息,包括日常税源管理事项、纳税评估、下户核查等完成情况,促进落实责任和主动加强管理。4登记管理。为登记日常管理提供管理信息,同时为征管考核、税收分析、监控等提供基础数据支持。5发票管理。提供发票日常管理信息。6申报征收。主动推送申报、入库、汇结算管理信息给责任管理部门,提醒及时、主动加强管理。7文书管理。提供各类减免优惠信息,便于分析统计。 8规费管理。提供规费日常管理信息和收入增减因素分析。9稽查管理。提供稽查案件查处、办结情况查询,推进稽查精细化管理,同时也为稽查绩效考核提供基础数据。10单户综合信息管理。提供一页式、集约化的查询单户企业综合信息,提高查询效率并简化操作。(二)数据预处理税收数据分析系统是以税收征管软件数据为基础的,通常情况下,用户总是会将本系统提供的报表和OLTP报表或者明细报表进行比较,以检验此系统报表的准确性,同时,征管软件提供的原始数据可能存在各种各样的问题,如数据缺失、超出数据范围、数据类型不符、数据属性冗余和业务逻辑不符等,因而一般在进行数据抽取之前,必须进行一定的预处理。结合系统分析主题,我们设置了如下数据预处理事项:1数据清理(1)处理空缺值。如检查营业税缴纳方式为空、增值税缴纳方式为空和所得税隶属关系为空等错误。(2)处理数据范围溢出错误。如有关日期字段非法、企业编码不是数字,原始数据表之间不满足外键约束等错误。(3)处理数据属性冗余。如最小管理单位(所在片区代码)与税务部门不一致性等错误。 (4)处理业务逻辑不符。如登记注册类型与税种登记不符,登记注册类型与税种登记中“代扣代缴标记”不符,发票用票核定与税种登记对应关系不符等错误。2登记分类管理根据税收分析需求对状态为正常的税务登记户按管理状态分成4大类(申报管理户、双定管理户、专项管理户、管理未到位户)24小类,通过进行分类管理有利于统一考核统计口径,准确申报管理基础,为征管考核、各管理方式税收分析、日常税源分类管理及统计等提供基础数据。(三)系统建模1.建模的基本原则(1)建立中间库和中间表。建立中间库的目的是容易备份、减轻生产机和生产库压力,而建立中间表有利于提高查询速度和数据一致性。(2)尽量提高数据压缩比是中间表设置的基本原则。可采用年月日转成月、行列转化(月份按列存放)等手段。(3)引入统一代码表简化中间表设计和数据加工。把征管系统中所有表示机构的代码统一到一张表中,方便各个层级数据的统一加工和展现,还建立历史统一代码表来保证历史数据查询明细和汇总结果的一致性,最小的管理单位可以由各地自行定义。(4)每张中间表中至少要有一个有时序概念的字段实现增量加工。有时序概念字段:入库年月(RKNY)、申报年月(SBNY)等,非时序概念字段:所属年月(SSNY)。如企业销售收入中间表(FX_XSSR)若只包含三个字段企业内码(QYNM)、所属年月(SSNY)、销售收入(XSSR),则设计是不合理的,应该增加操作年月(CZNY)字段,否则每次加工时都要对所有数据重新加工。2中间表的设计基于上述建模基本原则,对税收分析主要功能进行分析后,设计了核心中间表如下:(1)统一代码表、历史统一代码表。存放各管理单位信息,统一代码表包括16个数据项,其中与分析主题有关的有6个数据项:统一代码,统一代码类型,统一代码名称,上级统一代码,显示序号,负责人,历史统一代码表在统一代码表基础上增加起始年月和终止年月两个数据项,表示统一代码的作用时间范围。(2)企业主要代码变动情况表。存放每户企业主要代码的按月变动情况,包括9个数据项:起始年月,终止年月,企业内码,管理方式代码,统一代码,登记注册类型代码,行业代码,财政分片代码,社保基金应结算标记。每个数据项都与分析主题有关。(3)稽查案件日期中间过渡表。存放每个稽查案件在各环节处理日期和分工情况,包括38个数据项:加工年月,案件内码,案件状态代码,稽查方式代码,受理日期,计划日期,检查实际开始日期,检查科,主查员等。(4)减免抵缴情况中间表。存放每户企业减免和抵缴按月发生金额,包括23个数据项:入库年月,企业内码,统一代码,所属年月,征收品目代码,财政分片代码,行业代码,登记注册类型代码,小行业代码,查补类型代码,征收类型代码,税款收入类型代码,代扣代缴代码,申报表种类代码,提退类型代码,隶属关系代码,集贸市场代码,预算级次代码,减免项目代码,文书类别代码,减免数,抵缴数。是分析减免税和抵缴情况的取数来源。(5)月度欠税中间表。存放每户企业各月份欠税情况,包括18个数据项:加工年月,欠税年份,企业内码,统一代码,征收品目代码,欠税类型代码,1月欠税,2月欠税,12月欠税。(6)月度入库中间表。存放每户企业各月份入库情况,包括29个数据项:入库年份,企业内码,统一代码,征收品目代码,财政分片代码,行业代码,登记注册类型代码,小行业代码,查补类型代码,征收类型代码,税款收入类型代码,代扣代缴代码,申报表种类代码,提退类型代码,隶属关系代码,集贸市场代码,预算级次代码,1月入库,2月入库,12月入库。是所有税收入库分析的唯一来源。(7)月度所属中间表。存放每户企业各所属月份税收情况,包括30个数据项:加工年月,所属年份,企业内码,统一代码,征收品目代码,财政分片代码,行业代码,登记注册类型代码,小行业代码,查补类型代码,征收类型代码,税款收入类型代码,代扣代缴代码,申报表种类代码,提退类型代码,隶属关系代码,集贸市场代码,预算级次代码,1月所属,2月所属,12月所属。(8)月度应征中间表。存放每户企业按月应征情况,包括16个数据项:应征年份,企业内码,统一代码,征收品目代码,1月应征,2月应征,12月应征。(9)月度销售收入中间表。存放每户企业各月营业额或销售收入,包括9个数据项:所属月份,企业内码,统一代码,财务报表中的销售收入,水利建设资金申报的销售收入,营业税申报的销售收入,营业税减除中的销售收入,财务报表中的利润,所得税申报表中的利润。三、系统实现(一)数据加工每天晚上定时加工生成中间表数据,先加工最底管理层级数据,再按统一代码中管理单位的层次关系,逐层往上递归汇总形成各上层管理单位的数据,最后基于中间表再加工具体汇总分析表,同时,在加工过程中形成的明细分析数据也以中间表形式进行保存,实现分析系统运行的高效率。(二)数据展现考虑到征管系统已经有比较成熟的报表工具,并且能很好地满足税收数据分析系统展现的需求,因此系统延用原有报表工具,采用此报表工具后达到如下目的:1. 报表输入和展现界面可灵活定制,操作上简单方便,设置的分析报表只要有可选择的输入条件必定能查询到结果。2能实现数据库跨库操作。根据查询范围自动判断数据库连接,实现省局和地市级用户对全省和全地区数据的查询。3、C/S和B/S结合使用。报表设计采用C/S方式定义,展现可以无缝挂接到征管软件中运行,根据报表工具提供的功能也可同时在C/S和B/S结构下运行。四、系统特点我们设计和开发的税收数据分析系统具有以下特点:(一)满足需求,功能实用。实际工作中,许多报表并不需要即时数据,只需截止到前一段时期或前一天数据就能满足管理需要,比如说户籍类清册、税收完成情况统计、税收预测分析类报表等。软件主要是站在管理层角度考虑的,着眼于各级管理层直至基层单位的实际管理需求以及当前迫切需要解决的实际问题,实现对数据的深度挖掘和增值利用,有利于促进税源深度管理,适用全省管理需求。(二)查询快捷,操作简捷。由于采用中间事实表预加工方式,实现对大数据量的快速加工和处理,数据加工速度非常快,前台查询一般报表及清册查询都在五秒之内,十几万条的纳税人清册只需几十秒钟。系统采用了层级报表,采取层层钻取,直至明细清册,操作简便;同时对查询同口径的分税种、分行业、分注册类型、分纳税人状态等统一要求采用交互展开模式,无需另行再查询和重复多次操作,直接在报表界面双击便可展开同口径分类明细,大大地节省了操作时间,简化了操作流程。(三)主动管理,透明监控。系统主动推送设定办结时限的税源管理信息给责任管理部门, 将各项案头分析事项整合于待管理事项情况表,促进各责任

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论