关于数据挖掘技术在经济统计中的应用_第1页
关于数据挖掘技术在经济统计中的应用_第2页
关于数据挖掘技术在经济统计中的应用_第3页
关于数据挖掘技术在经济统计中的应用_第4页
关于数据挖掘技术在经济统计中的应用_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1/5关于数据挖掘技术在经济统计中的应用关于数据挖掘技术在经济统计中的应用一、经济统计中数据挖掘技术应用的可行性随着社会的发展,数据挖掘技术的研究与应用得到很大发展,已被广泛的应用,其具有很多优点,能够更好的提供服务于经济统计,因此进一步加强对其的研究非常有必要数据挖掘技术的发展是从二十世纪九十年代到现在,虽然时间不长,但是发展速度迅猛,因此也是越来越受到人们的重视。就目前的情况来看,国外对于其关注度非常高,致力于数据挖掘技术的开发和应用,例如IBM、微软等等。而其在我国也是得到很大的关注,我国对于该技术主要是体现在已经为其相继的建立了相应的工作实验室。数据挖掘工具日益丰富,能够满足经济统计的各种需要为了更好的符合市场发展需求,数据挖掘的工具也是不断更新,呈现出不同的形式,就目前的情况,数据挖掘工具的市场主要由3个部分,包括通用型工具、综合工具和面向特定应用。1通用型工具。在我们的现有市场中比较广泛的应用是通用型工具,其实用性非常广,就目前市场的这种类2/5型工作主要包括SGIMINESET、SASENTERPRISE、SPSSCLEMENTINE等软件。2综合工具。综合工具的主要特点是能够满足商业活动的相关要求,其主要的目的是能够及时地提供相关数据情况以及管理报告等,就目前的情况来看,这种类型的工作市场中主要有COGNOSSCENARIO、BUSINESSOBJECTS等。宏观经济数据库的建立,为数据挖掘技术的应用创造了良好的条件就目前的情况来看,我国的很多部门经济统计中都使用了数据挖掘技术,其主要工作内容是采集、处理。但是其还是存在着一些不足,主要是还没有完全的形成一个整体,从而进行数据的管理时候会有很多问题,因此,经济统计工作是本文由论文联盟HTTP/收集整理需要开发新的技术。而宏观经济统计数据库刚好能解决好这一问题,其能够准确的确保经济统计信息,然后在对其进行整理,从而不断的扩充数据资源。二、数据挖掘技术在经济统计中的应用在社会经济管理活动中,管理主体对经济统计数据的要求主要有两个一个是统计数据的真实性;一个是数据统计信息的实用性。单就这两个经济统计数据要求而言,数据挖掘技术能够很好地满足经济统计工作的需求,是适3/5用性极强的一种经济数据统计技术,其在具体的经济数据统计活动中主要有以下四种应用方法。预处理方法在经济数据统计活动中,最为基础的一种处理方式就是经济数据的预处理方法。因为数据挖掘本身是一种基于提供基础信息的智能分析技术,其本身是受基础经济信息限制的,不可能无中生有代替经济数据收集系统的功能,所以所有作为数据挖掘系统数据基础的经济统计数据信息都应该进行预处理。处理的内容主要包括数据中不正确、不真实、不准确,以及不同经济统计数据信息之间差距较大等现象。对这些基础数据存在的问题进行处理的过程被称为数据清理,当前数据清理主要采用的方法有均值法、平滑法和预测法。其中均值法是现代分析技术中模糊理念的一种应用形式,当基础数据中的一个数据点是空值或者噪声数据的时候,可以采用均值法进行处理,即用数据库中所有该属性已知的属性均值来填补空缺,保证数据挖掘系统对基础数据的分析和整理能够正常进行,得出相对而言准确度较高的统计分析数据。决策树方法就目前的情况来看,在数据挖掘技术应用过程中使用比较多的方法是决策树,因为其能够快速、直接的反映4/5情况。对于该方法最主要的是要构建好决策树,通常情况下回分为2部1)利用训练集建立并精简一棵决策树,同时建立一个模型,能够进行输出分析。2)将构建完的决策树充分利用,做好数据分类工作,这一分类是一个递归的过程,从决策树的根部开始进入到树干、枝丫,直到输入数据的分类满足了某种条件而停止。在具体的应用中停止分割的条件有两个一个是当一个节点上的所有数据都属于同一个类别的时候;另一个是没有分类属性可以对输入数据进行再分割。在决策树构建完成后,还要根据使用者的具体要求对决策树进行“剪枝”,剪枝的主要目的是要降低因为使用训练集而对决策树本身数据输出产生的起伏影响。三、数据挖掘技术在某省经济统计中的具体应用举例本文主要是将序列模式和决策树进行结合的方法进行经济统计中的数据挖掘技术的分析,将其进行分类,从而能够确定出调查的对象。通过某地区企业历年上报的数据建立各个企业的序列模式,通过这个方法能够计算出一个企业的预测值,然后进行分析得到差别率,主要的对象是预测值和上报的数据,最后是将这个差别率进行第一次的分类。根据分类可以将其分为3种,A、B、C类,其分类的依据是差别率所占5/5比率,顺序为大于等于百分之二十,百分之二十和百分之十之间以及百分之十以下。然后是进行建立决策树,其主要是从2个方面进行,即企业的规模变化率和企业是否发生了重大经营事件。如果企业的规模变化率非常大,就需要对其进行调查,如果变化率小,还需要进一步观察企业当年是否发生了重大经营事件,如果发生了就要进一步对其进行调查,如果没发生,就

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论