




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1/6经济统计工作中数据挖掘技术的应用分析经济统计工作中数据挖掘技术的应用分析斗转星移,历史变迁。经济不断进步中,我国经济统计数据中一些问题凸显,如果沿用旧的的经济统计数据方式,对经济发展探索和决策极为不利。不能深层次开展统计数据的分,使得经济数据中的潜在关系,没有办法发掘。所以,在传统的统计数据中下使得处理方式不断更新,实现经济的决策促进,有着重要意义。本文主要对数据挖掘技术概念和产生进行了阐述,并且对在经济统计方面的应用展开了详细的分析。经济统计工作虽然一直在进行,但是其中存在着多反面的问题。在经济统计分析方面有着数字汇总简单罗列的问题,非常不利于统计部门依照统计结果做出科学的决策。这就要求新形势下的经济统计工作进行深度的数据挖掘,不断适应新的经济统计分析需要。一、数据挖掘技术内涵经济社会的发展,使得经济工作中,需要分析的经济数据增多。在对经济分析需求增大的条件下,数据挖掘技术营运而生。经济统计工作中的数据挖掘技术,是一种在不全面的、模糊的、随机经济数据中,分析得到潜在信息,接2/6着对获取的数据展开分析和转换。这些数据在经过专门处理之后,应用于企业和者政府相关的决策。这种经济统计扥西方法,适应了社会中采集的数据量变大,处理信息量变大的现实。数据挖掘,实质是研究交叉的、比较复杂的学科。数据挖掘包括知识获取、统计学、知识库系统、数据库技术、模式识别等。数据挖掘技术在发展方面经过了一个长时间的过程数理统计阶段、人工智能阶段、机器学习阶段。在社会发展过程中,经济统计数据规模越来越大,人们、企业以及政府由于对经济发展的需要,所以对其质量要求比较高。但是传统的经济分析方法存在着明显的弊端。由于传统的数据统计方法里,数据之间之间的潜在关系没有涉及分析,所以无法为企业和政府经济决策实现关键有效决策提供关键信息。因为传统的统计分析方法中,使用的是效率比较低的计算方法,无法满足社会发展中的需要,并且分析的质量也没有办法得到保证。现实中存在的问题,也没有办法得到有效解决,数据挖掘本文由论文联盟HTTP/收集整理的方式通过信息技术的分析,可以发现数据中的潜在关系,分析出人们无法单凭感官不能实现的数据和信息之间的关系。实现了传统数据分析中的问题解决,数字挖掘技术正是为了克服上述问题而产生并发展的,利于政府和企业进行经济的决策。并且在信息技术不3/6断发展的今天,数据挖掘技术水平也在不断提高和发展。二、数据挖掘技术的应用1、预处理实际工作中,数据可能在收集的过程中有缺漏,关键信息不完整。所以在进行挖掘分析之前,对数据进行有效地预处理,对于减少分析的偏差有着重要作用。总的来说,数据的预处理有四个部分。数据的完善数据的完善,主要是把数据中存在不一致、缺损和噪声清除掉,目的是提升数据在整体有效性方面的质量。通常使用的方法是预测法、平滑法、均值法等统计法,主要根据实际情况中的差异,来抉择使用的方法。预测法,使用在推断噪声的数据和空值中,能够得到最有效的统计数据,目的是处理数据缺损。平滑法讲究将N个数据,在经过加权平均后得到的数值,作为替换数据。均值法是将N个不为空的数据,在经过数值的平均计算后的平均值,作为最终数据。平滑法和均值法也作为数据的降噪使用1。数据集合数据的集合就是数据集成过程。一般的数据在收集的时候,主要是由地方统计局收集通过各种途径收集,在收集之后要对这些多重多样的数据进行集成。因为这些数据挖掘的范围不同,需要通过一定的手段,使其成为一个4/6有效地整体。在数据集合的过程中,会产生一些问题。例如,不同数据源数据中的互相匹配问题,也就是数据的模式集成问题。除此之外,不同数据之间还会产生一些差异导致的互相排斥,这些数据中的冲突需要消除。还有数据的冗余问题,也就是假使一部分的属性可以被其他数据库中数据属性推断的得到,数据集成中就出现了冗余的问题。数据的变换数据的变化,主要是采用一定方式,把数据变换成和其相当,并且将适合信息挖掘出来的形式。具体变换有两种,一种是规范化,一种是泛化2。规范化,主要构成是零均值的规范化、最大最小情况的规范。泛化,就是把数据层和层次使用较高层次概念将其替代。数据的概念分层现实中的数据有着一些明显的特点,连续性就是其一。但是在爱实际已经应用的算法中,能后对连续性数据处理的还较少数据的离散化,也就是采用区间的划分,来代替某一些实际数据,得到真实的连续数据。概念分层的意思主要是使用有效的高层概念来代替一些收集量较少的数据3。2、关联规则和决策5/6关联规则在实际的数据挖掘领域中,整个过程采用对集合里的关联、频繁模式和因果结构开展查找,目的是找到那些不被注意,或与人们日常认知习惯背离的事件。在经济统计中,数据关联的挖掘,可以分析出一个大概的范围关系比较密切一些行业。在进行数据分析的过程中,不少的属性之间实际的关系被人们所知晓。这些属性被称作平凡规则。例如,工业总产值的提升,带来了生产总值的提升。利用关联性原则,可以使不同属性的数据,通过分析之后,得到相关联系属性。决策数据分类构成是两个步骤第一,决策树模型的形成,也就是采用训练集来得到一棵决策树,来实现经济统计数据决策的构建和精化。第二,把输入的数据在决策树的指导下,开展分类的处理。在数据输入决策树的时候,数据会由根节点,在属性值依次开展测试。最后到达叶子终端的节点,来达到寻找记录所在类的类别4。总的来书,决策树算法基本是递归过程的一种,数据的分类一直可以延续到终止条件结束。结语经济的快速发展,使得经济统计工作各部分之间关6/6系密切,使得经济统计分析的难度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度房地产融资居间服务合同范本(专业版)
- 2025卜璧离婚协议书及婚后财产分割与子女抚养协议
- 2025年海上光伏产业技术创新与海洋能源产业技术创新产业竞争力提升
- 2025版砂石料生产设备维修与保养服务合同范本
- 2025版企业人力资源绩效评估与激励方案合同
- 2025年公共安全设施维护责任书
- 2025年度室内装饰装修材料生产与销售联盟合同
- 2025年度租赁房屋租赁纠纷处理与仲裁协议
- 2025版宠物个人买卖合同:宠物交易健康协议
- 2025版食品行业知识产权保护保密协议模板
- 2025企业单位网络与信息安全事件应急预案
- 企业品牌价值评估模型设计
- 社保补助协议书范本
- 胆总管结石伴急性胆管炎
- 制度编写书写规范
- 电缆购销合同文本参考
- 新员工质量保证考试(中软国际)
- 安徽涵丰科技有限公司年产6000吨磷酸酯阻燃剂DOPO、4800吨磷酸酯阻燃剂DOPO衍生品、12000吨副产品盐酸、38000吨聚合氯化铝、20000吨固化剂项目环境影响报告书
- 制造业业务流程
- 石英长石无氟浮选分离工艺研究现状
- 对铁路机车乘务员规章培训的探讨与实践
评论
0/150
提交评论