电子政务中的数据挖掘_第1页
电子政务中的数据挖掘_第2页
电子政务中的数据挖掘_第3页
电子政务中的数据挖掘_第4页
电子政务中的数据挖掘_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章电子政务中的数据挖掘,电子政务作为基于一种网络,符合internet标准,而面向政府机关、企业以及社会公众的信息服务和信息处理系统,信息的获取、利用和开发是必须解决的问题。这种现状无法适应电子政务对高质量的网络信息的需求,网络信息中的数据挖掘技术应运而生。,第一节数据仓库,一、数据仓库的概念和产生背景从计算机应用初期的电子数据处理到今天的执行信息系统、决策支持系统、电子政务,都始终伴随着对数据仓库的探求。政府的高层管理者还需要使用数据进行各种复杂分析,以支持决策。,数据仓库是支持管理决策过程的、面向主题的、集成的、与时间有关的持久的数据集合。,二、数据仓库的基本特性与体系结构,1、数据仓库具有以下几个基本特性:1)数据仓库是面向主题的2)数据仓库是集成数据的3)数据仓库在一定时间周期内保持稳定性4)数据仓库比较强调时间序列性,2、作为一个系统,数据仓库至少应包括3个基本的功能部分:1)数据获取2)数据存储与管理3)信息访问,3、对数据仓库的基本体系结构进行细分,一个数据仓库一般由7个主要组成部分:1)数据源2)数据抽取、转换和装载工具3)数据建摸工具4)核心仓库5)数据仓库的目标数据库6)前端数据访问和分析工具7)数据仓库管理工具,三、数据仓库数据模型的设计,数据仓库是从传统的数据文件中经过处理后得到的,使用过程中,必须将数据仓库与传统的数据库中的数据相分离,为了获得数据仓库中的数据,必须进行数据仓库的设计。一般来说,对于数据仓库中数据模型设计,采取面向主题的自顶向下的设计方法,或者说使用的是面向对象的设计方法。,数据仓库设计与传统的设计方法一样,要经过概念模型设计、逻辑模型设计和物理模型设计三个阶段。对于面向主题的数据仓库设计来说,分别对应于信息包图的设计、星型图模型设计和物理数据模型设计。,1、概念模型设计信息包图概念模型设计也就是通常所说的需求分析。在需求分析阶段确定操作数据、数据源以及一些附加数据利用自上而下的设计方法设计一个立方体的步骤为:1)确定模型中需要抓住的电子政务运行过程2)确定需要捕获的植3)确定数据的粒度,信息包图拥有三个重要对象:指标、纬度和类别利用信息包图设计概念模型需要三大内容:1)确定指标2)确定纬度3)确定类别,2、逻辑模型设计星型图模型在传统的数据逻辑模型设计中,根据需求分析阶段获得的数据流程图,利用实体联系方法将概念模型转换为实体联系模型。星型图拥有三个逻辑实体:纬度、指标和类别。位于星型图中心的实体是指标实体对应于信息包图中的指标对象,是用户最关心的基本实体和查询活动的中心,为拥护的商务活动提供数据,位于星型图星角上的实体是纬度实体,它对应于信息包图中的纬度对象,其作用是限制用户的查询结果。另外一个实体是详细类别实体,它对应于信息包图中的类别对象。3、物理模型设计星型图转换为数据模型,第二节数据挖掘技术,一、概述数据挖掘就是从大型数据仓库或数据仓库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在的有用的信息。,1、数据挖掘的主要任务1)总结规则挖掘2)关联规则挖掘3)分类规则挖掘4)聚类规则挖掘,2、数据挖掘过程数据挖掘一般由三个主要的阶段组成:数据准备、挖掘操作、结果表达和解释。数据准备阶段包括数据整合、数据筛选和预处理三个阶段。3、实际数据挖掘操作的要点1)首先决定如何产生假设2)选择合适的工具3)挖掘知识的操作4)证实发现的知识5)结果表述和解释,4、数据挖掘过程中采用的挖掘技术1)统计分析方法2)决策树分析方法3)遗传算法4)人工神经网络5)Rough集6)最邻近技术7)归纳规则8)可视化技术,二、数据挖掘技术,1、关联规则的数据挖掘2、转移规则的数据挖掘3、分类方法的数据挖掘三、数据挖掘的功能1、自动预测趋势和行为2、关联分析3、聚类4、概念描述5、变差检测,四、数据挖掘工具1、基于人工神经网络的工具2、基于规则和决策树的工具3、基于模糊逻辑的工具4、综合多种方法的工具,第三节网络数据挖掘,一、网络数据挖掘与传统的数据挖掘一般来说Internet的数据挖掘和传统的数据挖掘相比,有以下特点:1、数据源是无序的、非结构化的2、数据源之间可能存在冗余、不一致甚至矛盾3、数据源具有很强的动态性4、数据具有多样性5、用户目标的模糊性,二、网络数据挖掘的固定流程关于网络数据挖掘技术,可以把网络数据挖掘分为4个步骤:1、确定业务对象2、数据准备网络数据挖掘的数据来自两个方面:一方面是客户的背景信息,主要来源于客户登记表;另外一部分数据主要来自于浏览者的点击流,人们主要用这部分数据考察客户的行为表现,3、网络数据挖掘4、结果分析三、网络数据挖掘形式根据不同的网络数据挖掘对象,人们将网络数据挖掘内容分为:网络内容挖掘、网络结构挖掘以及网络用法挖掘,四、网络数据挖掘专业人员由于网络数据的若干工作需要人工来完成,并且数据挖掘过程是分布实现的,因此不同步骤的工作具有不同专长的人员操作。大体可以将他们分为三类1、业务分析人员2、数据分析人员3、数据管理人员4、数据分析人员,第四节电子政务的数据挖掘,一、数据挖掘在电子政务的应用第一是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论