版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Ch.16数据库用于决策分析,1、资料仓储2、数据挖掘和Ch.16数据库用于决策分析。1、资料仓储1)、数据仓库的事务环境数据库不适合DSS应用程序的6茄子原因:(1)医生决策需要在事务系统中累积“统一数据”,从而形成“数据丰富、信息不足”的局面。(2)医生决策需要“科举数据”事务。通常只需要当前数据,数据库通常只存储短期数据。但是在决策分析中,历史数据非常重要,很多分析方法必须依赖大量的历史数据。没有对历史数据的详细分析,很难把握企业的发展趋势。Ch.16数据库用于决策分析,(3)医生决策需要“多数据源数据”DSS。需要合并数据。全面、准确的数据是有效分析和医生决策的第一个前提,您收集的相关
2、数据越完整,结果就越可靠。因此,DSS不仅需要企业中各部门的相关数据,还需要企业外部、竞争对手等的相关数据。数据源包括各种数据库、档案、HTML等。(4)确定医生所需的数据根据与主题相关的主题需要不同的数据。有些主题是预知的,有些主题是因决策要求而临时发生的。Ch.16数据库用于决策分析;(5)决策数据以读取为主;(6)联机事务处理(OLTP)以短事务为主,联机分析处理(OLAP)、用于决策分析的Ch.16数据库,2)、资料仓储(1)定义(W.H.INMON -数据仓库的上级)数据仓库是一个读取密集型数据库系统,它合并了多个数据源,并且具有当前和科举摘要数据(请说明前面添加的四个修饰语)!(2
3、) (2)资料仓储框架王书第2卷p.199图221岁茄子主要部分:数据源资料仓储(核心)工具和介面,3)OLAP技术(On-Line Analytical Processing) (1)数据(p.204),c .上圈和下钻-上圈是经过仔细计算的粗糙集函数。向下钻研是反向作业,但无法粗糙地汇出细致视图。向下钻取细化维的粒度,以查询更详细的数据。d .聚合函数的分类- 1)分配类型;2)代数类型;整体型。2,数据挖掘(Data Mining) 1)概述(1)定义:数据挖掘是对数据库中隐含的未知和非一般信息(即像OLAP中那样的总计、平均值等一般信息)或知识的提取。(又称KDD,knowledge
4、discovery in databases)(2)数据源:包括数据库中的数据、数据仓库中的数据,甚至一些非数据库数据。(3)“发掘”-“推理”:两种茄子推理方法-演绎推理:可以从演绎数据库系统、数据库中获得逻辑推理,找不到新的规则和规律。-归纳推理:数据挖掘的基本方法之一。,(4)数据挖掘过程王书第2卷p.221图23-1数据选择预处理外观(Pattern)发现-重要步骤,不同算法(模式模式不同,此处使用)评估说明2)数据挖掘的基本方法(1)联系人分析-同一交易内数据的连接实例:根据客户特征和科举信用记录,使用分类方法预测客户信用的类别。(3)群集与分类不同,预先指定了分类的类别,群集的类别
5、不是人为指定的。聚类是通过比较数据的相似性和差异发现特性和分布,抽象聚类的规律。3) 4茄子方法简介(1)关联规则1,概览:t=t1,T2,- TM事务处理数据I=i1,I2,- in事务处理t的数据集x支持范围支持(x=y) Y | 100% _ _ _ _ _ _ _ _ _ _ _ _ _ _ t包含Y | 100% _ _ _ _ _ _ _ _ _ _ _ _ t 当置信度超过指定阈值时,关联规则是要查找的关联规则。算法为:王书P.223,(2)时间序列挖掘1,示例不同事务的数据之间的关联,2,Apriori All算法(王书p.225) (1)排序,(2)过滤频繁的数据项集*分类为统计学、模式识别、2、分类方法:决策树方法、人工神经网络方法、统计算法、遗传算法等最常用的是决策树方法。王书P.227显示了在分类中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 白癜风光疗耐药机制及逆转策略
- 瘢痕疮瘩的微环境改善策略
- 症状管理与靶向治疗协同策略
- 生物制剂类风湿达标治疗终点策略
- 生物制剂使用期免疫缺陷者疫苗接种策略
- 生物信息学在分层标志物筛选中的应用
- 生物3D打印植入物的追溯法律问题前瞻
- 生物3D打印在肿瘤药物筛选中的临床转化
- 生殖医学伦理委员会的职能与运作
- 生成式AI在医疗创新中的应用前景
- 中药外洗治疗化疗导致外周神经毒课件
- 上海市松江区2026届初三一模英语试题(含答案)
- 2026年孝昌县供水有限公司公开招聘正式员工备考题库及参考答案详解一套
- 2026年及未来5年市场数据中国草酸行业发展前景预测及投资战略数据分析研究报告
- 临床技能培训中的教学理念更新
- 光伏系统并网调试施工方案
- 2025年太原理工大学马克思主义基本原理概论期末考试参考题库
- 2026届广东东莞七校高三上学期12月联考政治试题含答案
- 感染科结核病防治培训指南
- 思想政治教育研究课题申报书
- 开发区再生水资源化利用建设项目可行性研究报告
评论
0/150
提交评论