



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库与数据挖掘试题第一,解决问题(每个问题1分,计算30分,每5个答案都写着)1.数据库在业务中用作管理信息分析处理的数据资源。(x)2.对数据库的查询是指对分析要求的查询,而不是对记录级数据的查询。(x)3.关系数据库是二维数据(平面),多维数据库是空间三维数据。(v)4.数据进入数据仓库之前,必须经过处理和整合。(v)Olap使用当前数据。OLTP使用历史数据。(v)6.数据仓库活动不明确,生产数据量少。(x)数据集市比数据仓库难。(x)8.OLAP使用的数据经常更新。OLTP使用的数据不会更新,但会定期刷新。(x)9.数据集市可以升级到完整的数据仓库。(v)10.数据库中存储的数据基本上是存档当前综合数据。(x)11.OLAP可以根据分析师的要求快速灵活地处理大量数据。(v)12.OLAP支持复杂的决策分析工作,侧重于对分析人员和高层管理人员的决策支持。(v)13.OLTP具有大量事务吞吐量,处理内容相对简单,但重复率高。(v)14.数据仓库的用户包括两类:信息用户和探险家。(v)15.对数据库的操作相对明确,操作数据量大。(x)16.数据库用于事务处理,数据仓库用于决策分析。(v)17.信息用户以可预测、可重新发布的方式使用数据仓库平台。(v)18.OLAP一次处理大量数据。OLTP一次处理的数据量较少。(v)19.OLTP对每个作业的数据量很小,大部分是当前数据。(v)20.数据仓库系统由三部分组成:数据仓库(DW)、仓库管理和分析工具。(v)21.随着业务的变化,数据仓库中的数据将随时更新。(x)数据集市比数据仓库大。(x)23.数据集市有预存储在数据仓库中的更详细的数据。(v)24.不同维值的组合及其度量值构成了不同的查询和分析。(v)25.OLAP使用详细数据,OLTP使用综合数据。(x)26.数据集市由企业管理和维护。(x)Olap概念模型是多维的。(v)28.数据库已经成为经过验证的信息基础设施。(v)29.数据库存储历史数据和当前数据。(x)30.OLTP适用于事务处理操作员和子层次结构管理员。(v)二、填写空白问题(每个问题1分,计算10分)1.信息用户通常检查汇总的数据或聚集的数量。2.探访文字的任务是寻找公司数据中嵌套的价值。3.数据立方是在所有可能组合的维中分组的聚集计算的总和。4.基本多维数据分析操作包括切片切割、旋转、钻取等。5.数据立方体的构建和维护等计算方法已成为多维数据分析研究的核心问题。Olap是构建在网络上的开发体系结构。7.在数据立方中,不同的维组合构成不同的子立方。8.每个数据仓库必须设置不同的数据库。9.ETL是数据仓库部署中的重要步骤,需要70%的工作负载用于数据仓库开发。10.数据仓库中的数据是合并的合并。三、名词说明(每个问题5分,30分)1、数据集市4、元数据2、数据挖掘5,发现知识3、商业智能6、数据仓库1、数据集市是一个更小、更集中的数据仓库,它为企业提供了分析业务数据的低成本方法。Data Marts是具有特定应用程序的数据仓库,主要针对特定应用程序或部门应用程序,并帮助用户找到获得竞争优势或进入新市场的特定解决方案。4、元数据被定义为数据的数据(data about data)。换句话说,元数据描述数据仓库中的数据和环境。2,数据挖掘(DM) :KDD流程的特定阶段,使用特殊计算法律从数据中提取知识。3、业务智能基于数据仓库,通过在线分析处理和数据挖掘技术,帮助业务领导者对市场变化的环境做出快速准确的决策。5、知识发现(KDD):在数据中发现有用知识的全过程。6、数据仓库是用于决策支持系统(DSS)和联机分析应用程序数据源的结构化数据环境。研究并解决从数据仓库数据库中获取信息的问题。数据仓库的特征是主题、整合、稳定性和时间变性。四、简单的回答(每个问题5分,30分)1.您是否要简要说明数据仓库与数据挖掘的关系?数据仓库和数据挖掘是决策支持的新技术。但是它们有完全不同的辅助决策方式。数据挖掘是数据仓库系统前端的分析工具中的重要工具之一。有助于确定数据仓库中数据的嵌套规则性。比较统计和数据挖掘的异同?n统计信息主要通过数值(数字)或连续值数据(如年龄、薪金等)定量分析(如首次计算)来获取数量信息。n数据挖掘主要通过对职称、疾病等离散数据进行定性分析(适用范围、归纳等)来获取规则知识。n统计和数据挖掘是不同的。但它们是相辅相成的。3.将rollap与OLAP的数据模型mollap进行比较吗?MOLAP是用作多维多维数据集以供将来查询分析的教师,ROLAP动态生成Sql以执行查询关系数据库,如果不执行性能优化,则在数据量较大的情况下性能问题会更加明显。ROLAP与MOLAP的比较角色ap父lap继承现有关系数据库的技术为OLAP设计响应速度比MOLAP慢。现有关系数据库通过对OLAP执行许多优化提高了性能,这些优化包括并行存储、并行查询、并行数据管理、基于成本的查询优化以及位图索引和用于SQL的OLAP扩展(cube、rollup)卓越的性能,快速的响应快速数据装载数据装载速度慢存储空间占用少,维度不限需要预测计算,数据可以在有限的维度下爆炸。不能支持维的动态更改借用RDBMS存储数据,没有文件大小限制受Os平台上文件大小的限制,难以达到TB级(仅限10-20G)您可以通过SQL存储详细数据和摘要数据数据模型和数据访问的标准不足-不支持预计算的读写操作-SQL无法完成部分计算-嗯?无法完成多行计算-嗯?无法完成维之间的计算高性能决策支持计算支持-嗯?复杂交叉维计算-嗯?多用户读写操作-嗯?行级计算维护困难易于管理是否比较数据挖掘和OLAP之间的差异?OLAP的一般应用程式,可追踪商业活动变更的查询所发现的问题、追踪查询,找出问题发生的原因,以及作为次要决策的作用。数据挖掘任务包括群集(如神经网络群集)、分类(如决策树分类)和预测。5.数据仓库映射的元数据是什么?数据仓库的元数据除了数据仓库中数据的说明(数据仓库词典)外,还有三种类型的元数据:(1)数据源的元数据(2)有关提取和转换的元数据(3)最终用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司组拔河比赛活动方案
- 公司春游野餐活动方案
- 公司特色聚餐活动方案
- 公司美食节摆摊活动方案
- 公司自制寿司活动方案
- 公司组织种地活动方案
- 公司沙滩拓展活动方案
- 公司组织拓展活动方案
- 2025年智能制造工程师职业考试题及答案
- 2025年营养学与食品安全的考试试卷及答案
- 2025年全省民政行业职业技能大赛(孤残儿童护理员)备考试题库(含答案)
- 南京鼓楼医院合作协议书
- DB32/T 3375-2018公共场所母乳哺育设施建设指南
- 规培指导教师考试试题及答案
- 药学三基培训课件
- 2025-2030中国寿险行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030医疗美容产业市场深度调研及发展趋势与投资前景预测研究报告
- 甘肃省建设工程计价规则 (DBJD25-98-2022)
- 2025年北师大版小学数学小升初模拟考试测试卷及答案(共三套)
- 公证管理考试题及答案
- 钣金加工设备安全操作
评论
0/150
提交评论