




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库与数据挖掘I. 选择题,为每个问题选择最合适的答案(102%20%)1. 数据仓库上的业务处理称作B。A. 联机事务处理B. 联机分析处理C. 联机输入处理D. 联机查询处理2. 在自然演化体系结构中,关于导致数据缺乏可信性的原因的说法哪个不正确?DA. 数据无时基B. 抽取程序的算法有差异C. 抽取的层次不同D. 缺乏集成性3. 下面哪项关于OLTP与OLAP访问特点的说法是不正确的。AA. OLTP和OLAP对于响应时间的要求都高B. OLTP访问频率高,OLAP访问频率低C. OLAP访问大量的历史,执行大量统计操作D. OLTP数据处理具有并发性4. 下面关于数据仓库中数据的说法错误的是?A. 数据越详细,粒度越小,层次级别就越高。B. 在估计直接存储设备数时,如数据超过1000万行必须强制采取双重粒度级。C. 数据仓库大部分分析是针对被压缩的、存取效率高的轻度级数据进行的。D. 数据分割便于数据的重构、重组和恢复,以提高创建索引和顺序扫描的效率。5. 下面关于数据仓库的数据存储方式的说法哪个是不正确的?FE. 虚拟存储方式中,数据仓库的数据仍然在源数据中。F. 星型模式下的维表规范化的,而雪花模式下的不需要规范化G. 在查询效率方面,星型模式效率更高H. 在事实星座模式中有多个事实表,且它们共享相同的维表6. 下面关于星型模型的说法哪个是不正确的?I. 有一个包含大量数据的事实表J. 有一组小的附属表,称为维表,每维一个。K. 事实表的每个字段都是事实度量字段L. 事实中每条元组都含有指向各个维表的外键和一些相应的度量数据。7. 下面关于数据仓库的数据追加的说法哪个是不正确的?CA. 时标法需要为记录数据增加一个时间标志。B. 前后映像文件方法需要扫描整个数据库,占用较多资源,对性能有较大影响C. DELTA不需要扫描整个数据库,效率较高,应用普遍D. 日志文件法也不需要扫描整个数据库,是固有机制。8. 假设收入属性的最小与最大分别是10000和90000,现在想把当前值30000映射到区间0,1,若采用最大最小数据规范方法,计算结果是多少?BA. 0.25B. 0.375C. 0.125D. 0.59. 下面关于维的概念哪个是不正确的? CA. 维是人们观察数据的特定角度。B. 维的层次性是由观察数据细致程度不同造成的。C. “某年某月某日”是时间维的层次。D. “月、季、年”是时间维的层次。10. 数据仓库开发应用周期可分为三个阶段,下列哪项不是其中某个阶段? C? BA. 规划分析阶段B. 体系结构设计阶段C. 设计实施阶段D. 使用维护阶段II. 简答题 (45%20%)1. 在现实世界的数据中,元组在某些属性上缺少值是常有的,描述处理该问题的方法?(至少给出5种不同的方法) 空缺的数据会影响数据挖掘的质量,所以应该处理忽略该元组人工填写空缺值使用一个全局常量填空使用属性的平均值填充空缺值使用与给定元组属同一类的所有样本的平均值使用最可能的值填充空缺值2. 简述数据仓库的四个基本特征?面向主题,集成的,非易失的,随时间改变的3. 简述轮转综合数据存储的过程?简单逐日堆积数据的一种变种。数据用与前面相同的处理方法从操作型环境输入到数据仓库环境中,只是在轮转综合文件中的数据才被输入到不同的结构形式中。4. 简述数据库数据与数据仓库数据的异同?II. 设计题 (512%60%)1、 假定大学的数据仓库包含4个维student学生、course课程、semester学期、instructor教师,2个度量count和avg_grade。在最低的概念层(例如对于给定的学生、课程、学期和教师组合),度量avg_grade存放学生的实际成绩。在较高概念层,avg_grade存放给定组合的平均成绩。a)为数据仓库画出雪花模式图8%b)由基本立方体学生、课程、学期、教师开始,列出大学每个学生的“计算机导论”课程的平均成绩,应当使用哪些OLAP操作(如由学期上卷到年)?4%上卷到年,切块(学期、课程)、切片2、 假定数据仓库包含4个维date时间, spectator观众, location地区和game节目,2个度量count和charge。其中,charge是观众在给定的日期观看节目的付费。观众可以是学生、成年人或老人,每类观众有不同的收费标准。a)画出该数据仓库的星形模式图8%b)由基本立方体date,spectator,location,game开始,为列出2011年观众在GM-Place的总付费,应当执行哪些OLAP操作?4% 3.4假定BigUniversity的数据仓库包含如下4个维:student(student_name, area_id, major, status, university),course(course_name, department),semester(semester, year)和instructor(dept, rank);2个度量:count和avg_grade。 在最低概念层,度量avg_grade存放学生的实际课程成绩。在较高概念层,avg_grade存放给定组合的平均成绩。 (a) 为该数据仓库画出雪花形模式图。 (b) 由基本方体student, course, semester, instructor开始,为列出BigUniversity每个学生的CS课程的平均成绩,应当使用哪些特殊的OLAP操作。 解答: a) 为该数据仓库画出雪花形模式图。雪花模式如图所示。 b) 由基本方体student, course, semester, instructor开始,为列出BigUniversity每个学生的CS课程的平均成绩,应当使用哪些特殊的OLAP操作。 这些特殊的联机分析处理(OLAP)操作有: i. 沿课程(course)维从course_id“上卷”到department。 ii. 沿学生(student)维从student_id“上卷”到university。 iii. 取department=“CS”和university=“Big University”,沿课程(course)维和学生(student)维切片。 iv. 沿学生(student)维从university下钻到student_name。 3.5 假定数据仓库包含4个维:date, spectator, location和game;和2个度量:count和charge,其中charge是观众在给定的日期观看节目的付费。观众可以是学生、成年人或老年人,每类观众有不同的收费标准。 (e) 画出该数据仓库的星形模式图。 (f) 由基本方体date, spectator, location, game开始,为列出2004年学生观众在GM_Place的总付费,应当执行那些OLAP操作? 解答: (a) 画出该数据仓库的星形模式图。 (b) 由基本方体date, spectator, location, game开始,为列出2004年学生观众在GM_Place的总付费,应当执行那些OLAP操作? 沿日期(date)轴从date_id上卷到year。 沿
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025重庆统景旅游开发有限公司招聘9人笔试参考题库附答案解析
- 北师大版小学六年级上册 第五章第一节 扇形统计图 同步练习(含解析)
- 2025辽宁省能源控股集团所属清洁能源公司招聘2人笔试模拟试题及答案解析
- 2025解放军总医院京北医疗区社会用工招聘3人笔试模拟试题及答案解析
- 2025广西北海市铁山港区中小学幼儿园后勤服务人员控制数公开招聘22人笔试参考题库附答案解析
- 出租车急救知识培训课件
- 2025浙江丽水青田县中学面向全县教育系统选聘教师考试备考题库及答案解析
- 医学影像学海马硬化
- 2025辽宁鞍山市铁西区教育局面向师范类院校应届毕业生校园招聘45人考试备考试题及答案解析
- 2025内蒙古赤峰大井子矿业有限公司招聘21名笔试备考试题及答案解析
- DB32T-高粱属品种鉴定 InDel分子标记法
- 江西省教师进城选调考试教育理论综合知识考点知识点归纳背诵总结
- 智能审计实训平台需求说明
- 陕鼓集团线上笔试题目
- 七年级数学下册 专题 不等式(组)中新定义运算&程序性问题(解析版)
- DL∕T 5782-2018 20kV及以下配电网工程后评价导则
- CJT 526-2018 软土固化剂 标准
- 《交通事故车辆及财物损失价格鉴证评估技术规范》
- 我和我的祖国混声四部合唱简谱
- 生物药制造工艺经济与成本分析
- 信息安全技术 电信领域数据安全指南
评论
0/150
提交评论