2011级硕士研究生试题.doc_第1页
2011级硕士研究生试题.doc_第2页
2011级硕士研究生试题.doc_第3页
2011级硕士研究生试题.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2011级研究生“数据仓库和数据挖掘”课程期末考试试题1、(25分)有一个学生成绩管理系统,其中含有学生的学号、姓名、性别、籍贯、分数等信息,现在要构建一个数据仓库,其主题是学生成绩,回答以下问题:(1)给出该数据仓库中事实表的结构。(2)给出该数据仓库中所有维表的结构。(3)画出该数据仓库的模型,问属于哪种模型。(1)学生成绩事实表学生课程成绩(2)该数据仓库包含学生维表和课程维表 学号姓名性别籍贯课程名课程编号授课教师(3)星型模型 成绩事实表姓名课程成绩 学生维表 课程维表学号姓名性别籍贯课程名课程编号授课教师 度量2、(15分)简述OLAP的基本操作。OLAP的基本操作主要包括对多维数据进行切片、切块、旋转、钻取等分析操作。这些分析操作使得用户可以从多个角度、多个侧面观察数据库中的数据,从而更加深入地了解包含在数据中的信息。 1切片(Slicing) 切片操作就是在某个或某些维上选定一个属性成员,而在其他维上取一定区间的属性成员,或全部属性成员来观察数据的一种分析方式。 2切块(Dicing) 切块就是在各个维上去一定区间的成员属性,或全部成员属性来观察数据的一种分析方式,可以认为切片是切块的特例,切块是切片的扩展。3钻取(Drilling) 钻取包含向下钻(Drill-down)和向上钻(Drill-up)上卷(Roll-up)操作。下钻指从概括性的数据出发获得相应的更详细的数据,上钻则相反。钻取的深度与维度所划分的层次相对应。 4旋转(Pivoting) 旋转即改变一个报告或页面显示的维方向。旋转可能包含交换行和列,或是把某一个行维移到列为中去,或包页面显示中的一个维和页面外的维进行交换。3、(20分)有一个事务集合如表1所示,设最小支持计数为3,采用Apriori算法求出所有的频繁集。表1 一个事务集合T事务项1I1,I2,I4,I52I2,I3,I43I1,I2,I4,I54I1,I3,I4,I55I2,I3,I4,I56I2,I4,I57I3,I48I1,I2,I39I1,I4,I510I3,I41)由I= I1,I2,I3,I4,I5的所有项目直接产生1-候选集C1,计算其支持计数。去除支持计数小于3的项集,形成1-频繁集L1,如表1所示。表1 1-候选集C1和1-频繁集L1项集C1支持计数项集L1支持计数 I15 I15 I26 I26 I36 I36 I49 I49 I56 I562)为发现频繁2-项集L2,首先利用L1中的各项目组合连接,来产生2-候选集C2;然后扫描记录集,以获得C2中各项集的支持度。去除支持计数小于3的项集,形成2-频繁集L2,如下表2所示。表2 2-候选集C2和2-频繁集L2项集C2支持计数项集L2支持计数 I1,I23 I1,I23 I1,I32 I1,I44 I1,I44 I1,I54 I1,I54 I2,I33 I2,I33 I2,I45 I2,I45 I2,I54 I2,I54 I3,I45 I3,I45 I4,I56 I3,I52 I4,I563)为发现频繁3-项集L3,首先利用L2中的各项目组合连接,来产生3-候选集C3。连接时只能将只差最后一个项目的不同项集进行连接。连接后还要根据Apriori的性质:频繁集的子集一定是频繁的来修剪。最后扫描记录集,以获得C3中各项集的支持计数,去除支持计数小于3的项集,形成3-频繁集L3,如下表3所示。表3 3-候选集C3和3-频繁集L3项集C3支持计数项集L3支持计数 I1,I2,I42 I1,I4,I54 I1,I2,I52 I2,I4,I54 I1,I4,I54 I2,I3,I42 I2,I4,I544)为发现频繁4-项集L4,重复上述过程,则C4为空,所有频繁集都被找到,算法到此结束。4、(20分)对于如表2所示的数据集,其中d是类别属性,其余属性为描述属性。画出对应的决策树。表2 一个数据集Uabcd1000+2001-3011-4101+5111+6110- 5、(20分)对于如表2所示的决策表(U,CD),C=a,b,c,D=d,回答以下问题:(1)用分辨矩阵方法求出核COREC(D)。(2)求POSC(D)(3)采用任一方法求出一种属性约简。(1)以上决策表的分辨矩阵为:1234561cb,ca,b2aa,b3a,ba4b,c5c6核是分辨矩阵中所有单个元素组成的集合,所以COREC(D)=a,c (2) U/D=1,4,5,2,3,6 U/C=1,2,3,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论