全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库与数据挖掘一、选择题(每空2分,共40分)1开展数据挖掘的基本目的是( )。A. 建立数据仓库 B. 帮助用户作决策C. 从大量数据中提取有用信息 D. 对数据进行统计和分析2建立“数据仓库”的目的主要是( )。A规范管理数据 B.日常事务处理 C更新数据方便 D.联机分析与决策支持3以下不是支持数据挖掘技术的基础有( )。A数据加密技术 B.海量数据收集 C数据挖掘算法 D.强大的多处理器计算机4. 人工神经网络包括三个基本层,即输入层、( )和输出层。A. 网络层 B. 神经元层 C. 基因层 D. 隐含层5. 元数据是一种 ( )数据。A. 数据的原始版本 B. 数据仓库内存储的信息C. 描述数据仓库的信息 D. 是数据集中的精简数据。6数据仓库上的业务处理称作( )。A.联机事务处理 B.联机分析处理 C.联机输入处理 D.联机查询处理7. 智能决策支持系统是( )的系统。A. 决策支持系统与人工智能技术相结合 B. 决策支持系统与数据库系统相结合 C. 决策支持系统与范式理论相结合 D. 决策支持系统与事务处理系统相结合8. 数据仓库和数据挖掘是作为( )出现的。A. 两种相同的信息技术 B. 处理数据的方法 C. 两种独立的信息技术 D. 两种独立的信息存储技术9. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )。A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理10. 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘11. 假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? ( ) A. 第一个 B. 第二个 C. 第三个 D. 第四个 12. 数据仓库是随着时间变化的,下面的描述不正确的是 ( )A. 数据仓库随时间的变化不断增加新的数据内容B. 捕捉到的新数据会覆盖原来的快照C. 数据仓库随事件变化不断删去旧的数据内容D. 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行新综合13. 下面关于数据粒度的描述不正确的是:( )。A. 粒度是指数据仓库小数据单元的详细程度和级别B. 数据越详细,粒度就越小,级别也就越高C. 数据综合度越高,粒度也就越大,级别也就越高D. 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量14. 决策树中不包含一下哪种结点?( )A. 根结点(root node) B. 内部结点(internal node) C. 外部结点(external node) D. 叶结点(leaf node) 15数据集市的数据组织一般采用( )模型。A星型模型 B雪花模型 C星网模型 D第三范式16多维数据分析中,( )是使用户在多层数据中能通过导航信息而获得更多的细节性数据。A切片分析 B切块分析 C向下钻取 D旋转分析17遗传算法的三个基本算子有( )。A重复、配对、变异 B选择、交叉、变异 C繁殖、屏蔽、改良 D选择、配对、变化18一个链接到许多权威站点的站点叫( )。A权威 B中枢 C权威页面 D中枢页面19神经网络中,神经元起了一个( )作用。A决策作用 B分类作用 C判断作用 D简化作用20BACON系统有( )个版本。A3 B4 C5 D6二、判断题(每题1分,共10分。各题的答案只能是“对”或“错”,要求分别用“”或“”表示)1数据集市是一种更小、更集中的数据仓库,因此数据集市很容易升级成数据仓库。( )2监视休眠数据分为三级:表格级休眠、列级休眠和行级休眠。( )3思考模型属于静态数据分析,分析人员利用系统已有的多层次的综合路径层层细化,找出事实发生的原因。( )4可拓变换包括:转换变换、增加变换、删减变换和扩大变换。( )5文本挖掘是从大量文本数据中提取以前未知的、有用的、可理解的、可操作的知识的过程。( )6发现学习有两种方式,数据驱动方式的公式发现和启发式驱动方式的概念发现。( ) 7遗传算法是一种随机搜索方法,是高效的有方向的搜索。( )8ID3是将信息增益作为特征(属性)判别能力的度量。( )9数据仓库分析与设计由需求分析、概念模型设计、逻辑模型设计和决策模型设计四个部分组成。( ) 10数据挖掘是一个不断反馈的过程。( )三、简答题(共25分)1(5分)数据集市的定义及其与数据仓库的差别。2(6分)OLAP的十二准则。3(5分)数据仓库开发有哪些困难?4(4分)数据挖掘按挖掘对象分类有哪些?5(5分)数据仓库的决策支持包括哪些?四、应用题(共25分)1(10分)对于buy_computer的决策树,请从下图的决策树中提取分类规则。2(5分)设全集U对某属性A的划分为:A=E1,E2,E3=(a,b,c),(d,e,f),(g),现有对A的粗糙集X=a,b,g,分别计算集合X的下近似A-(X)、上近似A-(X)、正域POSA、负域NGEA和边界BNDA。3(10分)数据库有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国家管网集团湖南公司2026届秋季高校毕业生招聘考试备考题库(浓缩500题)含答案详解(轻巧夺冠)
- 国家管网集团山东分公司2026届秋季高校毕业生招聘笔试模拟试题(浓缩500题)带答案详解
- 2026年驻马店市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)带答案详解(完整版)
- 2026国家管网集团校园招聘(河北招17人)考试参考试题(浓缩500题)及答案详解【网校专用】
- 2026秋季国家管网集团华南公司(广东省管网公司)高校毕业生招聘考试备考试题(浓缩500题)及参考答案详解(夺分金卷)
- 2025国网湖北省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题及答案详解(考点梳理)
- 2026届国家管网集团高校毕业生招聘笔试模拟试题(浓缩500题)附参考答案详解(b卷)
- 2026秋季国家管网集团西北公司高校毕业生招聘考试参考试题(浓缩500题)附答案详解(完整版)
- 2026秋季国家管网集团广西公司高校毕业生招聘考试备考试题(浓缩500题)及参考答案详解一套
- 2025国网海南省电力校园招聘(提前批)笔试模拟试题浓缩500题含答案详解(基础题)
- 环境工程可行性研究报告内容及编制要求
- 消防管网渗漏水点排查施工方案
- 企业应急救援协议书8篇
- 2025年福建省事业单位招聘考试教师招聘体育学科专业知识试卷(体育教学)试题
- 2025年可持续时尚产业发展项目可行性研究报告
- 核电站保安考试题及答案
- 2025年绍兴鉴湖酿酒有限公司招聘7人考试模拟试题及答案解析
- 2025内蒙古国贸集团招聘11人考试参考题库及答案解析
- 民航救生衣演示知识培训课件
- 2025-2026学年第一勾股定理、第二章实数检测试卷北师大版八年级数学上册
- 制药企业市场营销战略案例分析
评论
0/150
提交评论