下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE2005级《数据仓库与数据挖掘》卷第2页共4页广西财经学院2007——2008学年第一学期姓名:学号:班级《数据仓库与数据挖掘》课程期末考试试卷(A)卷姓名:学号:班级适用班级:电商本0541、0542考试时间:120分钟(开卷机试)考查课程命题老师签名:郑华教研室主任签名:课程开课系:计信系注意:本次考试是开卷上机考,请大家独立分析完成。如果发现有相同的答卷,则二人都为0分,请大家自觉!请大家在2007年12月25日之前把做好的答卷发送到老师的邮箱:gxhuazheng@,过期不候.题号一二三四五六七八九十总分应得分20303020100实得分评卷人名词解释(每题4分,共20分)1、数据仓库数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。2、数据挖掘数据挖掘(DataMining),又称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。3、雪花模型雪花模式中某些维表是规范化的,因而把数据进一步分解到附加的表中,模式图形成了类似雪花的形状。通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能。雪花模型增加了用户必须处理的表数量,增加了某些查询的复杂性,但同时提高了处理的灵活性,可以回答更多的商业问题,特别适合系统的逐步建设要求。4、OLAPOLAP是联机分析处理,是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。它支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。5、决策树决策树是将训练集函数表示成树结构,通过它来近似离散值的目标函数。这种树结构是一种有向树,它以训练集的一个属性作节点,这个属性所对应的一个值作边。决策树一般都是自上而下的来生成的。简答题(每题6分,共30分)1、企业面对海量数据,应如何具体实施数据挖掘,使之转换成可行的结果/模型?首先进行数据的预处理,主要进行数据的清洗,数据清洗,处理空缺值,数据的集成,数据的变换和数据规约。2、请列举您使用过的各种数据仓库工具软件(包括建模工具,ETL工具,前端展现工具,OLAPServer、数据库、数据挖掘工具)和熟悉程度。ETL工具:AscentialDataStage,IBMwarehouseMANAGER、Informatica公司的PowerCenter、Cognos公司的DecisionStream市场上的主流数据仓库存储层软件有:SQLSERVER、SYBASE、ORACLE、DB2、TERADATA但是使用过的只有SQLSERVER和数据挖掘工具AnalysisServices,而且不大熟悉。3、请谈一下你对元数据管理在数据仓库中的运用的理解。元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。4、数据挖掘对聚类的数据要求是什么?(1)可伸缩性(2)处理不同类型属性的能力(3)发现任意形状的聚类(4)使输入参数的领域知识最小化(5)处理噪声数据的能力(6)对于输入顺序不敏感(7)高维性(8)基于约束的聚类(9)看解释性和可利用性5、简述Apriori算法的思想,谈谈该算法的应用领域并举例。思想:其发现关联规则分两步,第一是通过迭代,检索出数据源中所有烦琐项集,即支持度不低于用户设定的阀值的项即集,第二是利用第一步中检索出的烦琐项集构造出满足用户最小信任度的规则,其中,第一步即挖掘出所有频繁项集是该算法的核心,也占整个算法工作量的大部分。在商务、金融、保险等领域皆有应用。在建筑陶瓷行业中的交叉销售应用,主要采用了Apriori算法翻译分析题(30分)1、附件有一名为“DataMininginElectronicCommerce”的电子文档,请同学们翻译其中的一段。每位同学翻译的段号以大家学号的最后两位为准,如10号同学只需翻译正文的第10段,以此类推。分类则是一个标准的问题,在数据挖掘和在电子商贸的应用-原则下,适当的方法[随机森林,支持向量机(支持向量机),后勤拉索等]有赖于敏锐地在该网站上,该类型的广告都是可以收集到的资料。在亚马逊商务网站中,该推荐系统已进入先前购买和书籍进行视察。这是一个更丰富的信息来源,通过可以接入(他们只
知道这个词,有人期待在这次会议上,除非他们有库克-网页)。一些企业获得更多的信息,从数据仓库中,如作为choicepoint公司,这使得他们的专家来建立高度个性化的分类规则。2、通过阅读该文挡,请同学们分析一下数据挖掘在电子商务领域的应用情况(请深入分析并给出实例,切忌泛泛而谈)。随着网络技术和数据库技术的成熟,全球传统商务正经历一次重大变革,向电子商务全速挺进。这种商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需求信息和购物行为特征的可能性。数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。电子商务的发展促使公司内部收集了大量的数据,并且迫切需要将这些数据转换成有用的信息和知识,为公司创造更多潜在的利润,数据挖掘概念就是从这样的商业角度开发出来的。由于数据挖掘能带来显著的效益,它在电子商务中(特别是业、零售业和电信业)应用也越来越广泛。在金融领域,管理者可以通过对客户偿还能力以及信用的分析,进行分类,评出等级。从而可减少放贷的麻木性,提高资金的使用效率。同时还可发现在偿还中起决定作用的主导因素,从而制定相应的金融政策。更值得一提的是通过对数据的分析还可发现洗黑钱以及其它的犯罪活动。在零售业,数据挖掘可有助于识别顾客购买行为,发现顾客购买模式和趋势,改进服务质量,取得更好的顾客保持力和满意程度,提高货品销量比率,设计更好的货品运输与分销策略,减少商业成本。电信业已经迅速地从单纯的提供市话和长话服务演变为综合电信服务,如语音、传真、寻呼、移动电话、图像、电子邮件、机和WEB数据传输以及其它的数据通信服务。电信、计算机网络、因特网和各种其它方式的通信和计算的融合是的大势所趋。而且随着许多国家对电信业的开放和新型计算与通信技术的发展,电信市场正在迅速扩张并越发竞争激烈。因此,利用数据挖掘技术来帮助理解
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肌腱损伤的康复护理要点
- 2025-2026学年贵州省黔东南州九年级(上)期中历史试卷(含答案)
- 高科技企业研发中心投资协议
- 护理人文关怀实践
- 技术转让合同范本协议
- 2025年监理合同补充协议范文分享
- 麻章区2025年大学生乡村医生专项计划招聘备考题库及答案详解(夺冠系列)
- 2026年湖北银行武汉财富管理人员社会招聘备考题库含答案详解
- 2026年黑龙江八一农垦大学公开招聘辅导员和教师22人备考题库含答案详解
- 安徽中澳科技职业学院2025年度高层次人才招聘备考题库及答案详解参考
- 移动应用程序权限管理与加固项目需求分析
- 中华人民共和国简史学习通超星课后章节答案期末考试题库2023年
- 建筑施工事故案例PPT
- 农产物料干燥技术物料干燥与贮藏
- 核对稿300单元分析响应
- GB/T 5231-2022加工铜及铜合金牌号和化学成分
- GB/T 5097-2020无损检测渗透检测和磁粉检测观察条件
- GB/T 24689.2-2017植物保护机械杀虫灯
- GB 32166.1-2016个体防护装备眼面部防护职业眼面部防护具第1部分:要求
- 第21课《女娲造人》课件(共22张PPT) 部编版语文七年级上册
- 2022-2023学年人教版高中地理选择性必修一课件:5.1 自然地理环境的整体性 (33张)
评论
0/150
提交评论