商务智能的考试重点_第1页
商务智能的考试重点_第2页
商务智能的考试重点_第3页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1?商务智能的基本概念(简答)对工业界來说,商务智能是一类技术或工具,利用他们可以对大量的数据进行收集、管理、分析和挖掘,以改善业务决策水平,增强金业竞争力。对学术界来说,商务智能是一套理论、方法、和应用,通过他们可以快速的发现海量数据中隐含的各种知识, 冇效的解决企业而临的管理和决策问题,支持企业的战略实施2.商务智能系统的开发过程规划识别业务需求识別信i息需求时间成本规划设计OLAP设计数据集市数据挖掘设计1 1V 1 /需求分析1详细的需求分析技术:选择1在线 分析 处理数据挖掘算法实现构建数据仓昨构建数据集市聊强 查询 报表3?在线分析处理和在线事务处理 (简答)在线事务处理在线分析处

2、理用户普通职员管理人员和分析人员功能日常业务处理决策支持数据库设计高度规范化非规范化数据处理在线插入、删除、修改批量加载和删除使用方式重复操作即时的、图表形式的交互查询执仃单兀短的事务处理复杂的查询数据当前的、细节的数据丿力史的汇总数据性能指标事务吞吐量查询响应时间事务特性并发控制和事务恢复很重要并发控制和事务恢复不匣要4.决策支持系统的系统架构(1) 模型库管理系统主要用于管理决策所需的各种模型,例如财务、统计、预测以及管理等方面的定量模型,利用这些模型可以进行问题分析。用户利用该系统可以方便快捷的构建和操纵模型。系统提供对模型的分类、删除、复制等维护功能,可以将已冇模型进行合并,以及对模型

3、的执行情况进行跟踪、分析和评价,如对变量进行嫩感度分析等。(2) 知识库管理系统提供知识的表示、存储和管理功能,用于支持定量模型无法解决的决策过程,帮助用户建立、应用和管理描述性、过程性和推理性知识。(3) 对话产生与管理系统主要负责用户与系统 Z间的交互。接受用户的输入,能 够与数据库管理系统、模型库管理系统和知识库管理系统进行交互,以各种形式将结果返回给用户,提供图形用户界面以及可视化功能。川户对话产牛与管理系统知识库管理系统知识库数据咋倉理系统模型丿乍管理泵统模型库数据库6?回归:回归方法中最常用的是线性回归,包括一元线性回归、多元线性回归以及非线性回归。线性回归方法不仅用于预测,也口J

4、 以用作解释模型,以探寻变量 之间的关系。另外述有回归树和模型树等模型。7.回归系数的显著性检验:回归系数的显著性检验可以采用 t 检验。对于每个回归系数 b (41, 2, ? ? ? ?)k , 显著 性检验的两个假设分别为 Ho: bK和h biHO。若6=0说明自变量&的变 化对因变量 没冇线性影响,即变量冶对因变量的影响不显著。为每个回归系数b.构造变量S如式所示:式中 5 是对矩阵 C 二 XXF 的对角线上的第 i 个值。给定显者性水平a,查自由度为(n-k-1)的t分布表,得到ta (n-k-1),若tbi>t ?(n-k-1),则拒绝假设H°,即回归系

5、数b显著。在通过以上显著性检验之后,给定一个因变量位置的样本(xti,Q将其带入式5二b°bN+SXk屮的各个自变量取值屮就可以得到因变量的一个预测值。?回归树和模型树:都是通过自顶向下分而治之的思想,将训练集不断分割成子 据集来不断扩展树枝,当满足 - 定条件吋停止树的生长9?聚类效果衡量方法:(概念)凝聚度:是用丁 ?衡量簇内各对象紧密程度的常用度量 分离度:用于衡量簇间齐对象的相异程度。轮廓系数:也是将凝聚度和分离度相结合的一种度量10.4 类主要的数据预处理任务:(简答)1 ) 数据规范化2) 数据离散化3) 数据清洗4) 特征提取与特征选择噪音数据的处理以及数据不一致的 识

6、别11. 数据清洗的主要任务是数据缺失的处理、 和处理。以将填补数据缺失方法:将属于同一类的对象的该属性值的均值赋予此缺失值;还可 其转换为分类问题或数值预测问题。他非噪音的处理方法可以分为两类:一类是识别出噪音,将其去除;另一类是利用其 噪音数据降低噪音的影响,起到平滑的作用。12?多维数据模型 (名):又称维度数据模型, 由维度表和事实表两种类型的表构 成。 为了解企业内业务过程的绩效, 通常可以通过多种度量指标加以衡量。 对于 每个度量, 可以从多种视角和方位进行分析,这就是不同维度。度量通常是定量 属性(还有数值 型属性),存放于事实表中;维度属性综合起来限定了度量的取 值粒度。13?

7、在线分析处理 OLAP 的定义:在线分析处理是一类软件技术, 利用它可以使分 析 人员、管理人员以及主管从多种信息视角通过快速、一致和交互地访问数据 , 达到对 数据的洞察。这些视角是从原始数据转换过来的,反映了金业的真实维度 , 易于被用 户理解。14.积分卡和仪表盘(名词解释):是常用的两种展示企业关键业务业务指标和度 量 的可视化工具。积分卡用于显示企业的关键性能指标 (KPT),仪表盘综合各种类型 的图形和报表,提供丰富的可视化界面,提供一个金业在某个时间的业务状态。15?云计算的定义:是一种基于互联网的计算方式,通过这种方式,共享的软硕 件资源和 信息可以按需捉供给计算机和其他设备1

8、?商务智能的系统构成 ( 填空/ 简答/ 论述 )(1) 数据源 商务智能的根本是数据。数据的来源主要包括企业内部的操作型系统,即支持各 业 务部分日常 ' 运营的信息系统,以及企业外部的信息。(2) 数据仓库各种数据源的数据经过抽取、传换 Z 后需要被放到一个供分析使用的环境,以便对数据进行管理,这就是数据仓库。 数据仓库可以将分析数据与实现业务处理的操作型数据隔离,一方面不影响业务处理系统的性能,另一方面为数据的分析提供了一个综合的、集成的、统一的数据管理平台。(3) 在线分析处理 数据仓库中的数据可以通过不同的方法进行分析。在线分析处理是其中的方式Z 一。利用该法,业务性能度量可

9、以通过多个维度、多个层次进行多种聚集汇总, 通过交 互的方式可以发现业务运行的关键性能指标的异常之处。(4) 数据探查数据探杳包括灵活的杳询、即时报表以及统计方法等。该类方法属于被动分析方 法, 因为这些分析方法需要基于分析者对于问题的假设。(5) 数据挖掘数据挖掘是从大量数据中自动发现隐含的信息和知识的过程, 属于主动分析方法 , 不 需耍分析者的先验假设,可以发现未知的知识。数据挖掘可以作用于结构化数据,也可以对文木数据以及多媒体数据进行分析。常用分析方法包括分类、聚类、关联分析、数值预测、序列分析、社会网络分析等。(6) 业务绩效管理业务绩效管理,乂称为企业绩效管理,是对企业的关键性能指

10、标( 如销售、成本、 利润以及可盈利性等 ) 进行度量、监控和比较的方法和工具。2?数据仓库的体系结构:(论述)数据源部分:支持企业口常业务的操作性系统中的数据以及已经存档的数据 都 是数据仓库的数据来源。 各种数据源屮的数据通过一定的处理才能储存到 数据仓库 中,处理一般利用 ETL (抽取转换加载)工具完成。抽取过程:从不同的数据源把需要的数据读取出来就是抽取过程,不同的数 据 源的数据结构可能不同,因此,需要针对不同的数据源采用不同的抽取工具, 口 J 直接使用商品化的工具來抽取常见数据结构的数据。转换过程:主要涉及数据清洗、数据集成、数据汇总等功能。加载过程:分为两种情况:一种是数据仓库建成之初,需要将各种数据源中 的 数据大批量的一次性导入到数据仓库屮;另一种是数据仓库正常运作之后,需 要将 操作性系统的数据更新定期加载到数据仓库中。不同的数据的加载频率可以 不同。元数据部分 : 是对数据仓库小数据的描述信息。主要描述三方面的信息:数 据源

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论