已阅读5页,还剩66页未读, 继续免费阅读
(工商管理专业论文)基于数据仓库技术的财务数据分析系统研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘 要 摘要 当 今世界充 满了 激烈竞争, 准确及时的 决策是企业生存和发展的 重要环节。为了充分满足数据分析和决策支持的需求,近几年兴起的 数据仓库技术己在国内外的证券、 金融、 财务管理等领域得到了应用, 并且效果明显。 工业分析师们预测在未来的 2 0 年内, 数据仓库将在更 广泛的领域内被更多企业运用于企业管理当中。 太原铁路分局财务分处基本实现业务流程的计算机化后,数据资 源比 较丰富, 有待加强的是财务数据分析系统的建设。为了最大限 度 地提高数据的 利用率, 提高财务管理和科学决 策水平,在掌 握数 据仓 库基本理论和借鉴数据仓库在财务数据分析解决方案中 应用的 基础 上,决定运用数据仓库技术进行财务数据分析。 通过对太原铁路分局财务分处业务流程的调研、需求的分析、模 型的建立, 遵循数据采集、清洗、转换、 存储和数据分析的实施步骤, 开发了 “ 财务数据分析系统” 该系统运用数据仓库技术, 采用先进的 o l a p 工具为用户 提供了丰富的 数据分 析功能, 可从多个角度、 以 多种 形式、连续地展现管理者和决策者所需的财务信息,基本实现了进行 财务数据分析和辅助领导决策的需要。 同时,结合 “ 财务 数据分 析系统” 建设过程中遇到的问 题, 介绍 了建立数据仓库的体会,并就进一步完善分析功能、提高分析效率提 出了新的设想。 本论文正文共分为六大部分,第一部分是数据仓库概述,介绍了 数据仓库的产生与发展,重点从概念、架构、数据组织和种类等方面 阐述了数据仓库的基础理论;第二部分介绍了数据仓库的工具和主要 应用情况;第三部分分析了太原铁路分局财务管理现状,重点分析了 业务流程;第四部分是太原铁路分局财务数据分析系统的需求分析, 重点介绍了分析模型的设计;第五部分展示了系统的实现情况;第六 部分剖析了运用数据仓库进行财务数据分析的体会和完善系统建设 的思考。 关键词: 财务 联 机分析 ( o l a p ) 数 据仓库 a b s t r a c t a b s tr a c t w i t h i m p e t u o u s c o m p e t i t i o n i n o u r w o r l d , i t i s c r i t i c a l t o m a k e d e c i s i o n a c c u r a t e l y a n d t i m e l y f o r a n y e n t e r p r i s e w h i c h w a n t t o s u r v i v e a n d d e v e l o p . i n o r d e r t o m e e t t h e n e e d o f e n t e r p r i s e s d a t a - a n a l y z i n g a n d d e c i s i o n - s u p p o r t i n g , t h e t e c h n o l o g y o f d a t a w a r e h o u s e ( d w ) h a s s p r i n g e d u p i n t h o s e y e a r s a n d b e e n a p p l i e d e f f e c t i v e l y i n m a n y f i e l d s s u c h a s n e g o t i a b l e s e c u r i t i e s , f i n a n c e a n d s o o n . i t i s p r e d i c t e d t h a t d w w o u l d b e u s e d i n b u s i n e s s m a n a g e m e n t m o r e w i d e l y i n 2 0 y e a r s . a f t e r c o m p u t e r s w e r e i n t r o d u c e d i n t a i y u a n r a i l w a y s u b s t a t i o n f i n a n c i a l d e p a r t m e n t , i t i s u r g e n t t o e n h a n c e f u n c t i o n o f d a t a - a n a l y z i n g . t h e r e f o r e o n b a s e o f t h e t h e o r y o f d w, t h e s o l u t i o n b a s e d o n d w w a s c h o s e n t o i m p r o v e d a t a - u s i n g e f f i c i e n c y a n d t h e l e v e l o f d e c i s i o n - m a k i n g . i n t h e s e q u e n c e o f a n a l y z i n g r e q u i r e m e n t , m o d e l i n g a n d c o l l e c t i o n , f i l t r a t i o n , e x t r a c t i o n o f d a t a a n d d a t a - a n a l y s i n g , 七 h e f i n a n c i a l d a t a - a n a l y z i n g s y e t e m w a s r e a l i z e d . w i t h t h e h e l p o f t e c h n o l o g y o f d w a n d o l a p , t h e s y s t e m c a n a n a l y z e t h e o v e r a l l f i n a n c i a l i n f o r m a t i o n c o m p r e h e n s i v e l y a n d c o n t i n u o u s l y a n d f u l f i l l t h e e s s e n t i a l n e e d o f d e c i s i o n - s u p p o r t i n g . a t t h e s a m e t i m e , a c c o r d i n g t o t h e p r o b l e m e m e r g e d d u r i n g t h e i m p l e m e n t i n g o f t h e s y s t e m , t h e a r t i c l e d i s c u s s e d t h e e x p e r i e n c e o f b u i l d i n g d w a n d b r o u g h t f o r w a r d t h e a s s u m p t i o n t o p e r f e c t a n a l y t i c a l f u n c t i o n a n d i n c r e a s e a n a l y t i c a l e f f i c i e n c y . t h e a r t i c l e c o n s i s t s o f s i x p a r t s . t h e f i s t p a r t i n t r o d u c e d t h e b e g i n n i n g a n d d e v e l o p m e n t o f d w a n d e m p h a s e s e d o n i t s c o n c e p t i o n , a r c h i t e c t u r e , d a t a - o r g a n i z i n g a n d c a t e g o r y . t h e s e c - a n d i n t r o d u c e d m a i n t o o l s a n d a p p l i c a t i o n s o f d w . t h e t h i r d a n a l y z e d t h e p r e s e n t m a n a g e m e n t s t a t u s o f f i n a n c i a l d e p a r t m e n t a n d t h e f i n a n c i a l b u s i n e s s p r o c e s s . t h e f o r t h d e s c r i b e d t h e p r o c e s s o f r e q u i r e m e n t - a n a l y z i n g a n d m o d e l - d e s i g n i n g . t h e f i f t h d e s c r i b e d t h e i m p l e m e n t i n g o f d a t a - a n a l y s i n g s y s t e m . a n d t h e l a s t p a r t e x p a t i a t e d o n t h e f u r t h e r c o n s i d e r a t i o n o f f i n a n c i a l a n a l y z i n g s y s t e m b a s e d o n d a t a w a r e h o u s e . k e y w o r d s : f i n a n c e o l a pd a t a w a r e h o u s e 5 8 6 5 8 2 独创性声明 本人声明, 所呈交的学位论文是我个人在导师指导下进 行的研究工作及取得的 研究成果。 尽本人所知, 除了文中特 别加以 标注和致谢的地方外, 论文中不 包含其他人已 经发表 或撰写过的 研究成果, 也不包含为获得北京交通大学或其他 教学机构的学位或证书而使用过的材料。 与我一 起工作的同 志对本研究所做的任何贡献已在论文中作了明确的说明并 表示了 谢意。 本人签名: 日 期: 2 0 0 3 - 年 1 2 一 月 卫 生日 数据仓库 概述 数据仓库概述 数据仓库的产生与发展 当 今世界充满了 激烈竞争。 正确及时的决 策是企业生存和发展的 重要环节。现在,愈来愈多的企业认识到,要想在竞争中取胜,获得 更大的收 益,至关重 要的是,必须充分利用信息技术 ( i t ) , 深层次 地分析、 挖掘当 前的和历史的生产经营数 据, 以及 相关环境的 有关数 据,自 动快速获取其中有价值的决策信息, 为企业提供快速、 准确和 方便的决策支持, 为企业制定短期计划和长远规划提供科学的理论指 导, 使企业的决策者及时掌握 企业的 运行情况和发展趋势, 实现科学 决策,最终提高企业的管 理水平和竞 争优势。 在 2 0 世纪,企业 信息化的目 标 绝大部分都是锁定在实现工作流 程自 动化上。 计算 机系统的 功能 从数 值计算扩展到数据管理距今己 有 三十多年了。 最 初的 数据管 理形式主 要是文件系统, 少数是层次型或 网 状数据库, 均属于传统的封闭数据库系统, 到了1 9 6 9 年, e . f . c o d d 博士发表了著名的关系数据模型的论文,开创了数据管理的新时代。 整个 8 0 年 代直到9 0 年代初, 联机事务处理 ( o n l i n e t r a n s a c t i o n p r o c e s s i n g / o l t p ) 一直是数据库应用的主流。 当联机事务处理系统应用到一定阶段, 企业家们便发现单靠拥有 联机事务处理系统已经不足以获得市场竞争的优势, 他们需要对其自 身业务的运作以及整个市场相关行业的状况进行分析, 从而做出有利 的决策。 为了充分满足数据分析和决策支持的需求, 近几年兴起了一 种新的 信息技术 数据仓库 ( d a t a w a r e h o u s e ) 。 著名的 数据仓 库 专家 r a l p h k i m b a l l 写道: “ 我们花了二十多年的时间将数 据放入数 据仓库,如今是该将它们拿出来的时候了。” 数据仓库的概念一经出现,首先被应用于金融、电信、 保险等主 要传统数据处理密集型行业。 i i ) c在 1 9 9 6年的一次对 9 0 年代前期进 行的 6 2 个数据仓库项目 的调查结果表明: 进行数据仓库项目 开发的 公司在平均 2 . 7 3 年的时间内获得了平均为 3 2 1 %的投资回报率。 目 前, 数据仓库技术己在国内证券、银行、税务、保险、商业、保健等领域 进行了应用,并取得了良 好的效果。随着数据仓库技术的日臻成熟, 工业分析师们预测在未来的 2 0年 内,数据仓库将在信息业界将占有 北京交通大学硕士学位论文 一席之地,并将在更大的领域 内被更多企业运用于企业管理当中。 z . 数据仓库的基础知识 2 . 1 . 数据仓库的 概念 传统的 数据库技术 是单一的数据资源,即以 数据库为中 心, 进行 从事事务处理、 批处理到决策分析等各种类型的 数据处 理工作。 近年 来, 随着计算机应用和网络技术的发展, 开始向两个不同的方向拓展: 一是广度计算,一是深度计算 。 所谓广度计算就是把计算机的应用范 围尽量 扩大, 实现广泛的数据交流, 互联网 就是广度计算的 特征。 所 谓深度计 算就 是人们 对以 往计算机的简单 数据操作, 提出了更高的要 求, 希 望计算 机能 够更多 地参与数 据分析与 决策制定等领域。 特别是 数据库处 理可以 大致 地划分为两大 类: 操作型处理和分析型处 理。 操 作型处理 ( o l t p ) 也 叫事务 处理, 是指对数 据库联机的日 常操作, 通 常是对一个或一组纪录的查询和修改,主要为企业的特定应用服务 的,注重响应时间,数据的安全性和完整性;分析型处理( o l a p ) 则用 于管理人员的决策分析, 经常要访问 大量的历史数据。 数据库系统作 为数据管理手段,从它的诞生开始,就主要用于事务处理, 传统的业 务系统一般是 直接建 立在这种事务处理环境 上的。随 着技术的进步, 管理者对于决策分析, 也就是分析处理的功能越来越高,然而由于事 物处理和分析处理具有极不相同的性质, 直接使用事务处理环境来支 持决策是行不通的。 正是由于传统数据库系统难于实现对数据分析处 理要求,已经无法满足数据处理多样化的要求, 数据仓库技术应用而 生了。 数据仓库( d a t a w a r e h o u s e ) 概念的形成是以p r i s m s o l u t i o n s 公 司副总裁、“ 数据仓库之父” w i l l i a m h . 工 n m o n 先生在1 9 9 0 年出 版的 建立数据仓库( b u i l d i n g t h e d a t a w a r e h o u s e ) 一书为 标志的。 随 后, w i l l i a m h . i n m o n 先生又给出了 更为精 确的定义:数据仓库就 是 在企业管理和决策中面向主题的、 集成的、 稳定的、 不同时间 的数 据集合, 用以 支持经营管 理中的决策制定过程。 从 这个定义可以看出, 数据仓库拥有以下四个特点: . 主题特性。操作型数据库的数 据组 织面向事务处理任务,各 个业务系统之间 各自 分离, 而数据仓库中的 数据是按照一定的主题域 进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策 数据仓库概述 时所关心的重点方面,一个主题通常与多个操作型信息系统相关。 . 集成特性口面向事务处理的操作型数据库通常与某些特定的 应用相关,数据库之间相互独立, 并且往往是异构的。而数据仓库中 的数据是在对原有分散的数据库数据抽取、 清理的基础上经过系统加 工、汇总和整理得到的, 必须消除源数据中的不一致性,以保证数据 仓库内的信息是关于整个企业的一致的全局信息。 . 稳定特性。操作型数据库中的数据通常实时更新,数据根据 需要及时发生变化. 数据仓库的数据主要供企业决策分析之用, 所涉 及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一 般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作, 但修改和删除操作很少,通常只需要定期的加载、刷新。 . 渐变特性。操作型数据库主要关心当前某一个时间段内的数 据, 而数据仓库中的数据通常包含历史信息, 系统记录了企业从过去 某一时点 ( 如开始应用数据仓库的时点) 到目前的各个阶段的信息, 通 过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预 测。 企业数据仓库的建设, 是以现有企业业务系统和大量业务数据的 积累为基础。 数据仓库不是一个静态的概念, 而是一个不断进行设计、 构造、 管理和维护的循环过程。正是基于这一点, 数据仓库建设不是 一个项目或产品, 而是一个过程。 而数据仓库的主要任务是把数据加 以整理归纳和集成, 并及时提供给相应的管理决策人员, 用以进行分 析决策。 1 . 2 . 2 . 数据仓库的基本架构 数据仓库不仅包含了分析所需的数据, 而且包含了处理数据所需 的应用程序, 这些程序包括了将数据由外部媒体转入数据仓库的应用 程序,也包括了将数据加以分析并呈现给用户的应用程序。在应用系 统中, 数据仓库主要由数据源、仓库管理和分析工具三部分组成,如 图 1 - 1 所示。 数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常 包括企业内部信息和外部信息。内部信息包括存放于 d b m s中的各种 业务处理数据和各类文档数据, 这些数据可以来源于企业内部的办公 系统、e r p系统,甚至是e x c e l 表格。外部信息包括各类法律法规、 市场信息和竞争对手的信息等等。 北京交通大学硕士学位论文 仓库管理:是整个数据仓库系统的核心,为数据仓库中的数据提 供一个管理平台, 他的主要功能是对数据进行存储和管理。由于数据 源的复杂多样性, 在数据进入数据仓库系统之前, 要对数据进行抽取、 转 换和 过 滤, 也 就 是 使 用e t l ( e x t r a c t i o n , t r a n s f o r m a t i o n , l o a d ) 工具。 e t l 工具 将原始数据进 行抽取, 将多 余的 数据删除, 给必 要但 缺乏的数 据提供默认值, 然后将数据转换, 保持数据的一致性, 最后 将数据加载到数据仓库中。同时, 数据仓库还要完成一些主要管理任 务,包括批处理作业管理、数据安全管理、 元数据管理和数据的备份 与恢复等。数据管理平台为数据仓库的正常运行提供了基本保障。 q la p 胭场. 琪 鹦黔黔影 翻翻 工三 盈拐 旅 己 图 1 - 1 县_ . 带 口 - 盆组妞市臼 , a p 盈妥趁 数据仓库架构图 分析工具:主要包括各种报表工具、查询工具、数据分析工具、 数据挖掘工具以 及各种基 于数 据仓库或数据集市的 应用开发工具, 其 中联机分析处理和数据挖掘是两个最重要的工具。联机分析处理 ( o l a p ) 是基于数据仓库的分 析处理过程, 是数据仓库的 用户 接口。 o l a p以多维数据分析著称, 它允许多角度、 多方位地考察用户的信息, 如 产品维度、 地理维 度、 时间 维度和用户自 定义维度等。 数据挖掘( d m ) 是一种知识发现的方法, 是按照企业既定的业务目标, 对大量企业数 据 进行探索, 揭示隐藏在其中的 规律性并进一步进行模型化的先进而 有效方法。 进行数据挖掘的 主要方法包括回归分析、 决策树和神经网 络等。 数据仓库概述 2 . 3 . 数据仓库的数据组织 数据仓库中的数据分为四个级别:早期细节级、当前细节级、轻 度综合级、高度综合级。源数 据经过 综合后, 首先进入当前 细节级, 并根据具体需要进行进一步的 综合, 从 而进入轻度综合级乃 至高 度综 合级, 老化的 数据将进入早期细节级。由 此可见, 数据仓 库中 存在着 不同的综合级别,一般称之为 粒度 , 粒度问题是设计数据仓库时需 要考虑的一个重要方面。 粒度是数据仓库的数据单位中保存数据的细 化程度或综合程度的级别。 粒度越大, 表示细节程 度越低, 综合程度 越高,反之,综合程度越低。当数据仓库空间有限时, 用高粒度级表 示 数据将比用低粒度级表示的 数据效 率要高 得多, 然而 对于高 粒度级 的数据,回答查询的能力也将随之下降。 数据仓库的数据来源于操作型系统环境中的大量历史数据, 这些 数 据在数 据仓库中如何 进行合 理的组 织是一个重要的问 题。 选择哪种 数据组织方式要结合数据量、 存储环境和分析需求等因素进行综合考 虑。数据仓库中最为常见的数据组织形式主要包括: .简单堆积文件: 它将每日由 数据库中 提取并加工的数据逐天 积累并存储起来。这里的事务处理是以天来进行综合的。相对而言, 这种方式最简单,也保存了最完整的细节数据。 然而, 这种方式的数 据量也最大,要占据大量的空间。 .轮转综合文件: 数据存储单位被分为日、 周、 月、 年等几个 级别。 在一个星期的七天中, 数据被逐一记录在每日数据集中; 然后, 七天的数据被综合并记录在周数据集中: 接下去的一个星期,日数据 集被重新使用,以记录新数据。同理, 周数据集达到四个后,数据再 一次被综合并记入月数据集。以此类推。轮转综合结构十分简捷, 数 据量较简单堆积结构大大减少。 当然, 它是以损失数据细节为代价的, 越久远的数据,细节损失越多。 . 简化直接文件:它类似于简单堆积文件,但它是间隔一定时 间的数据库快照,比如每隔一星期或一个月作一次。这种方式不是在 每天的 基础上组织的, 而是以 较长的时 间为单位的, 这 样在数据仓库 中的数据与操作环境的数据有一点的间隔, 但它降低了数据加载的频 率。 使用合理的数据组织形式,建立合适的粒度级别,不仅能节省数 据仓库的资源消耗, 还能提高数据仓库的性能, 提高汇总分析的效率。 北京交通大学硕士学位论文 1 . 2 . 4 . 数据仓库的种类 如果将数据仓库以其规模与应用层面来加以区分, 大致可以分为 以下四种: . 标准数据仓库 ( s t a n d a r d d a t a w a r e h o u s e ) :它是企业最常 用的数据仓库,是依管理决策的需求而将数据加以整理分析, 再将其 转换至数据仓库之中。它是以整个企业为着眼点而构建出来的, 所以 其数据都是有关整个企业的数据, 用户可以从中得到整个组织运作的 统计分析信息。 . 数据集市 ( d a t a m a r t ) :它是针对某一个主题或是某一个部 门 而构建的数据仓库, 一 般而言, 它的规模会比 标准数据仓库小。 例 如,一个企业内部的财务部门、市场部门、销售部门等业务部门,都 可以 构建自己的 数据集市。数据集市只存储与部门或主题相关的 数 据。 . 多层数据仓库 ( m u l t i - t i e r d a t a w a r e h o u s e ) :它是标准数 据仓库与数据集市的一种组合应用方式,在整个架构中,有一个最上 层的数据仓库提供者,它会将数据提供给下层的数据集市。多层数据 仓库的好处是拥有统一的全局性的数据源, 创建部门使用的数据集市 就比较省时、 省事,而且各数据集市的工作人员可以分散整体性的工 作开销。 . 联合式数据仓库 ( f e d e r a t e d d a t a w a r e h o u s e ) 。它是在整体 系统中包含了多重的数据仓库或是数据集市系统, 也可以包括多层的 数据仓库,但是在整个系统中只有一个数据仓库数据的提供者。 这种 数据仓库系统适合大型企业使用。 数据仓库的工具和士要应用 2 . 数据仓库的工具和主要应用 2 . 1 . 数据仓库的两大工具 数据仓库是一种企业解决方案, 而不是一件产品, 主要提供用于 决策支持的当前数据和历史数据, 对这些数据的决策分析在传统的操 作型数据库中很难甚至无法进行。 数据仓库技术是为了有效地把操作 型数据集成到统一的环境中以提供决策型数据访问的各种技术和模 块的总称,能提供一个完整的并且完全集成的商务智能方案。 无论在 客户机/ 服务器和 还是 在w e b环境中, 一个好的 解决方 案应 具有强 大 的查询、 分析和报表功能, 以便让用户更快、 更方便地查询所需信息, 得到决策支持。目 前, 数据仓库的解决方案主要提供了 两大工具: 联 机分析处理 ( o n l i n e a n a l y t i c a l p r o c e s s , o l a p ) 和数据挖掘 ( d a t a m i n i n g , d m ) . 2 . 1 . 1 联机分析处理 ( o l a p ) 联机分析处理( o l a p ) 的概念最早是由关系数据库之父 e . f . c o d d 于 1 9 9 3 年提出的。 当时, c o d d 认为联 机事务处理( o l t p ) 已 不能满足 终端用户对数据库查询分析的 需要, s q l 对大数 据库 进行的 简单查 询 也不能 满足用户分析的 需求。 用户的决策分析需要 对关系数据库进行 大量计算才能得到结果,而查询的结果并不能满足决策者提出的需 求。因此 c o d d提出了多维数据库和多维分析的概念,即 o l a p . o l a p一个更明确的定义是共享多维信息的快速分析, 要理解这 一定义, 首要的要掌握维的概念。 假定某个百货零售商, 有一些因素 会影响他的销售业务, 如商品、时间和流通渠道等,更具体一点,如 品牌、月份、地区等。 对某一给定的商品,也许他想知道某种商品在 某段时间的销售情况。这里所提到的商品品牌、时间和地区都是维, 维就是相同类数据的集合,也可以理解为变量。更通俗的讲,维就是 管理者进行分析时所采用或关注的角度。 他想从时间这个角度对销售 情况进行分析, 那么这里的时间就是一个维度。 对于 o l a p另一个重 要的 概念就是度量, 度量就是管 理者进行决策分析查 询时所使用的 指 标。 如对于某商店的销售情况而言,管理者可能很关心销售的数量和 北京交通大学硕士学位论文 销售的金额, 那么这里的销售数量和销售金额作为两个重要的分析指 标,就是我们所说的度量值的概念。 o l a p的本质特征在于它的多维性。人们很容易理解一个二维表 ( 如通常的电 子表格) ,二维表是关系数据库的主 要存储方式。 o l a p 通常将三维立方体的数据进行切片, 显示三维的某一平面。 如一个立 方体有时间维、商品维、 地理维,其图形很容易在屏幕上显示出来并 进行切片。如图z - 1 所示,就是一个简单的三维立方体模型,这是一 个对产品销售量加以分析的多维模型, 其中包含了三个维度:时间维 度、 地理维度和产品维度和一个度量值:销售量。也就是说管理者将 从时间、地理位置和产品类型这三个角度对销售量这个指标加以分 析。 其中在这个立方体中的每一个单元格中都会对应一个数值, 也就 是一个立方体的切片。 多雄教 据视图 京海州 北上广 地理位t 产品 类 型 图z - 1 o l a p三维立方体模型视图 同时, o l a p的多维分析视图冲破了物理的三维概念,采用了旋 转、 嵌套、 切片、 钻取和高维可视化技术, 在屏幕上展示多 维视图的 结构,使用户直观地理解、分析数据,进行决策支持。 相对以 往的事务处理系统, o l a p 具有以 下良 好的 特性: . 快速性: 用户对 o l a p的 快速反应能力有很高的 要求。 对于 分析需求而言,如果响应时间过长,会影响用户的分析思路,降低分 析效果。 而o l a p 采用一些专门的存 储格式, 实现将一些聚合数据存 储在立方体中,以便提高快速的响应。 . 可分 析性: 在o l a p 的使用 过程中, 尽管系统需要事先编程, 但并不意味着系统已定义好了所有的应用。 用户无需编程即可定义新 的专门计算, 将其作为分析的一部分, 并以用户理想的方式给出报告。 . 信息性:不论数据量有多大,也不管数据存储在何处, o l a p 数据仓库的工具和主要应用 系统都能及时获得信息,并且对大容量的数据加以管理。 2 . 1 . 2 数据挖掘 ( d m ) 数据挖掘,也称知识挖掘, 是对巨大的数据集进行寻找和分析的 计算机辅助处理过程, 在这一过程中发现先前未曾发现的模式, 然后 从这些数据中发掘某些内涵信息,包括描述过去和未来趋势的信息。 数据挖掘是一个过程, 在大量的数据中发掘隐藏在其中的有意义的某 种模式和关系. 数据挖掘对于那些收集了大量的历史资料的机构组织来说更有 价值。一方面, 数据挖掘要以大量的、规范的历史数据为基础,数据 仓库的数据来源于整个企业, 保证了数据挖掘中数据来源的广泛性和 完整性, 数据挖掘技术是数据仓库应用中比较重要也是相对独立的部 分。 另一方面,要进行数据挖掘需要建立合适的挖掘模型,挖掘模型 是指由数据挖掘算法编译而成的物理模型。 简单地说, 数据挖掘是这样的一个过程: 首先从原始数据源中提 取和过滤有用的数据, 并且进行校验,保证数据的一致性、兼容性和 完整性。 然后,创建或选择合适的挖掘模型, 模型是一个特定的存储 己经过算法处理的数据结构, 将数据在挖掘模型中进行分析, 所得到 的结果集用来支持决策。最后对于已经建立好的挖掘模型要进行维 护,保持其有效性和对变化的适应性。 目前, 数据挖掘技术正处在发展当中。 数据挖掘涉及到数理统计、 模糊理论、神经网络和人工智能等多种技术, 技术含量比较高,实现 难度较大。此外,数据挖掘技术还会同可视化技术、地理信息系统、 统计分析系统相结合,丰富了数据挖掘技术及工具的功能与性能。 2 . 2 . 数据仓库在财务数据分析中的应用 对于企业决策层来说, 随着财务分析范围的扩大和自身防范经营 风险的迫切需要, 财务分析所涉及的基础业务数据越来越多,分析人 员需要同会计部门和各个生产、 经营部门特别是同市场部和生产部进 行密切联系。 于是,手工或半手工方式进行财务分析工作变得越来越 困难,财务分析人员早己不堪重负,有时甚至束手无策。 随着我国财务电算化 事业, 特别是 现代化企业的垂直式管 理模式 的推广,改变了多年的宝塔型管理模式, 并使越来越多的企业实施了 北京交通大学硕 七 学位论文 财务电算化。企业的会计凭证、账薄、报表等会计数据大多以电子形 式存储于账套文件中。 财务电 算化在一定 程度上解决了 传统的 财务数 据处理的复 杂性和繁琐性。 然而, 企业的财务活动情况及经营成果, 虽然反映在财务报告及 其它有关资料上, 但这些资料往往只是对企业的财务活动做较浅层次 的描述, 而未能揭示其本 质特征和内 在联系。 因 此, 有 必要对这些资 料进行分析研究, 使他们转化为对企业决策和管理更直 接、 更有用的 信息。利用数据仓库技术进行财务分析,可以将企业大量复杂的历史 数据加 以采集整理,并按决策者的需求,灵活地展现出来。使用者可 以从多个角度、 以多种不同的 形式( 动态表格、 动 态图 形或图 表结合) , 连续地展现所需财务信息,以供辅助决策。 目前已经有很多企业 已经使用或正在开发财务数据分析系统的 数据仓库解决方案。 财务分 析系 统是以企 业的财 务及其相关数据为依 据,运用数据仓库技术, 对企业的财务状况和经营成果进行剖析、 研 究和评价, 为企业内 外有关 方面的 决策和管理提供服务的智能分析系 统。 数据仓库 在财务数据分 析领域能够很好的 起到汇总分析和辅助决 策的功能,这是在一般意义上的财务电算化系统中无法比拟的优势。 为了满足财务数据分析的需求, 数据仓库的解决方案, 提供了全 面的、准确地、多 方位的 财务指标分析功能, 其中 包括: . 收入分析:对主营业务收入、投资 收益、 其它业务利润、营 业外收支净额、其它各项收入 ( 补贴和以前年度损益调整) 、人均创 效、单位营业面积创效等加以分析。 . 费用分析:对费用额、( 累计)费用率、( 本月或本年累计) 费用占销货比率等加以分析。 . 利润分析: 对利润或亏损总 额、净利润、 实现利税、 缴纳利 税、 净资产收益率、 总资产报酬率、资 本金利润率、 销售利润率、 获 利倍数、社会贡献率等加以分析。 . 资产分析:对资产总额、流动资产、应收账款、存货、待摊 费用、待处理流动资产净损失、长期投资、固定资产、 在建工程、无 形资产、 长期待摊费用、资 产负债率、 流动比 率、 存货周 转率、 应收 账周转率、不良资产比率等加以分析。 . 其他分析:如现金流量分析、保值增值分析、综合指标分析 等等。 实 例: 青岛市商业总公司运用数据仓库技术开发的 青岛 市商业 总公司智能分析系统己于 2 0 0 2年 1 月在正式运行。该系统融合了 商业总公司下面的 1 7家 ( 重组后变为 1 家)大型企业集团 ( 包括零 售业、批发业、工业、服务业、其它,共 5 种行业)的财务数据,每 数据仓库的工具和主要应用 月 对此 进行专业的财 务分析。 数据仓库技术在财务数 据分 析系统中 发 挥着重要的作用,一方面,简化了商业总公司每月的财务分析报表、 汇总报 表和上 报报表的 制作过程, 与原有半自 动化方 式的 财务分析系 统相比, 这一解决 方案大大减少了 财务分析人员的 工作量; 另一方面, 显著提高了 财务分析结果的详细程度和各个分析 指标的精度, 并可很 快地满足公司 决策层随时提出的各种分析要求, 为 公司的决策提供了 强有力的支持。 2 . 3 数据仓库在金融领域的 应用 随着社会主义市场经济改 革的深 化, 传统的 计划金融 模式逐渐瓦 解,市场金融模式逐渐形成, 由此而带来了银行对各种金融变量控制 的随机性和模糊性。如何防范银行的经营风险、 实现科学管理以及进 行决策,成为当今金融研究的一个重要课题。 利用数据仓库的强大功 能, 银行可以 建立企业客户群、 个人客户群的数 据库, 并 对企业的 结 构、经营、财务、市场竞争等多个数据源进行统一的组织,形成一个 一体化的 存储结 构, 为 决策分析奠定基础。 银行决 策支持系统是建立 在银行管理信息 系统基础之上的、以 银行数据库 和数据仓库为基础, 包括各种辅助制定货币 政策、 开拓金融业务等的 模型 库、 方法库和知 识库。 例如有许多 著名的 金融机构从基于大型主 机信息管理的多个系 统, 转向 一种客户/ 服务器结构下的数 据仓库解 决方案。 实例:南京市利用数据仓 库技术实 施贷款证制度。 1 9 9 7 年5 月, 南京分行开始着手进行南京市 贷款证 管理网 络系统的研制与开发。 该 系统采用客户/ 服务器的数据平台结构、数据仓库技术和软件构件技 术。 1 9 9 7 年 7 月i 日 , 该系统的一期工 程完成并正 式投入使用。 该系 统覆盖南京市区及市辖 5 县的省、 市、 县三级一千余家金融机构的贷 款证管理业务, 大大提高了 贷款证系统的工作质 量与效 率,同时也提 高了南京市信贷业务的决策管理水平。 从实际运行情况来看,该系统 功能齐全、操作方便、结构合理、运行稳定。 2 . 4 . 数据仓库在证券领域的应用 数据仓库技术在证券业的应用十分广泛,它可处理客户分析、 账 户分析、 证券交易数据分析、 非资金交易分析等多个业界关心的主题, 这是证券业扩大经营、 防范风险的预警行动。证券公司利用基于数据 北京交通大学硕士学位论文 仓库的客户行为分析系统将所有客户的操作记录进行归类和整理, 并 结合行情走势、上市公司资料、宏观微观经济数据等,在掌握大量数 据的情况下,对客户的行为和市场各因素的关联、客户的操作习惯、 客户的持仓情况、 客户的盈亏情况、 公司的利润分布等进行统计和分 析。 从而获得以往一直想获得但却无法获取的关于客户在本公司的行 为、盈亏、习惯等关键信息。 证券商在获得这些信息后,就有能力为 客户提供针对其个人习惯、 投资组合的投资建议, 从而真正作到对客 户的贴心服务。 实例: 深圳国 信证券建立数据仓库。 1 9 9 9 年4 月, 深圳国信证券 的数据仓库系统 ( 由 s y b a s e公司提供解决方案) 一期工程完成,该项 首期投资近 2 0 0 万元数据仓库系统建设的出发点是为当前公司的决策 者提供快速有 效的 各种报表和分析方式, 提高公司的市场反应速 度和 竞争力水平。同时,考虑到公司业务系统的不断完善和决策支持的更 高要求, 对不断增长的企业数据具有很好的可扩展性并提供可控的快 速查询响应时间。 该系统包括了客户分析、 账户分析、 证券汇总分析、 资金交易分析、 非资 金交易 分析等多 个业界 关心的主题。 公司用户可 以 通过固定灵活报表、多维分析等多种形式实现多个层面的数据访 问, 数据访问的 手段包括访问 授权的内 部w e b 站点、 通过自 动e - m a i l 邮件转发、 直接c l i e n t / s e r v e r 连接等多 种方式。 该系统的完成是国 内开放平台数据仓库系统建设的一个成功案例。 2 . 5 . 数据仓库在其他领域的应用 数据仓库技术在税务、 保险、 商业、 保健等领域的应用也非常成 功。如税务部门通过对大量数据资料的分析, 应用数据仓库技术掌握 各行各业、 各种产品 和各类市场的 从业人员以 及企业的纳税能力, 并 与其实际纳税金额进行对比, 从而查出 可能的 偷漏税者。 数据仓库技 术在政府税收部门的 应用所带来的 效益也是十分可观的。 澳大利亚政 府税务部门 将数据仓库技术用于支持税收业务, 系统经过3 年的运行, 投入回报率达到 1 : 巧。 美国 德克萨斯州政府税务部门 采用数据仓库 技术半年, 而且 工程尚未结束, 每月己 可带来6 0 0 万美元的收益, 预 计每年的收益将超过 8 0 0 0万美元。国内深圳市国税局与深圳奥尊电 脑公司合作, 利用数据仓库技术开发了新一代税务信息系统, 提高了 业务数据统计分析功能, 实现了 决策支持, 加强了税收征管。 ,此外,英国电信采用数据仓库应用系统保证了关键性业务的处 理,福特汽车公司、m o t o r o l a . g e总部、a t 截止 2 0 0 2 年底,太原铁路 分局 拥有职工6 9 5 6 1 人。 2 0 0 2 年, 太原铁路分局完成货运量 1 2 2 1 7 . 8万吨, 客运量 2 0 8 2 . 2 万人,换算周转量 4 6 8 8 2 . 1 百万吨公里,运输收入 5 9 6 3 0 2 . 5万元, 实 现运输利润5 7 5 5 万元。 3 . 2 . 太原铁路分局财务管理现状 3 . 2 . 1 . 太原铁路分局财务管理组织结构 太原铁路分局财务管理工作由 分局长主管, 总会计师协管并 负责 日常工作。 财务分处作为分局专业职能部门负责管理太原铁路分局本 级以及太原铁路分局所属 1 0 9 个决算单位的财务管理、 会计核算、资 金管理等工作,业务上受北京铁路局财务处指导。 财务分处下设运营 计划、会计决算组 ( 含国有资产管理 ) 、综合财务、大修管理、财务 太原铁路分局 财务管理现状分 析 监察、机关财务等六个组以及资金调度中心、记账中心、财会学会三 个附属机构。如图3 - 1 所示。 图3 - 1 太原铁路分局财务组织结构图 3 . 2 . 2 . 太原铁路分局财务分处业务流程分析 按照现行铁道部对铁路局实行资产经营责任制、 铁路局对铁路分 局实 行生 产经营责任制的 管理方式, 分局以 生产经营为主, 是生 产经 营的主体。 分 局在财务管理方面的 主要职责是: 根据铁道部关于客 货 网分账核算的规定,按照 “ 客运收入来自市场、货网收入合并清算、 提供 服务 相互清算” 的原则, 分局可 根据客运营业收 入、 货网营 业收 入和提供服务收入的多少, 在收支弹挂率计算的成本有权范围内,除 铁路局制定项目外,自主安排支出,以收定支,收支平衡, 保证完成 北京交通大学硕士学位论文 盈亏目标。财务分处作为分局财务管理的职能部门, 业务流程主要包 括收入、 成本、资金和会计管理,结合分处组织结构具体包括 以下业 务流程。 a . 运营计划管理。主要内容是: . 根据上级下达的生产财务计划,结合分局实际情况,组织分 局生产财务计划的编制、下达、汇总、上报工作; . 根据 铁路运输企业成本费用管理核算规程 、 铁路运输企 业成本费用管理核算规程实施细则及上级有关成本支出管理的规 定, 制定分局有关成本管理制度、 成本考核办法,并指导基层单位成 本管理工作, 不断完善成本管理制度, 控制成本支出,确保基层完成 分局下达的经营指标; . 按照上级有关清算办法的规定,计算分局的营业收入,并制 定和执行分局对基层单位的清算办法、利润分配办法; . 在季度、年度决算期,负责审查基层单位财务清算指标完成 情况, 审核基层单位成本计划执行情况,并向分局有关部门提供基层 单位财务指标的完成情况; . 控制分局季度、年度财务决算的支出额度,调整支出比例, 调控分局运输利润完成额度; . 组织分局运营单位、工附业单 位应付福利费 计划的 编制、 下 拨工作; . 根据分局成本支出情况,深入基层进行调研,了解各单位的 生产状况及成本支出情况, 提出 分局成本管 理、 成本控制、 成本计 划 指标调整的合理化建议; . 负责分局向当地税务机关交纳各税的申报、企业所得税监管 报表的申报、固定资产报废的申请报批等; . 负责分局经济活动分析指标的计算、资料的组织,掌握分局 成本管理、 成本控制、 成本增支因素等有关信息, 并及时向上级反馈; . 组织支出大户的考核管理,组织成本对标工作,推广成本管 理工作中的先进经验。 运营计划管 理工作 具
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年度一级建造师试题预测试卷含答案详解【模拟题】
- 2024-2025学年度六盘水职业技术学院单招《职业适应性测试》高频难、易错点题带答案详解(满分必刷)
- 2024-2025学年度火电电力职业鉴定过关检测试卷【全优】附答案详解
- 2024-2025学年度注册核安全工程师题库(夺冠)附答案详解
- 2024-2025学年度电梯考试模拟题库附完整答案详解(典优)
- 2024-2025学年咨询工程师预测复习含完整答案详解(必刷)
- 2024-2025学年山东电子职业技术学院电视播音主持期末考试考前冲刺练习【达标题】附答案详解
- 2024-2025学年天津铁道职业技术学院单招《职业适应性测试》经典例题附答案详解(预热题)
- 2024-2025学年度公务员(省考)题库检测试题打印附参考答案详解(培优)
- 2024-2025学年度临床执业医师考试综合练习附参考答案详解【典型题】
- 牛羊肉供应合同协议书
- 国际贸易学 第五版 课件全套 金泽虎 第1-14章 导论、传统国际贸易理论-国际贸易与经济增长
- 《健康监测技术》高职健康管理相关专业全套教学课件
- 《文物修复与保护基础》课件
- 中医男性健康与前列腺疾病
- 心脑血管疾病试题及答案
- 养牛与牛病防治课件
- 火灾自动报警系统设计规范完整版2025年
- 《水井坊酒业公司资本结构现状、问题及完善策略的分析案例》10000字
- 关于新能源汽车安装充电桩的政策
- 部编四年级下册《道德与法治》全册教案-教学设计
评论
0/150
提交评论