(会计学专业论文)应用商业智能技术实现自动分析财务报表.pdf_第1页
(会计学专业论文)应用商业智能技术实现自动分析财务报表.pdf_第2页
(会计学专业论文)应用商业智能技术实现自动分析财务报表.pdf_第3页
(会计学专业论文)应用商业智能技术实现自动分析财务报表.pdf_第4页
(会计学专业论文)应用商业智能技术实现自动分析财务报表.pdf_第5页
已阅读5页,还剩59页未读 继续免费阅读

(会计学专业论文)应用商业智能技术实现自动分析财务报表.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 财务报表的重要性不言而喻。但是,每一张会计报表仅能反映一定的财 务状况信息,这些信息是零碎的、局部的不便于揭示整个企业的财务状况、 经营成果和现金流量情况,不便于投资者综合分析和利用会计报表信息进行 投资决策,不便于很多非财务专业的管理人员全面地了解企业经营状况。 为了揭示公司各会计报表之闻的内在联系,客观全面系统地反映公司的 整体情况,使投资者获得全面的财务信息,便于经营管理人员客观、全面地 了解企业的经营情况,分柝经营中现存的或潜在的问题,我们要认真分析研 究各会计报表之问的逻辑关系联系,综合分析会计报表,从中获取有用的综 合信息。传统的搬表分析方法主要采用比率法、指标法、趋势法等方法,单 纯应用这些方法,往往会造成就事论事,只见树木不见森林,无法客观全面 地分析企业的经营情况。 我们能否建立一套新的分析思路,以财务报表为基础,结合公司特征、 行业特性,给报表使用者一个客观全面经营情况分析报告呃? 即在分析人员 选择利润、成本、资产结构等分析项目后,自动进行分析判断,并得出相应 的分析结论。朗让分析系统把专家的经验融入了软件,回答企业普遍关心的 经营管理问题,让专家的智慧和计算机的计算能力结合起来,快速回答企业 所关,f i , 的问题。本文试从建立财务报表数据仓库入手,通过综合应用各种分 析方法。从动态和静态,相对数和绝对数、行业特征等多个方面全面客观分 析企业经营情况现状和变化情况,深入分析重点项目,找出主要成绩,发现 存在问题,提出改进意见。为企业内部管理者、外部投资者和利益相关者提 供一套全面的分析报告。系统报告的自动编制是建立在财务数据仓库基础上 的,应用了商业智能技术和专家智能系统。系统提高了分析效率和准确性, 为报告的使用者提供了一个身边的财务顾问。帮助用户快速实现“迅速综观 全局,而又能明察秋毫”。 关键词:财务报表分析商业智能专家系统 a b s t r a c t a b s t r a c t t h e i m p o r t a n c eo ff i n a n c i a ls t a t e m e n ti sw e l l - k n o w n h o w e v e r , n o ta l lo ft h e u s e f u li n f o r m a t i o nc o u l db eo b t m n e df r o mo n es p e c i f i cs t a t e m e n t i t sr e p o s e dt h a t m o r et h a n6 0 m a n a g e r so f p r i v a t e - o w n e dc o m p a n i e sh a v el i t t l ek n o w l e d g ea b o u t f i n a n c i a ls t a t e m e n t s i no r d e rt od i s c o v e rt h ei n t e m a lr e l a t i o nb e t w e e na l lt h ef i n a n c i a ls t a t e m e n t s t o r e v e a lt h eg e n e r a ls t a t u so f t h ec o m p a n y , t of i n dt h ec u r r e n tp r o b l e m sa n dp o t e n t i a l r i s k so ft h ec o m p a n y , w es h o u l dc a r e f u l l ys t u d yt h el o g i cr e l a t i o n so ft h ea l lt h e s t a t e m e n t st oo b t a i nt h eu n d e r l y i n gi n f o r m a t i o n t h et r a d i t i o n a lm e t h o d sa r er a t i o s , i n d e x e s ,t r e n d i n ga n a l y s i s i nm o s tc a s e s ,w ec o u l dn o tg e t t h ew h o l e p i c t u r eo f t h e c o m p a n y w h e t h e rw ec o u l db u i l dan e w w a y t oa n a l y z et h es t a t e m e n t ,w h i c hb a s e do n t h ef i n a n c i a ls t a t e m e n t s ,i n c l u d i n gt h el i f e c y c l eo f t h ec o m p a n y , t h ec h a r a c t e ro f t h e f i e l d ? i t sj u s tas o l a r es y s t e mw h i c hc o n t a i n st h ew i s d o mo f e x p e r t sa n dr a p i d c o m p u t i n gc a p a b i l i t yo ft h ec o m p u t e r t h es y s t e mc o u l da n s w e rs o m ec o m m o n q u e s t i o n sc o n c e r n e db yt h em a n g e r s i tc a nt e l lt h eg o o da n db a do ft h ec o m p a n y a n dm a k et h e s u g g e s t i o n s f o r i m p r o v e m e n t t h r o u g ht h er e p o r t sg e n e r a t e d a u t o m a t i c a l l yb yt h es y s t e m ,a l lt h eu s e r so f s t a t e m e n tc o u l dh a v eac l e a rp i c t u r eo f t h ec o m p a n y k e y w o r d s :f i n a n c i a ls t a t e m e n t a n a l y s i s ,b u s i n e s si n t e l l i g e n c e ,e x p e r ts y s t e m 北京交通大学硕士学位论文 p7 4 1 5 8 1 独创性声明 本人声明,所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽本人所知,除了文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得北京交通大学或其他教学机构的学位或证书而使用过的 材料。与我一起工作的同志对本研究所做的任何贡献已在论文中作了 明确的说明并表示了谢意。 本人签名: 日期:越年月旦日 背景分析 1 。背景分析 上市公司会计报表的信息及质量对于投资者的决策行为至关重要,投资者 要善于从会计报表中捕获质量最高的信息为其决策服务。2 0 0 2 年初的诸多新 闻人物中,充满悲情神色的女学者刘姝威给人们留下深刻印象。就是这位深藏 科研大院,看似弱不禁风的中年女性,用一篇不足6 0 0 字的短文把曾经创造中 国股市长盛不衰的绩优神话的蓝田股份拉下了马。刘姝威在分析蓝田股份招股 说明书及2 0 0 1 年中期财务报告等资料后发现,蓝田股份已经成为一个空壳。 已经没有任何创造现金流量的能力。可见财务报表分析的重要性。 但是,每一张会计报表仅能反映一定的财务状况信息,这些信息是零碎的、 局部的,不便于揭示整个企业的财务状况、经营成果和现金流量情况,不便于 投资者综合分析和利用会计报表信息进行投资决策,不便于很多非财务专业的 管理人员清楚准确地了解企业经营状况。 为了揭示公司各会计报表之间的内在联系,全面系统地反映公司的整体情 况,使投资者获得全面的财务信息,便于经营管理人员客观、准确地了解企业 的经营情况,分析经营中现存的或潜在的问题,我们要认真分析研究各会计报 表之间的逻辑关系联系。综合分析会计报表,从中获取有用的综合会计信息。 传统的报表分析主要采用比率法、指标法、趋势法等方法,单纯或单独应 用这些方法,往往会造成就事论事,只见树木不见森林,无法客观全面分析企 业的经营情况。 目前,大多数财务软件和管理软件提供商,包括国内的用友、金蝶,国外 的s a p 、o r a c l e 、p e o p l e s o f t 公司等重量级软件企业所提供的财务分析功能模 块,实际上只是将企业的财务数据以不同的指标、不同的图形显示出来而己, 它只是为使用者提供了将会计报表数据进行加减乘除等运算之后得出新数据 的工具,而真正的财务报表分析和经营诊断工作仍然留给软件使用者自己来完 成,因此分析的结果就仁者见仁。智者见智了。而企业管理人员或投资者真正 需要的是科学、全面、客观的分析和评价。 造成这种状况的原因并不是计算机软件技术还不成熟,也不是因为这些企 业缺少精通企业经营和财务分析的一流专家,而是在综合应用财务报表分析方 法上尚待有所突破。我们能否建立一套新的分析思路,以财务报表为基础,结 合公司特征、行业特性,给报表使用者一个客观全面经营情况分析报告呢? 即 北京交通大学硕士学位论文 在分析人员选择利润、成本、资产结构等分析项目后,自动进行分析判断,并 得出相应的分析结论。即让分析系统把专家的经验融入了软件,回答企业普遍 关心的经营管理问题,让专家的智慧和计算机的计算能力结合后共同快速回答 企业所关心的问题。本文试从建立财务报表数据仓库入手,通过综合应用各种 分析方法,从动态和静态,相对数和绝对数、行业特征等多个方面的信息后, 全面客观分析企业经营情况现状和变化情况,深入分析重点项i i ,找出主要成 绩,发现存在问题,提出改进意见,为企业内部管理者、外部投资者和利益相 关者提供一套全面的分析报告。系统报告的自动编制是建立在财务数据仓库基 础上的,应用了商业智能技术和专家智能系统,提高了分析效率和准确性,为 报告的使用者提供一个身边的财务顾问,让财务报告用户能够快速实现“迅 速综观全局,而又能明察秋毫”。 2 财务报表分析概述 2 财务报表分析概述 2 1 财务报表概述 财务报表分析的主要内容来自企业的财务会计报告。 企业应当按照企业财务会计报告条例的规定,编制和对外提供真实、 完整的财务会计报告。企业的财务会计报告由会计报表、会计报表附注和财务 情况说明书组成。 企业向外提供的会计报表包括: ( 1 )资产负债表 ( 2 )利润表 ( 3 )现金流萤表 ( 4 )资产减值准备明细表 ( 5 )利润分配表 ( 6 )股东权益增减变动表 ( 7 )分部报表 ( 8 )其他有关报表 会计报表附注至少应该包括下列内容: ( 1 ) 不符合会计核算基本前提的说明 ( 2 ) 重要会计政策和会计估计的说明 ( 3 ) 重要会计政策和会计估计变更的说明 ( 4 ) 或有事项和资产负债表日后事项的说明 ( 5 ) 关联方关系及其交易的披露 ( 6 ) 重要资产转让及其出售的说明 ( 7 ) 企业合并、分立的说明 ( 8 ) 会计报表中重要项目的明细资料 ( 9 ) 有助于理解和分析会计报表需要说明的其他事项 财务情况说明书至少应当对下列情况作出说明: ( 1 ) 企业生产经营的基本情况 ( 2 ) 利润实现和分配情况 北京交通大学硕1 :学位论文 ( 3 ) 资金增减和周转情况 ( 4 ) 对企业财务状况、经营成果和现金流量有重大影响的其他事项。 资产负债表是反映企业某一特定日期财务状况的会计报表,它是根据资产 负债和所有者权益之间的相互关系,按照一定的分类标准和一定的顺序,把企 业一定日期的资产、负债和所有者权益各项f l 予以适当排列,并对f t 常工作形 成的大量数据进行高度浓缩整理后编制而成的。 利润表示反映一定期问生产经营成果的会计报表。利润表把一定期间的营 业收入与其同一会计期间相关的营业费用进行配比,以计算出企业一定时期 净利润( 或净亏损) 现金流量表是以现金为基础编制的财务状况变动表,反映一定期间内现金的 流八和流出。三张报表之间的关系如图2 1 。 t l i , 2资产血债表f 特定i i 期)饥位b 挣壹十 摄釜裳 i 簿动藏户 il 摊劬扭愤 l l坠 l l竖楚生l j 磕:销* 戚率1 l 鼍船氮懂 l t 厂_ 旨再再爵i i 艘糸牲赫l r _ 1 丽殍 厂鬲葡回 9 , l 噩债# 狰窘pl 5 1型璺璺妻垫l 彳。篆 1舰盘谶毓轻 投赉衍站 鳟恃诉动 簿赞皤碡 埘所有神袭赉产投强枘增加箍剩性鲢辨鞲r 厦盎睾聋;肄呐辱轾的鼬斑坶珥叠舯束 再琨盘逛埘;经* 性苛批柏幸乇盎憾盘 湃: 对所岢种类舻收州腻f 盘计转媾# 埔小嚣晌魂垒罄连愤务,妻付鞋科、封l 理盘的柬涮 嚼墟强整也t j 嘲利精枘影响 斑本艟理盘远州 图2 1 财务报表关系概览 2 堕墨塑麦坌堑塑垄 2 2 财务报表分析概述 目前,对于财务报表分析尚没有比较权威或是约定俗成的定义,我们试列 出几个有关财务报表的定义: a 注册会计师全国统一考试指定辅导教材财务成本管理对财务报表分 析所下的定义是:财务报表分析是指以财务报表和其他资料为依据和起点,采 用专门方法,系统分析和评价企业的过去和现在的经营成果、财务状况以及其 变动,目的是了解过去、评价现在、预测未来,帮助秘益关系集团改善决策。 b 杜胜利在企业经营业绩评价中指出:财务报表分析是根据企业定期 编制的会计报表等资料。应用专门的分析方法,对企业的财务状况和经营成果 进行剖析,其目的在于确定并提供会计报表数字中包含的各种趋势和关系,为 各有关方面特别是为股东提供企业盈利能力、财务状况、偿债能力等财物信息, 使报表使用者据以判断并作出相应的决策,从而为财务决策、财务计划、财务 控制提供依据。因此,对会计报表的计算、分析、比较、解释、评价就是报表 分析;它是运用会计报表数据对企业过去的财务状况和经营成果及未来前景的 一种评价。 cl e o p o l da b e r n s t e i n 所著财务报表分析:理论、应用与解释以 及c l y d ep s t i c k n e y 所著的财务报表分析:一种战略展望,都将财务报 表分析界定为:对企业的财务状况与成果进行分析,通过包括企业投资收益、 盈利能力、短期支付能力、长期偿债能力、企业价值等进行分析与评价,从而 得出对企业财务状况及成果的评价。 我认为,上述定义就财务报表分析的目的和作用已经论述的非常清晰,就 分析的客体而言,我认为,要充分结台客体所处的行业特征,不能脱离企业的 经营活动和企业的外部市场环境,要充分考虑结合企业经营业务的特点和企业 的市场环境,另外客体在不同的阶段也有不同的特征,例如同一行业内部有成 长性企业也有成熟性企业,这些都应该是我们在分析过程中充分考虑的。 3 北京交通大学硕士学位论文 2 3 财务报表分析技术回顾 a 比较分析 比较分析,也称为“水平分析”,是指将连续几年的资产负债表、损益表 和现金流量表并列放在一起。查看个年度或几个年度各分类项目的变动情况。 比较财务报表分析反映出来的最重要信息是变动趋势,包括趋势的方向、速度 和程度。比较分析的方式有: 绝对值增减变动: 变动数量绝对值= 分析期某项指标实际数一基期同项指标实际数 增减变动率: 变动百分比= 变动数量绝对值基期同项指标实际数 变动比率值: 变动比率值= 分析期某项指标实际数基期同项指标实际数 b 结构百分比分析 通过计算报表中各项目占总体的比重和结构,反映报表中的项目与总体关 系情况及其变动情况 一个结构百分比的分析表在反映资产、负债、费用和其他财务报表类别各 组成部分的比例变动方面很有价值。 因为百分比会随着一个项目绝对金额的变动或其分类中总额的变动而变 动,因此解释结构百分比时,既要看实际数字,也要看计算基础。 c 比率分析指标 比率分析是财务报表中最基本的分析方法。比率分析就是把影响财务状况 的两个或多个相关因素联系起来,通过计算比率,反映出他们的关系,借以评 价企业财务状况和经营状况的一种财务分析方法。 比率分析简单明了,因此,在财务报表分析中被广泛使用。但是,他们的 作用也常常被误解,被夸大。比率分析的有效性依赖于所用数字的质量。另外 除了公司内部的经营情况以外,重大经济事件、行业因素、管理政策和会计方 法都会影响到比率的结果,因此我们在做比率分析时,应当注意到比率本身并 没有什么意义,只有与相关项目进行比较时才具有解释的意义,如前期比率、 预先确定的标准或行业比率。 4 财务报表分析概述 2 4 主要财务报表分析技术缺陷 a 试问:a 的汽车每1 0 0 公里耗油1 2 公升b 品牌企业每1 0 0 公里耗油1 5 公升是不是b 的汽车比b 品牌汽车更好? 假如他们的是同一品牌、同一型号的汽车,我们在做出谁的汽车性能更好 之前,需要对多个影响汽油消耗量的因素进行分析:( 1 ) 载重量;( 2 ) 地形: ( 3 ) 车龄:( 4 ) 燃油的等级:( 5 ) 汽车行驶速度;( 6 ) 驾驶水平。由于财务报表 之间复杂的关系以及影响因素复杂多变,应用财务报表比率要比评价汽油消耗 复杂得多。 b 试问:同样一片云彩,在不同的时间、不同的地点,我们能据此判断天 气情况吗? 云的生成、外形特征、量的多少、分布及其演变,不仅反映了当时大气的 运动、稳定程度和水汽状况等,而且也是预示未来天气变化的重要特征之一。 正确观测分析云的变化,是了解认识大气物理状况,掌握天气变化规律的一个 重要因素。 云的生成和变化是十分复杂的,它和任何事物一样都包含着本身特殊的矛 盾,由此而形成了绚丽多彩的外貌和瞬息万变的特点。掌握云的这些特点才能 正确识剐云,不断提高云的观测水平。 云的外形特征千变万化,形成原因各不相同,但是又有其共同的特点。通 常根据其共同的特点,结合实际需要,按云的底部高度把云分为低、中、高三 族,然后按照云的外形特征、结构、核成因划分为十属及若干类。 复杂的天气信息需要通过对云的形态、运动的变化的变化解释而得来, 当然也要考虑不同地区、不同季节性的因素。 那么,结合企业,企业的综合财务和经营情况,可以通过财务报表获知。 例如:从传统意义上我们认为,企业偿债能力是由资产负债率、流动比率、 速动比率等指标决定的。而事实上,企业偿债能力是由企业现有资产及负债规 模、企业资产出售之后的增值金额、企业资产的周转速度三个方面因素决定。 只考虑资产负债规模一个方面的因素,不但难以得出正确的结论,而且有可能 得出与企业实际情况完全相反的结论。 c 试问:a 与b 公司谁更有偿债困难? 北京交通大学硬士学位论文 表2 1 公司b 公司资产负债简表 项目a 公司 b 公司 年收入 1 2 01 0 0 资产 t 0 0 2 0 0 流动资产 4 0 1 0 0 速动资产 3 0 5 0 负债总额 9 51 0 0 流动负债 8 05 0 如果单纯从传统的财务比率分析方法来看,a 公司有偿债困难。 表2 2a 公司b 公司资产负债相关比率 指标a 公司b 公司 赍产负债率 9 5 5 0 流动比率 o 52 速动比率 0 4l 结论 有困难无困难 但事实上,a 公司无偿债困难。 表2 - - 3a 公司b 公司偿债情况分析表 a 公司b 公司 流动资产周转次数3l 流动资产增值率( 营出 3 0 5 利润流动资产) 一年后 流动资产( 4 0 + 1 2 ) + 1 5 + 2 0 = 8 81 0 0 + 5 = 1 0 5 流动负债 8 05 0 结论无困难无困难? 原因 a 公司还掉一半流动负傍b 公司还掉一半债务,馑 ( 4 0 ) ,经营业务不但没蔫流动资产从期初的1 0 0 鲡 缩减。还有所扩大( 流毒减为8 0 ,经营业务规模绣 资产变为4 8 )减,资金趋紧。 6 财务报表分析概述 因此,一个企业是否有偿债困难,是否应当举债,不能简单地从资产负债 率、流动比率等反映资产与负债规模的指标来判断,还应当考虑资产的周转速 度、资产的增值能力:考虑这三个因素的相互影响后。a 公司偿债务或增加负 债没有风险,b 公司偿还债务存在困难。与传统分析方法的结论完全相反。 d 试问:a 公司的流动比率为2 0 ,b 公司的流动比率为1 8 那么是不是 公司的短期偿债能力要比b 公司强。 如果单纯看这一项,a 公司胜过b 公司,但是如果看看两个公司流动比率 的变化方向: 表2 4 流动比率分析表 1 年度 l2 345 a 公司 2 52 4 2 32 12 o 第一年第二年第三年 第四年第五年 i ! 坌望j ! :!l ! :! l ! :!i ! :!l ! :! f 图2 2 流动比率分析 从上述图2 - 2 中非常清楚地可以看到,a 公司的流动比率从2 5 下滑到2 0 。 而b 公司的流动比率却从1 3 上升到1 8 ,可见a 公司的流动性能变差,而b 公司的流动性能渐渐改善。 主要财务报表分析技术的主要缺陷 7 北京交通大学硕士学位论文 ( 1 ) 单指标分析,多指标简单联系判断 ( 2 ) 凭经验值判断,用一个或多个指标的良好值或平均值来评价,而不从 企业实际出发 ( 3 ) 行业比较判断,用“普遍性”来评价“特殊性”,不能具体企业具体 分析; ( 4 ) 就指标论指标,就数据论数据,加权打分,不能动态地、发展的、有 机联系地看问题。 所以,对财务报表的分析不能仅仅从几个指标的高低来判断企业的好 坏,也不能单纯从一点来评判企业的好坏,应当结合企业的行业特征、生 产经营特点,历史情况、发展变化情况以及现状,综合地、动态地、全面 地分析,才能真正发现企业的优势,找到不足,提出正确的改进办法。 正如,高立法先生所说:由于企业经济活动的复杂性和企业外部环 境的多变性,要求在做出财务报告分析结论时遵循一定的原则。如收集 全面资料、掌握真实情况;通过指标对比,进行综合判断;点面结合、 抓住重点;定性分析与定量分析相结合;静态分析与动态分析相结合等 等。 商业智能技术介绍 3 商业智能技术介绍 3 1 商业智能基本概念 商业智能( b u s i n e s si n t e l l i g e n c e ,简称b i ) 的概念最早是g a r t n e rg r o u p 于1 9 9 6 年提出来的。当时将商业智能定义为一类由数据仓库( 或数据集市) 、 查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业 决策为目的技术及其应用。当时,g a r t n e r g r o u p 预测说:到2 0 0 0 年,信息民主 ( 注:指组织内信息共享的无差别性) 将在具有前瞻性思维的企业中浮现。借 助商业智能,员工、咨询员、客户、供应商以及公众能够有效地运用信息。其 实商业智能所涉及的技术与应用,在g a r t n e rg r o u p 命名之前就有,起初被称 为经理信息系统( e i s ) ,在羽化成商业智能之前叫决策支持系统( d s s ) 。 i b m 认为商务智能是指一种能力:通过智能的使用你的数据财产来制定更 好的商务决策。它的意思是说各种企业的决策人员以企业中的数据仓库( d a t a w a r e h o u s e ) 为本,经由各式各样的查询分析工具( q u e r y r e p o r tt o o l s ) 、联机分 析处理( o n l i n ea n a l y t i c a lp r o c e s s i n g 简称o l a p ) 工具、或是数据挖掘( d a t a m i n i n g ) 工具加上决策规划人员的行业知识( i n d u s t r yk n o w l e d g e ) ,从数据仓储中 获得有利的信息,进而帮助企业提高获利,增加生产力与竞争力。 学术界的观点是:b i 实际上是帮助企业提高决策能力和运营能力的概 念、方法、过程以及软件的集合,其主要目标是将企业所掌握的信息转换成 竞争优势,提高企业决策能力、决策效率、决策准确性。 商业智能技术并不是基础技术或者产品技术,它是数据仓库、联机分析 处理o l a p ( o n l i n ea n a l y t i c a lp r o c e s s i n g ) 和数据挖掘等相关技术走向商 业应用后形成的一种应用技术。 商业智能系统主要实现将原始业务数据转换为企业决镱信息的过程。与 一般的信息系统不同,它在处理海量数据、数据分析和信息展现等多个方面 都具有突出性能。 9 北京交通大学硕士学位论文 图3 - 1 商业智能系统架构图 商业智能系统主要包括数据预处理、建立数据仓库、数据分析及数据展 现四个主要阶段。数据预处理是整合企业原始数据的第一步,它包括数据的 抽取、转换和装载三个过程。建立数据仓库则是处理海量数据的基础。数据 分析是体现系统智能的关键,一般采用联机分析处理和数据挖掘两大技术。 联机分析处理不仅进行数据汇总聚集,同时还提供切片、切块、下钻、上卷 和旋转等数据分析功能,用户可以方便地对海量数据进行多维分析。数据挖 掘的目标则是挖掘数据背后隐藏的知识,通过关联分析、聚类和分类等方法 建立分析模型,预测企业未来发展趋势和将要面临的问题。在海量数据和分 析手段增多的情况下,数据展现则主要保障系统分析结果的可视化。一般认 为数据仓库、o l a p 和数据挖掘技术是商业智能的三大组成部分。 a 数据仓库:商业智能酌基础 对于一个企业来说,最关键也最为重要的是,如何以一种有效的方式逐 步整理各个业务处理系统中积累下来的历史数据,并通过灵活有效的方式为 各级业务人员提供统一的信息视图,从而在整个企业内实现真正的信息共享。 数据仓库技术正好满足了这一需求。数据仓库是商业智能系统的基础,如果 没有数据仓库,没有企业数据的融台,数据分析就成为了无源之水。 数据仓库主要有四个重要特征: ( 1 ) 、数据仓库是面向主题的。传统的操作型系统是围绕公司的应用进行 组织。如对个电信公司来说,应用问题可能是营业受理、专业计费和客户 服务等,而主题范围可能是客户、套餐、缴费和欠费等。 1 0 商业智能技术介绍 ( 2 ) 、数据仓库是集成的。数据仓库实现数据由面向应用的操作型环境向 面向分析的数据仓库的集成。由丁各个应用系统在编码、命名习惯、实际属 性、属性度量等方面不一致,当数据进入数据仓库时,要采用某种方法来消 除这些不一致性。 ( 3 ) 、数据仓库是非实时的。数据仓库的数据通常是一起载入与访问的, 在数据仓库环境中并不进行一般意义上的数据更新。 ( 4 ) 、数据仓库随时间的变化性。数据仓库中的数据随时间变化的特性表 现在三个方面: 一数据仓库中的数据时间期限要远远长于操作型系统中的数据时间期 限。操作型系统的时间期限一般是6o 90 天,而数据仓库中数据的时间期 限通常是5 lo 年。 一操作型数据库含有“当前值”的数据,这些数据的准确性在访问时是 有效的,同样当前值的数据能被更新;而数据仓库中的数据仅仅是一系列某 一时刻生成的复杂的快照。 操作型数据的键码结构可能包含也可能不包含时间元素,如年、月、 日等;而数据仓库的键码结构总是包含时间元素。 bo l a p :海量数据分析利器 对于t b 级的海量数据,联机分析处理o l e p 无疑是一种有力的数据分析 工具。它可以让管理者灵活地对海量数据进行浏览分析。利用多维的概念, o l a p 提供了切片、切块、下钻、上卷和旋转等多维度分析与跨维度分析功能。 相对于普通的静态报表,o l a p 更能满足决策者和分析人员对数据仓库数据的 分析。 区别于传统的联机事务处理( o l t p ) 系统,o l a p 有1 2 条准则: i 、 o l a p 模型必须提供多维概念视图 2 、透明性准则 3 、存取能力推测 4 、稳定的报表能力 5 、 客户服务器体系结构 5 、 维的等同性准则 7 、动态的稀疏矩阵处理准则 8 、 多用户支持能力准则 9 、非受限的跨维操作 北京交通大学硕士学位论文 1 0 、直观的数据操纵 1 1 、灵活的报表生成 1 2 、不受限的维与聚集层次 虽然随着技术的发展,部分准则有所突破,但这些准则仍然是o l a p 技术 的基础。 o l a p 系统架构主要分为基于关系数据库的r o l a p ( r e l a t i o n a lo l a p ) 、 基于多维数据库的m o l a p ( m u l t i d i m e n s i o n a lo l a p ) 、基于混合数据组织的 h o i ,a p ( h y b r i do l a p ) 三种。前两种方式比较常见。r o l a p 表示基于关系数 据库的o l a f 实现。它以关系数据库为核心,以关系型结构进行多维数据的表 示和存储。r o l a p 将多维数据库的多维结构划分为两类表:一类是事实表,用 来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放 维的层次、成员类别等维的描述信息。m o l a p 表示基于多维数据组织的o l a f 实现。它以多维数据组织方式为核心,使用多维数组存储数据。m o l a p 查询 方式采用索引搜索与直接寻址相结合的方式,比r o l a p 的表索引搜索和表连 接方式速度耍快得多。 c 数据挖掘:洞察力之源 与展示企业历史和现有信息的静态、动态报表及查询等分析方法不同, 数据挖掘是从数据库中智能地寻找模型,从海量数据中归纳出有用信息。可 以说通过商业智能系统,企业获得洞察力的主要手段就是数据挖掘。 数据挖掘( d a t a m i n i n g ) 是从大量的、不完全的、有噪声的、模糊的、随 机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息 和知识的过程。 数据挖掘技术可分为描述型数据挖掘和预测型数据挖掘两种。描述型数 据挖掘包括数据总结、聚类及关联分析等。预测型数据挖掘包括分类、回归 及时间序列分析等。 数据挖掘的过程可以分成以下5 个步骤: ( 1 ) 问题定义:了解相关领域的有关情况,熟悉背景知识,弄清用户要求。 定义要挖掘的目标。 ( 2 ) 数据提取:根据要求从数据库中提取相关的数据。 ( 3 ) 数据预处理:主要对前一阶段产生的数据进行再加工,检查数据的完整 性及数据的一致性,对其中的噪音数据进行处理,对丢失的数据进行填补 ( 4 ) 知识提取:运用选定的数据挖掘的算法,从数据中提取用户所需要的 1 2 商业智能技术介绍 知识,这些知识可以用一种特定的方式表示或使用一些常用的表示方式。 ( 5 ) 评估:将发现的知识以用户能理解的方式呈现,如某种规则,再根据 实际执行情况对知识发现过程中的具体处理阶段进行优化,直到满足用户要 求 数据挖掘的方法主要有如下6 种: ( 1 ) 关联分析:如果客户购买了产品a ,在x 的情况下,他也可能购买 产品b 。p ( bia ) = p ( a b ) p ( a ) 两个关键的闺值指标分别是支持度:p ( a b ) 和置信度:p ( b a ) 。 这种分析方法的不足: ( a ) 支持度仅以出现次数为评价对象,可能忽略销售额大而次数很少的 项目。 ( b ) 分析出来的关系可能是随机的。 ( c ) 置信度低的数据可能反映很重要的市场信息。可能是替代品或竞争 产品。 ( 2 ) 分类分析 分类其目的是建立一个分类函数或分类模型( 也称作分类器) ,该模型能 把数据库的数据项映射到给定类别中的某一个。分类是有指导的学习。根据 设定的分组,将不同的数据分配到不同的分组,然后研究每个组的特点。如 客户跳槽分析。 ( 3 ) 聚类分析 c l u s t e r i n g 是将数据分为几组,其目的是要将组与组之间的差异找出 来,同时也要将一个组之中的成员的相似性找出来。c l u s t e r i n g 与 c l a s s i f i c a t i o n 不同的是,你不晓得它会以何种方式或根据什么来分类。所 以你必须要有一个分析师来解读这些分类的意义。聚类分析帮助我们决定将 哪些组合更有意义,聚类是把一组个体按照相似性归成若干类别,即”物 以类聚”。它的目的是使属于同类别的个体之间的距离尽可能地小,而 不同类别的个体间的距离尽可能地大。 ( 4 ) 决策树 分析不同的影响因素对分析目标的影响,找到关键的影响因素。决策树 法的优点是直观,但随着数据复杂性的提高,其分支树也会增多,管理困难。 ( 5 ) 遗传算法 遗传算法是一种基于生物进化过程的组合优化方法。其基本思想是:随 北京交通大学硕士学位论文 着时间的更替,只有适合的物种才得以进化。将这种思想用于数据挖掘就是 根据遗传算法获得最适合的模型,并据此对数据模型进行优化。 ( 6 ) 神经网络 神经网络从经验中学习,常用于发现一组输入数据和一个结果之间的未 知联系。 数据挖掘另一个重要方面是与之相关的方法论。一般的事务处理系统甚 至一些只提供报表分析功能的简单商业智能系统,建成以后只需要少量的工 程维护工作,而采用数据挖掘技术的商业智能系统往往有很大不同。因为数 据挖掘是一个商业理解、数据理解、建模、评估等一系列多次反复、多次调 整的过程,并且模型的应用也不是一成不变的,在适当的时候需要更新和重 建。所以一般的商业智能项目并不追求一次性工程建设,更倡导的是一种与 企业业务紧密联系能够提升企业竞争力的咨询服务,而且熟悉业务和分析方 法的分析人员在商业智能系统的应用中起着至关重要的作用。从这点也能 看出为什么说b i 是企业m i s 之后更高层次、更具战略意义的应用。 诚然,对于数据挖掘或者商业智能也应有一个客观的认识。从广义上, 数据挖掘是在传统数据分析方法基础上,融合了数据库、人工智能等多方面 技术形成的知识发现技术。它对企业的信息分析必然产生积极的效果。对企 业经营决策的辅助作用也是显而易见。但是数据挖掘只是一些技术和方法, 并非万能,而商业智能系统更多的是为企业提供一个经营分析的环境和一些 分析工具。如何切合企业经营实际,从海量的经营数据中挖掘出有助于企业 市场竞争的知识,商业智能系统本身体现并不多。因此,企业洞察力的真正 来源是商业智能系统以及数据挖掘技术的成功应用和实践。数据挖掘的应用 建立在商业模型的基础上,我们把商业模型扩展到专家系统,帮助企业提高 对于挖掘出来的信息的利用。下面我们将介绍与自动财务报表有关的产生式 规则专家系统。 3 2 产生式规则专家系统 产生式规则专家系统是专家系统中应用最广泛的一种,因为产生式规则 知识表示形式容易被人理解;它是基于演绎推理的,保证了推力结果的正确 性;大量产生式规则所连成的推理树可以是多颗树,树的宽度反映了实际问 题的范围,树的深度反映了实际问题的难度。这使得这种专家系统适用各种 1 4 商业智能技术介绍 实际问题的能力很强。 3 2 1 产生式规则基本原理 产生式规则知识一般表示为:i fat h e nb ,即表示为:如果a 成立则b 成立。 产生式规则知识有如下的特点: 一 相通的条件可以得到不同的结论,如a b ,a c : _ 相同的结论可以由不同的条件得到,如a g ,b g ; _ 条件之间可咀用“与”和“或”连接,如a a b g ,a v b g _ 一条规则的结论可以是另一条规则中的条件:如:f a b z ,c d f 。 由于以上特点,规则集能做到:描述和解决各种不同的、灵活的实际问题 把规则集中的所有规则连成一棵“与、或”推理树。 a 正、反向推理过程 正向推理:逐条搜索规则库,对每一条规则的前提条件,检查事实库中 是否存在前提条件中各子项,若在事实库中不是全部存在,放弃该条件规则。 若在事实库中全部存在,则执行该条规则,把结论放入事实数据库中。反复 循环执行上面过程,直至推出目标,并存入事实库中为止。 反向推理:逆向推理用的比较多,主要是目标明确、推理快。逆向推理 是从目标开始,寻找以次为结论的规则,并对该规则的前提条件进行判断。 若该规则的前提中某个子项是另一个规则的结论时,再找以次为结论的规则, 重复以上过程,直到对某个规则的前提能够进行判断。按此规则前提判断得 出结论的判断,由此回溯上一个规则的推理,一直回溯到目标的判断。 在计算机上实现逆向推理时利用规则栈来完成。规则栈由“规则编号、前 提表和结论”三项组成。 b 推理树( 知识树) 规则库中的各条规则之间一般来说都是有联系的,即某条规则中的前提 是另一条规则中的结论。我们按逆向推理思想把规则库所含的总目标作为根 北京交通大学硕士学位论文 结点,按规则的前提和结论展开成棵树的形式。这棵树一般成为推理树或 知识树,它把规则库_ 中的所有规刚都连接起来。由于连接时有“与”关系和 “和”关系,从而构成了“与、或”推理树。 我们通过一个例子画出推理树,它是逆向推理树,以目标结点为根结点 展开。例如,若有规则集为: a v ( b c ) 一g ( i j ) v k a x 八f j l b m v e c w 八z m p a q e 画出“与、或”推理树 a彳卜 xf wzpo 图3 - 2 推理树 该“与、或”推理树的特点是:每条规则对应的节点分支有“与”和“或” 关系;数据的根结点是推理树的总目标;耜邻两层之间是一条或多条规则连接; 每个节点取值可以是单值,也可以是多值。若结点是多值是,各值对应的规则 将不同;所有的叶结点都安排向用户提问,或者把它的值直接放在事实数据库 中。 c 逆向推理过程 1 6 商业智能技术介绍 逆向推理过程在推理树中反映为推理树的深度优先搜索过程,以上面的 推理为例子,逆向推理过程如下: 从根结点开始搜索,经过a 结点到i 结点,向用户提问,若回答为y e s , 则继续搜索j 结点,再到x 结点,它是叶结点,向用户提问,若回答y e s , 再搜索f 结点,向用户提问,若回答为n o ,由于是“与”关系,回溯j 结点 为n o ,再回溯a 结点暂时为m 。由于a 结点还有分支,则搜索k 结点,若回 答也是n 0 ,则此时a 结点为n 0 。向上回溯g 暂时为n o ,搜索其他分支,到b 结点,再到l 结点,提问回答为y e s ,回溯b 结点为y e s ,再到g 结点,由于 是“与”关系,搜索另一分支c 结点再到l l | 结点,再到w 结点,提问回答若 为y e s ,则搜索z 结点,提问回答也是y e s 时回溯到m 结点为y e s ,再回溯到 c 结点也为y e s ,再回溯到g 结点为y e s ,e 分支就不在搜索了。 当目标有多个值时,目标求解分两种情况:( i ) 多值问互斥。目标可取 多值时,这些值之间是互斥的,即目标只能取其中一个值。( 2 ) 多值间不互 斥。目标取多值时。还需要继续进行,对目标的所有值都必须搜索求解。 3 2 2 解释机制和事实数据库 a 事实数据库 事实数据库中的每一个事实除该命题本身,它还应该包括更多的内容 每个事实有如下属性,构成了关系型结构,如下表: 事实t n 值规则号可信度 aylo by20 8 cn30 7 表3 一l 事实数据表 事实栏中放入命题本身,t n 值栏中表示是y e s 还是n o 。规则号则表示 用该规则描述当前事实。可信度表示该事实的可信度,是一个度量值。本系 统中暂不考虑可信度。 如果事实可以取多值,则事实栏就变为变量栏,“y n ”栏就是值栏,同 一变量取多值时,就应该建立多条记录,每个记录表示一个特定值。 b 解释机制 1 7 北京交通大学硕士学位论文 解释机制是专家系统中的重要内容,它把推理过程显示给用户,让用户 知道目标是如伺推导出来的。解释机制有两种实现方法:一种是推理过程的 全部解释;一种是推理过程中正确路径的解释。 3 2 3 产生式规则专家系统的特点 a 模块化,每条规则具有相同格式: b 结构化,每一条规则或知识结构的每一部分所含有的知识量较少,解决问 题时通过这些知识的不同组合完成的。因此,修改、增删其中的某些部分 比较容易,对其他部分的影响较小。 c 自然性,和人类的思维过程比较接近,容易被人理解,便于人机交互。 d 效率低,这是产生式系统固有的弱点,由于产生式系统的模块化和结构化, 求解问题时往往应用过头。例如,产生式系统执行每一个动作主要依靠匹 配,传送信息依靠知识库可能经过很多步骤才能取得有效匹配。 e 非透明性。这是该系统的另外一个缺点。求解问题时控制流程不明确,条 件一动作知识能够自然地表达,但算法知识不能自然地表达。 由于具有上述特点,产生式专家系统适用于以下领域: ( i )领域知识杂乱,事实众多,没有简明、统一的理论 ( 2 )领域知识能表示成一种独立、无关的动作; ( 3 )领域知识可方面从使用方式中分离出来。 3 3 专家系统目前在财务领域中的应用 在企业财务中应用专家系统,一般不是针对企业财务的全部,而是其中 的一个部分,如现金管理、财务状况分析、融资的选择、信用额度分析等。 f 面介绍二个在企业财务中应用的实例。 现金管理:现金管理的目的是使现金使用得更有效。这个系统的核心部 分是一组运筹学模型,支持这个模型的是一个知识库,其中的知识来自运筹 学专家及现金管理人员。运筹学专家的支持包括如何建立模型和求解,现金 管理人员的知识则是如何选择和购买有价证券,包括了一系列的过程和经验。 金融分析专家分析系统:这类系统很多,我们介绍一个法国企业界的一 个s a f a r i 系统。这个系统是为几乎没有计算机知识的金融分析人员使用的, 它的知识来自法国企业界财务专家。它有两个主要功能,图表输出功能和咨 1 8 商业智能技术介绍 询功能。s a f a r i 可用于预测和趋势分析,分析的基本信息有金融状态和工业 指数。它能用一系列的图表来表示大量的金融数据,如资金流动、成本分解 等。这种图形显示和输出功能使用户在使用咨询功能之前,就对情况有个大 概了解。该系统通过两种方式提供咨询:一种是系统将已有的数据和表格形 成一个工作文件,用户可直接用这个文件对数据进行预测分析;第二种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论