数据挖掘在财务分析中的应用_基于模糊聚类的上市公司财务状况分析.pdf_第1页
数据挖掘在财务分析中的应用_基于模糊聚类的上市公司财务状况分析.pdf_第2页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2010 7中国证券期货58 财会研究accounting research 数据挖掘在财务分析中的应用 基于模糊聚类的上市公司财务状况分析 齐中华 包钢(集团)计划财务部 黄丽娜 内蒙古科技大学经济与管理学院 【摘要】席卷全球的信息化浪潮为财务管理领域带来活力,各种数据库的构建极大提升了 财务分析的科学性、准确性以及分析效率。然而数据量的惊人增长也带来了“数据爆炸,知识贫 乏”的窘境。数据挖掘通过在大量数据中挖掘出隐含的有价值数据,为财务分析提供了有力工 具。本文选取部分制造业板块上市公司2008年的财务数据,运用数据挖掘中的模糊聚类技术进行 分析,说明数据挖掘技术在财务分析、决策中的应用。 【关键词】财务分析;数据挖掘;模糊聚类;上市公司 (一)样本选取 本文选取制造业板块七家上市公司 2008年报告数据,具体包括中集集团、 tcl集团、中核科技、民生投资、银河动 力、美达股份和海王生物。选取指标分 别反应了公司的偿债能力(流动比率、 资产负债率)、营运能力(存货周转 率、应收账款周转率)、盈利能力(资 产净利率、净资产收益率)以及发展能 力(净利润增长率)的7个财务指标。 (二)数据标准化处理 由于各个指标的量纲和数量级不同, 直接利用原始数据参与计算,可能会突 出某些数量级特别大的指标对分类的作 用,降低甚至排斥某些数量级较小的指 标的作用,因此必须对原始数据进行无 量纲化处理。数据标准化的方法很多, 本文使用标准差规格化法。首先在excel 表格中计算出样本指标的平均值和标准 差,然后按照公式1进行数据标准化处 理。 (公式) 其中,为数据标准化后数据, 为第k个变量的平均值,k s 为第k个变量 的标准差。 三、分析过程 (一)计算对象间相似关系的模糊 矩阵r 为了定量地进行分类,必须计算样 一、研究背景 数据挖掘(data mining),又称数 据库中的知识发现(knowledge discover in database,kdd),是从大量的、不 完全的、有噪声的、模糊的、随机的实 际应用数据中,提取隐含在其中的、人 们事先不知道的、但又是潜在有用的信 息和知识的过程。同时数据挖掘也是一 种新的商业信息处理技术,其主要特点 是对商业数据库中的大量业务数据进行 抽取、转换、分析和其他模型化处理, 从中提取辅助商业决策的关键性数据, 在这个层次上数据挖掘可以描述为:按 企业既定业务目标,对大量的企业数据 进行探索和分析,揭示隐藏的、未知的 或验证已知的规律性,并进一步将其模 型化的先进有效的方法。在信息化极大 发展的今天,企业数据量非常大,而其 中真正有价值的信息却很少,因此从大 量的数据中经过深层分析,获得有利于 商业运作、提高竞争力的信息就非常重 要,数据挖掘正是满足了这一方面的需 求,因此成为深层次数据分析的重要工 具。 利用数据挖掘进行数据分析常用的 方法主要有分类、回归分析、聚类、关 联规则、特征、变化和偏差分析、web页 挖掘等,它们分别从不同的角度对数据 进行挖掘。模糊聚类分析一般是指根据 研究对象本身的属性来构造模糊矩阵, 并在此基础上根据一定的隶属度来确定 聚类关系,也就是用模糊数学的方法把 样本之间的模糊关系定量的确定,从而 客观且准确地进行聚类。 目前,一些软件已经具有模糊聚类 分析模块,能够实现模糊聚类分析的功 能。excel作为一种功能强大的电子表 格,能够方便、快捷的实现数据的模糊 聚类分析,本文就采用excel表格实现数 据的模糊聚类分析。 二、研究设计 模糊聚类分析一般是先求出论域上 的模糊相似矩阵,再褶积运算求出传递 闭包t(r),最后通过取不同的t(r)阈值 截矩阵,得到聚类结果。现以随即抽 取的七家制造业板块上市公司2008年度 财务指标为例,运用excel对其综合财务 状况进行模糊聚类分析。 中国证券期货7 201059 财会研究accounting research 表1 制造业板块七家上市公司2008年财务指标 偿债能力营运能力盈利能力发展能力 财务指标流动比率资产负债率存货周转率应收账款周转率资产净利率净资产收益率净利润增长率 中集集团1.512756.78425.38617.22913.754310.4800-55.5532 tcl集团1.095373.21796.78889.98802.285412.580026.6024 中核科技2.458427.79932.79425.54614.64406.5700-83.7142 民生投资4.311719.411917.15031773.6673-1.4494-1.8900-390.3317 银河动力2.049725.20872.97105.7234-5.6484-8.2600-380.9042 美达股份0.621751.63949.588641.1338-7.1122-19.0900-507.7395 海王生物1.000371.88927.61444.35600.82403.4600-37.1683 品之间的相似程度的数量指标,称为聚类 统计量。聚类统计量可分为相似度和距离 两类。本文中我们运用欧氏距离(见公式 2)产生距离矩阵d(距离矩阵见表4), 利用公式3求得模糊矩阵r,其中c取矩阵d 中的最大值5.469693。 (公式2) (公式3) (二)构建模糊等价矩阵t(r) 从一个模糊矩阵出发,可以构造一 个模糊等价矩阵,具体方法可以采用平 方法: ? k rrrr 242 经过有限次运算后,一定有 1 22 + = kk rr, 即可得到模糊等价矩阵 k rrt 2 )(=。 在excel中利用minmax运算法则计 算出r,然后采用平方法计算出 2 r、 4 r和 8 r,可知 4 r= 8 r,即t(r)= 4 r,求出模糊等 价矩阵(r、 2 r、及t(r)分。 (三)聚类 根据给定一个聚类水平, 1 , 0 , 计算模糊等价矩阵的截矩阵。 给定任意 1 , 0 ,所确定的分类又 粗到细变化,随之得到较为合理的分类 关系。根据抽样数据,本例中取0.5, 即可得到模糊等价矩阵的截矩阵(见表 2)。 (四)调整截矩阵,确定分类 根据求得的截矩阵进行调整,得到 所求分类。由调整结果(表3)可知中集 集团、tcl集团、中核科技、海王生物 聚为一类,银河动力、美达股份聚为一 类,民生投资自己为一类。 四、聚类分析结果 中集集团、tcl集团、中核科技、海 王生物为一类偿债能力中等,营运能力 较强,盈利能力较好,发展能力一般; 银河动力、美达股份为一类,偿债能力 较强,营运能力较强,盈利能力很差, 发展能力较差;民生投资自己为一类, 偿债能力较强,营运能力较强,盈利能 力较差,发展能力较差。 通过模糊聚类的分析方法对上市 公司的财务状况进行综合分析,揭示了 同一行业不同企业的财务状况、经营成 果。有利于经营者了解企业状况加强公 司治理;有利于投资者更好了解投资对 象状况,以作出最为有利的决策。 参考文献 1赵磊.数据挖掘技术在财务分析中的应用j. 中国管理信息化,2009,12(2):34-38. 表2 模糊等价矩阵的截矩阵 财务指标流动比率资产负债率存货周转率 应收账款 周转率 资产净利 率 净资产收 益率 净利润增 长率 中集集团1110001 tcl集团1110001 中核科技1110001 民生投资0001000 银河动力0000110 美达股份0000110 海王生物1110001 表3 聚类结果 流动比率资产负债率存货周转率应收账款周转率资产净利率净资产收益率净利润增长率 中集集团1110001 tcl1110001 中核科技1110001 海王生物1110001 银河动力0000110 美达股份0000110 民生投资0001000 2张瑞龙.基于模糊聚类的综合财务分析方法及 其excel实现j.中国管理信息,2008,11(1):66-68. 3向建红,黄巧仙.数据挖掘技术在财务分析中的 应用j.学院学报(文社会科学版),2009,6(3):71-72. 4干方彬,王伟.在excel中实现上市公司财务的 模糊聚类分析j.中国会计电算化,2003(12):45-46. 5蒋艳故,柯大钢,解青芳.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论