安然公司高管组织结构发现_第1页
安然公司高管组织结构发现_第2页
安然公司高管组织结构发现_第3页
安然公司高管组织结构发现_第4页
安然公司高管组织结构发现_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、安然公司高管组织结构发现摘 要 本文针对安然公司高层管理组织结构问题,通过对人物关系网络的行或列求和,并进行排序,得到关键人物和除已知嫌疑人外的其他嫌疑人,综合利用熵权法和数据标准化处理得到综合评价指标,结合聚类分析的方法,挖掘出人物关系网络中的群集行为。针对问题一:要利用方法1和方法2中的人物关系网络找出关键人物,对方法1中的人物关系网络矩阵的每一行求和,建立相应的数学模型,用matlab软件求解,得到每一个人的通信总次数,并进行排序,取前5名,所求的关键人物如下:Lavorato-j,Dasovich-j,Bass-e,Hayslett-t,Jnoes-t。以方法1中的人名为基准,在方法2

2、中的人物关系网络矩阵中找到其对应行和列位置,利用matlab软件,提取出矩阵的子矩阵,作为方法2的人物关系网络,利用同方法1同样的方法,得到每个人的在邮件内容里出现的总频率及其排序,取前5名,所求的关键人物如下:Mike Swerzbin,Fletcher J Sturm,Jay Reitmeyer,Steven P South,Robert Badeer。针对问题二:基于方法1和方法2所构建的关系网络,分析两种方法对组织结构关系刻画的利弊,分析结果如下:方法1以通信次数为分析对象,人物关系直接明了,但是信息量较小;方法2以邮件内容为分析对象,兼顾考虑了通信次数和人与人之间的间接通信,信息量大

3、,但在数据预处理时,从2307个人中提取107个人,可能会遗漏也可能成为关键人物的那一部分人,总体来说,两种方法各有利弊。综合利用两种方法挖掘人物关系网络中的群集行为,首先利用熵权法,对通信和邮件两项指标赋权重,结果见表3。由于通信和邮件两项指标的量纲不同,对二者进行标准化,结果见附录表7和表8。最后对赋权值和标准化后的通信与邮件两项指标进行求和,得到综合评指标,基于综合评价指标的人物关系网络矩阵见表4。利用该矩阵,利用聚类分析的方法,建立数学模型,用matlab软件求解,得到人物关系网络中的群集行为,结果如下:harris-s一个人为一类,king-j一个人为一类,lewis-a一个人为一类

4、,williams-j一个人为一类,其余的103个人聚为一类,详细结果见表5。针对问题三:要由已知道的三位犯罪嫌疑人找出可能存在的其他犯罪嫌疑人,只需找到与这三个犯罪嫌疑人联系最频繁的人即可。在方法2中的人物关系网络矩阵中找到已知的3位犯罪嫌疑人的对应位置,提取子矩阵,对矩阵的每一列求和,建立相应的数学模型,利用matlab软件得到每个人与这三个犯罪嫌疑人联系频繁程度之和,作为对嫌疑程度的综合度量,进行排序,取前5名,则最有可能的其他犯罪嫌疑人如下:Morten E Pettersen,Kenneth,Andy,Page,Jones。(职位)关键词:组织结构问题;熵权法;标准化;综合评价指标;

5、层次聚类分析一 问题重述安然公司(Enron)是一家位于美国得克萨斯州休斯敦市的能源类公司,曾是世界上最大的电力、天然气以及电讯公司之一,公司连续六年被财富杂志评选为“美国最具创新精神公司”,然而真正使安然公司在全世界声名大噪的,却是这个拥有上千亿资产的公司2002年在几周内破产,持续多年精心策划、乃至制度化系统化的财务造假丑闻,以及安然事件中的高层管理者欺诈犯罪事件。安然倒闭之后,许多研究者致力于分析与处理安然邮件数据集(包含有150位安然公司高层管理者自2000年至2002年的所有邮件),试图通过分析这个数据集挖掘出安然公司高层管理者之间的组织结构关系(通常也叫做社区结构),并进一步找出其

6、中可能存在犯罪嫌疑人。他们采用了两种建立人物关系的方法初步得到了两个与之对应的人物关系网络(用矩阵来描述,每个元素描述关系的紧密程度,取值范围从0至1, 0代表关系最不紧密,1代表关系最紧密):方法1,基于通信行为的人物关系网络构建:人物关系的建立是基于通信行为的,这是指如果两个人之间的通信次数越高那么二者之间的关系就越紧密;所得人物关系网络为150乘150矩阵,这里的150是Enron高管的人数,详细数据见第一组数据(数据中有两个文件,name.txt为150个人的名字,adjacent.txt表示他们之间的有效通信次数);方法2:基于邮件内容的人物关系网络构建:人物关系的建立是基于邮件内容

7、的,这是指假设两个人在N篇邮件内同时出现过,如果N越大,那么二者的关系就越紧密。所得人物关系网络为2307乘2307矩阵,这里的2307个人物是邮件内出现的高频人物,详细数据见第二组数据(数据中Namelist2.txt表示人物名字,RalationNet2.mat是matlab文件,表示这2307个人物之间的紧密程度。值得提醒的是由于基于内容分析,有些人物名字上可能有不一致,比如可能是名字全称,也可能只用名或姓,这也需要你们自行分析)。问题:1、 分别针对方法1和方法2中的人物关系网络,找出其中的关键人物。2、 试分析上述两种方法所构建的人物关系网络对组织结构关系刻画的利弊,结合第一问得到的

8、关键人物,选择其中的一种方法(或是综合两种方法),挖掘人物关系网络中的群集行为。3、 若已经知道,Enron公司的三位高管是犯罪嫌疑人(Kenneth Lay:Chairman;Jeffery Skilling:CEO;Andrew Fastow CFO),能否通过以上的组织结构找出可能存在的其他犯罪嫌疑人,高管职位参见附录。二 问题分析针对问题一,要求分别根据方法1和方法2中的人物关系网络,找出其中的关键人物。对于方法1,人物关系网络是基于通信行为建立的,两人之间的通信次数越高则这两者之间的关系就越紧密,一个人与其他人的总通信次数越多则表明这个人物越关键。从方法1中的人物关系网络矩阵,找出每

9、一个人与他人总的通信次数在前五位的人作为关键人物。即对人物关系网络矩阵的每一行进行求和,建立相应的数学模型,利用matlab软件求解,得到每一个人的通信总次数,并进行排序,取前5名,即为针对方法1所求出的关键人物。对于方法二,由于所给数据太过庞大,且数据中人物名字不一致,有可能是全名,也有可能是名或姓。这会在建模时照成一定的困难,在这里对名字进行一定的处理,使数据量减少,便于计算。处理方法如下:以方法1 中150个人物的名字为基础,在方法2的2307个名字中,把150个名字对应的位置找出,利用matlab软件,提取出矩阵的子矩阵,作为方法2的人物关系网络,用同方法1同样的方法,找出针对方法2的

10、关键人物。针对问题二,要分析两种方法所构建的人物关系网络对组织结构关系刻画的利弊,可以基于方法1和方法2所构建的关系网络,从信息的广度,提供信息的真实可靠性等方面来进行分析。由于方法1和方法2所构建的人物关系网络对组织结构关系的刻画各有利弊,且在确定关键人物的过程中,通信和邮件这两项评价指标的重要性并不相同,为了挖掘人物关系网络中的群集行为,需综合利用两种方法,即得到综合的评价指标,具体过程如下:对方法1中的通信指标和方法2中的邮件指标分别赋权值,且对这两个指标进行标准化处理,最后将二者相加,求得综合的评价指标。考虑到熵权法可以根据各指标的变异程度,利用信息熵计算出各指标的熵权,再通过熵权对各

11、指标的权重进行修正,得出较为客观的指标权重,故采用熵权法,求解出通信和邮件两项指标的权重。通过以上分析,建立相应的数学模型,利用matlab软件求解,得到基于综合评价指标的人物关系矩阵,结合聚类分析的方法,建立相应的数学模型,利用matlab软件求解,即可分析出人物关系网络中的群集行为。针对问题三,要求根据已知的三位犯罪嫌疑人,通过组织结构关系,找出可能存在的其他犯罪嫌疑人。在犯罪嫌疑人已知的情况下,只要找到跟这三个犯罪嫌疑人联系最频繁的人,即可找到最有可能其他犯罪嫌疑人。先根据已知的3为犯罪嫌疑人的名字在方法2的人物关系网络中找出其相对应的位置,提取出人物关系网络矩阵,而这三行中的元素表示的

12、就是其他人与已知的3个犯罪嫌疑人之间的联系频繁程度。对矩阵的每一列求和,建立相应的数学模型,利用matlab软件求解,得到每个人与这三个犯罪嫌疑人联系频繁程度之和,进行排序,取前5名,即可获得5位除已知嫌疑人之外的最有可能的犯罪嫌疑人。三 模型假设1.所给数据具有一定的依据。2.对于方法二中的重复信息,假设只考虑全名和名,不考虑只有姓的情况。3.每个人的嫌疑程度可以通过与已知的三个的嫌疑人的联系频繁程度来衡量。四 符号说明:表示第个人与其他人通话次数总和。:表示第各人与其他人得在邮件中出现频率总和。:表示第个人和第个人之间的通话次数。:表示第个人和第个人之间的邮件中出现频率。五 模型建立与求解

13、5.1 问题一模型建立与求解基于方法1分析关键人物模型的建立与求解模型的建立对方法1构建的基于通信行为的人物关系网络,即矩阵进行每行求和,得到每个人的通信总次数,建立相应的数学模型:模型的求解利用matlab软件求解,对所得结果从大到小进行排序后,找出通话次数在前五名的五个人,即为针对方法1的关键人物,所得结果见下表: 方法1中关键人物表 附表1排名姓名编号姓名通话次数163Lavorato-j2413220Dasovich-j218036Bass-e1793446Hayslett-t1604555Jnoes-t1554结果分析据上表可知,由方法1的人物关系网络找出的关键人物是Lavorato

14、-j,Dasovich-j,Bass-e,Hayslett-t,Jnoes-t,这些人与其他人的通话次数最多,是最有可能的关键人物。基于方法2关键人物分析模型的建立与求解模型的建立对方法2中所给出的2307个名称进行处理,处理方式如下:以方法1 中150个人物的名字为基础,在方法2的2307个名字中,把150个名字对应的位置找出。由已找到的107个人,提取人关系网络矩阵的子矩阵,作为方法2的人物关系网络,对这个新的人物关系网络矩阵进行每行求和,得到每个人的在邮件内容里出现的总频率,建立相应的数学模型:模型的求解利用matlab软件求解,且对所得结果从大到小进行排序后,找出在在邮件内容里出现的总

15、频率前五名的五个人,即为针对方法2的关键人物,所得结果见下表:方法2中关键人物表 附表2排名姓名编号姓名邮件出现频率11558Mike Swerzbin3.30352741Fletcher J Sturm3.17431025Jay Reitmeyer3.083942088Steven P South3.064351867Robert Badeer2.9417结果分析据上表可知,由方法2的人物关系网络找出的关键人物是Mike Swerzbin,Fletcher J Sturm,Jay Reitmeyer,Steven P South,Robert Badeer。这些人在邮件内容里出现的频率最大,

16、最有可能与其他人存在间接地联系,则最有可能是关键人物。5.2 问题二模型建立与求解用两种方法刻画组织结构关系利弊的分析对于方法1,以150个人的通信情况为分析对象,进行数据分析。人物关系直接明了,但是该方法只分析了150个高层管理者之间的关系,且只考虑了通信次数,所获取的信息量较小。对于方法2,从2307个人中提取107个人,以107个人的邮件内容为分析对象,进行数据分析。该方法广泛地分析了公司各个职位人物间的关系,不仅考虑了通信次数,还考虑了人与人之间的间接通信,所获取的信息更全面。但是在数据预处理的过程中该方法存在不足,由于107个人是从2307个人中提取的,有一部分人被遗漏了,而这一部分

17、人中有可能也存在关键人物。结合两种方法获取综合评价指标模型的建立与求解模型的建立方法1中,以通信作为评价指标,每个人与其他人总通信次数越大,嫌疑程度越大,进而得到关键人物;方法2中,以邮件作为评价指标,每个人与其他人同时出现在邮件内容中的频率之和越大,嫌疑程度越大,进而得到关键人物。由于方法1和方法2所构建的人物关系网络对组织结构关系的刻画各有利弊,且在确定嫌疑程度的过程中,通信和邮件这两项评价指标的重要性并不相同,故在挖掘人物关系网络中的群集行为时,需综合利用两种方法,得到综合的评价指标。该综合评价指标应满足如下条件:兼顾反映通信和在邮件这两项评价指标对嫌疑程度的贡献,且贡献的大小不相同。本

18、文采用计算指标权重的熵权法1来确定通信和邮件这两项评价指标的各自的权重,进而得到对嫌疑程度的综合度量。熵权法的基本思想:熵权法是一种客观赋权方法。在具体使用过程中,熵权法根据各指标的变异程度,利用信息熵计算出各指标的熵权,再通过熵权对各指标的权重进行修正,从而得出较为客观的指标权重。熵权法的基本步骤:现有个待评项目,个评价指标,形成原始数据矩阵:其中为第个指标下第个项目的评价值。步骤1:计算第个指标下第个项目的指标值的比重;步骤2:计算第个指标的熵值:步骤3:计算第个指标的熵权:从方法1中的150个人中提取107个人,要求与方法2中的107个人相同,得到一个人物关系网络矩阵,对每一行求和,得到

19、每一个人总通信次数。同理,对方法2中的矩阵的每一行求和,得到每个人与其他人同时出现在邮件内容中的频率之和。基于以上结果,得到一个的矩阵,行表示107个人,列表示总通信次数和在邮件出现的总频率,结合这个这个矩阵,利用熵权法,用matlab软件求解,得到两个评价指标的权重如下:两项指标的权重 附表3通信邮件权重0.94830.0517由于通信和邮件两个评价指标的量纲不同,为了综合利用两项指标,得到综合指标,需对通信和邮件两个评价指标的数据进行标准化2处理,见附录表7和表8。让方法1中的标准化处理后的人物关系网络矩阵乘以权重0.9483,方法2中的标准化处理后的人物关系网络矩阵乘以权重0.0517,

20、二者相加,得到一个基于综合评价指标的新矩阵。 综合以上分析,建立如下数学模型:其中,表示方法1中矩阵中的每一个元素;表示方法2中矩阵中的每一个元素;表示通信的权重;表示邮件的权重;表示通信数量的平均值;表示在邮件内容上出现频率的平均值;表示通信数量的方差;表示邮件内容上出现频率的方差;表示综合评价指标。模型的求解利用matlab软件求解,得到了一个新的人物关系网络矩阵,矩阵中每一个元素代表综合评价指标,可以作为对嫌疑程度的综合度量。部分数据见下表:综合评价指标 附表410.016-0.000105000000-0.000110.016-0.000475-0.00011-3.80E-05-0.0

21、00316-0.00011300-0.00047510.016-0.0005300-0.00050200-0.000108-0.00053410.01600-0.000573200-3.80E-050010.016000.0106480-0.00031600010.016-0.000354800-0.000113-0.000502-0.000570-0.00035510.016000000.0106480010.016挖掘人物关系网络中的群集行为模型的建立与求解模型的建立在已求得的基于综合评价指标的人物关系网络矩阵中,每个元素的值越大表示人与人之间的关系越紧密,越有可能群集在一起。把该矩阵当做

22、距离矩阵,利用聚类分析3的方法,将距离相差最大的聚为一类,每个类之间的距离的计算方法如下:将两个类之间所有元素的距离进行求和,再求平均数,得到两个类之间的平均距离。平均距离越大的两类越有可能聚在一起。综合以上分析,建立如下数学模型:(变量)其中,表示第类和第类的平均距离;表示第类所有人的集合;表示第类所有人的集合;表示人物关系网络矩阵中的每一个元素;表示集合中有个个体;表示集合中有个个体。模型的求解规定聚为5类,利用matlab软件求解,得到每个人所属的类,结果如下:群集行为 附表5第一类45第二类60第三类66第四类145第五类1、2、3、4、5、6、7、8、9、10、11、12、13、14

23、、15、20、21、22、23、24、25、28、30、31、32、33、35、37、39、40、41、42、43、44、45、46、47、49、50、51、53、54、55、56、57、60、61、64、65、66、68、70、72、73、74、75、78、80、82、85、86、87、89、90、95、96、98、99、100、101、103、104、105、108、109、110、112、113、114、116、117、118、119、120、121、123、124、126、130、131、132、133、135、137、138、139、140、141、143、144、145、146、1

24、47、148、149、150(注:表中的数字表示每一个人在题目所给的150个高管的人名中对应的编号)结果分析结合上表和题目所给的人名可知;harris-s一个人为一类,king-j一个人为一类,lewis-a一个人为一类,williams-j一个人为一类,嫌疑程度较轻,可以排除,其余的103个人聚为一类,最有可能从事犯罪活动。5.3 问题三模型建立与求解分析其他犯罪嫌疑人模型的建立与求解模型的建立通过查找,三位已知的犯罪嫌疑人在方法2的人物关系网络矩阵中,找到三位已知犯罪嫌疑人在该矩阵中的对应位置,提取出一个子矩阵,构成一个新的人物关系网络,这个矩阵显示了每个人与三位已知犯罪嫌疑人的联系频繁程

25、度。对这个矩阵进行列求和,可获得每个人与这三位犯罪嫌疑人的总的联系频繁程度,建立相应的数学模型:模型的求解利用matlab软件求解,对进行从大到小排序,取前五个人,则这五个人就是最有可能的其他嫌疑犯,结果见下表:可能犯罪嫌疑人 附表6姓名编号姓名(职位)联系频繁程度11593Morten E Pettersen0.804021226Kenneth0.7450377Andy0.601641697Page0.578051133Jones0.5731结果分析:分析上表,在已知三个犯罪嫌疑人的情况下,通过分析其他人与这三个嫌疑人的联系频繁程度大小,发现Morten E Pettersen,Kennet

26、h,Andy,Page,Jones与已知的三位犯罪嫌疑人联系最频繁,则这五个人是最有可能的其他犯罪现一人。六 模型讨论本文针对安然公司高层管理者之间的组织结构关系问题,建立了相应数学模型,分析了关键人物和群集行为,以及除嫌疑人以外的其他嫌疑人。就解决本问题来说,该模型简单明了,且能很好的解决问题。但本模型也存在一定问题,在找除嫌疑人以外的其他嫌疑人的过程中,只考虑了其他人与已知三位犯罪嫌疑人的联系频繁程度的总和,并没有考虑其他人与已知三位犯罪嫌疑人的是否同时联系,对最终结果的准确性会造成影响。七 参考文献1 熵权法_百度文库,2 数据标准化方法_百度文库 3 王骏, 王士同, 邓赵红,聚类分析

27、研究中的若干问题J,控制与决策,第27卷第3期:P321-328,2012.34 郭小和,刘科,廖焕文,姚伟,周继强 ,基于复杂网络的安然公司高管组织结构发现J,南昌航空大学学报:自然科学版,第27卷第3期:P102-108,2013.9附录 附表700000000000000000000000000.330060000000000000000000000000000000000000000000000000000000000000000000000000000000000000000002.306800000000000000000000000000000000000.33006000000

28、000000000000002.30680000000000000000000000000000000000000000000000000000附表810.016-0.000105000000-0.000110.016-0.000475-0.00011-3.80E-05-0.000316-0.00011300-0.00047510.016-0.0005300-0.00050200-0.000108-0.00053410.01600-0.000573200-3.80E-050010.016000.0106480-0.00031600010.016-0.000354800-0.000113-0.000502-0.000570-0.00035510.016000000.0106480010.016聚类分析程序function result=julei(D,k)m=length(D);for i=1:m resulti,1=i;endn=m;while n>k result=julei1(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论