




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独创性声明 本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得 的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了 明确的说明。本声明的法律结果由本人承担。 1 学位论文作者签名: 剜衄 日期: 独f 旦:兰圣 学位论文使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东 北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许 论文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有 关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编本学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:哲翅圣 日期:如f 里量姐 学位论文作者毕业后去向: 工作单位: 通讯地址: 指导教师签名丕丝j i f 亏一 日期: 盈s 垒:工:蛰 电话: 邮编: 摘 灰色系统理论以“部分信息已知,部分信息未知 的“小样本、“贫信息”不确定 性系统为研究对象,主要通过对“部分 已知信息的生成、开发,提取有价值的信息, 实现对系统运行行为、演化规律的正确描述和有效监控。 在交通事故系统中,交通事故的原因多种多样,有效地分析属性和属性值的重要度 对减少交通事故的发生具有重要意义,本文根据交通事故成因分析中属性重要度计算的 局限性,借鉴灰关联熵的思想,结合了灰色综合关联度和信息熵,利用熵分析事件不确 定性的原理针对属性的重要度进行分析,提出一种新的数据分析方法,并以m a t l a b 为 工具将其应用到中国某地交通事故实例分析中。本文提出的灰色综合关联度熵不仅能应 用于交通事故成因分析,还可以用于其他社会科学领域。 分析了属性值和属性重要度之后,在通过实例研究灰色系统预测模型的基础上,对 灰色g m ( 1 ,1 ) 预测模型进行了改进,提高实际应用过程中的精度以满足实际需要,并且应 用交通事故数据对这个改进模型进行检验。原始模型预测结果与改进后预测模型预测结 果的比较分析表明,改进的预测模型相对于原始预测模型在预测精度上有所提高。 关键词:交通事故成因分析,灰色综合关联度,信息熵,灰色关联熵,灰色综合关联度 熵,灰色系统,g m ( 1 ,1 ) rl奉 a b s t r a c t g r e ys y s t e mt h e o r yc a l lb eu s e dt os t u d yu n c e r t a i no raf e ws w a t c ho rd e f i c i e n t i n f o r m a t i o ns y s t e m ,s o m eo fi t si n f o r m a t i o ni sk n o w na n ds o m ei su n k n o w n i t sm a i n l yt o a b s t r a c ts o m ev a l u a b l ei n f o r m a t i o nt h r o u g ht h eb i r t ha n dd e v e l o p m e n to fs o m ek n o w n i n f o r m a t i o nt om a k ear i g h td e s c r i p t i o na n de f f e c t i v em o n i t o r i n go fs y s t e mb e h a v i o ra n dt h e l a wo fe v o l u t i o n t h e 的伍ca c c i d e n t sh a v em a n yk i n d so fr e a s o n si nt h et r a f f i ca c c i d e n t ss y s t e r n i tw i l l h a v es i g n i f i c a n c et or e d u c et r a f f i ca c c i d e n t sb ya n a l y z i n gt h ei m p o r t a n c ed e g r e eo fa t t r i b u t e a n da t t r i b u t ev a l u ee f f e c t i v e l y a c c o r d i n gt ot h el i m i t a t i o n sw h i c ha r ef o u n di nt h ec a l c u l a t i o n a b o u tt h ei m p o r t a n td e g r e eo fa t t r i b u t e ,t h i sp a p e rd r a wo nt h ei d e ao fg r e yr e l a t i o n a le n t r o p y , c o m b i n eg r e yr e l a t i o n a lg r a d ew i 也g e n e r a li n f o r m a t i o ne n t r o p y , m a k eu s eo ft h ep r i n c i p l eo f e n t r o p yt oa n a l y z et h ei m p o r t a n c ed e g r e eo fa t t r i b u t e ,p r e s e n t san e wd a t aa n a l y s i sm e t h o d s f i n a l l y , w eu s e dm a t l 嬗a s at o o lt oa n a l y z et h e 舰街ca c c i d e n t si na p l a c eo fc h i n aw i t hi t g r e ys y n t h e t i cd e g r e eo fi n c i d e n c ee n t r o p yi nt h i sp a p e rn o to n l yp l a y sa ni m p o r t a n tr o l ei n t r a 伍ca c c i d e n t sa n a l y s i s ,b u ta l s oc a nb eu s e di n0 l e l s o c i a ls c i e n c ef i e l d s a f t e rt h ea n a l y s i so ft h ei m p o r t a n td e g r e eo fa t t r i b u t e sv a l u ea n da t t r i b u t e s b a s e do n a n a l y z i n gg r e ys y s t e mp r e d i c tm o d e l sw i t he x a m p l e ,ii m p r o v e dt h eg r e yp r e d i c tm o d e li nt h i s p a p e re x p e c tt oi n c r e a s et h ep r e c i s i o ni na p p l i c a t i o np r o c e s s t h e nia p p l i e da c t u a lt r a f f i c a c c i d e n t sd a t at ot h em o d e l ,a n dt h ec o m p a r a t i v ea n a l y s i so fd a t as h o w st h a t t h ei m p r o v e d m o d e li sb e t t e rt h a no r i g i n a lm o d e lt h r o u g h t e s t i n g k e yw o r d s :t r a f f i ca c c i d e n t , a t t r i b u t e ,g r e ys y n t h e t i cd e g r e eo fi n c i d e n c e ,i n f o r m a t i o n e n t r o p y , g r e ys y n t h e t i cd e g r e eo f i n c i d e n c ee n t r o p y , g r e yt h e o r y , g m ( 1 ,1 ) f吁,h吡j 1 1 灰色系统理论概述1 1 1 1 不确定性与灰色系统理论1 1 1 2 灰色系统理论的产生及发展1 1 2 选题意义2 1 2 1 交通事故成因分析的意义2 1 2 2 交通事故成因分析的国内外研究现状2 1 3 本文研究内容2 1 3 1 灰色理论的研究2 1 3 2 改进模型的研究3 1 3 3 实际应用研究3 1 4 本文的创新点3 第二章灰色综合关联度4 2 1 灰色绝对关联度4 2 2 灰色相对关联度5 2 3 灰色综合关联度5 第三章熵7 3 1 信息熵7 3 2 灰色关联熵7 3 2 1 灰熵7 3 2 2 灰关联系数分布映射8 3 2 3 灰关联熵8 第四章灰色综合关联度熵9 4 1 灰色综合关联度熵的概念9 4 2 灰色综合关联度熵意义及理论价值1 0 4 3 灰色综合关联度熵在交通事故成因分析中的应用1 1 4 3 1 交通事故数据处理1 1 4 3 2 属性值重要度计算1 2 4 3 3 灰色综合关联度熵分析1 6 4 3 4 灰色综合关联度熵分析的显著性差异检验1 7 4 4 灰色综合关联度熵的特点1 8 第五章灰色系统模型1 9 5 1g m ( 1 ,1 ) 模型1 9 5 2g m ( 1 ,1 ) 模型的适用范围2 0 5 3g m ( 1 ,1 ) 模型的精度检验进2 1 5 4 灰色预测模型在交通事故分析中的应用2 2 i i ! i v f ) 6 6 6 6 7 7 o l 3 4 2 2 2 2 2 2 3 3 3 3 i 一 一 一 一 一用一 一一 一 , 一 一 一 一 一应一一一 一 ,j 一 一 一 一一的一 一 一 一 r 一一一一析一一一 卜 一一一一一分一一一一 t , 一 一一一一故一一一一 东北师范大学硕士学位论文 第一章绪论 1 1 灰色系统理论概述 1 1 1 不确定性与灰色系统理论 现代科学技术在高度分化的基础上高度综合的大趋势,导致具有方法论意义的系统 科学学科群的出现。系统科学揭示了事物之间更为深刻、更具本质性的内在联系。在对 系统的研究中,由于内外扰动的存在和认知水平的局限性,人们所得到的信息往往带有 某种不确定性。随着科学技术的发展,人们在科学研究中所涉及的系统越来越庞大、复 杂,不确定性的表现也就越来越突出,人们对不确定性的认识逐步深化,不确定性系统 的研究也在日益深入。目前,人们最常用的不确定性系统研究方法有三种:概率统计、 模糊数学和灰色系统,它们研究对象在不确定性上各有区别。灰色系统理论着重研究概 率统计、模糊数学所难以解决的“小样本 、“贫信息 不确定性问题,并依据信息覆盖, 通过序列算子的作用探索事物运动的现实规律。其特点是“少数据建模”。与模糊数学 不同的是,灰色系统理论着重研究“外延明确,内涵不确定 的对象。 1 9 8 2 年中国学者邓聚龙教授创立了灰色系统理论,是一种研究少数据、贫信息不确 定性问题的新方法。灰色系统理论以“部分信息已知,部分信息未知 的“小样本”、“贫 信息”不确定性系统为研究对象,主要通过对“部分 已知信息的生成、开发,提取有 价值的信息,实现对系统运行行为、演化规律的正确描述和有效监控。灰色系统模型对 实验观测数据没有什么特殊的要求和限制,因此应用领域十分广泛。 1 1 2 灰色系统理论的产生及发展 1 9 8 2 年,北荷兰出版公司( n o r t h h o l l a n dc o ) 的系统与控制通讯( s y s t e m s & c o n t r o ll e t t e r s ) 杂志上发表了我国学者邓聚龙教授的第一篇灰色系统论文灰色系统的 控制问题( t h ec o n t r o lp r o b l e m so fg r e ys y s t e m s ) 。19 8 2 年第3 期的华中工学院学报 上发表了邓聚龙教授的第一篇中文灰色系统论文灰色控制系统。这标志着灰色系统 理论经过其创始人邓聚龙教授多年卓有成效的努力,开始问世嘧1 。 2 0 多年来,灰色系统理论引起了国内外学者的广泛关注。许多国家( 如英国、美国、 德国,中国等) 及联合国等国际组织也有许多学者从事灰色系统的研究和应用。据不完 全统计,灰色系统论著被s c i ,e i ,i s t p ,m r ,s a ,m a 等国际权威性检索机构跟踪、 摘引我国学者的灰色系统论著3 0 0 0 多次,国内外有1 6 0 多项灰色系统成果获得国家或省 部级奖励,有6 0 余种灰色系统学术著作出版问世,有3 0 0 余种学术期刊接受并刊登灰色 系统论文。 目前,灰色系统理论的应用范围己拓展到工业、农业、社会、经济等众多科学领域, 成功地解决了生产、生活和科学研究中的大量实际问题。 1 东北师范大学硕士学位论文 1 2 选题意义 1 2 1 交通事故成因分析的意义 道路交通事故具有突发性强,涉及面广,危害性大的特点,它直接影响到社会的稳 定和人民生命财产的安全。产生交通事故的原因多种多样,准确地找出交通事故发生的 主要原因以及精确地预测是预防和减少交通事故的关键,以进行科学的决策,提出切实 有效的管理措施,对提高管理水平,增进交通安全有十分重要的意义。 1 2 2 交通事故成因分析的国内外研究现状 道路交通事故是随机事件,具有偶然性,其原因错综复杂,影响道路交通安全造成 交通事故的原因是多方面的,通常是在特定的交通环境下,由于人、车辆、道路、环境 所构成的动态交通系统的某个环节失调所引起的。因此,分析道路交通事故的成因最主 要就是分析人、车辆、道路以及环境因素对交通事故的影响。 为了切实把握住道路交通事故现状和未来发展趋势,一些经济发达国家的通常做法 是首先建立道路交通事故信息数据库( t r a f f i ca c c i d e n ti n f o r m a t i o nd a t a - b a s e ) ,然后通 过与交通警察、急救部门和保险公司的密切合作,将较严重的交通事故相关信息全面、 详细地收录其中。数据库存放的大量事故数据,将为深入研究道路交通事故的成因、预 防道路交通事故发生,并为实现汽车、保险关联产业的信息资源共享等提供基础性保障。 与此同时,交通事故信息数据库的建立还催生了一门新的学科交通事故统计分析 学。 美国、日本和欧盟等经济发达国家不但对道路交通事故进行资料建档,而且对交通 事故信息数据库进行了详细的统计分析,并成立了专门的交通安全研究机构,以此来保 障和改善国家的道路交通安全水平。如美国、日本、欧盟等国家和地区都按期汇总并发 布一次全国交通事故的详细统计结果,包括5 0 至1 0 0 个有关属性,管理部门按照某种 方式进行统计分析,以便于进行交通安全方面的研究。 我国交通事故分析数据库及平台建设缺乏先进的数据分析理念和手段。目前,全国 公安交通管理部门使用的“交通事故统计信息系统 尚处于原始事故数据统计的层面上, 仅能对数据进行简单处理,无法发现并充分利用数据中存在的关系,且大部分的事故成 因分析都是从事故定责的角度开展的,很少从技术层面挖掘事故发生的深层次原因及机 理,建立新型交通事故分析数据库系统势在必行口】。- 1 3 本文研究内容 1 3 1 灰色理论的研究 目前,计算属性值的重要度有多种方法,包括主成分分析n 1 ,灰色关联度陆,粗糙 集理论,关联规则n 1 等。灰色系统理论具有分析不确定性事件的特点,适合分析道路交 通事故成因的不确定性。交通事故具有无序特性,是一个开放系统。熵是原子无序状态 的数值测度喁1 ,可以分析体系的混乱程度,针对交通事故分析是一种好的方法,在交通 2 f j 曙jj 东北师范大学硕士学位论文 分析中经常用于事故分析的多种问题旧1 0 3 。 但是,应用灰色系统理论进行交通事故分析时,只能得出某属性中具体属性值与决 策属性之间的关联程度,而无法得出各个属性对决策属性的关联程度。例如,我们可以 通过灰色关联度分析得出天气属性中晴天,阴天,雨天等各属性值相对决策属性,也就 是交通事故死亡人数的关联度,也可以通过灰色关联度分析得出路表状况属性中干燥, 潮湿,积水等各属性值相对于决策属性的关联度,但是,我们却无法通过灰色关联度分 析得出天气和路表状况这两个属性哪一个与决策属性的关联性更强。这反映出,仅仅应 用灰色关联度进行属性的重要度分析具有一定的局限性,因此,需要探索一种新的数据 分析方法。本文将灰色综合关联度与信息熵相结合,并且借鉴灰色关联熵,建立一种新 的数据分析方法用来研究系统属性的重要性排序问题。 1 3 2 改进模型的研究 g m ( 1 ,1 ) 是动态模型,是高层次的量化模型,它更为深刻地揭示输入与输出之间的 数量关系或转换规律。本文通过对吉林大学交通学院提供的交通事故数据进行实例计 算,分析说明g m ( 1 ,1 ) 模型存在的一些不足之处,针对这些不足之处加以改进,使之更 加适应实际要求,更具有灵活性。 1 3 3 实际应用研究 本文研究依托“十一五 国家科技支撑计划道路交通安全保障关键技术研究及示 范项目的子题之一道路交通事故数据挖掘技术与综合成因分析模型研究( 课 题编号:2 0 0 7 b a k 3 5 8 0 1 ) 。研究的目的在于从大量相关因素中发现交通事故的主要影响 因子,并预测某一时间段的交通事故总次数,从而便于相关部门采取相应的妥善措施, 减轻道路交通事故为国家和人民带来的生命和财产损失。 1 4 本文的创新点 论文有以下创新点: ( 1 ) 交通事故数据的序列化是用灰色关联度分析交通事故成因的关键。 ( 2 ) 提出针对分析属性间相关性的局限性,结合灰色关联度和信息熵的特点,借鉴灰 色关联熵,得到一种新的算法一灰色综合关联度熵。 ( 3 ) 针对交通事故灰色预测的精度等问题利用序列算子对灰色预测模型加以改进,使 其更具灵活性。 3 东北师范大学硕士学位论文 第二章灰色综合关联度 在日常生活中,人们已普遍接受用“黑色 表示未知的信息,用“白色表示信息 完全明确,而用“灰色 ,表示部分信息明确、部分信息不明确。相应地,信息完全明 确的系统称为白色系统,信息未知的系统称为黑色系统,部分信息明确、部分信息不明 确的系统称为灰色系统。 它的基本特征有: ( 1 ) 灰色系统理论认为,系统是否会有信息不完全的情况、取决于认识的层次、信息 的层次和决策的层次,低层次系统的不确定量是相当的高层次系统的确定量,充分利用 已知的信息去揭示系统的规律。灰色系统理论在相对高层次上处理问题,其视野较为宽 广; ( 2 ) 应该从系统内部结构和参数去研究系统。灰色系统的内涵更为明确具体; ( 3 ) 灰色系统用灰数、灰色方程、灰色矩阵、灰色群等来描述,突破了原有方法的局 限。更深刻地反映了事物的本质: ( 4 ) 社会、经济等系统,一般都存在随机因素的干扰,这给系统分析带来了很大困难, 但灰色系统理论把随机量看作是在一定范围内变化的灰色量,尽管存在着无规则的干扰 成分,经过一定的技术处理总能发现它的规律性; ( 5 ) 用灰色系统理论研究社会经济系统的意义,在于一反过去那种纯粹定性描述的方 法,把问题具体化、量化,从变化规律不明显的情况中找出规律,并通过规律去分析事 物的变化和发展。 2 1 灰色绝对关联度 命题2 1 1 设系统行为序列置= ( ( 1 ) ,玉( 2 ) ,薯伽) ) 记折线 ( ( 1 ) 一( 1 ) ,( 2 ) 一x i ( 1 ) ,( 刀) 一而( 1 ) ) 为x ,一t ( 1 ) ,令 墨= l ( 置- x ,( 1 ) ) d t ( 2 1 1 ) 则 1 。当x ,为增长序列时,s ,0 ; 2 。当x ,为衰减序列时,s ,0 ; 3 。当x ;为振荡序列时,s ,符号不定。 由增长序列、衰减序列、振荡序列的定义及积分的性质,上述命题的成立是显然的。 定义2 1 2 设系统行为序列f = ( # ( 1 ) ,# ( 2 ) ,矽( 刀) ) ,d 为序列算子,且 4 奎! 皇堕垄奎兰堡主兰垡笙窒 了而百而习而石) d ) 其中石,( 七) d = x i ( 七) - - x i ( 1 ) ,七= 1 ,2 ,一,则称d 为始点零化算子,x ,d 为x i 的始点零 化像,记为 x , d = f = ( # ( 1 ) ,# ( 2 ) ,# ( 刀” 命题2 1 3 设系统行为序列 置= ( t ( 1 ) ,五( 2 ) ,而( 玎) ) x j = ( _ ( 1 ) ,x j ( 2 ) ,( 以) ) 的始点零化像分别为 矸= ( # ( 1 ) ,# ( 2 ) ,# 伽) ) x o ,= ( 工;( 1 ) ,x ;( 2 ) ,x ;( 珂) ) 令 s t s j = 孓蠼一x : 则 1 。当x ? 恒在x ? 上方,s ,一s ,0 ; 2 。当x :) 恒在x ;下方,j ,一s ,0 ; 3 。当x ? 与x ? 相交,q s f 的符号不定。 定义2 1 4 设序列x 。与x ,长度相同,s o ,s ,如命题2 1 1 中所示,则称 f 一 ! b ! 也! ( 2 1 2 ) 气2 可可百再而 峥纠 为x 。与x ,的灰色绝对关联度,简称绝对关联度。 定理2 1 5 灰色绝对关联度 1 + is ni + ls fi 岛,= 两可可再而 满足灰色关联公理中规范性、偶对对称性与接近性,但不满足整体性。 2 2 灰色相对关联度 定义2 2 1设序列x 。,x ,长度相同,且初值皆不等于零,x :,z 分别为x o ,x , 的初值像,则称x :与x ;的灰色绝对关联度为x 。与x ,的灰色相对关联度n 1 ,简称为相对 关联度,记为。 灰色相对关联度表征了序列x 。与x ,相对于始点的变化速率之间的关系,x 。与x , 的变化速率越接近,r o ,越大,反之就越小。 2 3 灰色综合关联度 定义2 3 1设序列x 。,x ,长度相同,且初值不等于零,岛,和,o ,分别为x 。与x ,的 东北9 币范大学硕士学位论文 灰色绝对关联度和灰色相对关联度,o 0 ,1 】,则称 p o f = o e o j + ( 1 一印r o , ( 2 3 1 ) 为x 。与x ,的灰色综合关联度,简称综合关联度。 灰色综合关联度既体现了折线x 。与x ,的相似程度,又反映出x 。与x ,相对于始点 的变化速率的接近程度,是较为全面地表征序列之间联系是否紧密的一个数量指标。一 般地,我们可取o = 0 5 ,如果对绝对量之间的关系较为关心,p 可取大一些;如果对变 化速率看得较重,o 可取小一些。 6 东北师范大学硕士学位论文 第三章熵 熵( e n t r o p y ) 指的是体系的混乱的程度,它在控制论、概率论、数论、天体物理、 生命科学等领域都有重要应用,在不同的学科中也有引申出的更为具体的定义,是各领 域十分重要的参量。1 8 6 5 年,德国物理学家克劳修斯( r c l a u s i u s ) 首先引入和提出熵这 一概念,用以定量地阐明热力学第二定律的数学表达式。1 8 7 7 年奥地利理论物理学家玻 尔兹曼( l b o l t z m a n n ) 导出了被后人称之为玻尔兹曼关系的著名公式,赋予了熵的统计 解释,极大地丰富了它的物理内涵和明确的应用范围。1 9 2 9 年西拉德( s z i l a r d ) 又发现了 熵与信息的关系,揭示了熵含意的新层次。1 9 4 8 年香农( c e s h a n n o n ) 给出了信息熵, 并与维纳( w i e n e r ) 创立了信息论,有关熵概念已在许多自然科学和社会科学领域内广为 应用。 3 1 信息熵 信息熵n 卜1 3 1 是表征随机变量本身统计特性的一个物理量,它是随机变量平均不确定 性的度量,是从总体统计特性上对随机变量的一个客观描述。 我们以s h a n n o n 提出的信息熵的概念作为不确定信息的统计测度。根据香农信息熵 的定义: 日= 一p kl 0 9 2 见 ( 3 1 1 ) k = l 式中: m 一状态空间的维度; 仇一第k 种状态的概率。 若第k 种情况发生的次数为,总样本数为n ,则以= 寿 实际测量工作中,由于多种因素的影响和限制,观测数据的统计特性不明显。用信 息熵的概念作为不确定信息的统计测度,并不要求已知数据的概率分布形式,也不要求 数据的概率分布一定是单峰的。因此,信息熵非常适合检验总体分布的离散程度。对信 息熵而言,不确定性的降低意味着熵值减少。 3 2 灰色关联熵 3 2 1 灰熵 设灰内涵数列x = ( 而,x 2 ,五) ,对于任何i ,_ or x ,= l ,称函数: h 。( x ) 兰一柚 ( 3 2 1 ) 为序列x 的灰熵,而为属性信息。灰熵具有s h a n n o n 熵的全部性质。 7 8 ( 3 2 2 ) ( 3 2 3 ) 数作为熵的信息 列与主行为列各 4 1 的各 不确 熵1 7 1 p o ,( f = 1 ,2 ,朋) 。 定义属性值灰色综合关联度概率 风,= l ( 4 1 1 ) 氏 则该属性灰色综合关联度熵 日= 一风,l 0 9 2 胁, ( 4 1 2 ) 灰色综合关联度熵反映了某属性中各属性值灰色综合关联度分布的均匀性,分布越 均匀,该属性的重要程度越低。有时不同属性中的属性值个数不尽相同,在灰色综合关 联度熵计算中体现为概率空间的维度不同。当概率空间维度m 不等时,属性之间的灰色 综合关联度熵没有可比性。因此,需要对灰色综合关联度熵给出更严格定义。 设某属性的属性值为m 个,各属性值相对决策属性的灰色综合关联度为 , o o ,( f = 1 ,2 ,所) 。 h m “代表由m 个属性值构成的属性的最大灰色综合关联度熵。这时灰色综合关联度 概率 =轰=mp0。=1pole p e p 朋 ( 4 1 3 ) = 一= m = 一 l j j 叭o 1 h 即等概率分布时熵最大, 日一= 一喜p 。,。g :p 。,= 一喜去- 。g :( 去) = 一朋i 1 - 。g :( 去) = - 。g :朋c 4 t 4 , 重新定义灰色综合关联度熵: 膏= 老一上l 0 9 2 氖k - - i m 1 0 9 :p ( 4 1 5 ) 日吣 一“” 、 。 式中m 是状态空间的维度,即属性值个数;风。是第k 种状态的概率,即第k 种属 东北师范大学硕士学位论文 性中各属性值的灰色关联度概率。 灰色综合关联度熵结合了灰色综合关联度和信息熵的优点,既可以对动态灰过程发 展态势整体接近性进行分析,又可以对事件的不确定性进行分析,克服了灰色系统理论 对属性重要性分析的局限性。 4 2 灰色综合关联度熵意义及理论价值 灰色综合关联度熵与灰关联熵用到的信息源是不同的,灰关联熵的信息源是属性值 的关联算子n 钔,灰色综合关联度熵的信息源是灰色综合关联度。本文中的灰色综合关联 度熵准则与灰关联序的熵关联度准则不同,当事件的发生相对于某种属性分布得越均 匀,即不确定性越强,便可以认为事件对该属性的依赖性越弱。基于这一原理,灰色综 合关联度熵准则是熵值越小,属性重要程度越大,反之,属性的重要程度越小。 为简要说明,这里模拟四季交通事故关联度作图( 图1 ) 进行说明。众所周知,在 北方地区冬季的交通事故的发生会因冰雪路滑而增加,因此四季的属性值关联度分布会 不均匀,季节属性对北方交通事故发生的关联度高;而在南方地区因为冬季冰雪很少, 因而各季节对交通事故的发生影响不会有所偏重,在南方,季节属性的各个属性值关联 度分布较为均匀,便可以认为季节对南方交通事故发生的关联度较低。 季 春夏秋冬 图l 南北四季交通事故关联度模拟分布图 表1 是模拟南北方四季交通事故关联度数据,计算南北方四季的灰色综合关联度熵。 表1 南北方四季交通事故关联度模拟数据 春夏秋冬 南方 0 6 8 7 90 6 9 9 20 6 7 6 50 7 2 3 5 北方 0 7 8 6 50 6 7 7 80 7 2 3 20 9 1 0 2 令 岛f2 ( o 6 8 7 9 ,0 6 9 9 2 ,0 6 7 6 5 ,0 7 2 35 ) 岛i2 ( o 7 8 6 5 ,0 6 7 7 8 ,0 7 2 3 2 ,0 9 1 0 2 ) 属性值灰色综合关联度概率 1 0 l 9 8 7 6 5 4 o o n n c i n 东北师范大学硕士学位论文 p l ,= 乒= ( o 2 4 6 8 ,0 2 5 0 9 ,0 2 4 2 7 ,0 2 5 9 6 ) , 岛, f 5 h l = 一p l ,l 0 9 2p l , = - ( 0 2 4 6 8 x l 0 9 20 2 4 6 8 + 0 2 5 0 9 l 0 9 20 2 5 0 9 + 0 2 4 2 7 l 0 9 20 2 4 2 7 j + 0 2 5 9 6 l 0 9 20 2 5 9 6 ) 21 9 9 9 6 p 2 ,= ( o 2 5 3 9 ,0 2 1 8 8 ,0 2 3 3 5 ,0 2 9 3 8 ) ,凰= 1 9 9 1 0 等概率分布时熵最大,这时有 一善p l f l 。g :p l l - - 一m 荟去l 0 9 2 嘲一所i 1l 0 9 2 ( 寺= l 0 9 2 m = := 2 求得灰色综合关联度熵: 毫= 老一上l 0 9 2m k = l p l kl 0 9 2 胪n 9 9 9 8 q 2 = 0 9 9 5 5 南方的灰色综合关联度熵毫大于北方的灰色综合关联度熵豆。根据事件发生相对 于某种属性分布得越不均匀,事件对该属性的依赖性越强的准则,可知季节对南方交通 事故发生的关联度较低,依据交通事故常识可见其结果符合灰色综合关联度熵准则,熵 值越小,属性重要程度越大。 4 3 灰色综合关联度熵在交通事故成因分析中的应用 4 3 1 交通事故数据处理 交通事故数据是呈放射状、多维、多层次的超立体结构。每条交通事故记录都包含 多个数据属性,每个属性反映了一起交通事故在一个维度上的特性,属性中的每个属性 值反映该属性所处于的不同状态。交通数据库的多属性构成了交通事故数据的多个维 度。本文中的属性与属性值具有一定含义。属性是人们观察或分析事物的角度。属性值 是在规定的观察角度下,某事物对应属性的程度或类别。一个事件记录只能取几个属性 值其中之一,绝不可能兼而取之,例如,天气是属性,而晴天、阴天和雨天等,是天气 这一属性的不同取值,即属性值。用集合论的概念来说,“属性 是集合,“属性值”是 集合中的元素。 如表2 所示,5 条交通事故记录包含多个属性,决策属性是死亡人数,条件属性包 括天气属性,路表情况属性,交通信号方式属性等其他属性。而属性中的每个属性值反 映该属性所处的不同状态,例如这5 条记录中,天气属性就包含了晴、阴、雨和雪这四 个属性值,路表情况属性包含了干燥、冰雪、积水和潮湿这四个属性值。 东北师范大学硕士学位论文 表2 交通事故数据记录表 一 死亡人数天气路表情况交通信号方式其他属性 事故标号 l l 晴干燥无信号 2 0晴冰雪民警指挥 32雨 积水标线 4 l 雪冰雪无信号 5 3 阴潮湿标线 交通事故数据记录表如表1 所示,但字符不适合应用到灰色关联度分析中,需要将 交通事故数据采集表中的字符映射为灰色系统可以处理的灰数,即序列化数据。 在交通事故数据中,死亡人数可以表示交通事故的严重程度,事故起数的多少可以 表示事故是否经常发生,因此可以将这种数据直接用在关联度分析中。为了实现这一目 的,将本文观测数据x ,( j | ) 的k 定为时间序列号,在k 时刻发生的事故次数作为序列值, 构成灰数序列。 假设时间为2 0 0 3 年、2 0 0 4 年、2 0 0 5 年、2 0 0 6 年、2 0 0 7 年、2 0 0 8 年的死亡人数分 别为8 7 6 、2 9 8 、1 8 7 、1 2 3 、4 5 、1 6 ,则系统特征行为序列为 k ( 尼) = ( 8 7 6 ,2 9 8 ,1 8 7 ,1 2 3 ,4 5 ,1 6 ) 我们把序列x o ( 七) 作为交通事故分析决策属性的行为序列。当我们拟研究天气与事 故死亡人数的关联性时,则用各种天气状况对应不同死亡人数所发生的事故数构造相应 天气状况的事故数行为序列。例如,晴天对应2 0 0 3 年到2 0 0 8 年的事故数分别为6 7 6 、 4 9 、2 7 、1 3 、7 、3 ,则相关因素行为序列为五( 七) = ( 6 7 6 ,4 9 ,2 7 ,1 3 ,7 ,3 ) 。 我们把序列五( 七) 作为天气状况条件属性值行为序列之一的晴天。同理,可以构造 出天气状况的其他条件属性值行为序列,例如阴天的行为序列置( 七) 、雨天的行为序列 置( 七) 、雪天的行为序列l ( 后) ,等等。这些序列集合构成了天气状况属性值行为序列 族。当然,我们也可以构造出诸如交通方式各属性值( 驾驶机动车、驾驶非机动车、乘 车、步行、其它交通方式) 等其他属性的属性值行为序列族。 以上述行为序列的均值像作为灰数矩阵,即可建立起序列化数据库。 4 3 2 属性值重要度计算 对中国某地交通事故进行事故成因分析,以时间作为序列号,以死亡人数作为决策 属性,事故起数作为条件属性,做灰色关联曲线,最接近事故决策属性参考序列曲线的 属性值对交通事故的影响最大。 1 2 东北师范大学硕士学位论文 表3 属性值重要度计算需要的部分交通事故数据 属性值0 6 年0 6 年0 7 年0 7 年 上半年下半年上半年下半年 属性名称 死亡人数 2 7 77 23 7 52 9 5 干燥4652 4 97 2 85 4 7 潮湿 5 01 68 24 5 路表情况 积水 1 291 32 0 冰雪4209 64 其他 1 041 86 晴4802 5 37 8 35 4 7 阴4 486 02 6 天气雨 3 31 74 24 7 雪 2 205 2l 其他ll13 1 5 0 米 1 0 491 3 33 0 5 0 1 0 0 米9 05 21 3 68 4 能见度 1 0 0 - 2 0 0 米1 2 4 6 0 1 8 01 2 2 2 0 0 米以上 2 6 11 6 13 7 22 2 5 无信号 1 3 86 12 6 81 4 0 标线 l01 1 01 1 2 交通信号方式信号灯 3 02 83 94 4 标志4041 8 55 1 l3 1 5 其他7 4 91 2 直行2 7 2 1 3 8 3 8 72 1 7 倒车5o52 掉头 6474 起步 l l21 44 停车 ll2l 车辆行驶状态左转弯1 9 2 4 3 82 9 右转弯76l o1 2 变更车道 l414 躲避障碍 l0ll 静止7 0 7 o 其他5061 由表3 属性值重要度计算需要的部分交通事故数据可知决策属性和路标情况属性中 属性值干燥的行为数据如下: 死亡人数:墨= ( 五( 1 ) ,而( 2 ) ,x 1 ( 3 ) ,x j ( 4 ) ) = ( 2 7 7 ,7 2 ,3 7 5 ,2 9 5 ) 干燥: 五= ( 而( 1 ) ,x 2 ( 2 ) ,x 2 ( 3 ) ,而( 4 ) ) = ( 4 6 5 ,2 4 9 ,7 3 8 ,5 4 7 ) 以x 为系统特征序列,计算灰色绝对关联度 第一步:求其均值像: 13 东北师范大学硕士学位论文 由置。= ( ( 1 ) d , x i ( 2 ) d ,毛( 玎) d ) ,其中而( 尼) d = 等,置= 丢喜誓( 七) ;i = l ,2 ,得 置- ( 1 0 8 7 3 ,0 2 8 2 6 ,1 4 7 2 ,1 1 5 8 ) 豆= ( o 9 3 5 1 ,0 5 0 0 8 ,1 4 6 4 1 ,1 1 0 0 1 ) 第二步:求始点零像化。得 霹= ( o ,0 8 0 4 7 ,0 3 8 4 7 ,0 0 7 0 7 ) 是= ( o ,0 4 3 4 3 ,0 5 2 9 0 ,o 1 6 5 0 ) 第三步:求l 而i ,i s 2 i ,i s 2 - - s i i : b l2 陲水_ 1 w f r o ) | = o - 3 8 4 6 斗:l = 障驰) 哇珊) i :o m 2 8 - - s 1 2 障( 珈) 一靴) ) + 三( 相) 矧4 ) ) l = o 5 6 1 8 第四步:计算灰色绝对关联度 铲晶端2 裟一o 7 3 5 5 计算灰色相对关联度 第一步:求五、五的初值像。得 墨- ( 1 ,0 2 5 9 9 ,1 3 5 3 8 ,1 0 6 5 0 ) z = ( 1 ,0 5 3 5 6 ,1 5 6 5 7 ,1 1 7 6 5 ) 第二步:求石,墨的始点零像化: x :- ( o 。- 0 7 4 0 1 ,0 3 5 3 8 。0 0 6 5 0 ) 掣= ( o ,- 0 4 6 4 4 ,0 5 6 5 7 ,o 17 6 5 ) 第三步:求卜f ,l 屯i ,l 屯7 一o i : s i f 2 l 辜r ( 七) + 三r ( 4 ) i = o 3 8 s 2l2 i 孝譬( 七) + 三# ( 4 ) i :o - 8 9 6 k 一而l = i 辜( 毒( d r ( 枷+ 圭( r ( 4 ) 一r ( 4 ) ) l = o s 4 3 5 第四步:计算灰色相对关联度: 铲赢龋2 丽1 5 4 3 4 一o 7 3 9 7 计算灰色综合关联度,取0 = 0 5 ,可得: 岛22 鸭2 + ( 1 一秒) 22 0 5 o 7 3 5 5 + 0 5 0 7 3 9 7 = 0 7 3 7 6 l,tii 其他属性值的重要度计算结果如表4 所示。 表4 灰色综合关联度 属性 属性值相对关联度绝对关联度综合关联度 干燥073970 7 3 5 50 7 3 7 6 潮湿084550 8 3 5 30 8 4 0 4 路表情况积水07450 0 7 4 2 1o 7 4 3 5 冰雪 o 8 9 0 4o 8 9 4 00 8 9 2 2 其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 井矿盐采卤工突发故障应对考核试卷及答案
- 纯三氧化钨、仲钨酸铵、兰钨制取工成本控制考核试卷及答案
- 2025年2-乙基己酰氯行业研究报告及未来行业发展趋势预测
- 2025年彩钢板行业研究报告及未来行业发展趋势预测
- 钻车司机工艺考核试卷及答案
- 金属材精整工工艺创新考核试卷及答案
- 2025年风景名胜区管理行业研究报告及未来行业发展趋势预测
- 农药使用培训员职业技能考核试卷及答案
- 遗体防腐师作业指导书
- 粪便清运工作业指导书
- 小学科学新教科版三年级上册全册教案(2025秋新版)
- (2025年标准)员工住房安全协议书
- 烟花爆竹理论题目及答案
- 青海省尖扎县2025年上半年公开招聘辅警试题含答案分析
- 苏教版2025-2026秋三年级数学上册教学计划及课时安排
- 【里斯】年轻一代新能源汽车消费洞察与预测 -新物种 新理念 新趋势(2024-2025)
- 2025年综合基础知识题库(含答案)
- DB32T3916-2020建筑地基基础检测规程
- 新苏教版六年级上册《科学》全一册全部课件(含19课时)
- 外周血管介入诊疗技术管理制度和质量保障措施
- 河南某高速公路改扩建工程盖板涵洞施工方案
评论
0/150
提交评论