(管理科学与工程专业论文)基于模糊聚类的客户分类方法研究.pdf_第1页
(管理科学与工程专业论文)基于模糊聚类的客户分类方法研究.pdf_第2页
(管理科学与工程专业论文)基于模糊聚类的客户分类方法研究.pdf_第3页
(管理科学与工程专业论文)基于模糊聚类的客户分类方法研究.pdf_第4页
(管理科学与工程专业论文)基于模糊聚类的客户分类方法研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(管理科学与工程专业论文)基于模糊聚类的客户分类方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着企业经营环境越来越复杂,市场的竞争环境越来越激烈,客户关系管理 ( c r m ) 已经成为新世纪企业致胜的关键。但是,任何功能层次的c r m 都是在客户分 类的基础上实现c 跳的理念和目标的。鉴于此,本文针对国内外研究现状,研究了 客户分类的最新进展和难点,旨在找出一种全面的分类方法帮助企业对客户进行分 类。 本文主要探讨使用模糊数学的聚类分析方法进行客户分类。在数学上,按一定 的要求和规律,通过对事物的数量关系的分析,对事物进行分析的方法,叫做聚类 分析。聚类分析是一种用数学方法定量地确定样品的亲疏关系,从而客观地分型划 类的多元分析方法,但传统的聚类分析是一种硬划分,它把每个待辨识的对象严格 地划分到某个类中,具有非此即彼的性质,因此这种分类的类别界限是分明的。而 实际上大多数客户对象并没有严格的属性,它们在性态和类属方面存在着中介性, 适合进行软划分。而模糊集理论为这种软划分提供了有力的分析工具。因此,本文 通过引入模糊的方法来处理聚类问题,从而实现了定性和定量相结合,得到了客户 样本属于各个类别的不确定性程度,表达了客户样本类属的中介性,建立起了客户 样本对于类别的不确定性的描述,从而能更客观地反映现实的客户分类情况。 本文采用定性和定量相结合的研究方法,将理论和模型、方法与实例、模型与 应用研究融为一体,构建了一种新的客户分类模型一模糊聚类客户分类模型。并且 利用c 语言编写出了模糊聚类分析的计算机程序,实现了分析研究过程的电算化, 大大提高了工作效率:运用该程序实现了对客户数据的分析研究,使分类更切合实 际。 本文通过实例应用,验证了模糊聚类客户分类模型的合理性和有效性。模型 的评价结果不仅能有效地对客户进行分类,还能展示客户与不同客户类型之间的 联系。根据这种分类,企业可以制定不同的个性化营销策略改善客户与企业的关 系,从而提升客户价值,提高企业的销售额和利润,最终达到客户与企业双赢的 目标。 关键词:客,。分类聚类分析模糊矩阵模糊聚类客户分类模型 a b s t r a c t w i t ht h ec o m p e t i t i o no fc o r p o r a t i o nb e c o m em o r ea n dm o r ev e h e m e n t ,c u s t o m e r r c l a t i o n s h i pm a n a g e m e n t ( c r m ) h a sb e e np l a y i n gt h ek e yr o l ei nm o d e mc o 叩o r a t i o n w h i c hc q m et ot h et o p a c t u a l ly e v e r yf u n c t i o n a l 伊a d a t i o nc r mc a r r i e si t si d e aa n dg o a l o u tb yc u s t o m e rc l a s s i f i c a t i o n i t h i sp a p e r ,n e wd e v e l 叩m e n ta n dt h ee x i s t i n gd i f n c u l t i e s o fc u s t o m e fc l a s s i f i c a t i o na r ed i s c u s s e di no r d e rt oh e l pc o r p o m t i o nc l a s s i f yc u s t o m e r sb y ac o m p r e h e s i v ed a s s j f i c a f i o nm e t h o d w ei n t e 擘a t et h e o r i e sa n dm o d e l s 、m e t h o d sa n de x a m p l e 、m o d e l sa n da p p l i c a t i o n r e s e a r c h e si n t oa e wc l a s s i f i e dm o d e i - f u z z yc l u s t e r i n gc l a s s i f ym o d e l 1 1 1 i sm o d e lu s e f u z z yc 1 u s i e r i n gt oa n a l y s ea n dd e a lw i t hc u s t o m e r s d e m a n d sd y n a m i ca n dd u l y i t c o s t n 】c tf 1 1 z z ym a 啊xb a s e do nt h ea t t r i b u t e so fc u s t o m e r s a i l dt h e ni tc o n f i 咖t h e c l a s s i f yr e l a t i o n s h i p a c c o r d i l l gt os o m es u b j e c t i o n s a g a i n ,t h em o d e li n t r o d u c e sf i l z z y m a t h 锄a t i c st oc a l c u l a t ea dc o n d u c tr e l e v a n td a t a w h i c 舡b l u r st h eb o r d e r l i n e so f c u s t o m e rc l a s s i f i c a i i o na n dh e l p sc o r p o r a i i o n sc l a s s j f yc u s t o m e r sm o f en a t u r a l l ya n d r e a l i s t i c a l ly b ye x p e r i m e n t a lr e s e a r c h ,b o t ht h er a t j o n a l j t ya n dt h ev a l i d i t ya r ev a l i d a t e d f u z z y c l u s t e 血gd a s s i f ym o d e ln o to n l yc a nc l a s s j f yc u s t o m e r se f f e c t i v e ly ,b u ta l s oc a ni m p l y d i f f e r e n tr e l a t i o n s h i p sb e t w e e nc u s t o m e r sa n dc 1 】s t o m e rc l a s s i f i c a t i o n s 气c c o r d i n gt ot h o s e c l a s s i 丘c a t i o n ,c o r p o r a t i o n sc a nm a k ed i f f e r e n i d e c i s i o n so ni n d i v i d u a t i o nm a r k e t i n g s t r a t e 百e st oi m p r o v er e l a t i o n s h i p sb e t 、v e e nc u s t o m e r sa n dt h ec o r p o r a t i o n t h es t r a t e g i e s w i l lc 0 v 缸t h em o s tp o t e n t i a lc u s t o m e r st ot h em o s 【v a l u a b l ec u s t o m e r s ,a n dc o n v e r tt h e r e m a i n e dc u s t o m e r st ot h em o s tp o t e n t i a lc u s t o m e f s ,酉v eu pt h ed e s e n e dc u s t o m e r s ,s o t h a tt h ec o r p o r a t i o n sc a ni n c r e a s ec u s t o m e rv a l u ea n dg a i m o r es a l e sa n dp r o f i t s , i m p l e m e n tc r m i nt h eo 唱a n i z a t i o nt h o r o u 曲l y ,r e a l i z ct h ew i n - w i ng o a lf i n a l l y k e yw o r d s :c l a s s i f yc u s t o m e r s ;c l u s t e r i n ga n a l y s e : f u z z ym a t r i x : f u z z yc l u s t e r i n g c 1 a s s i f ym o d e l 第一章绪论 1 1 选题背景和意义 1 1 1 选题的背景 从8 0 年代中期开始,许多企业开始重组和重新设计其商业流程,以期降低成本 并提高效率和竞争能力。同时,这些企业也意识到,要达到这些目的,所需要开发 的技术耗资巨大,复杂且耗时冗长。因此,许多公司转而求助于企业资源规划应用 系统。这些应用系统帮助他们实现了内部商业流程,如财务、制造、库存管理和人 力资源的自动化和优化,从而将企业从战术性的日常商业运作事务中解放了出来。 然而,全世界范围内的各个企业都在经历一场深刻的变革,企业关注的焦点逐渐改 进内部运作转移到更多地关注客户上来,企业都意识到客户才是企业生存发展的源 泉。而要把注意力集中到客户身上,许多企业都必须再度开始寻求信息技术的帮助, 即求助于客户关系管理来赢得更多的客户并且提高客户的忠诚度。可以说客户关系 管理带给我们的不仅仅是一个软件产品,更重要的是一种先进的管理思想和管理方 法。尤其是基于i n t e r n e t 技术的电子商务正在改变着各个行业的经营模式,彻底改 变了企业客户和供应商之间的关系,同时也带来了更为激烈的竞争。在这种竞争中, 谁能把握住客户的需求,并以最快的速度做出响应,谁就能吸引新客户保持老客户, 在竞争中取胜。这就要求企业从“以产品为中心”的模式转向“以客户为中心”的 模式,那么如阿实现这种模式呢? 客户关系管理提供了答案。在客户关系管理中, 企业以客户为中心,企业的生产、营销、服务以及市场都是围绕着客户而进行的在 最大程度地提高客户满意度地同时,也提高了企业的运作效率,降低了企业的运作 成本。c r l 同e r p 和s c m 一起,已经成为现代企业提高竞争力的有效手段。c r m 涉及 到大量的数据方面的处理。随着数据库技术的迅速发展以及数据库管理系统的广泛 应用,企业积累的客户数据越来越多。激增的数据背后隐藏着许多重要的信息,企 业希望能够对其进行更高层次的分析,以便更好地利用这些数据对客户进行分类, 进而对不同的客户采取不同的管理策略,降低吸引客户的成本,增加客户的回头率。 1 1 2 选题的意义 国内外大量的研究表明,企业8 0 的利润是由2 0 的客户创造的,这就是著名 的8 0 2 0 法则。由于企业资源的有限性,企业不可能为所有客户都提供令其满意的 服务,这就导致企业在不断努力开发新客户的同时,也不断地有老客户因为不满足 广东工业大学臂理学硕士学位论文 其服务而离开,而企业开发一个新客户成本是维系一个老客户成本的4 至5 倍,减 少5 的客户流失率就可增加6 0 8 0 的利润,因此企业能否维系住老客户尤其是优 质客户,是决定企业赢利能力大小的关键,也是企业核心竞争力的重要组成部分。 对于企业而言,不同的客户具有不同的内在价值,c r m 作为一个获取、保持和增加可 获利顾客的过程,其首要问题就是采取有效方法对客户进行分类,发现内在价值高 的客户,将企业有限的资源集中于这些客户,更好地为他们提供服务,培育客户忠 诚度,防止优质客户被挤压而失去,所以客户分类可以说是客户关系管理的基础。 虽然已经有很多定型的方法可以对客户进行分类。但是随着时代的变迁,科学 的进步,数据仓库技术日益完善,客户关系管理对客户分类的研究并不能都满足于 定性研究,然而客户数据非常复杂,有些复杂的数据是难于精确化的,把模糊数学 应用于客户分类,能很好地贴近人类的思维方式,更加易于被人理解。本文应用模 糊集软化数量型属性的划分边界,提出了基于模糊的客广,细分方法,从客户关系角 度出发,把客户价值和客户行为结合起来对客户进行分类。期望本文的分类方法能 够对企业的客户分类提供有价值的参考。 1 2 客户分类方法研究现状 1 2 1 定性的客户分类方法 定性的客户分类方法是以不同客户所认知的价值的不同侧重点为分类基础的客 户分类方法。 客户价值的形成一般可表示为: 价值= 利益一成本 企业为了给客户提供更多的价值,就可以采用两种不同的方法,即提高利益或 降低成本。那么,到底是为客户创造更多的利益好,还是提供价格更低廉的产品好, 应该取决于客户的感觉。根据这种感觉的不同,可以把客户分为阱下三类。 ( 1 ) 内在价值型客户。这类客户的特点是对产品已有很深的了解,知道产品是 否或在多大程度上满足他们的需求。他们只希望自己购买时所花费的费用合理,采 购过程快捷便利,他们对各种建议和量身定做不感兴趣,低价格和便利的采购程序 可以给他们带来最大价值和满足感。 ( 2 ) 外在价值型客户。除了产品本身的价值外,这类客户更看重企业为他们提 供的建议和个性化订制方案的价值。他们认为,销售人员的帮助和建议会为他们创 造额外价值,并且也愿意为此支付额外费用。这类客户般局限于大中客户身上, 弟一苹缔论 因为客户规模太小,创造的价值不足以弥补双方所付出的时间、金钱和精力。 ( 3 ) 战略型价值客户。这类客户只可能限定在企业的少数几个最大的客户内。 他们要求企业能为他们投入大量时间,并建立起战略伙伴联盟关系,这种联盟关系 的长远利益是可观的。 我们可以用下图简单地表示这种分类情况。对这三种客户,在c r m 过程中必须 区别对待。如图所示,对只注重产品自身价值的内在价值型客户而言,最佳的c r m 管理策略是采用简单的交易方式,简化交易程序,降低销售成本,为客户提供令他 们满意的低价商品:对外在价值型客户,c r m 策略则不宜采用简单的交易方式,而应 选用专家顾问型的交易方式,即企业应多了解客户所存在的问题,提供有效解决方 案,为客户创造产品以外的新价值,客户本身也愿意为这些新价值支付报酬:对企 业拥有的、少数的战略型客户,c r m 策略是投入足够的人、财、物和时间等资源,与 客户建立起长远的伙伴关系,为客户创造非同一般的价值,企业也要从中获得长久 的巨额回报。实际上,这种分类管理的目的是想让企业的投入与客户期望的投入量 相平衡,使企业的营销达到事半功倍的效果。 外在价徽搬客户 追饿产晶以外的价格 c r m 策l ;l i : 身客户创遗新价f f :( 战略价德型客户 追求战硌伙伴关系 c r m :瓣黪; 刨遗非同一般的价缎 内柱价f | ! 【型客户 双挂m 产品自身价f i ! f c r 瓶策略:降低成奉便糖采购 1 2 2 定量的客户分类方法 1 r 刚模型 r f m 模型是客户关系管理( c r m ) 的分析模式中广泛应用的模拟。r 模型采用三 个属性对用户进行分类。r ( r e c e n c y ) 表示客户最近一次购买的时问,f ( f r e q u e n c y ) 表示客户在最近一段时间内购买的次数,m ( m o n e t a r y ) 表示客户在最近一段时间内购 买的金额。在r f m 模型中,注重以客户的行为来区分客户。 2 b c 分类方法 a b c 分类法是一种最常用、最简洁的方法,其原理是根据企业利润额构成区分客 j 乐工业大学冒理学坝士学位论x 户。我们按照企业利润额来源大小对客户进行排序后发现,企业8 0 以上的利润来 源于2 0 的客户,7 0 的客户只提供了不足2 0 的利润,另有1 0 的客户不仅不会 为企业带来任何利益,甚至会削弱企业的赢利水平。这种情况可以运用帕雷托曲线 描述如下: 根据企业利润额的构成情况,客户较直观地分为a 、b 、c 三类,他们对于企业 而言客户价值相差甚远,客户管理的要点就是优先发展a 类客户保持或缩减b 类 客户,抛弃c 类客户。 运用a b c 分类法的缺陷就是只考虑客户给企业带来的利润总额,而没有区分本 企业经营中不同客户所带来的资金利润率高低,以及客户的成长情况,导致一些规 模较大而实际内在价值并不高的企业被列入a 类,享受到优质服务,而一些起步晚、 成长较快的明星型企业被忽视或抛弃。 3 以客户价值为中心的分类方法 因为客户价值是c r m 中很重要的一个变量,我们可以利用这个变量对客户进行 定量分类。由于影响客户价值的因素主要有三个,即客户生命周期、客户平均每次 消费额和客户平均消费周期 5 ,为此,可以建立如下的数学模型。 c 矗v :喜x7 i l 式中:c r v 为从核定期开始计算的客户生命周期的客户价值:t 为从核定期 开始计算的客户生命周期长度:了为根据客户消费数据计算的客户平均每次消费额; 丁为根据客户消费数据计算的客户平均消费周期。 可见,客户价值主要取决于客户生命周期长度t ,客户平均消费周期丁和客 户平均每次消费金额5 ,根据这三个指标的不同对客户进行如下分类。 ( 1 ) 放弃客户。这类客户表现为三个变量t 、f 、s 都处于劣势。在实施c r m 时,他们应该是被忽略或稍加注意的客户,否则,只能使c r m 的收益成本比的结果 趋于劣化。 ( 2 ) 发展客户。这类客户特点是三个变量中有两个处于劣势,一个处于优势, 如7 和了劣,但t 优。企业需要掌握更多的客户信息,把握他们的需求状况,对他 们投入较多关注,提高他们的满意度和忠诚度,以促使某个变量的优化,使他们向 “白银客户”或者“黄金客户”转化,而这一切又对企业的营销管理人员的素质提 出更高的要求。 ( 3 ) 白银客户。与发展客户相对,这类客户的特点是三个变量中有两个处于 第二章理论基础 弟一早璀i 匕昼们面 2 1 聚类分析 2 1 1 聚类分析的概念与用途 聚类分析( c l u s t e r i n ga n a l y s i s ) ,又称聚类,是一种广泛应用于数据挖掘的 分析手段。它是这样一个过程,即,按照事物的某些属性,将事物分成多个类或簇, 使得在同一类中的事物相似性尽量大,不同类间的事物相似性尽量小。 聚类作为一种非监督型的知识发现方法,不需要任何事先的训练数据,而仅仅 按照相似性原则,将一组数据划分为事先未知的分类状态,因而是一种有效的、得 到广泛应用的识别与发现未知模式的几种有效方法之一。 聚类分析是人类认识世界的重要方式,人早在婴幼儿时期,就开始通过不断地 改进潜意识中的分类主题学习如何区分猫和狗、区分动物与植物等。虽然人们可以 凭经验和专业知识实现分类,但聚类分析作为一种定量方法,从数据分析的角度给 出了一个更准确的分类工具。目前,聚类分析已经被广泛的应用于各个数值分析领 域,包括模式识别、数理统计、图像处理以及市场分析等。在商业上,聚类分析可 以帮助市场分析人员根据客户消费模式对客户进行分类,发现不同类别客户的消费 偏好和特点,从而进行有针一对性的服务和广告宣传。在生物学上,聚类能用于推 导植物和动物的分类,对基因进行分类,获得对种群中固有结构的认识。在天文学、 地理学以及文本挖掘等方面,聚类分析也有大量的应用。聚类分析已经成为数据挖 掘研究领域中一个非常活跃的研究课题。 近年来,聚类作为一种基本的数据挖掘方法被广泛地应用于相似搜索、顾客划 分、模式识别、趋势分析等领域中。例如,在超市中,把经常被同时购买的商品项 聚类到一起有利于改善商品的布置,提高销售利润。在电子商务的每天的日常业务 中,网上商店的w e b 服务器自动收集并存储了网上客户的对商品的购买、浏览倾向, 对不同类别的客户群分析其可能的兴趣特点和购买方式。在信息检索领域中,聚类 分析对文档进行分类,改善信息检索的效率,或者发现某一领域文献的组成结构。 在医疗分析中,通过对一组新型疾病聚类,得到每类疾病的特征描述,就可以对这 些疾病进行识别,提高治疗的功效。 2 1 2 聚类的具体方法 聚类分析的基本思想是将比较接近的样本归为一类。不过有可能预先并不知道 应分成几类,也可能预先已确定好要分成几类。据这两种不同的前提,聚类方法又 广东工业大学管理学硕j 二学位论文 可大致分为系统聚类法,动态聚类法两种。 1 、系统聚类法 系统聚类法可分为三个步骤: ( 1 ) 计算各样本之间的距离,将距离最近的两个点合并为一类 ( 2 ) 借助定义类与类之间的距离,将距离最近的两类合并成新的一类: ( 3 ) 反复进行步骤c 2 ) 使类与类之间不断合并最后全部样本归为一类,则得到聚 类过程结果。 类与类之间的距离又有各种不相同的定义方法常用的有下列四种: ( 1 ) 最小距离法 设g t 与g - 是聚类过程中的两类样本,则它们之间的距离d ,定义为 g ,= ! 螬【d ( - 气) l ( 2 ) 最大距离法 设g 。与g ,是两类样本,则其距离d ,定义为: 岛5 删 d ( ,一) 】 1 i 。b 。 ( 3 ) 中间距离法 因为每次聚类总是只有两个类互相合并,设合并的两类为g 。与g ,合并后记为 g t j 则g 。与另一类g 。的距离定义为 g = 蕊丽 ( 4 ) 重心法 由于“类的距离”定义不同,聚类结果也就不一样,到底采用哪种定义更合适, 应由具体问题而定。 例如有五个单指标的样本,它们的指标分别是x ,x :,x 3 ,抽,将它 们进行分类,类与类之间距离采用最小距离法。用系统聚类法所得到的聚类结果, 是一个系统的分类树。我们可以从分类树上任意选择聚类结果。例如,要将样本分 成三类时,就可相到如下分类结果: k ,x 。) , ,x ;) , x 。 : 若要将样本分成二类时,则可得到如下分类结果: x 。, x 2 , x 3 ,x ,x 5 : r 第二荦理论基础 2 、动态聚类法 系统聚类法一次形成分类结果,因此对分类方法提出的要求较高,相应的计算 量也较大。为此,提出动态聚类方法。此法是先将样本进行一次粗略的分类,称为 初始分类,然后根据某种最优原则进行反复不断修改,直至分类合理为止。 所谓聚类中心,就是先使用代表该类的理想样本,通常把该类的重心作为聚类 中心。但在选择初始聚类中心时,所选出的并非一类的真正中心,而是人为设想的 中心,带有一定的盲目性。 通常用下述方法来选择初始聚类中心: ( 1 ) 人为选择 根据人们对问题的了解,按人们的主观意图,去选定某些样本作为聚类中心, 所选的样本希望有一定的代表性。 ( 2 ) 随机选择 用随机抽样的办法,任意选择各个样本,只有在一无所知的时候才采用。 ( 3 ) 重心法 将样本人为地分成几类,计算每一类的重心,将这些重心作为初始聚类的重心。 ( 4 ) 密度法 人为地选定两数r j 和r :,以每个样本为球心,r ,为半径作球面,落在球内的样 本个数,即该样本的密度最大者为第一聚类中心,与第一聚类中心距离超过r 。,并 且密度为次大的样本为第二聚类中心,依次类推,则可得到初始聚类中心。通常凡 要大于r ,所选的聚类中心太多时,则可适当调整r 。和r :。 初始聚类形成以后的修改分类有如下两种方法: ( 1 ) 成批修改法 根据初始聚类的结果重新计算每一类的重心,作为新的聚类中心。再将样本逐 个输入按最近原则重新进行聚类并计算出新聚类结果的每一类的重心,将它作为又 一次的新聚类中心。如前后两次所得的聚类中心一致,则认为分类合理,聚类过程 结束,最后的聚类结果即为最终分类。 ( 2 ) 逐个修改法 成批修改法在样本全部归类后刁改变聚类中心、。逐个修改法则是每输入一个样 本即进行一次分类,同时改变聚类中心,然后再输入下一个样本。具体步骤为:首先 人为地选定三个数a 、b 和c 。取前n 个样本作为聚类中心,然后计算这些聚类中心 两两之间的距离将距离小于l 的两个聚类中心合并,用合并后的重心作为新的聚类 中心。重复此过程,直到所有聚类中心间的距离均不小于定值为止。将样本逐个纳 q 广东工业大学管理学碗:匕学位论文 入,每输入一个样本,首先计算该样本与所有聚类中心的距离,如果最小距离大于 较大,则该样本作为新的聚类中心:若最小距离小于或等于定值,则将该样本归入与 它最近的聚类中心的那一类同时重新计算这一类重心,以此重心作为新的聚类中, 若所有聚类中心间的距离均大于等于定值,则输入下一个样本并重复此过程,否则 再对聚类中心进行合并。最后,将样本按上述所得的聚类中心重新进行聚类。在聚 类过程中,如所得的类与前次不同,则须重新计算该类的重心作为新的聚类中心, 若新的聚类结果与前一次的聚类结果完全一致,则分类合理,聚类过程结束,所得 分类结果即为最终分类。 逐个修改法中实质上己包含了初始聚类中心的选择与进行初始聚类的全部 过程,因而应用此方法时就不必再考虑这两点了 一般的动态聚类法分类的个数应是预先知道的,尽管逐个修改法所得的类数与 初始规定的类数,会有不同,但也要预先给出,这是和系统聚类法的不同之处。在 很多情况下动态聚类法是相当实用的。 2 1 3 聚类与分类的区别 聚类和分类的最大区别就是,分类是有监督的,聚类是无监督的。什么叫监督 呢? 就是标准,或者说有目标变量。聚类是没有目标的,“物以聚类,人以群分”, 聚类是不知道每一类有什么特征的,聚后再总结,再发现共同点。而分类事先知道 类别数和种类的典型特征。 2 2 模糊理论 2 2 1 模糊数学概述 世界上的许多事物,包括人脑的思维和控制作用,都具有模糊和非定量化的特 点。可以说,在整个世界上模糊性不是例外而是常规。长期以来,人们己经习惯于 用模糊的方法来思考和推理,然而在处理客观世界上的问题时,人们基本上都忽略 了这一事实,而仅仅用经典数学的精确方法来对待这个弥漫性的、非定量化的世界, 这就很可能要导致失败,甚至使数学工作者面对带模糊现象的问题而束手无策。 模糊数学是应用数学方法研究和处理具有“模糊性”现象的数学。所谓模糊性, 主要是指客观事物的差异之间存在着中间过渡,存在着亦此亦彼的现象。例如有矿 与无矿、美与丑、好与坏、高个与矮个等等,都难以明确地划定界限。 在1 9 世纪以前的数学研究过程中,人们研究对象的本质属性,也就是概念的内 1 0 第二覃理论基础 涵。1 9 世纪初布尔等人采用概念的外延解释,即概念是被它的本质属性所确定的对 象的总和,才能明确揭示出数学概念和推理过程中的普遍规律。 集合论在经典数学中占有非常重要的位置,之所以这样说是因为每一个数学概 念都反映了具有特殊性质的对象的集合,每一个判断都反映了集合之间的某种关系, 每一步数学推理都反映了集合之间的某种运算。经典数学中关于集合的概念是基于 形式逻辑的定律,同一律、矛盾律等等。也就是说,所研究的对象,要么属于某个 集合,要么不属于某个集合,两者必居其一。但是客观现象中,大多数情况并不具 备这种明显的清晰性,往往所研究的集合并没有一个明确的边界。如果过分简单地 提取特征,就会影响客现实际本身的规律性。因此,必须对经典集合进行扩充,以 便更好地与客观实际相吻合,模糊集合正是在这种情况下诞生的。 美国自动控制专家查德( l a z a d e k ) 在1 9 6 5 年第一次提出“模糊集合”( f u z z y s e t ) 的概念,引入了“隶属函数”来描述差异的中问过渡。首次成功地运用了数学 方法描述模糊概念,这是精确性对模糊性的一种逼近。 在模糊数学中,正确地确定隶属函数非常重要,它关系到是否能很好地利用模 糊集合来恰如其分地将模糊概念定量化。但是对同一模糊概念,不同的研究人员可 能使用不同的隶属函数。这是因为,对隶属函数的确定没有统一的途径。这并不影 响隶属函数的使用,只要隶属函数能反映所研究的模糊概念,尽管形式不同,但在 解决处理模糊信息的问题中仍能殊途同归。 2 2 2 模糊子集的定义与运算 论域x = x ) 上的模糊集合a 由隶属函数u “( x ) 来表征,其中u ( x ) 在实轴的闭区域 o ,1 中取值,u 一( x ) 的大小反映:对于模糊集合a 的隶属程度。 这里,论域x = f x ) 上的模糊集合a 是指x 中的具有某种性质的元素整体,对于这种 元素中的任一元素,基于所具有的某种性质,可用 o ,1 问的一个数来描述该元素x 隶属于a 的程度。 被讨论的全体对象称为论域,这些论域元素都是分明的,而x 的子集a , b ,c 等却是模糊的,一般所说的模糊集合即指模糊子集合。当隶属函数u 。( x ) 的值接近于 l 时,表示元素二隶属于a 的程度很高:当隶属函数u 。( x ) 的值接近于o 时,表示元 素隶属于a 的程度很低:当隶属函数u ( x ) 的值接近于o 5 时,表示元素x 隶属于a 的程度比较模糊。 归纳整合之,一般应用模糊理论来解决管理上问题的相关研究,其运用手法可 分为两种:第一种方法是采用模糊数来代表“质化指针”的语义变量值,透过模糊 广东工业大学管理学硕士学位论文 排序的方法进行运算,最后以排序值来解释、分别结果;另一种方法是建立“量化 指针”的归属函数求得评估对象于各指针的归属度,并透过模糊多准则决策的方法, 决定评估结果。如下图为一般研究模糊控制系统的组成。 模糊信号 明确信号 图2 1 模糊控制系统的组成要素图 ! :! 耋三茎堡塑圣:篁皇! :i 墼型 ! 第三章模糊聚类客户分类模型 3 1 聚类分析的缺陷 在普通集合中,等价关系能够将一个集合作严格的分类,要求是被分类集台 中的任意两个元素要么等价,要么不等价。然而在现实世界中,。一组事物根据其亲 : 疏程度和相似性是否形成一个类群,或一个事物是否属于某一个类别,其界限往往 是不分明的,即具有很大的模糊性,不能按普通集合分类。传统的聚类分析在讨论 普通集合中元素的等价关系时,由于等价关系那种“是或不是”的性质,因而按照 关系r 对集合x 进行的分类是“硬性”的,非此即彼的,所以它是一种硬划分。而实 际上大多数客户对象并没有严格的属性,它们在性态和类属方面存在着中介性,适 合进行软划分,因而用聚类分析方法就不宜对具有模糊关系的事物进行分类。而模 糊集理论为这种软划分提供了有力的分析工具。因此,这里引入模糊的方法来处理 聚类问题,而应用模糊数学的方法进行聚类分析,就是模糊聚类分析。模糊聚类分 析是依据客观事物间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事 物进行分类的统计技术。用模糊聚类分析方法处理带有模糊性的聚类问题更为客观、 灵活、直观和计算更加简捷。 3 2 模糊聚类分析 模糊聚类分析是在模糊分类关系基础上进行聚类。从集合的概念出发,给出如 下的定义: 若有n 个样本的全体所组成的集合x 作为全域,令x y 一 ( x ,y ) i x x ,y y 则称x x y 为x 的全域乘积空问。 设r 为x y 上的一个集合,并且满足: ( a ) 自反性:( ,工,) r ,即集合中每一个元素和它自己同属一类;即对角线上 的元素均为1 ,表示任一资料点与自己完全相关,也就是相似关系为1 ,如 此才不会发生自己与自己不同一类的不合理情形。 ( b ) 对称性:若( ,y ) r ,则( y ) ( ) r ,即集合中( x ,y ) 元素同属于r 时,则 ( y ,囝电同属于r ,即r 为对称矩阵:表示a 与b 的相似关系和b 与a 的 相似关系相同,如此才能保证若a 与b 分为同一类,则b 与a 必定也分 为同类。 厂乐工业丈掌管理掌坝士学位论文 ( c ) 传递陛:( ,y ) r ,( y ,z ) r ,则有( x ,z ) r 包含它与它自身的合成,则 称为模糊等价关系,或称为等价矩阵,表示若己知各点间的关系,则a 与c 的 关系由b 与c 的关系传递得来,如此才能保证若a 与b 为同一类,b 与 c 也为同一类时,则a 与c 必为同一类。 聚类分析的基本思想是用相似性尺度来衡量事物之间的亲疏程度,并以此来实现 分类。而模糊聚类分析的实质就是根据研究对象本身的属性而构造模糊矩阵,在 此基础上根据一定的棣属度来确定其分类关系。 r 为x 上的个分类关系的充分必要条件是: ( 1 ) ,i j 置1 ( 2 ) r ,= 0 ( 3 ) r 。月er r 为x 上的一个模糊分类关系的充分必要条件是对每一个a ( 0 sa s l ) ,r 为普通的分类关系;当模糊分类关系r 确定之后,对于给定的a 【0 ,1 】,便可相应地 得到普通分类关系r ,也就是说可以决定一个a 水平的分类。利用模糊理论进行聚 类分析的具体步骤是对原始数据进行变换处理,变换的思想和方法同于系统聚类分 析,常有标准化变换、规格化变换及对数变换等。设有n 个待分类的样本:x 。,工:,工, 。每个样本均具有m 个特性,对于每一个样本均对应着一组描述它各种特性的一组 数:y 。y :,y ,( 其中y ,表描述样本中第j 个特性的数值) 此即为样本m 个 指标,以石。表示第i 个指标值。因此,n 个样本工,如,屯,的各种指标可以用 下表表示: 表3 1 模糊聚类数据变换处理表 檬本指檩 y 1y 2 _ y 3y 。 工l z l lx 1 2 工1 3z 1 m x 2 z 2 1工2 2茗2 3z 2 m 工h z 1工 2z 月3工 m 样本z ,可由行矩阵表示:x = ( 一。,:,石,) i = 1 ,2 ,n 1 4 第三章模糊聚类薯尸分类模型 研究变量或样本的亲疏程度的数量指针有两种,一种叫相似系数,性质愈接近 的样本,其相似系数愈接近1 或一1 ,而无关的样本其相似系数为o ,在进行聚类处 理时,比较相似的样本归为一类:另一种是距离,它是将每一个样本看成是m 维空 间( m 个变量) 的一个点,在这m 维空间中定义距离,距离较近的归为同一类;一般 有以下几种用相似系数r 。,来表示样本x ,与x 。之间的相似程度的方法:相关 f ? 系数法:最大最小法:算术平均最小法:几何平均最小法:绝对指数法: 绝对值减数法:夹角余弦法:欧氏距离。 选取何种方法描述两样本间的相似程度,将直接影响分类的结果。因此,在作聚类 分析时,应针对问题的特性选取适当的方法。 再来就是计算模糊相似矩阵,通常可取在 1 ,1 区间中的相似系数r ,= c o so 构成相 似系数矩阵,为使它成为模糊矩阵,而又不改变原来各元素的相对应关系,作变换: 1 7 r ,j = 二兰使得r ,被压缩到 o ,1 的区间内,r = ( r 。) 构成一个模糊相似矩阵。 z 用上述方法建立起来的模糊相似矩阵r ,一般来说只满足自反性与对称性,并不 满足传递性,为求得模糊等价关系,需将r 改成等价矩阵r 才可得到聚类图。在适 当的门槛值上进行截取,便可得到所需要的分类。 其中,一般模糊关系r 若满足: ( 1 ) 自反性:= 1 ( f = 1 ,2 ,以) ,即对角线上之元素均为1 ( 2 ) 对称性:r ,= r 。,即r 为对称矩阵。 ( 3 ) 传递性:r + 。r r 即r 包含它与它自身的合成 则称r 为模糊等价关系,或称为等价矩阵 获得模糊分类关系,对模糊矩阵进行褶积计算:r 一凡2 一只3 一舻,这样经 过有限次数耀形蛞,使得奴“j r :r “,由此得到模糊分类关系r ”。为保证褶积过程 的收敛眭,设r 为定义在x x 上的模糊矩阵,并且满足反身性和对称性,则极限 存在并且r 。为一模糊分类关系。对满足传递性的模糊分类关系的尺以进行聚类处 理,给定不同的置信水平的a ,求r 阵,找出r 的a 显示,得到分类关系。 模糊聚类方法是通过建立模糊相似关系而将客观事物予以分类的方法。其分 类的特点为:模糊聚类的结论并不表示样本绝对地属于某一类或不属于某一类,而 是以a 值来表示样本在什么程度上属于某一类,在什么程度上相对地属于另一类。这 种划分带有相对的性质,因此适用于复杂多变的客户分类分析。 广东工业大学管理学硕士学位论文 3 3 模糊聚类客户分类模型的建立 3 3 1 原始数据的变换处理 由于在抽取样本对数据进行量度处理时,不同指标( 变量) 一般都有不同的量纲, 并且有不同的数量级单位,为了不同量纲、不同数量级的数据能放在起比较,通常 需对数据进行变换处理。其中样本数( 1 一n ) 是指要进行聚类的样本多寡,指针数 、。 宅,、 ( 1 一m ) 是指原始数据的变量,等级一至等候五是指该变量的感受程度,依其感 受程度给予4 一o 的评分,有了评分的基础方可对数据进行二态编码;例如要问 指标一:顾客对公司最近所订购的商品重量,则有以下五个程度的等级给予选择:01 极重0 2 重0 3 普通0 4 轻0 5 极轻,选择第一个等级极重者该指针给予 4 分,选第二个等级者给予3 分依此类推,数据进行变换的处理详如下表: 表3 - 2 数据进行变换处理表 样本指针 指标1指标 等级 评分 等级评分 44 33 样本1 22 四 l 四 l 五o 五o 44 33 样本2 22 四 l四l 五o五0 4 33 样本n 22 四l四1 五o 五0 根据上述将所有的顾客填完的资料整理成条列式的顾客单元评分表,将顾客单 元评分数据进行二态编码,并将重新写成规范的原始数据矩阵,如此的作法是为了 方便进行标准化变换,所渭二态编码系指将上述感受程度的评分由原本是4 、3 、2 、 1 及o 的数值转换成全部都是o 或1 的码其转换的原则是每一感受分数化为4 位数,若 16 第三章模糊聚类客户分类模型 为0 则4 位数均填0 ,若为l 则4 位数最左边一位数为l ,其余为o ,若为2 则最左边二位数为1 ,其余为o ,依此类推若为4 ,则全部位数均填l :因为指标1 又细分为4 个单独的小指标,如:z 。肖。一盖,。,所以二态编码后,单独的小指针共有 原有的m 指针的4 倍,详如下表: 表3 ,3 数据进行二态编码表 样本指针 指标l 指标 评分评分 x l1 x 1 2 彳1 4 z 1 ( 4 村一3 ) z 1 ( 4 村一2 ) x 1 【4 ) 样本1 x 2 x2 2 2 4 x 2 t 4 m n x2 m ,2 1 x :4 1 样本2 x q i xn 1 xn 4 x n b m 一莽”r x 蚺m 、 样本n 再来是对这些指针进行标准化变换:这种变换方法主要是对变量的属性进行 变换处理。首先对行进行中心化,然后用标准差进行标准化,即 r = 二f x ,j 2 1 ,2 ,4 m ? 鲁” 铲高* 一巧2 i ( s j 砌赫糊 ( x 。为标准差变换) 广东工业大学管理学硕士学位论文 通过标准化变换处理后,每列数据的平均值为o ,方差为1 ,使用标准化处 理后,在抽样样本改变时,它仍保有相对稳定性,标准化变换结果如下表所示 表3 4标准化变换表 x 1 1 x 1 ( 4 m ) x 样本1 盖1 l l ( 4 埘) 样本2 x 2 f 4 m 1 蜀, 样本n 石1 x f 4 村1 3 3 2 模糊相似性矩阵的计算 为使成为模糊矩阵,而又不改变原来各元素的相对关系,我们将它作变换使得 被压缩到 0 ,1 的区间内,构成一个模糊相似矩阵。在经过测试所有方法后,因为本 研究所选择的相似性尺度有明确的意义,研究的样本不是很大,而且原始数据在进行 聚类分析处理之前已经对变量进行相关性的处理,所以本研究使用数量积法的相似系 数来表示各样本之间的相似程度 再j 其中x 为适当选取的正数,满足 正一 舱m “霭t 一2 求出仿真相似矩阵如下表: ! :兰三耋堡塑量耋童呈竺耋堡篓 表3 5 仿真相似性矩阵表 1n 1 , l l厂1 n 2 r 2 lr 2 nr 1t q n 3 3 3 模糊分类关系的建立 上述模糊相似性矩阵即是一个r 阵,而上述r 仅满足自反性及对称性,仍不能说 其具有传递性,所以要对模糊矩阵进行褶积计算r r2 一r 3 一一r “,这样经 过有限次褶积后,使得彤。r :月“,由此可得模糊分类关系月“,即对于反身对称 模糊阵,经过有限次自乘,即可得到模糊分类关系;利用g e o 虺ejk l i r & b oy u a n h ( 1 9 9 5 ) 所介绍的聚类法验证r 具有传递性,详如下列解法。 ro 月= 1 03 20 。8 509 l( ) j 4 0 3 2 1o 5 40 3 205 4 0 8 50 5 4 10 8 5 08 5 o 9 10 3 2 0 。8 5l( ) 4 6 o5 4o 5 4o 8 504 6i 10 5 4o ,8 50 9 1o 8 5 ( ) 5 4 l 0 5 40 5 4o5 4 e ) 8 50 5 41 0 8 508 5 ( ) 9 ll i 5 40 8 5 l0 8 j ( ) 8 50 5 40 8 50 8 5l l0 3 2o 8 50 9 1 05 4 0 3 2 l0 5 40 3 20 5 4 0 8 50 斟t0 8 50 8 5 09 l0 3 20 8 5l0 。4 6 o 5 4o 5 408 504 6 t 1 9 j,j 广东工业大学管理学硕士学位论文 艇和月月= 均= r 搿一,( ,;) h 3 3 4 模糊聚类处理 对于满足传递性的模煳分类关系彤进行聚类处理,给定不同的置信水平的a , 求r ,阵,找出r 的a 显式,得到普通的分类关系。如下囱当a = 1 时每个样本自成 一类,随着a 值降低,由细到粗逐渐归类,最后得到动态性的聚类谱图,a = 0 6 2 5 时样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论