(计算机应用技术专业论文)基于动态模糊格的数据分类方法及其在人事管理中的应用.pdf_第1页
(计算机应用技术专业论文)基于动态模糊格的数据分类方法及其在人事管理中的应用.pdf_第2页
(计算机应用技术专业论文)基于动态模糊格的数据分类方法及其在人事管理中的应用.pdf_第3页
(计算机应用技术专业论文)基于动态模糊格的数据分类方法及其在人事管理中的应用.pdf_第4页
(计算机应用技术专业论文)基于动态模糊格的数据分类方法及其在人事管理中的应用.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(计算机应用技术专业论文)基于动态模糊格的数据分类方法及其在人事管理中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于动态模糊格的数据分类方法及其在人事管理中的应用中文摘要 基于动态模糊格的数据分类方法及其在人事管理中的应用 中文摘要 随着社会的不断发展,企业也在不断的发展壮大,相对应的各个企业人事管理也 变得越发复杂,如何提高人力资源的利用效率和达到企业人事组织结构的合理化成了 每个企业必须考虑的核心问题。在这个核心问题中,系统能否表达动态模糊数据则是 提高系统性能的关键。 为了回答上述问题,笔者作了一些探索性的尝试,通过对现有人事管理中的种种 状态类型的分析,将动态模糊格理论引入到人事管理系统中,利用动态模糊格的理论 来对复杂的人事数据进行表示分类。 其具体表现为:( 1 ) 提出了利用动态模糊格的数据分类理论指导现代人事管理, 优化了人事管理体系。( 2 ) 扩展了动态模糊格的应用范围,使理论实现了到实践的转 化。( 3 ) 提出并设计了基于动态模糊格理论的人事系统结构模型。尽管如此,本文的工 作还很基础,今后还有许多工作需做进一步研究,如动态模糊格在多维数据划分的规 则、原理及应用前景等。 关键词:动态模糊格数据分类人事管理决策树分类 作者:戴雯惠 指导教师:李凡长教授 基于动态模糊格的数据分类方法及其在人事管理中的应用 m e t h o do fd a t ac a t e g o r i z i n gb a s e do nd y n a m i cf u z z yl a t t i c e a n di t sa p p l i c a t i o n si nh u m a nr e s o u r c em a n a g e m e n t a b s t r a c t w i t l lt l l ed e v e l o p m e n to ft h es o c i e 劬e n t e 印r i s er e i n f o r c e si t sp o w e r d a yb yd a yw h i l e i t sh 啪锄r e s o u r c em a l l a g 锄e n th a v i n ga l s ob e c i d m ee v e nm o r ec o n l p l i c a t e d n eq u e s t i o n o fh o wt 0a c h i e v et l l er a t i o n a l i z a t i o no fm ee n t e 印r i s e sh u m a i lr e s o u r c em i c r 0 s n c t u r eb y i m p r o v i n gm ee e i c i e n c yo fo b t a i n i n g 锄du s i n gh u m 吼r e s o u r c e b e c o m e sa c o r ep r o b l e m 廿l a te v e 巧e n t r e p r e n e u rm u s tc o i l s i d e r s i nt l l ec o r ep r o b l e m ,1 a t 、h e m e rs y s t 锄c 觚 e x p r e s st 1 1 ed y n 锄i cf u z 巧d a t ai sm ek e yo fr a i s i n gs y s t e m 劬c t i o n t 0a 1 1 s w e rm ea b o v eq u e s t i o n ,ih a v e d o n ea 南wp b i l l ga t t e m p t s t u 曲觚f l l y z i n g t l l ed i 饪e r e n td a t at ) ,p e so fe x i s t i n gh l h n 观r e s o u r c em 锄a g e m e n t ;m m i n gf 0 r w a r dt l l e m e t h o do fd a t ac a t e 9 0 r i z i n gb a s e do n d y n 锄i cm z z yl a n i c e i nh l l m a nr e s o u r c e m 锄a g p m e n ts y s t 锄 t bs u mi tu p ,t 1 1 i sp a p e rh a sc e n a i nc h a r a c t e r i s t i c s 勰f o l l o w s :1 p u t t i n gf o r w a r dt h e m e t h o do fi n v o l v i n gt i l ed y n 锄i c 允z 巧l a t t i c ei nh u m a nr c s o u r c em a n a g e m e n tb y 锄a l y z i l l gd i 触卯e so fe x i s t i n gh 岫锄r e s o u r c em a l l a g e m e n t 卸d0 p t i i l l i z et h eh r m 趾a g e m e n ts y s t e m 2 。e x p a l l dt 1 1 ea p p l y i n g 瑚g c0 fd ) ,l l a l l l i c 如z 巧l a n i c ew h i c hr e a h z e s t h ec o n v e r s i o n 舶mt l l e o d rt 0 p r a c t i c e 3 p 眦i n gf o r w 2 时a 1 1 dd e s i g i 】缸gm eh r s y s t 锄a t i c a l 咖c t u r a lm o d e lb a l s e do nt l l et h e o 巧o fd y n 锄i c 缸掣l a t t i c e a n y w a y t l l i s p a p e rh 嬲0 1 1 l yd o n es o m e 如n d 锄e n t a lw o r ko nt h es u 功e c tw h e nt h e r e sm u c h 、0 r kt 0b e 鼬e rr e s e a r c h e dl 掀0 1 1 f o re x 锄p l e ,m e 廿l o di i ld i v i d i n gm u l t i d i i i l e n s i o n a ld a t av v i t t l d y r 脚l l i c 蜘l 删c e 锄d i t sp d n c i p l e s 砒1 df h t i l r e k e y 、i ,o r d s :d y n 锄i cf u z 2 = ) rl 撕c e , d a t a c a t e g o r i z a t i o n , h 啪孤r e s o 眦e m 锄a g e m e n t ,p r e c i s i o n1 r e ec a t e g o r i z a t i o n w 五t t e nb yd a iw e n l “ s u p e i s e db yl if a l l z l l a l l g 苏州大学学位论文独创性声明及使用授权的声明 学位论文独创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进 行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含 其他个人或集体己经发表或撰写过的研究成果,也不含为获得苏州大学 或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡 献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律 责任。 研究生签名: 日期:堡查:! 史:! 学位论文使用授权声明 苏州大学、中国科学技术信息研究所、国家图书馆、清华大学论文 合作部、中国社科院文献信息情报中心有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本 人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文 外,允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分 内容。论文的公布( 包括刊登) 授权苏州大学学位办办理。 研究生签名:i 粒日 研究生签名:剑型笾日 导师 期:竖:! 皇:! 期: 基于动态模糊格的数据分类方法及其在人事管理中的应用第一章弓i 言 1 1 课题背景 第一章引言 自1 9 6 5 年l a z a d e h 教授提出模糊集的概念以来,模糊数学在理论和应用上都 得到了长足的发展,取得了很多成果。但是模糊集只能解决静态的模糊现象,面对动 态模糊问题王光远等人在1 9 8 7 年提出了基于时间变量的动态模糊集概念,1 9 9 6 年李 凡长教授等人对动态模糊集进行了广义的定义,并提出了动态模糊逻辑系统理论n 3 , 为处理现实中具有动态模糊性的问题提供了理论支持。 在动态模糊逻辑中,格结构是很重要的代数结构,已经成为动态模糊逻辑中相当 理想的代数框架之一。本文基于动态模糊格理论n 儿2 埘,针对数据具有的动态模糊性 问题,提出了“基于动态模糊格的数据分类方法及其在人事管理中的应用 的研究课 题。 自然界和人类社会中的诸事万物都有各种特征和属性,其中有些是严格可分的, 有的是模糊的、动态的不易区分的。就以人为例子,人有多种特征,其中性别、年龄、 文化等特征都是清晰的。每个人都有唯一确定的性别( 男或女) 、年龄( 岁数) ,但 是在健康状况方面只能填“好、较好、良、丹,至于什么样的身体属于好,什么样 的属于良,系统就很难确切地区分了。实际上健康状况是一个综合性的定性的评估, 而且常带有个人的主观判断。再如经常听到议论某人“能干、大方、聪明、漂亮、一, 这些语言中常用的词汇更是很模糊的。再比如按年龄可分为“年轻人、中年人、老年 人一,按身高分为“高个子、中等个、矮个子 。除了分类界限上显示出的模糊 性外,这些概念又是不断的变化发展的,可见动态模糊性在自然界和人类社会中是普 遍存在的。 那么在处理这些具有动态模糊性的各项复杂数据中,按照怎样的方法对数据进行 分析研究;提取数据背后隐藏的关系、规则来指导并形成科学的组织管理形式也就成 了人事管理系统中的关键问题之一。下面就数据分类的基本方法进行简述。 第一章引言 基于动态模糊格的数据分类方法及其在人事管理中的应用 1 2 国内外目前存在的数据分类方法 数据分类的前提就是必须知道数据以什么样的方式存放,以及数据之间是按照什 么样的逻辑关系联系起来的。 数据分类的目的h 1 是构造一个分类函数或分类模型( 分类器) ,该模型能把数据 库中的数据项映射到某一个给定类别。分类技术在很多领域都有应用 5 。例如某公 司的销售部门可以通过销售人员销售能力分类构造一个分类模型来对本年度预计达 到的销售总额和所销售的产品地区分布进行评估,从而公司能根据这个评估结果及时 进行市场开发、产品生产、员工培训等调整。这样使公司整体效益得到进一步提高。 下面对目前存在的几种主要的数据分类方法做简要分析: 1 决策树( d e c i s i o nt r e e ) 分类方法 决策树归纳嗍口儿町是经典的分类算法,它是一个以样本数据集为基础的归纳学习 方法,它着眼于从无次序、无规则的样本数据集中推理出决策树表示形式的分类规则 方法。采用自顶向下的递归方式构造决策树,在决策树的内部节点进行属性比较,根 据不同属性判别从该节点向下分支,在树的叶节点得到结论。使整棵树从根节点就对 应着一条合取规则,整棵树就对应着一组析取表达式规则。决策树生成算法有基于信 息论的i d 3 、c 4 5 算法以及基于最小g i n i 指数的c a r t 、s l i q 、p u b l i c 算法。 图1 2 1 概念d i m i s s i o n 决策树 图l i2 1 表示的是一棵对概念d i m i s s i o n 的决策树,反映某企业员工是否可能 离职。每个内部( 非树叶) 节点表示一个属性的测试。每个树叶节点代表一个类 2 基于动态模糊格的数据分类方法及其在人事管理中的应用第一章引言 ( d i m i s s i o n = y e s ,或d i m i s s i o n = n o ) 。 采用决策树分类方法获取的决策树的形式表示是直观的,且决策树的构造不需要 任何领域知识或参数设置,因此适合探索式知识发现。决策树归纳算法已经成功应用 于许多领域的分类,如医学、制造和生产、金融分析、天文学和人事管理等。 2 贝叶斯( b a y e s ) 分类方法 b a y e s 晰1 0 1 分类方法是统计学分类方法,是一种在已知先验概率与类条件概率的 情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。b a y e s 分 类方法可以预测成员关系可能性,如给定元组数据一个特定类的概率。 p ( 日i x ) :丛墨! 丝2 塑望 b a y e s 定理:一 。 尸( 彳) ( 其中x 是数据元组,h 为某种假设( 如 数据元组属于某特定类c ) ,p ( 日i 彳) 为给定x 的属性描述,找出元组属于类c 的 概率。) 3 最近邻( k n n ) 分类方法 k 最近邻法n 1 1 ( k n e a r e s tn e i g h b o r ) 分类方法:即k n n 法,是一种统计学习方 法,最初由c o v e r 和h a r t 于1 9 6 8 年提出的。l ( n n 分类方法是基于类比学习,即通过 给定的检验元组与和它相似的训练元组进行比较来学习。k n n 分类方法实质就是利用 统计概率原理,采用计算机自动学习的方法,通过对已知训练样本的自动学习,建立 特征体系,并实现对未知样本的预测。 该算法比较适用于样本容量比较大的类域的自动分类,而那些样本容量较小的类 域采用这种算法比较容易产生误分。k n n 分类算法目前广泛应用于分类、回归和模式 识别等领域。 4 支持向量机( s ) 分类方法 支持向量机n 2 m 羽( s u p p o r tv e c t o rm a c h in e ) 分类方法即s 法,是近几年发展 起来的新型通用的知识发现方法,在分类方面具有良好的性能。s 是建立在计算学 习理论的结构风险最小化原则之上,主要思想是针对两类分类问题在高位空间中寻找 一个超平面作为两类的分割,以保证最小的分类错误率。该方法是建立在统计学习理 论基础上的机器学习方法。通过学习算法,s v m 可以自动寻找出那些对分类有较好区 分能力的支持向量,由此构造出的分类器可以最大化类与类的间隔,因而有较好的适 应能力和较高的分准率。该方法只需要由各类域的边界样本的类别来决定最后的分类 第一章引言基于动态模糊格的数据分类方法及其在人事管理中的应用 结果。 5 向量空间模型( v s m ) 分类方法 向量空间模型分类方法n 加5 1 ( v e c t o rs p a c em o d e l ) 即v s m 法,由s a l t o n 等人于 二十世纪6 0 年代末提出。这是最早也是最出名的信息检索方面的数学模型。其基本 思想是将文档表示为加权的特征向量:d = d ( t 1 ,w l ;t 2 ,w 2 ;t n ,w n ) ,然后通 过计算文本相似度的方法来确定待分样本的类别。当文本被表示为空间向量模型的时 候,文本的相似度就可以借助特征向量之间的内积来表示。 6 神经网络分类方法 神经网络n 町n 力n 8 1 是一种很好的函数逼近工具,是通过适当的权重系数调整来使输 出收敛于正确的目标值,表现出一种非监督学习条件下分类器的性能,具有能够通过 调整使得输出在特征空间逼近任意目标的优点。 它的分类算法的重点是构造阈值逻辑单元,一个值逻辑单元是一个对象,它可以 输入一组加权系数的量,对它们进行求和,如果这个和达到或者超过了某个阈值,输 出一个量。如有输入值五,五,以和它们的权系数:形,矾,求和计算出的 五形,产生了激发层口= ( 五毒) + ( x 2 ) + + ( 置形) + + ( 瓦宰呒) ,其中置 是各条记录出现频率或其它参数,朋,是实时特征评估模型中得到的权系数。 神经网络是基于经验风险最小化原则的学习算法,有一些固有的缺陷,比如层数 和神经元个数难以确定,容易陷入局部极小,还有过学习现象,这些本身的缺陷在 s 算法中可以得到很好的解决。 1 3 当前数据分类方法存在的缺陷 数据分类方法还有很多,比如关联规则分类、遗传算法分类等等。随着国内外的 学者对数据分类方法的研究和应用,使数据分类方法在理论和实践上都得到了很大的 发展。但每一种分类算法的缺点和局限性还是比较明显的。比如决策树分类方法常常 受到数据集规模大小的限制,并且要求训练样本驻留内存,所以在处理大规模数据集 的时候显得不足:贝叶斯分类方法由于类别总体的概率分布和各类样本的概率分布函 数不明确,从而需要增大样本数量;k 邻近分类方法在处理小样本时,容易产生误分; 4 基于动态模糊格的数据分类方法及其在人事管理中的应用第一章引言 支持向量机分类方法性能则主要取决于它的参数,参数选择不当,支持向量机就可能 出现过学习或欠学习现象,并且支持向量机分类方法具有速度慢的主要缺点;向量空 间模型分类方法依赖分类样本集类别向量中所包含的特征项的复杂度,所以更适合专 业文献的分类;神经网络分类方法受限于分类层数和神经元个数难以确定,所以容易 陷入局部极小,并且具有过学习现象。 :上述分类方法主要是针对于静态的数据进行分类,未涉及到对于动态的模糊的数 据如何分类。然而客观世界存在大量的动态模糊数据,因此当前数据分类方法存在的 最大不足就是缺乏对动态的模糊的数据进行分类的方法。笔者就是根据基于动态模糊 格理论n 儿羽臼3 ,针对数据具有的动态模糊性问题,提出了基于动态模糊格的数据分类 方法。 1 4 运用动态模糊格数据分类的意义 数据分类算法的发展和在现实生活中的应用,大大提高了工作效率,使隐藏在海 量数据背后的关系得到了清晰的呈现。运用这些分类方法对数据进行分类,为每个类 找到一种准确的描述或者模型,由此生成的类描述可对未来的预测数据进行分类,使 我们对每个类的数据有更好的理解,也使我们获得了这个类的知识,并能形成对未来 的指导或决策。 现实的数据表述总是来源于人的思维与感知,而人的思维和感知所描述的数据往 往不是精确的,表现出模糊的概念,如描述人的身高、体重、健康用“高、“胖一、 “良等模糊词语。上述诸多分类方法已经不能适应一个系统中模糊知识表达的要求, 所以必须要产生一种能够解决客观存在的模糊概念的分类方法,即模糊分类方法。 除了人们表述语言表现出模糊性外,还具有动态性,上述的分类方法主要是对静 态数据进行分类,对动态模糊性的数据进行分类存在不足,所以构建一种既能表示现 实数据的模糊性,又能体现数据的动态性的分类方法是有重要科学意义的。因此我们 要选择动态模糊格理论工具来对动态模糊性的数据进行分类。 现代人事管理系统中,大量数据就具有动态模糊性。比如张某工作业务水平逐渐 提高,首先“提高 就是一个模糊的数据,其次“逐渐”是具有动态性的,从而说明 了“逐渐提高 是一个动态模糊数据。在系统中这样的数据类型存在很多,因此,将 第一章引言 基于动态模糊格的数据分类方法及其在人事管理中的应用 动态模糊逻辑理论应用于解决这些具有动态模糊的数据无疑是一种好方法。 笔者通过把动态模糊逻辑引入到人事管理系统中,运用动态模糊理论对系统中存 在的动态模糊数据进行准确描述,并根据动态模糊格理论对数据进行分类,初步实现 了更为人性化的和谐人事信息管理系统。 1 5 论文内容安排 综上所述,下面对本文做如下安排: 第一章简单阐述研究课题的背景,并对当前的数据分类方法作了简要分析,提 出存在的缺陷,说明了基于动态模糊格的数据分类的重要意义。 第二章对课题研究中所用的相关理论做一介绍,主要是动态模糊集、动态模糊 格结构、动态模糊格的类型,为动态模糊格理论在人事管理系统中的应用奠定理论基 础。 第三章运用决策树数据分类方法结合动态模糊格理论,设计出动态模糊决策树 分类属性选择度量g i n i 指标算法,实现动态模糊格的数据分类。以人事管理系统中 的人事流动数据模块进行验证,实现了理论到实践的转化。 第四章说明人事管理系统中人事数据动态模糊表示的必要性及运用动态模糊格 理论对人事数据进行分类的作用。通过基于动态模糊格数据分类方法在人事管理系统 中人事离职模块进行设计、实现与决策树分析,进一步验证基于动态模糊格的数据分 类对企业人事管理的意义。 第五章通过人事软件的需求分析,设计了基于动态模糊的人事管理系统软件。 第六章总结目前研究成果并对下一步的工作给予了展望。 6 基于动态模糊格的数据分类方法及其在人事管理中的应用第二章相关理论 第二章相关理论 2 1 动态模糊集理论概述 集合论在经典数学中占有非常重要的位置,之所以这样说是因为每一个数学概 念都反映了具有特殊性质的对象的集合,每一个判断都反映了集合之间的某种关 系,每一步数学推理都反映了集合之间的某种运算。经典数学中关于集合的概念是 基于形式逻辑的定律,同一律、矛盾律等等。也就是说,所研究的对象要么属于某 个集合,要么不属于某个集合,两者必居其一。但是客观现象中,大多数情况并不 具备这种明显的清晰性,往往所研究的集合并没有明显的边界。如果过分简单地提 取特征,就会影响客观实际本身的规律性。因此,必须对经典集合进行扩充,以便 更好地与客观实际想吻合,模糊集合正是在这种情况下诞生的。 自1 9 1 6 5 年l a z a d e h 教授首次提出模糊集的概念以来,模糊数学在理论和应 用上都得到了长足的发展,取得了很多成果。但是在客观世界中经常遇到“动态模 糊性 问题,如果用模糊数学来解决还是显得很困难的。因此,李凡长教授等人提 出了动态模糊集和动态模糊逻辑等理论n 】,在理论和应用上都取得了一些成果,在 数据和知识的表示上更加贴近于实际。下面结合要研究的内容,介绍一下相关理论 知识。 2 2 动态模糊集基本定义 定义2 2 1 设在论域u 上定义一个映射: ( 互j ) :( 疗,舀) 【o ,1 】【卜,一】,( 孬,面) h ( j ( 疗) ,j ( 面) ) 记为( 互j ) = j 颤,则称 ( 彳,j ) 为( 痧,疗) 上的动态模糊集,简称d f s ,称( j ( 刃,j ( 历”为隶属函数( m e m b e r s h i p f u n c t i o n ) 对( j ,彳) 的隶属度( m e m b e r s h i pd e g r e e ) 。 n fn f 任何一个数口【o ,1 】,都可以把a 动态模糊化为:口= ( 石,云) ,口= 衲谲, 7 第二章相关理论 基于动态模糊格的数据分类方法及其在人事管理中的应用 厶 m a ) ( ,石) = 云,m i n ( 石,历) = 石。这样我们就可以把a 状态的发展变化趋势直观地表示 出来了。 在论域( d o m a i no fd i s c o u r s e ) u 上可以有多个d f 集,记u 上的d f 集的全体 为d f ( u ) 即: d f ( 【,) = ( 彳,j ) l ( j ,j ) ,( 历,舀) h 【0 ,1 卜,专】) = ( 彳( 卜,一) ) i ( 卜,一) ) , ( 卜,一) ) 一【o ,1 】【卜,一】) 2 3 动态模糊格定义 定义2 4 1 ( ( 霞,霞) ,) ) 称为予序集,若( 霞,霞) 上的关系“ 满足下列条件: ( 1 ) 自反性: ,面) ,西) ( 2 ) 传递性:( 度,面) ( 痧,万) ,( 方,夕) ( 歹,歹) j ( 厅,舀) ( 尹,尹) 称( ( 声,声) ,) ) 为偏序集,如果它是予序集,且满足: ( 3 ) 对称性:( 应,历) ( 痧,万) ,( 痧,万) ( 应,舀) j ( 应,厅) = ( 痧,万) 在偏序集中,未必有 ,西) ( 万,矽) 与驴,万) ( 疠,厅) 之一成立,若对于任意 ( 瓦厅) 、( 矽,夕) ( 多,多) ,必有( 应,反) ( 矽,万) 或( 方,万) ( 西,厅) ,称( 声,歹) 为线性有序 集。 在偏序集( ( 户,声) ,) 中,若( 膏,疗) c ( 户,声) ,j ( 厅,厅) ( 声,声) ,v ( 石,云) ( 膏,再) , 使( 再,万) ( 订,霸) ,则称( 厅,订) 为( 鼠豆) 的上界;如果( 青,豆) 的上界集合中有一个最 小元素,则称它为( 膏,疗) 最小上界。记为 s u p ( 日,日) 或【j ;,i ) 沥,画) ( 厅,厅) 若j ( 哥,哥) ( 声,户) ,v ( 方,西( 膏,厅) ,( 矿,哥) ( 元两,称( 元石) 为( 膏,豆) 的下界;如 果( 膏,疗) 的下界集合有一个最大元素,称之为( 疗,历的最大下界,记为 8 基于动态模糊格的数据分类方法及其在人事管理中的应用 第二章相关理论 i 咄日,踬霓( z j 命,矗) 特别关于两个元素( 石,厅) 和万,舌) 的最小上界记为何,厅) v ( 方,方) ,最大下界记为 ( 石,动 ( 6 ,6 ) 。 由此有: 定理3 4 1 设( ( 声,声) ,) 为偏序集,最小上界和最大下界有以下性质: ( 1 ) ( 历,五) ( 6 ,6 ) ( 五,历) ( 占,云) ( 6 ,6 ) ( 6 ,6 ) ( a ,a ) ( 石,西) v ( 6 ,6 ) ( 6 ,6 ) ( 石,厅) v ( 6 ,6 ) ( 2 ) ( 占,a ) ( 6 ,6 ) = ( 扫,6 ) ( 石,a ) ( 占,云) v ( 6 ,6 ) = ( 6 ,6 ) v ( 厅,云) ( 3 ) ,云) v 簸,厅) = q ,云) , ,五) ,舀) = 瓶,云) ( 4 ) ( 历,历) ( 6 ,6 ) 争( 石,历) ( 6 ,6 ) = ( 石,磊) 陋,刃p ,6 ) s ( 厅,厅) v ( 五,刃= ( 6 ,6 ) ( 5 ) ( 石,a ) ( ( 6 ,6 ) ( 孑,石) ) = ( ( 石,a ) ( 6 ,6 ) ) ( 石,孑) ) ( 五,云) v ( ( 6 ,6 ) v ( 石,石) ) = ( ( 磊云) v ( 6 ,6 ) ) v ( 方,孑) ) ( 6 ) ( 石,面) ( ( 石,云) v ( 6 ,6 ) ) = ( a ,五) ( 历,云) v ( ( 石,厅) ( 6 ,6 ) ) = ( 石,云) 定义3 4 2 偏序集“云西,匀称为格,如果对于任意( 应,回,谚,历正西有 ( 蠢,西) v ( ,) ,( 厉,西) ( ,) ( 厶三) 。 定理3 4 2 集l 是格的充分必要条件为: ( 1 ) 存在两种运算v ,人,使对任意( 历,西) ,( 万,万) ( 三,三) 有( 应,舀) v ( 万,万) ( 三,三) ,( 应,画) ( 声,夕) ( 三,三) 9 第二章相关理论基于动态模糊格的数据分类方法及其在人事管理中的应用 ( 2 ) ( 历,厅) v ( 6 ,6 ) = ( 6 ,6 ) v ( 石,孑) ,( 厅,孑) ( 6 ,6 ) = ( 6 ,6 ) 人( 历,西) ( 3 ) ( ( 石,云) v ( 6 ,6 ) ) v ( 石,孑) 2 ( 厅,云) v ( ( 6 ,6 ) v ( 石,孑) ) ( 石,历) ( ( 6 ,6 ) ( 石,石) ) 2 ( 石,a ) ( ( 6 ,6 ) ( 石,石) ) ( 4 ) ( 石,云) 人( ( 石,云) v ( 6 ,6 ) ) = ( 厅,云) ( 石,历) v ( ( 石,厅) ( 6 ,6 ) ) 2 ( 石,云) 定理3 4 3 设( ( 三,三) ,9 是格,则有性质 ( 1 ) ( 6 ,6 ) ( 石,弓) = 争( 石,云) ( 6 ,6 ) ( 石,云) ( 石,己) ( 6 ,6 ) ( 石,孑) = ( 云,云) v ( 6 ,6 ) s ( 石,云) v ( 石,云) ( 2 ) ( 石,云) v ( ( 6 ,6 ) ( 石,石) ) ( ( a ,a ) v ( 6 ,6 ) ) ( ( 石,石) v ( 亭,石) ) ( 厅,厅) ( ( 6 ,6 ) v ( 孑,孑) ) ( ( 占,云) ( 6 ,6 ) ) v ( ( 厅,厅) ( 孑,孑) ) ( 3 ) ( 石,历) ( 享,石) ( 石,厅) v ( ( 6 ,6 ) 人( 石,石) ) ( ( 石,云) v ( 6 ,6 ) ) ( 石,孑) , ( 石,云) ( ( 6 ,6 ) v ( 石,石) ) ( ( a ,五) ( 6 ,6 ) ) v ( 石,孑) 定义3 4 3 设设( ( 三,三) ,) 是格,若v ( 膏,厅) c ( 三,三) ,( 疗,膏) 有最大下界和最 小上界,称( ( 三,三) ,) 为完备格。若v ( 青,厅) c ( 三,三) 有 ( 历,云) v ( - 一( 办,办) ) = 八一一( ( 口,口) v ( 办,办) ) ( , ) ( h ,日)( 丹, ) ( 日,日) ( 占,a ) v ( v 一一( 办,j i l ) ) = y 一一( ( 口,口) a ( 办,办) ) 。 ( , ) j i j ,月)( i ,i ,) e ( 日,片) 称( 三,三) 为完备分配格。 定义3 4 4 设( 三,三) 是完备格,( 石,历) ( 三,三) ,( j ,j ) c ( 三,三) ,称( j ,j ) 为( 石,面) 的一个极小族,如果( 互j ) 满足条件: ( 1 ) s u p ( 彳,彳) = ( 云,云) 使 ( 2 ) 若( 雪,云) c ( 三,三) ,s u p ( 云,云) = ( 厅,历) ,则v ( 舅,i ) ( j ,j ) ,| ( 歹,歹) ( 占,雪) , ,歹) ( 舅,i ) ,称( 彳,j ) 为( 厅,云) 的一个极大族, l o 基于动态模糊格的数据分类方法及其在人事管理中的应用第二章相关理论 如果似,么) 满足条件: ( 1 ) i n f ( j ,j ) = ( 石,云) ( 2 ) 若( 最雪) c ( 云三) ,i n f ( 亩,否) = ( 厅,历) ,则v i ) 佤彳) ,j ( 只歹) ( 豆否) , 使( 歹,刃( 舅,i ) 。 定义3 4 5 格( ( 三,三) ,9 称为稠密的,如果v ( 石,厅) ,( 矽,夕) ( 三,三) ,当 ( 历,云) ( 矽,万) 时,存在( 歹,尹) ( 三,三) ,使得( 历,云) ( 歹,罗) ( p ,) ) = ( ,) 定义3 4 6 设( ( 霞,詹) ,9 是予序集,映射n :( 霞,霞) 一( 霞,云) 称为保序映射,如 果 瓶,云) 晤,云) ( v ( 石,a ) ,万,舌) ( 霞,霞) ) 时 , 有 ( 玩五) 万,i ) 。 若 ( 玩厅) ( 方,云) ( v ( 石,刃,莎,舌) ( 霞,露) ) 时,有( 方,舌) ( 石,历) ,称n 为逆序映射,如 果逆序映射n 满足对合律,即( ( 石,厅) = ( 石,刃,则称n 为伪补。 :;定理3 4 4 设n 是格( ( 三,三) ,9 上的伪补,则 ( ( 占,云) v ( 6 ,6 ) ) = ( 占,云) ( 6 ,6 ) ( ( 历,云) ( 方,云) ) :( 石,云) v ( 方,方) 2 4 本章小结 本章简单介绍了动态模糊集,动态模糊格及动态模糊格的结构等理论,为动态 模糊集的格结构到人事管理的应用奠定了理论基础。 第三章基于动态模糊格( d f t ) 的数据分类方法基于动态模糊格的数据分类方法及其在人事管理中的应用 第三章基于动态模糊格( d f t ) 的数据分类方法 3 1 概述 动态模糊集及动态模糊逻辑主要是为解决具有动态模糊性的问题而提出的理 论,所以我们尝试使用动态模糊格作为理论基础来处理数据分类的问题。 3 2 动态模糊数据数值化处理过程 在现实数据描述中我们很难用具体的数值来表述具有动态模糊性质的数据,如 表3 2 一l 所示。通过第二章关于动态模糊理论的介绍,我们知道可以通过利用隶属 函数的定量分析的方式,揭示出动态模糊集合的本质。事实上,隶属函数 “( j ( 刃,j ( 厅”的值反映了( 玩面) 对( 彳,j ) 的从属程度,甜( j ( 厅) ,j ( 百) ) 越接近于( i ,i ) , 表示( 订,面) 从属( j ,j ) 的程度越高,i 表示将更高,i 表示从属程度有下降趋势; 甜( 彳( 历) ,j ( 厅) ) 越接近于( 6 ,石) ,表示( 历,厅) 从属( j ,j ) 的程度降低。当”( j ( 历) ,j ( 厅) ) 的 值域为 o ,1 时,( 互j ) 退化为模糊集合;当“( j ( 历) ,j ( 历) ) 的值域为 o ,1 ) 时( 彳,j ) 便退化为普通子集,隶属函数也就退化为特征函数。由此可见普通集合是模糊集合 的特殊形式,而模糊结合是普通集合概念的推广口钔。 表3 2 1 企业员工数据库类标记的训练元组 1 2 基于动态模糊格的数据分类方法及其在人事管理中的应用第三章基于动态模糊格( d f t ) 的数据分类方法 通过以上的分析我们知道动态模糊数据的取得是通过相应的隶属函数,隶属函 数啪儿2 妇乜2 3 的构建没有唯一性。我们可以通过研究确定评价因素,组成因素集合,并 确定每个因素包含的属性值,取一个属性值来构建隶属函数,不难看出一个科学的 隶属函数的取得对于我们的数据分析有极其重要的作用。 ,我们将这种处理方法应用于数据分类中,则形成了动态模糊格数据分类方法。 :数据分类中动态模糊性抽取幢3 操作的基本步骤为: ( 1 ) 对于属性t ,使用t 的一个属性值代替而,用( 置,置) 表示,表明其具有动 态模糊性且其值为动态模糊数;如表3 2 一l 中的属性“i n c o m e 用“i n c o m e = h i g h 一 代替,而其值域为 氘,函,函) ,即变换后的属性值使用动态模糊数位,画) 表示, 其中位,厅) 表示了i n c o m e 为h i g h 、m e d i u m 或1 0 w 的程度。 ( 2 ) 对于实例 ,其中x = ,x 表示训练实例,x ,表示训练 实例具有的属性,由( 1 ) 知属性具有动态模糊性,实例的动态模糊性是由其属性体 现的,故j 用( ;,为代替;而f ( 力用动态模糊数 ,厉) 表示,即 c ( x ,x ) = ( 厉,虚) 【0 ,0 】 1 ,1 】。 ( 3 ) 假设空间日中的每个假设厅用动态模糊数布尔量( 虚,厅) 表示,由于假设 1 3 第三章基于动态模糊格( d f t ) 的数据分类方法基于动态模糊格的数据分类方法及其在人事管理中的应用 办日表示x 上定义的函数: j i l :x _ 0 ,1 】【卜,一】,此时 j l l ( x ,x ) = ( 厅,厅) o ,0 】【1 ,l 】。 ( 4 ) 对于实例集u ,实例集包含实例且实例的动态模糊性由其属性来体现,所以 将实例集u 用动态模糊集( 万,万) 来表示,表示实例集为动态模糊空间上的论域。 通过以上4 个基本步骤替换之后表3 2 一l 的实例r 1 表示为: 表3 2 2 表3 2 1 训练元组实例r 1 的动态模糊化 r i d a g e i n c o m e d i a p h y s l su n d e r g r a d u a t ed l m ls s l o n = 5y e a r s = h i g h = n o = y e s= y e s r 1 - 。 o 70 8o 60 1o 3 3 3 动态模糊化数据表示的意义 对数据进行动态模糊化表示有以下几方面的意义: ( 1 ) 数据的动态模糊化表示能够直观的表现数据现实的描述,在解决了数据模糊 化的同时,能够反映出数据属性值的动态性,使我们能对事物的动态趋势有比较清 晰的了解。 ( 2 ) 动态模糊的数据表示能够较清晰的表现出一个专家隶属函数对现实数据的 表述;能够反映出专家的一些经验和划分准则,较好的体现了专家的参与性。 ( 3 ) 动态模糊数据的描述,使我们得到的数据分类模型( 比如决策树分类器) 表 现得更直观,易懂,能较好的解释数据之间关系和特征。 3 4 动态模糊格性质分析 通过前两章的分析我们知道,我们进行的动态模糊格的分类方法是基于训练实 例的属性值和决定类别的决策属性值来进行的,为了应用格结构我们首先来分析格 的一些性质。 1 4 基于动态模糊格的数据分类方法及其在人事管理中的应用 第三章基于动态模糊格( d f t ) 的数据分类方法 格乜3 3 作为一种理论和数学中一个很有特色的分枝,大体上形成于2 0 世纪的3 0 到4 0 年代,在计算机科学中有广泛的应用。一个格就是一个偏序集,在这个偏序 集中,每两个元素都有唯一一个最小上界和唯一一个最大下界。 ,二 为了在分类中应用这一序结构,我们给出一般到特殊的序结构,首先给出以下 j : 的两个假设: ,西) = ( 画,面) ,( 五,厅:) ,( 瓯,玩) ) ,( ,) = ( 夕,万) 。 傅,舀) ( 万,万) 关系定义了实例空间( 霞,霞) 上的一个偏序关系,即( 存,反) ,( 痧,矽) ,f j 之间的关系满足自反性、传递性和对称性,关系更一般的解释为( 厅,反) 属于分类 的上层,也就是说( 西,反) 包含的实例约束较少,任何被它所划分的属于某类的实例 都会被谚,矽) 划分为属于相同的类,因为( 声,矽) 含有的约束比( 历,西) 多,所以说( 历,反) 比( 痧,矽) 更一般,随着划分的进行,集合越来越小,约束条件越来越苛刻,从而使 ,昂) 逐渐划分为多个驴,矽) 子集。 我们应用h a s s e 图( 图3 4 1 ) 来表示表3 2 1 的属性i n c o m e 的偏序集 i n c o m e , ) 的链的关系: 第三章基于动态模糊格( d f t ) 的数据分类方法基于动态模糊格的数据分类方法及其在人事管理中的应用 l a w m 酣i 啪) i o w l 州m 嘶吼,h j g h l m e d i 啪,l l i g l i ) h i g i i 图3 4 1 偏序集 i n e o m e ,) 的h a s s e 图 其中i n c 伽e 的任意子集设( 应,舀) ,( ,矽) ( f 眦d 聊p ) 有姣,厅) v 够,) ,( 厅,舀) 人 ( 声,万) ( 胁聊p ) 。再如图1 2 1 中条件属性“y e a r s = 5y e a r s ,“i n c o m e = h i g h , “d i a p h y s i s = n o ,“u n d e r g r a d u a t e = y e s 对属性划分构建的决策树,如图3 4 2 , 左边的树状结构为决策树中落入各节点的实例组成的集合。决策树中上层集合与下 层集合间的关系为,如 1 ,2 ,8 ,9 ,1 1 ) f 9 ,1 1 ) , 4 ,5 ,6 ,1 0 ,1 4 ) 4 ,5 ,1 0 ,由此 可知,决策树中落入各结点的实例组成的集合构成了偏序的关系,右边为决策树每 一层上对实例集划分后的结果。从决策树每一层对实例集的划分可以看出,分类属 性对实例集进行了逐步加细的划分。 ( 1 勰1 4 ) j 7 ( 1 2 船m ) j ( 4 轰j 日。;墨) j 入 ( 9 0 量d 一( 1 j l - 勋一( 4 0 乙暮、鼢t 6 您) 一( 9 心一( 1 j | | 葑一( 4 j 乙加) f 6 强) 一 图3 4 2 对表3 2 1 决策树集合表示 1 6 基于动态模糊格的数据分类方法及其在人事管理中的应用第三章基于动态模糊格( d f t ) 的数据分类方法 3 5 动态模糊决策树的分类属性选择度量g i n i 指标算法 上面所述是对数据动态模糊化进行准确描述。动态模糊化操作对数据分类中的 属性及实例进行了处理,但是要构造一个分类模型,还需要确定怎样对实例集进行 划分,即选择什么属性来进行下一步的分类操作。在本文第一章中分析了多种数据 分类算法,下面就以决策树分类属性选择算法为基础,运用实例数据设计一基于动 态模糊格的数据分类方法。 为了能进行动态模糊决策树的分类,我们在此以动态模糊理论对一些数据的表 示进行定义。 在动态模糊决策树数据分类中,设( 云云) 表示属性,属性( 磊云) 的值域表示为 ( 瓦,矿:) = ( 茜,i ) ,( z ,琶) ,( 磊嚣) ) ,则l ( 爵,矿i ) | _ 七表示属性( 三云) 值的个数。则一个 1l22栩埘 具有m 个属性的实例可表示为:( 歹,乃= ( 瑶,瑶。) ,( 噍,吃) ,( 吃,噍) ,具有n 个实例集可表示为:( 玩孑) = ( 五z

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论