




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于粗糙集的人力资源评价的规则挖掘 摘 要 应用粗糙集理论和区分矩阵来挖掘各因素规则的方法对一个人力资源评价的例子进行分析和处理,挖掘评价规则,并从客观的数据中得出了各主要因素的客观权重。 关键词 粗糙集; 人力资源; 规则; 权重 1 前言 粗糙集(Rough sets)理
2、论是一种处理模糊、不精确的分类问题的新型数学工具。粗糙集理论已成为当前数据挖掘的主要方法之一,其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。该理论已被成功地应用于机器学习、决策分析、过程控制、模式识别与数据挖掘领域。 人力资源是指社会所拥有的能为社会创造价值的人力或劳动力,其本质是人的能力而不是人本身,人力资源的价值在于人掌握的知识和技能,在于人为社会创造价值的能力。人力资源评价就是通过分析影响人力资源价值的主要因素,结合一定的评价方法,进而得出一个综合评价值的过程。2 粗糙集处理的基本步骤及算法
3、0; 收集和整理数据,组成信息表。 数据预处理。将数据库中的初始数据信息进行分类、聚类分析以及使某些属性的连续值离散化,转换为粗糙集形式,明确条件属性和决策属性。 属性约简,根据预处理后的数据信息表生成区分矩阵,利用区分矩阵法生成约简属性集。区分矩阵(Discernibility Matrix)是由波兰华沙大学的著名数学家skowron提出来的,是近年来在粗糙集约简上出现的一个有力工具。利用这个工具,可以将存在于复杂的信息系
4、统中的全部不可区分关系表达出来。 定义1:设有信息系统S,a(x)是记录x在属性a上的值cij表示区分矩阵中第i行,第j列的元素,这样区分矩阵的定义是:(cij) 其中i,j1,2,3,n,这里n 。 在获得区分矩阵的时候,还有一种情况没有列出来,就是a(xi)a(xj),D(xi)D(xj)的情况,在有些资料中,将这种情况下的cij赋了一个1;有些则不讨论这种情况,因为他们认为在数据表的预处理阶段会对数据表中冲突的记录做处理,使其不加
5、入到数据中,并且将冲突的记录数除以记录总数,得到一个粗糙度的量度,该量度可以作为数据表的一个特征。本文遵从后一种处理方法,对冲突的记录不予讨论,认为数据表中没有冲突的记录。 定义2:区分函数是从区分矩阵中构造的,方法是把cij的每个属性“或”起来,然后再“与”其所有的cij,其中i,j1, ,用p来表示。 区分矩阵是一个对称 × 矩阵。在实际应用中,只计算它的上三角矩阵或下三角矩阵。 根据区分矩阵的概念,有三点值得注意
6、: 区分矩阵中条件属性组合数为1的元素项,即Card(cij)1,表明除该属性外其余条件属性无法将决策不同的两条记录区分开来,即该属性必须保留,这个与决策表中核的概念一致。因此,矩阵中所有条件属性组合数为1的属性均为核属性。 区分矩阵中凡是条件属性组合中包含有核属性的矩阵元素都可以仅用核属性就把决策不同的记录区分开来,也就是说属性组合中凡是包含有核属性的区分矩阵项的其它条件属性都是多余的。 对于不包含核属性的属性组合必然每
7、个组合都至少有一个元素成为约简后的一个条件属性,否则决策表中的某些记录将无法识别。 属性约简的基本过程如下: 第一步:生成区分矩阵,将矩阵中属性组合数为1的属性列入最终的属性约简集合,即Red=Core= cijCard(cij)=1,i,j=1,2,3, 。 第二步:从区分矩阵中找出所有不包含核属性且cij0属性组合Q,即:Q cijcijCore=,且cij0,i,j1,2,3,
8、; 第三步:将所有不包含核属性的条件属性组合表示为合取范式的形式,即:P(cij),cijQ。 第四步:将P转换为析取范式的形式,并进行化简。 第五步:根据需要选择不同的属性组合作为约简。 选取约简属性后的信息表,对每个规则求出其核属性,得到各规则的核值。 定义:具有相同条件属性而有不同决策属性的对象成为不可分辨的对象。 基本思想:考虑依次去掉各
9、个属性,若存在不可分辨对象,则说明该属性为必要属性,即核值。若去掉该属性时,无不可分辨对象,则说明该属性为冗余属性,可省略。 根据核值表产生约简规则。 基本算法: 输入:信息系统S=(U,CD, V, f ) 输出:约简后的决策规则集。 步骤: 计算区分矩阵;int
10、160;i=1,j=0; int k=card(U); M=;
11、160; while(1ik) for(
12、i=0;i+;ik) for(j=i+1;j+;jk) if (D(xi) D(xj) mij=a C:a(xi)
13、60;a(xj) else M=M mij 得到CORE;i=1;CORED(C)=;从头取M中元素,若为单一属性组合则将该属性加入CORED(C), &
14、#160; 进行属性约简从M中删除含有核属性的组合。Q cijcijCORED(C)=,且cij0P(cij)将P转换为析取范式的形式 P=(ci*)ci*为约简的属性集合 一约简的属性集合ci*,对每一个规则求核属性 for(j=1;j+;jm)(m 为每个规则的属性个数)
15、 每次假设从规则中去掉一个属性aj if 不存在不可分辨的规则 then 去掉该属性 else aj为该规则的属性核值 根据每一规则的核值,列出约简的规则集合。若对每一个对应的决策值该规则组合是既约的且在系统中为真时为约简规则。
16、160; 求出各约简属性的权重。 通常情况下,决策者会拥有对各个条件属性的先验知识,权重用来衡量属性的相对重要性。在不同的决策环境下,相同的属性对决策输出会有不同的影响,即权重对环境敏感。粗集理论中的属性重要度表达了当前数据环境下属性对决策的影响,但它不能反映决策者的先验知识。因此,将二者结合起来确定属性的权重可以得到比较理想的结果。这样我们将粗集理论同决策者的先验知识结合起来,即将由大量的历史数据确定出来的客观的属性重要度同由主观的先验知识确定的属性权重结合起来确定最终的综合权重,从而实现主观先验知识
17、同客观情况的统一。 我们假设系统中的条件属性为C,决策属性为D。在C中有n个属性a1,a2,an。由决策者先验知识给定的权重分别为p(a1), p(a2), , p(an)。然后收集大量的评价样本,由这些样本数据来考察所有条件属性将样本划分为决策类的分类能力,并由决策属性对条件属性的依赖度rC(D)=Card(posC(D)/Card(U),其中Card表示集合的基数。然后去掉条件属性i后,在重新考虑分类情况,求出rCi(D)=Card(posCi(D)/Card(U),则属性i的重要度为rC(D)rCi(D),以此类
18、推。在此基础上将各个属性的重要度进行归一化处理并把处理后的结果q(ai)作为属性i的客观权重。即q(ai) 。显然,q(ai)在0和1之间取值。得到各个属性的主观和客观权重后,由于客观权重是由历史数据处理后得到的,我们赋予其较大的权重为60,相应地,赋予主观权重为40,那么,由此确定的综合权重P(ai)0.6×p(ai)+0.4×q(ai)。3 应用实例 数据采集。在人力资源评价中,各属性值用3,2,1分别表示“优,中,差”。指标对象知识量a创新能力b交流能力c适应能力d毕业院校e健康状况f心理承
19、受能力g进取欲望h评定结果i11122233322111211321323211212341212121115312223333622322333372211312228233312233 使用区分矩阵进行属性约简,建立区分矩阵如下 1234567810cefhabdefghbcefghaabc0abcdefg2 0abcdfg0acefhabcefhabdegabcdfgh3 0abcdh00bcefg04 0abcefghacefghadefghabcdgh
20、5 00abcdefgh06 0cdefgh07 0bcdefh8 0 从区分矩阵可以看出,a为核属性,因此可以获得Q(cefh)(bcefgh) (bcefg) (cdefgh) (bcdefh),根据吸收律,Q (cefh)(bc
21、efg),将其转换为析取范式后,得到Q(bh)(gh) (c) (e)(f),因此a,b,h,a,g,h,a,c ,a,e ,a,f 都可以作为约简后的属性。 取a,b,h来进行规则挖掘,生成核值表。属性约简表 核值表 根据核值表,生成规则约简表 得出规则: b1h2a1
22、i1,即创新能力为差且进取欲望为中时或知识量为差时,综合评估为差。 a1h3b2h2 i2,即知识量为差且进取欲望为优时或创新能力为中且进取欲望为中时,综合评估为中。 a2b3a3b1 h3 i3,即知识量为中且创新能力为优时或知识量为优且创新能力为优时或进取欲望为优时,综合评估为优。 计算各约简属性的客观权重。 由属性约简表得,其条件属性集Ca,b,h,决策属性集Di,U/ind(a,b,h)=1,2,3,4,5,6,7,8,U/ind(i)=1,7,2,4,3,5,6,8,PoSC(D)=1,2,3,4,5,6,7,8,rC(D)=k= Card(posC(D)/ Card(U)=8/8=1,说明决策属性全部依赖于条件属性(依赖度为1)。 去掉属性a后,U/ind(b,h)=1,5,2,3,4,6,7,8, PoSC-a(D)=2,3,4,6,7,8, rC-a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 检测中心外协协议书
- 提前解除服务协议书
- 日光温棚承包协议书
- 楼顶安装安全协议书
- 教师师生补课协议书
- 景观鱼池购买协议书
- 搭建钢棚合同协议书
- 游泳学员报名协议书
- 校园欺凌调解协议书
- 智能仓库租用协议书
- 经纪公司聘用协议书
- 2025年北京市朝阳区高三二模-政治+答案
- 温州市普通高中2025届高三第三次适应性考试物理试题及答案
- 《光纤激光切割技术》课件
- 初中化学基础试题及答案
- 10.信息光子技术发展与应用研究报告(2024年)
- 《导数及其应用》复习课教学课件
- 2024年山西杏花村汾酒集团有限责任公司招聘笔试真题
- 天津师范大学与韩国世翰大学入学综合素质题目
- MOOC 学术英语写作-东南大学 中国大学慕课答案
- MOOC 家具·设计·生活-北京林业大学 中国大学慕课答案
评论
0/150
提交评论