




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
- 一 果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也 不包含为获得凼墓直太堂及其他教育机构的学位或证书而使用过的材料。与我一同工作的同 志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 日期: 指导教师签名: 日期: 在学期间研究成果使用承诺书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将 学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允 许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。 为保护学院和导师的知识产权,作者在学期间取得的研究成果属于内蒙古大学。作者今后 使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学就读期间导师的同意;若用 于发表论文,版权单位必须署名为内蒙古大学方可投稿或公开发表。 e l期:丛! ! ! :么:! ! 日 期: 一 t 内蒙古大学工程硕士学位论文 基于数据挖掘的林业执法部门 人力资源管理的研究 摘要 随着知识经济的到来,人力资源管理被提到了前所未有的高度,同时,许多新兴技 术在人力资源管理领域得到广泛应用。即便如此人力资源管理仍存在一些现有技术不能 解决的问题,寻找新的管理技术势在必行。擅长从数据中发现模式的数据挖掘技术,在 许多领域被使用,并已取得良好的经济效应,为本文所述问题的解决,开辟了新的思路。 本论文以现代人力资源管理理论为指导,运用数据挖掘技术“智能地 和“自动地 对林业执法部门人力资源管理状况进行系统的分析,使得大量的数据信息得以有效的利 用。并在此基础上,发现有价值的知识,指导实际工作,提升林业执法队伍的整体战斗 力。首先,本文阐述了人力资源管理以及数据挖掘技术的国内外研究现状,分析了人力 资源管理系统的特点及目前存在的问题。其次,介绍了数据挖掘的相关知识,对其流程、 方法、模型与软件进行了比较、分析和选择,运用数据挖掘技术对林业执法人员管理系 统中的海量数据进行了预处理,对内蒙古自治区和江苏省林业执法人员信息进行挖掘, 分析它们之间的潜在关系,存在的问题,为提高林业执法部门的决策能力提供了参考。 关键字: 数据挖掘,人力资源管理,决策支持 a p p l i c a t i o nr e s e a r e ho fd a t am i n i n gi nt h eh u m a n r e s o u r c e s m a n a g e m e n to ff o r e s tl a wa d m i n is t r a t i o n a b s t r a c t i nk n o w l e d g ee c o n o m i ca g e ,h u m a n r e s o u r c em a n a g e m e n ti sr a i s e dt oa h i g h e rl e v e l ,a n d m a n yt e c l m o l o g e sb e c o m eo n ei m p o r t a n tp a r to fh u m a nr e s o u r c em a n a g e m e n t i ns p i t eo fi t , s o m ep r o b l e m sa r ea l s ol e f to v e la na d v a n c e t e c h n o l o g yw o u l db ef o u n di n e v i t a b l y d a t a m i n i n g ,w h i c hi sg o o da tf i n d i n gm o d ef r o md a t a , h a sb e e na p p l i e di n m a n yf i e i d sa n d o b t a i n e dg o o de c o n o m i cr e s u l t s t h i si san e wm e t h o d u s i n gm o d e mh u m a nr e s o u r c e sm a n a g e m e n tt h e o r ya sag u i d e ,t h i sa r t i c l ea p p l i e sd a t a m u u n gt e c h n o l o g ys u c ha s“i n t e l l i g e n t a n d a u t o m a t i c t ot h e h u m 锄r e s o u r c e s m a n a g e m e n ts y s t e mf o rt h ea n a l y s i so ft h es i t u a t i o nm a k i n ge f f e c t i v eo nal a r g ea m o u n to f d a t ai n f o r m a t i o n a n db a s e do nt h i sf u n d m e n t a l s ,w ed i s c o v e rv a l u a b l ek n o w l e d g et o g u i d e o u ra c t u a lw o r kt oe n h a n c et h ep e r s o n a la b i l i t yo ff o r e s tl a wa d m i n i s t r a t i o n 1 1 1 j sa r t i c l e d e s c r i b st h er e s o u r c e sa n dd e v e l o p m e n ta n dp r e s e n tc o n d i t i o na th o m ea i l da b r o a do nm e t o p l co fh u m a nr e s o u r c e sm a n a g e m e n t ,a n a l y z e st h ec h a r a c t e r i s t i c sa n dp r e s e n tp r o b l e m so f h u m a nr e s o u r c em a n a g e m e n ta n di n t r o d u c e sd a t am i n i n g t e c h n o l o g y i ti n t r o d u c e sr e f e r e n c e k n o w l e d g eo fd a t am i n i n gm a n a g e m e n t ,m a k e ss y s t e m i cc o m p a r i s o na n da n a l y s i so ni t s p r o c e s s 、m e t h o d s 、m o d e l sa n ds o f t w a r e ,d o e s p r e t r e a t m e n tm a s s i v ed a t ao ff o r e s t r y l a w 毪x e c u t l ”m a n a g e m e n ts y s t e mb yd a t am i n i n gt e c h n o l o g y ,d i g so u tp o t e n t i a lr e l a t i o n s h i p o ft h ef o r e s t r yl a w - e x e c u t o r si ni n n e rm o n g o l i aa u t o n o m o u sr e g i o na n dj i a n g s up r o v i n c ei n t h i ss y s t e m ,a n a l y z e sp o t e n t i a lp r o b l e m s ,a l lo fw h i c h g i v es u p p o r tt of o r e s t r yl a wd e p 叭m e n t k e yw o r d sd a t am i n i n g ,h u m a nr e s o u r c e s ,d e c i s i o ns u p p o r t 一 内蒙古人学工程硕士学位论文 目录 第一章引言l 1 1 概述1 1 1 1 :f i f f ! i i 撇1 1 1 2 研究目的及惑兕1 1 2国内外瞬帮胁簖瞅2 i 2 1 , 功j ;! f i i i i ! ! f j 9 9 l j i ;i ; l j 。! c i 5 i :l l 黜2 1 2 2 数据挖掘的研揪4 1 3 本论文的研究工佑4 第二章 力资狳窗掣习砀羽陇研究6 21 人力资源管理相羌罂沦6 2 1 1 人柳劁嬲的含义6 z1 2 力资源静匿睫彀性6 2 2i 5 ( 1 j i j j i 5 i l i ;i ! :,肋3 ;5 f i i ;i 辨l 蝴7 黼数据挖掘技术理论研究8 3 1 数据挖掘的定义8 3 2 挖掘的基本过程8 3 3 数据挖掘的分类9 3 4 数据挖掘的功能1 0 3 5 数据挖掘软件介绍1 1 3 6s p s s 公司数据挖掘软件介绍j 1 3 第四章林业执法部门人力资源管理系统中数据挖掘的应用1 4 4 1 数据挖掘技术在林业执法部门的应用基础1 4 屯2 实施方案及技术基础1 5 4 3 数据收集1 7 4 4 数据选择2 0 4 5 数据预处理2 0 4 6 数据变换2 1 4 7 数据挖掘2 3 i i i , 0 基于数据挖掘的林业执法部门人力资源管理的研究 二- 一 4 8 知识同化3 4 第五章总结和展望j 3 6 5 1 总结3 6 5 2 展望3 6 参考文献3 8 致谢4 0 i v 内蒙古人学工程硕士学位论文 图目录 图3 1 数据挖掘的基本过程8 图3 2 数据挖掘分类图1 0 图4 1 内蒙古地区年龄数据转换图。2 2 图4 2 内蒙古地区工龄数据转换图2 2 图4 3 全国数据中职务与年龄关联图2 3 图4 4 全国数据中职务与学历关联图2 4 图4 5 内蒙古f i r s ts t e p 聚类结果2 5 图4 6 内蒙古数据第一步聚类结果2 5 图4 7 内蒙古数据第二步聚类结果。2 6 图4 8 内蒙古t w os t e p 聚类结果2 6 图4 9 内蒙古人员职务分布图2 7 图4 1 0 四个聚类结果中男女比例视图2 9 图4 1 1 四个聚类结果中民族比例视图3 0 图4 一1 2 内蒙古数据关联规则结果图3 2 图4 1 3 聚类后江苏省职务分布图3 3 图4 一1 4 内蒙古学历分布图3 4 v 基于数据挖掘的林业执法部门人力资源管理的研究 表目录 表4 1 人员表。l7 表4 2 地区表1 9 表4 3 对应学历表19 表4 4 挖掘过程所需变量2 0 表4 5 聚类结果比较表。2 7 表4 6 聚类结果中男女比例分布表2 9 表4 7 内蒙古数据的职务与年龄关联表3 0 v 1 内蒙古人学丁程硕十学位论文 第一章引言 1 1 概述 本文以现代人力资源管理理论为指导,运用数据挖掘技术“智能地和“自 动地 对林业执法部门人力资源管理状况进行系统的分析,使得大量的数据信 息得以有效的利用。并在此基础上,发现有价值的知识。目前国家倡导领导干部 高学历化和年轻化,本研究论文希望能够通过数据挖掘得到有关这方面的科学支 持。 1 1 1 研究糯 2 1 世纪,社会对知识和智力资本的需求比以往任何一个时代都更为强烈, 导致人才短缺的现象加剧。正如美国思科( c i s c o ) 公司总裁所言:与其说我们是在 购并企业,不如说我们是在购并人才。美国知名管理学者托马斯彼得斯曾说: 企业或事业唯一真正的资源是人,管理就是充分开发人力资源以做好工作。美国 另一位著名的企业家说:你把我公司全部资产全拿走吧,可是得把我的人才留下。 那么,只要五年,就准能把所失去的一切完全恢复。这些都说明人在组织中的重 要性。而人力资源在人才的选拔和培养中的作用则更为突出。 随着全球气候变暖趋势的加剧和生态环境破坏的日益严重,生态保护越来越 受到人们关注,森林作为陆地生态系统的主体,其保护工作尤为重要。我国林业 执法部门的地位和执行能力也应得到相应的重视,执行能力高低的决定性因素是 人,准确地说是人的综合素质。因此,如何吸引最佳人才、保有高水平的人才就 成为全国林业执法部门人力资源管理中至关重要的问题。 1 1 2 研究目的嫩 林业执法系统人力资源管理的目的就是最大限度地调动每个执法人员的积 极性、主动性、创造性,为保护森林资源安全,维护林区社会治安稳定多做贡献。 在经济全球化的背景下,为了实现林业执法部门人力资源管理科学化这一任务, 必须对人力资源管理进行积极而有效的改革:树立“以人为本 的管理理念,建 立科学有效的管理机制,实施重点培养的开发战略,完善事业留人的服务体系, 营造尊重人才的人文环境,建立合理的人才流动机制。 基于数据挖掘的林业执法部门人力资源管理的研究 林业执法系统人力资源管理者在从事人才开发、培养使用、岗位设定、薪酬 分配、绩效考核、奖惩等管理活动中,传统方法是运用日常管理中积累表层信息 实施决策,造成组织机构庞大,薪酬分配不均,绩效考核失真,人才流失,执法 人员满意度低,导致人力资源管理工作处于被动地位。如何实现现代人力资源管 理对人的动态管理,对人力资源管理的相关活动构建体系,则需要获取大量的信 息。由于传统的数据分析方法只能获得这些数据的表层信息,并不能获得内在属 性和隐含的信息,这就需要转变理念,探索运用数据挖掘理论,采用新技术分析 这些数据,使大量的数据信息得以有效利用。 对人力资源进行系统化建设与管理并进行有效的开发和利用,是推动林业执 法系统更好地为社会服务的关键。本文研究目的是通过论述数据挖掘理论在林业 执法系统中人力资源管理方面应用的研究,针对具体地区人力资源管理现状,运 用科学的分析方法,对该林业执法系统人力资源信息进行挖掘,建立适合林业执 法系统发展的组织结构,公平合理的薪酬分配体系,为选拔高素质人才提供决策 依据。 1 2 国内外研究和应用现状 1 2 1 人力资源曹髫系绷锈摅觏状 人力资源管理系统( h r m s ,h u m a nr e s o u r c em a n a g e m e n ts y s t e m ) 是指人力 资源管理与信息技术相结合的信息系统。一个好的人力资源管理系统,既是人力 资源管理的信息处理工具,更应是规范人力资源管理的工具。如果系统只是简单 地处理信息,则只能被称为人力资源信息系统( h r i s ,h u m a nr e s o u r c e i n f o r m a t i o ns y s t e m ) 。 人力资源管理系统从产生到现在,大约经历了三个阶段,分别为: 第一代的人力资源管理系统出现在2 0 世纪6 0 年代末期。系统的主要功能是 利用计算机自动计算薪金。系统受到当时技术条件和需求的限制,只包括财务信 息和薪金的历史记录,就连基本的报表生成功能和薪资数据分析功能都无法实 现。但是,它的出现为人力资源的管理展示了美好的前景。 第二代的人力资源管理系统出现在2 0 世纪8 0 年代初。随着计算机技术的发 展,尤其是数据库技术的发展,系统基本上解决了第一代的主要缺陷,对非财务 2 内蒙古人学丁程硕士学位论文 的人力资源信息和薪金的历史记录都予以考虑,报表生产和数据分析功能也都有 了较大的改善。但是,系统没有纳入人力资源管理的需求和理念,因此人力资源 信息不是十分系统和全面。 第三代的人力资源管理系统出现在2 0 世纪9 0 年代末期,这一代人力资源管 理系统产生了质的飞跃。此时,企业竞争十分激烈,人力资源成为企业兴衰的重 要因素;计算机已经普及,数据库技术、客户服务器技术以及互联网技术也都 有了长足发展。该阶段的人力资源管理系统开始从人力资源管理的角度出发,用 集中的数据库将几乎所有与人力资源相关的数据统一管理起来,形成了集成的信 息源,并且增强了报表生成功能、分析功能和信息共享。 我国人力资源管理系统落后于先进国家,出现在2 0 世纪8 0 年代。那时,国 内部分企业开始将计算机用于企业管理,主要进行办公打字,然后逐渐延伸为内 部人员自己编制解决方案,用于基本的人事档案管理及工资的计算与发放。进入 9 0 年代后,国内大部分企业都已拥有计算机,但人力资源部门的计算机普及程 度仍然不够。企业人力资源管理系统没有很大发展,大多是自己开发或委托小型 软件公司开发,个别的直接采用e x c e l 进行工资计算。这个时期的人力资源管理 系统远远落后于财务管理系统的发展。9 0 年代中期,国外软件厂商开始进入中 国,推广各自的人力资源管理系统。同时,我国的系统开发商也注意到了这个市 场,开始研制人力资源管理系统。到了9 0 年代末,国外先进的人力资源管理理 念开始被国内广泛接受,在经济市场化进程及互联网快速发展的推动下,企业对 信息建设越来越重视,人力资源管理系统成为企业信息化的核心内容之一。随着 管理者对人力资源重视程度的提高,他们认识到了人力资源管理系统的重要性, 并且希望通过使用系统来规范人力资源部门的业务流程、集中人力资源管理信息 和提高人力资源管理的透明度等。同时,国内外的许多软件厂商也注意到了人力 资源管理这个市场,纷纷开发了各自系统。 从人力资源管理内容方面比较:所有系统都涵盖了人力资源管理中的人事信 息管理、薪资管理,可见这是人力资源管理的基础;其中,部分系统又增加了机 构管理、绩效考核等内容,但每个系统都各有侧重。从系统功能方面比较:大部 分系统处于m i s 管理的较低层次,只是进行数据的录入、存储、查询和统计等管 理工作,较少有系统涉及到决策支持功能,而集成数据挖掘技术的系统则少之又 基于数据挖捌的林业执法部门人力资源管理的研究 少。可见,人力资源管理系统仍存在完善和发展的空间。 1 2 2 数周勰白铜躜觋状 国际上对数据挖掘的研究起步较早,研究内容涉及到数据挖掘的多个方面。 如w h i n m o n ( 1 9 9 3 ) 提出了数据仓库( d a t a w a r e h o u s e ,d w ) 的概念,解决了数据 挖掘的前期数据准备问题;f r i e d m a n ( 1 9 9 7 ) 列出了支持数据挖掘的四个主要技 术;j i a w e i h a n 等( 2 0 0 0 ) 全面介绍了数据挖掘的相关内容等。在数据挖掘系统的 开发方面,目前在世界上比较有影响的有:s a s 公司的e n t e r p r i s em i n e r 、i b m 公司的i n t e l l i g e n t m i n e r 、s y b a s e 公司的w a r e h o u s e s t u d i o ,还有d b m i n e r 、q u e s t 等。 在国内,数据挖掘的讨论主要集中于对数据挖掘相关算法的介绍和修正,以 及数据挖掘在一些具体行业部门的实施架构。郑泽芝( 2 0 0 0 ) 、高峰( 2 0 0 0 ) 修正了 经典的a p r l o r i 算法,提高了关联规则挖掘的效率;熊肖华( 2 0 0 2 ) 讨论了模糊理 论在关联规则挖掘中的应用;刘夫涛等( 2 0 0 0 ) 将变量聚类和样本聚类结合起来, 使分类性能有了较大提高;中国人民大学统计学系数据挖掘中心( 2 0 0 2 ) 则集中讨 论了决策树技术的概念和应用。国内的数据挖掘研究一般是计算机领域的专业研 究,专门面向c r m 的数据挖掘研究还远远不够。 本文以国家林业执法部门为例,将数据挖掘技术应用于林业执法人员人力资 源管理系统中。在比较了几种常用的数据挖掘算法的异同及适用范围后,通过对 比,最终选择了聚类分析和关联规则,并利用s p s s 软件对挖掘的变量进行反复 跌代建模,将全国指标进行对比。其次,使用t w o - s t e p 模型进行挖掘分析,分 析出林业执法部门人员的分布状况,得出林业执法人员领导干部的分布呈现高学 历化和年轻化的趋势,为领导干部的选拔提供指导,为管理的决策提供支持。目 前将数据挖掘技术结合到林业执法系统的人力资源管理中的研究刚刚起步,在研 究时没有相应的参考资料,该论文可以说是该领域的一次尝试。作者在数据挖掘 的整个过程中,遇到了很多的问题,例如数据清理、数据转换、建立模型、模型 解释等,经过研究和不断探索解决了这些问题,成功的建立了挖掘模型,并得出 了一些对管理者有帮助的结论。 4 内蒙古大学工程硕士学位论文 第一章引言,介绍研究背景、研究意义、国内外的研究现状等;第二章人 力资源管理与开发理论研究,介绍人力资源管理的含义、人力资源管理的重要性、 引入数据挖掘在人力资源管理中的重要作用:第三章数据挖掘技术理论研究, 介绍数据挖掘的概念、数据挖掘的基本过程、数据挖掘的分类、数据挖掘的功能、 以及数据挖掘相关软件的介绍;第四章林业执法部门人力资源管理系统中数据 挖掘的应用,使用聚类分析方法对内蒙古林业执法人员数据进行挖掘,显示内蒙 古地区与全国林业执法人员数据的差异结果,分析差异原因;第五章总结和展 望,对本文工作进行全面总结,给出本文所取得的成果,指出存在的不足和改进 方向。 5 基于数据挖掘的林业执法部门人力资源管理的研究 21 1 人力资源寄勤饴义 人力资源管理,就是指运用现代化的科学方法,对与一定物力相结合的人力 进行合理的培训、组织和调配,使人力、物力经常保持最佳比例,同时对人的思 想、心理和行为进行恰当的诱导、控制和协调,充分发挥人的主观能动性,使人 尽其才,事得其人,人事相宜,以实现组织目标。 根据定义,可以从两个方面来理解人力资源管理,即: a ) 对人力资源外在要素量的管理。对人力资源进行量的管理,就是根 据人力和物力及其变化,对人力进行恰当的培训、组织和协调,使二者经常保持 最佳比例和有机的结合,使人和物都充分发挥出最佳效应。 b ) 对人力资源内在要素质的管理。主要是指采用现代化的科学方法, 对人的思想、心理和行为进行有效的管理( 包括对个体和群体的思想、心理和行 为的协调、控制和管理) ,充分发挥人的主观能动性,以达到组织目标【l 】。 21 2 人力资源管理的重要i 生 知识经济的兴起和发展是2 l 世纪最重要的社会经济特征,主要表现在:信 息技术的发展改变了人们的工作内容、方式以及行为,尤其是因特网的出现,打 破了地域和时间上的限制;经济全球化浪潮的兴起,为企业的生存和发展提出了 新的机遇和挑战;产品周期的不断缩短和更新换代的不断加快,是企业面临的新 对手。所有这些,都增加了企业内部和外部环境的不确定性,使得企业不得不面 对比以往任何时候都更加激烈的竞争。因此,企业为了生存和发展,必须采用新 的管理理论和技术,调整产品结构和市场战略,调动员工的积极性和创造性。而 作为知识载体和掌握者的人,则被推到了前所未有的高度,使人力资源成为企业 持久竞争优势的来源。 首先,人力资源管理是企业组织竞争优势的基础。在技术、资本、政策的差 异越来越不明显、环境日益趋同的知识经济时代,生产力的关键要素越来越多地 依赖于脑力,人成为实现组织竞争优势的关键。而且,由人力资源构成的组织, 6 内蒙古大学工程硕士学位论文 竞争对手难以模仿。 其次,人力资源管理是企业经营战略成功实施的组织保障和技术保障。因为 人是智力和技术的载体。组织需要有智力的人、有技术的人、有组织才能的人、 有责任心的人、善于合作的人等等。有了各种类型的人,企业通过管理整合使其 成为有效的资源,从而保障经营战略的实施和组织的运作、发展。 最后,人力资源管理是企业适应性的来源。因为人力资源是企业中最多样化 的要素。世界没有两个人是完全一样的,即使克隆技术也并不能使两个人具有一 样的经验、智慧和总体能力。由于人力资源的多样性,使组织可对人力资源进行 最多样化的组合和选择,以完成不同的任务和适应不同的环境。这在知识经济时 代,市场瞬息万变的环境中,尤其具有重要的意义。那些不能适应环境的组织, 不能持续学习、不断自我改造的组织,不能保持适度灵活性、可塑性的组织,是 很容易被市场淘汰的。 2 2 数据挖掘在。力资源管理中的应用 。 2 0 世纪9 0 年代,数据库研究领域出现了一种全新的技术数据挖掘 ( d a t a m i n i n g ,d m ) ,该技术用以对大规模的数据进行探索和分析,揭示数据 :中隐藏的、未知的规律,以提高决策能力【2 1 。它在挖掘数据中隐含的规律和解决 具体问题的能力方面是其他技术方法所不能比拟的,现已经在实际领域得到广泛 的应用并且取得了良好的效果。此外数据挖掘技术可以集成到具体的m i s 系统 之中,从而利用已有信息系统存储的数据进行挖掘计算,通过计算机应用程序把 高深复杂的统计技术、挖掘算法封装起来,人们可以不用掌握这些技术而完成同 样的功能,从而更专注于自己所要解决的问题1 3 1 。 数据挖掘在实际应用中有很多经典案例。例如美国得克萨斯州利用数据挖掘 技术挖掘出不付或少付税款的公司和个人,由此增加了1 5 8 亿元的税收【4 】。他们 还把飞机注册管理部门的数据也纳入了监控范围从而确定拥有私人飞机的人是 否为他们的飞机上了税。2 0 0 1 年澳大利亚国家社会服务局在采用数据挖掘技术 识别福利欺骗行为和身份欺诈行为后,挽回了3 0 0 万澳元的损失嘲。 7 基于数据挖掘的林业执法部门人力资源管理的研究 籀数据挖掘技术理论研究 3 1 数据挖掘的定义 1 9 8 9 年8 月,美国底特律市召开的第十一届国际联合人工智能学术会议上, 数据挖掘正式形成。1 9 9 5 年,在美国计算机年会( a c m ) 上,提出了数据挖掘( d m , d a t a m i n i n g ) 的概念,即通过从数据库中抽取隐含的、未知的、具有潜在使用价 值信息的过程。 数据挖掘的技术定义。j :从技术角度来看,数据挖掘是从大量的、不完全的、 有噪声的、模糊的、随机的实际数据中提取隐含在其中的、人们所不知道的,但 又是潜在有用的信息和知识的过程。 数据挖掘的商业定义:从商业应用角度看,数据挖掘是一种崭新的商业信息 处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转化、分析 和模式化处理,从中提取辅助商业决策的关键知识,即从数据库中自动发现相关 商业模式。 3 2 挖掘的基本过程 图3 1 数据挖掘的基本过程 f i g 3 - 1pr o c e s so f d a t am i n i n g 1 ) 数据选择( d a t as e l e c t i o n ) 根据特定的需求搜索与日常业务对象有关的原始数据,并从中选择出适用于 数据挖掘应用的数据。数据选择是数据挖掘的源头,选择有针对性的数据是成功 的数据挖掘的先决条件。从原始数据中经过数据选择得到的数据被称作目标数 据。 2 ) 数据预处理( d a t ap r e p r o c e s s i n g ) 内蒙古人学 :程硕士学位论文 由于数据可能是不完全的、有噪声的、随机的,数据结构复杂,数据预处理 就要对数据进行初步的整理,清洗不完全的数据,为进一步的分析做准备,并确 定将要进行的挖掘操作的类型l 。采用数据清洗、数据集成、数据变换等方法对 目标数据进行预处理,得到预处理后的数据( p r e p r o c e s s e dd a t a ) 。 3 ) 数据转换( d a t at r a n s f o r m a t i o n ) 在确定好适合的数据挖掘算法后,根据数据挖掘的目标和数据特征,选择合 适的模型。数据转换实际上就是将预处理后的数据转换成针对特定数据挖掘算法 的分析模型。建立一个真正适合数据挖掘算法的分析模型是数据挖掘成功的关 键。 4 ) 数据挖掘( d a t am i n i n g ) 这一阶段进行实际的挖掘工作。首先是算法规划,即决定采用何种类型的数 据挖掘方法,如数据总结、分类、聚类、关联规则发现或序列模式发现等。然后, 针对该挖掘方法选择一种算法,而算法的选择直接影响着挖掘模式的质量。完成 了上述的准备工作后,就可以运行数据挖掘算法了。这个阶段是数据挖掘分析者 和相关领域专家最关心的阶段,也可以称之为真正意义上的数据挖掘。 5 ) 解释和评价( i n t e r p r e t a t i o n e v a l u a t i o n ) 根据最终用户的决策目的对提取的信息进行分析,把最有价值的信息区分出 来。对于数据挖掘阶段发现的模式还要经过用户或机器的评估,对于存在冗余或 无关的模式要将其删除;对于不能满足用户要求的模式,则需要退回到上一阶段, 如重新选取数据、采用新的数据变换方法、设定新的参数值,甚至采用其他的数 据挖掘算法。另外,数据挖掘面对的最终用户是人,因此要对发现的模式进行可 视化,或者把结果转换为用户易懂的其他方式。 3 3 数据挖掘的分类 随着数据挖掘技术的发展,出现了不同的数据挖掘方式和技术,因此,有必 要对它们进行分类。下图3 2 给出了常规的数据挖掘的分类。 9 基于数据挖掘的林业执法部门人力资源管理的研究 验证驱动的数据挖掘 发现驱动的数据挖掘 。 s q l 生成器s q l描述预测 媚 查询工具 o l a p j j | 分类统计回归 l 可视化聚集关联分析统计规则归纳神经兀网络、决策树 图3 2 数据挖掘分类图 f i g 3 - 2c a t e g o r ym a po fd a t am i n i n g 通常数据挖掘分为两种类型的知识发现:“验证驱动型”( v e r i f i c a t i o n d r i v e n ) 和“发现驱动型”( d i s c o v e r y - - d r i v e n ) 。“验证型驱动”是指用户首先提出自己的假 设,然后利用各种工具通过反复的、递归的检索查询以验证或否定自己的假设。 一般在检验假设过程中使用结构化查询语言( s q l ) 或结构化查询生成器 ( s q l g e n e r a t o r s ) ,结构化查询生成器可分为两大类:查询工具( q u e r y ) 和在线分 析处理( o l a p ) i 具。在线分析工具展现给用户的是多维视图的数据。“发现驱动 型”是指通过使用机器学( m a c h i n e - - - l e a r n i n g ) 、统计和数据可视化等技术来发 现新的假设。这些技术对发现新的知识起到相当重要的和积极的作用。但是,这 个流程不完全是自动的,仍然要分析人员在知识发现流程中的参与。它又包括描 述型和预测型两大类。描述型数据挖掘技术主要有可视化、聚集、关联、统计等 技术。预测型主要有决策树、规则归纳、神经元网络等技术。一般我们说的数据 挖掘技术主要是指描述型和预测型这类发现驱动的数据挖掘技术。 3 4 数据挖掘的功能 一般而言,数据挖掘的功能与挖掘的目标数据类型是相关的。某些功能只能 应用在某种特定的数据类型上,而某些功能则可以应用在多个不同类型的数据库 l o 内蒙古人学工程硕十学位论文 上。对于数据挖掘任务的确定,必须综合考虑数据挖掘功能、要挖掘的数据类型 和用户的兴趣。 数据挖掘的功能主要包括以下几个方面:自动预测趋势和行为、关联分析、 分类与聚类、概念描述、偏差检测。数据挖掘功能一般可以分为描述和预测两类。 描述性挖掘分析主要用来刻画数据集合的一般特性;预测性挖掘则是根据当前数 据进行分析推算,从而达到预测的目的。 数据挖掘的各项功能不是独立存在的,而是互相联系发挥作用 4 1 。目前,林 业执法系统刚刚建立,系统中存在的数据类型相对来说比较简单,这里只使用聚 类分析和关联规则,建立数据挖掘的模型。 3 5 数据挖掘软件介绍 数据挖掘是从大量的数据中找出规律,再从数据中提取信息的过程。它的目 标是从数据中发现有价值的规则或模式以指导实际。数据挖掘项目一般要经历数 据收集、数据准备、建立数据挖掘模型、评价模型和应用模型等一系列过程。数 据挖掘过程的系统化、工程化方法学和支持系统( 软件或工具) 对解决应用问题起 着至关重要的作用。为了抽象系统化方法,人们提出了一些数据挖掘过程的参考 模型和标准,如s p s s 提出的5 a 、s a s 提出的s e m m a 以及数据挖掘特别兴趣 小组提出的“数据挖掘交叉行业标准过程,c r i s p d m ( c r o s s i n d u s t r ys t a n d a r d p r o c e s sf o rd a t am i n i n g ) ”。 其中,5 a 模型强调数据挖掘工具的功能和能力;s e m m a 强调结合s a s 公 司的挖掘工具进行应用开发;c r i s p d m 则从数据挖掘方法学的角度强调实施数 据挖掘项目的方法和步骤,并独立于各种具体的数据挖掘算法和数据挖掘系统所 提出的过程模型,均在实际项目中得到实践和验证,因此具有一定的代表性。 目前,市场上出现了众多名牌厂商提供的数据挖掘工具,但是这些产品都是 收费的,而且价格不菲。下面主要介绍几种挖掘软件,依次为i b m 公司的 i n t e l l i g e n tm i n e r 、s a s 的e n t e r p r i s em i n e r 、s p s s 的c l e m e n t i n e 。 下面是一些数据挖掘技术在人力资源管理系统中研究和应用的实例。 i n t e l l i g e n tm i n e r 是由美国i b m 公司开发的数据挖掘软件,它提供了广泛的 数据挖掘技术、算法集和被用来开发用户化数据挖掘应用程序的编程接1 2 1 ,支持 分类、预测、关联规则、聚类、顺序模式侦测和时间序列分析的算法,这些算法 基于数据挖掘的林业执法部门人力资源管理的研究 大多数是由i b m 研究所研发出来的,是i b m 的专有技术。i n t e l l i g e n tm i n e r 是一 种分别面向数据库和文本信息进行数据挖掘的软件系列,它包括i n t e l l i g e n tm i n e r f o rd a t a 和i n t e l l i g e n tm i n e rf o rt e x t 。i n t e l l i g e n tm i n e rf o rd a t a 可以挖掘包含在数 据库、数据仓库和数据中心中的隐含信息,帮助用户利用传统数据库或普通文件 中的结构化数据进行数据挖掘。它已经成功应用于市场分析、诈骗行为监测及客 户联系管理等方面。i n t e l l i g e n tm i n e rf o rt e x t 允许企业对文本信息进行数据挖掘, 文本数据源可以是文本文件、w e b 页面、电子邮件、l o t u sn o t e s 数据库等等。 e n t e r p r i s em i n e r 是s a s 公司推出的数据挖掘工具。它支持关联、聚类、决 策树、神经元网络和经典回归技术,能运行在客户服务模式下,其对数据的访问 是通过标准的s a s 数据程序。总的来说它适用于企业在数据挖掘方面的应用和 人力资源管理的决策应用。s a s 的e n t e r p r i s em i n e r 是一种在我国企业中得到广 泛采用的数据挖掘工具,比较典型的包括上海宝钢配矿系统应用和铁路部门在春 运客运研究中的应用。s a s 的e n t e r p r i s em i n e r 是按照“抽样探索一转换一建 模一评估 的方法进行数据挖掘【1 7 1 ,它可以与s a s 数据仓库和o l a p 集成实现 从提出数据、抓住数据到得到解答的“端到端”知识发现。 s p s sc l e m e n t i n e 是一个开放式数掘挖掘工具,曾两次获得英国政府s m a r t 创新奖,它不但支持整个数据挖掘流程,从数据获取、转化、建模、评估到最终 部署的全部过程,还支持数据挖掘的行业标准c s p d m 。c l e m e n t i n e 的可 视化数据挖掘使得“思路 分析成为可能,即将主要精力集中在所需解决的问题 本身,而不是局限于完成一些技术性工作( 比如编写代码) ,同时提供了多种图 形化技术,有助于理解数据间的关键性联系,指导用户以最便捷的途径找到问题 的最终解决办法。 除了以上3 种软件,其它常用的数据挖掘工具还有l e v e l 5q u e s t 、 m i n e s e t ( s o i ) 、p a r t e k 、s e l e a m 、s p s s 的数据挖掘软件s n o b 、a s h r a fa z m y 的 s u p e r q u e r y 、w i n r o s a 、x m d v t o o l 等,不过这里不做一一介绍。 这里选择了s p s s 公司的c l e m e n t i n e ,主要因为自从2 0 0 0 年以后,全球最大 的数据挖掘信息网站k d n u g g e t s 面向全球读者进行“你最常用的数据挖掘工具 投票调查,s p s s 公司的c l e m e n t i n e 等产品7 年来一直位居榜首,成为当前最常 用的数据挖掘工具。 1 2 内蒙古火学jl :程硕十学位论文 3 6 s p s s 公司数据挖掘软件介绍 1 、s p s s 公司介绍 s p s s 公司是全球专业统计分析软件和解决方案的领导者,s p s s 向用户提供 包括统计分析和数据挖掘的专业软件产品,s p s s 预测分析技术把数据应用于战 略工作中,有效判定当前状况并对未来重大事件进行预测。全球有2 5 万多的商 业、学术和公共行业用户采用s p s s 技术增加收入,降低成本,优化业务流程, 发现并预防欺诈。在全球财富1 0 0 0 家组织中有9 5 的组织是s p s s 的客户。 2 、s p s sc l c m c n t i n e 软件介绍 c l c m c m i n c 具备的数据挖掘分析方法是关联分析、分类、预测、聚类等。在 研究林业执法人员人力资源管理时,可以分别使用或者组合使用这些分析方法, 它的c r i s p - - d m 标准可以帮助规范数据挖掘流程。 c l e m c n t i n c 挖掘软件对建模算法支持较多,其中主要包括神经网络、c 5 o 、 c & r t r e e 、a p r i o r i 和l o g i s t i c 等算法,通过使用此软件可以使分析过程更简单更 直观。 基于数据挖掘的林业执法部门人力资源管理的研究 第四章林业执法部门人力资源管理 系统中数据挖掘的应用 随着信息技术的迅速发展,特别是数据库技术和计算机网络的广泛应用,林 业执法部门数据库中的数据量急剧增大。在大量的数据与信息中,蕴藏着执法人 员综合素质能力的高低,这将直接决定林业执法系统执行能力的高低,以及在社 会和群众中的地位。如果能够对这种海量的数据与信息进行快速有效地深入分析 和处理,就能从中找出规律和模式,获取所需
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025中国电信研究院春季校园招聘笔试题库历年考点版附带答案详解版
- 2025中国一重集团有限公司市场化选聘内设机构领导岗位人员5人笔试题库历年考点版附带答案详解
- 2025年人工智能行业人工智能在教育领域的应用研究报告
- 2025年皮肤科常见皮肤科手术操作技巧模拟测试卷答案及解析
- 2025年智能家居行业消费趋势与市场前景研究报告
- 2025年医疗器械行业医疗器械创新与医疗健康服务研究报告
- 2025年全科医学疾病家庭医生健康管理模拟试卷答案及解析
- 2025年宁夏轨道交通高级技工学校笔试参考题库附答案解析
- 2025山东农业大学招聘人员34人 (第二批博士)笔试备考试题及答案解析
- 2025山西阳泉平定县县属国有企业招聘职位表笔试备考题库及答案解析
- 中国自身免疫性胰腺炎诊治指南(上海2023)
- 人教版小学二年级上册数学口算题(全套)
- 2024年-2025年《公路养护》知识考试题库与答案
- NB-T31052-2014风力发电场高处作业安全规程
- FZ-T 01158-2022 纺织品 织物刺痒感的测定 振动音频分析法
- 工程部造价管控手册
- 汽车销售三方协议
- 氧气吸入的注意事项课件
- 20以内加减法口算题(10000道)(A4直接打印-每页100题)
- 天惊牌中药消毒剂专家讲座
- 中国建设工程造价管理协会《建设工程造价鉴定规程》
评论
0/150
提交评论