(概率论与数理统计专业论文)某师范院校研究生就业意愿的调查研究.pdf_第1页
(概率论与数理统计专业论文)某师范院校研究生就业意愿的调查研究.pdf_第2页
(概率论与数理统计专业论文)某师范院校研究生就业意愿的调查研究.pdf_第3页
(概率论与数理统计专业论文)某师范院校研究生就业意愿的调查研究.pdf_第4页
(概率论与数理统计专业论文)某师范院校研究生就业意愿的调查研究.pdf_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

f 7 :、 : 硕士学位论文 m a s t e r st h e s i s 摘要 基于就业形势的不断变化,与研究生就业期望值较高的现实矛盾,本文运用基 于层次分析法的聚类分析方法和特征加权朴素贝叶斯分类两种不同的分类方法,分 别将受访者分成若干类,学校的就业指导部门就可以针对不同的学生人群采用不同 的策略,进行针对性较强的就业指导和心理辅导。对新的未知分类信息的受访者, 两种不同的分类方法均可以对其进行预测分类,使受访者迅速地找到相应的辅导类 别,就业指导部门就可以对其进行个性化的就业指导了。本文还根据师范院校毕业 生的实际,提出了教育类指数和非教育类指数的概念,增加了模型的可解释性,提 高了就业辅导工作的效率。最后,对这两种不同的分类方法进行了比较。 关键词:层次分析法;特征加权;朴素贝叶斯分类;聚类分析;就业指数 硕士学位论丈 m a s t e r s 丁h e s i s a b s t r a c t b a s e do nt h ep r a c t i c a lc o n t r a d i c t i o nb e t w e e nt h e e v e r - c h a n g i n ge m p l o y m e n t s i t u a t i o na n dt 1 1 eh i 曲e re m p l o y m e n te x p e c t a t i o no ft h ep o s t g r a t u a t e ,t 1 1 i sp a p e rd i v j d e s t l l er e s p o n d e n t si n t os e v e r a lg r o l l p su s i n g 觚od i 艉r e n tm e m o d so ft h ec l u s t e ra n a l y s i s a i l dt l l ef e a t l l r ew 西出i n gn a i v eb a y e s i a nc l a s s i f i e r s ot h ed e p a r “n e n to fe m p l o y m e n t 咖d a i l c ec a i lu s ed i 仃e r e n ts t r a t e g i e st o d e a lw i t hd i & r e n tg m u p sa n dt og i v eh i g m y t a 玛e t e de m p l o y m e n tg u i d a n c ea n dp s y c h o l o g i c a lc o u n s e l l i n g f o rt h en e wr e s p o n d e n tt o 衄k n o w n 铲o u p ,t w od i f f e r e n tm e t h o d sc a na l s op r e d i c tl l i s 伊o u p t h j sr e s p o n d e n tc a i l q u i c l d yf i n d t i l e c o r r e s p o i l d i n gg r o u p ,a n dm ed e p 蝴e n to fe m p l o y m e n tg u i d e n c e c 硎e sp e r s o n a l i z e de m p l o ”n e n tg u i d a n c eo u t b a s e do na c t u a l i 够o fn o m l a j 吼i v e r s i 吼 “sp a p e rc r e a t e sm ec o n c e p t so fm ee d u c a t i o ni n d e xa n dt h en o n e d u c a t i o ni n d e x ,a n d 脚r o v e st l l ee m c i e n c yo fm ee m p l o y m e n tg u i d a n c e a tl a s t ,t h e 如,od i f f e r e n tm e t h o d s a r ec o m p a r e d k e v c l a s s i f i e r : w o r d s :a n a l y t i ch i e r a r c h yp r o c e s s : f e a t u r ew e i g h t i n g ;n a i v eb a y e s i a n c l u s t e ra i l a l y s i s ;e m p l o y m e n ti n d e x 霄 硕士学位论疋 m a s 1e r s7 j _ h e sj s 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作 所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均己在 文中以明确方式标明。本声明的法律结果由本人承担。 作者签名: 够豸 日期:泗脾夕月劲日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权 中国科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通 过网络向社会公众提供信息服务。 作若签名:馋礼 日期:沙8 年朋汐日 导师签名: ,r 铷办幻 日期:2 口口净歹月z l ) 日 本人已经认真阅读“c a l i s 高校学位论文全文数据库发布章程”,同意将本人的 学位论文提交“c a l i s 高校学位论文全文数据库”中全文发布,并可按“章程”中的 规定享受相关权益。回重迨塞堡童后溢蜃;旦主生;旦= 生;旦三生筮鱼! 作者签名:颦钇 日期:枷g 年芦月p 日 纫d 认 盯 争s 、 午 少旷 红汐 参0 师期 b r 日 硕士学位论丈 m a s t e r st h e s l s 引言 自1 9 9 9 年高校实行扩招以来,我国高等教育实现了超常规的快速发展。国家 发展和改革委员会副主任张茅说,我国普通高等教育在校人数位居世界第一。张茅 介绍,2 0 0 7 年我国普通高校大学生和研究生招生规模分别达到5 7 0 万人和4 2 4 万人, 普通高等教育在校生达1 7 3 8 8 万人,研究生1 1 0 5 万人,预计到2 0 1 0 年普通高校本 专科在校生规模将达到2 0 0 0 万人左右,高等教育毛入学率已超过了2 2 ,已步入 大众化阶段。 同时,我们也看到,随着大学毕业生数量的逐年迅速增长,毕业生就业难也日 益凸显,毕业生就业形势日趋严峻。对毕业生来说,他们对未来就业充满较大期待, 但是自身社会经验贫乏,对现实困难估计不足,都在不同程度上影响大学毕业生的心 理活动,甚至使学生出现严重的心理问题。比如:焦虑心理、盲从心理、攀比嫉妒心 理、恐惧逃避心理、依赖心理、自负心理、自卑心理、不正当竞争心理等f l ,2 】。 作为在毕业牛就业工作中起主导作用的高等院校,其就业指导服务,心理辅导 工作发挥的好坏将对毕业生能否顺利就业、满意就业起到至关重要的作用 3 】。而现 实的就业辅导工作的现状是:教师没办法,学生没兴趣,两者矛盾的沟堑一时难以 弥合。今年,研究生的就业在即,学生对就业指导及相关的就业心理指导就变得愈 来愈迫切,可是面对大量的就业意愿调查表,我们如何去提取有用的信息,帮助毕 业生的就业及进行心理辅导呢,统计学此时大有用武之地。 7 7 、 硕士学位论丈 m a s t e r st h e s i s 1 1 聚类分析 第一章预备知识 聚类分析又称群分析,它是研究( 样品或指标) 分类问题的一种多元统计方法, 也就是人们说的研究“物以类聚”的一种方法。所谓类,通俗地说,就是指相似元 素的集合。在不同问题中类的定义是不同的。 聚类分析起源于分类学,随着生产技术和科学的发展,人类的认识不断加深, 分类越来越细,要求也越来越高,往往需要定性和定量结合起来去分类,于是形成 了数值分类学;后来多元分析的引进,聚类分析从数值分类学中分离出来,形成了 一个相对独立的分支。 聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊 聚类法、图论聚类法、聚类预报法等。本文主要采用两种常用的系统聚类法:中问 距离法、最大距离法f 4 】。 1 2 层次分析法 人们在处理决策问题的时候,要考虑的因素有多有少,有大有小,但是一个共 同的特点是他们通常都涉及到经济、社会、人文等方面的因素,在比较、判断、评 价、决策时,这些因素的重要性、影响力或者有限程度往往难以量化,人的主观选 择( 当然要根据客观实际) 会起着相当重要的作用,这就给用一般的数学方法解决 问题带来本质上的困难【5 】。 三f 勋哪等人在七十年代提出了一种能有效地处理这一类问题的实用方法,称 层次分析法( a n a j y t i ch i e r a r c h yp r o c e s s ,a h p ) 。这是一种定性和定量相结合的、系 统化、层次化的分析方法。过去研究自然和社会现象主要有机理分析和统计分析两 种方法,前者用经典的数学工具分析现象的因果关系,后者以随机数学为工具,通 过大量观测数据寻求统计规律。近年来发展的系统分析又是一种方法,而层次分析 法就是系统分析的数学工具。 2 硕士擘位论丈 m a s t e r s 了h e s i s 1 3 特征加权朴素贝叶斯分类 贝叶斯学派是现代统计学中与经典频率学派并列的两个学派之一。经典的频率 统计学派对具有不确定性的未知参数目的推断宜接利用样本信息,而与具体的应用 领域无关。认为总体x 的概率分布f ( x ,臼) 或概率密度厂( x ,臼) 中的未知参数口是一 个确定的数,完全由样本决定。而贝叶斯概率是观测者对某一事件的发生的相信程 度。贝叶斯理论认为口除了与样本信息相关外,还与来自于非样本信息的先验信息 相关。先验信息来自包含类似咿的过去的经验,具有一定的主观性。贝叶斯数据分 析就是先验分布在经过了数据所提供的信息,修订之后作形成的后验分布。 分类( c l a s s i 蠡c a t i o l l ) 是数据分析和机器学习领域的基本问题。没有一个分类方 法对所有数据集均是最优的,从数据中学习高精度的分类其近年来一直是研究的热 点,各种不同的方法都可以用来学习分类器。例如,人工神经元网络,决策树,非 参数学习算法等等,与其他精心设计的分类器相比,在学习效率和分类效果方面, 朴素贝叶斯分类器是较好的分类器之【6 ,7 】。 朴素贝叶斯分类器的表达能力和神经元网络的感知器相当,都在实例空间中描 述了线性的分类边界( 超平面) ,j e a g e r f 8 】证明了所有的线性可分概念均可出朴素贝 时斯分类器表达。贝叶斯分类器可以在线性_ 日寸脚内学习完所有的训练集,并渐进的 更新其参数,数据到达的顺序和分类错误均不影响分类器的学习过程,因此是学习 效率最高的分类器算法之一( 没有任何学习算法能够短与线性时间访问所有的训练 数据) 。 朴素贝叶斯独立假设是本算法的关键假设,却在很多真实的领域中明显不能得 到满足,因此长期以来朴素贝叶斯分类其不被重视。 但是,在信度网被广泛用作概率知识表达模型后,大量的研究证明,朴素贝叶 斯分类器在大量的真实数据集上的分类精确度与许多常用的算法相当或者更好。 与此同时,改进朴素贝叶分类器的各种方案层出不穷,每一种都在某些条件下 改进了朴素贝叶斯分类器的分类精度。这些方法包括,半朴素贝叶斯分类器,概率 调整,朴素贝叶斯树分类器,树增强朴素贝叶斯9 】,属性选择 1 0 】等等。 本文则提出一种基于特征加权的新的朴素贝叶斯分类器模型,将数据对结果的 不同影响因子引入到模型的计算中,从而使模型的分类效果得到改善。 硕士学位论丈 m a s t e r st e s 】s 1 3 。1 贝叶斯定理 全概率公式:设c 1 ,c 2 ,c 。k ,两两不相容,尸( c ,) o ,i - l ,2 ,m , 且u c ,= q ,对于任意的b ,则 f 盅1 p ( 曰) = 尸( 召n q ) = 尸( b n c ,) l = l = 尸( b l c ,) p ( c ,) 在上式中,p ( c ) 是在分析之前就可以得到的,因此称为先验概率,而 尸( blg ) 是根据以前得到c 的信息后重新加以修正的概率,称为后验概率。 贝叶斯定理:若c l ,c :,巳k ,两两不相容,尸( e ) o ,i l ,2 ,m , 则对于任何满足p ( x ) 0 的x ,有: 删耻警 1 3 。2 朴素贝叶斯分类 :! ( 茎! 9 2 1 1 9 ! 尸( xfc f ) 尸( c ) f = l 贝叶斯分类是基于数据库的统计学分类方法,可以预测成员关系的可能性,例 如,未知样本属于某一个特定类的概率f 11 】。朴素贝叶斯分类是一种基于概率的分 类方法,它通过样本的属性值计算样本属于某一个类的可能性,然后,根据极大似 然估计的原理,将样本归属到最有可能的类中。即假设有m 个类c ,c :,c 。,朴 素贝叶斯分类将未知分类信息的样本工分配给类c ,当且仅当: 尸( ej x ) = 肱磁尸( c ii 彳) ,以gj j ) ,尸( qi x ) ) ( 2 ) 这里,可以把样本x “,恐,稚) 看为一个属性向量,薯表示第i 个属性的值。 4 z 、 硕士学位论文 m a s t e r st h e s l s 贝叶斯分类基于贝叶斯定理和属性独立性假设。贝叶斯定理给出了分类函数在 数学上的计算方法,贝叶斯定理将先验概率和后验概率结合起来,对未知参数向量 的估计综合了它的先验信息和样本信息。朴素贝叶斯分类假设一个属性对给定类的 影响独立于其他属性,即各属性相互独立,在属性问不存在依赖关系,即“朴素的”, 因此: 主 尸( x l e ) = n 尸( 4 ,= _ l c ) ( 3 ) 其中,彳表示第j 个属性,x 表示样本x 的么属性值,x ,可能有多个不同的取 值,尸( xic i ) 为类条件概率,尸( 彳= x ic 。) 为属性彳尸x ,的类条件概率。由( 1 ) 式可以改写为 兀尸( 彳= _ i e 炉( c ) p ( c j = 生丽厂一 “) 熹不参与整个过程的计算,可以看成是一个定值口( 显然口 o ) ,由( 4 ) p ( x 、 可得: 尸( c il x ) :口卉h 彳:x ic f ) 尸( c f ) ( 5 ) 贝叶斯理论把在训练数据中观测到的频率作为条件概率,若计类c 。中样本个数 为( e ) ,总样本d 的个数为( d ) ,( c = e ,4 = t ) 表示在类e 中,属性4 的取 值为一的样本数,则有: 删= 器 脚邶) = 坠怒型 利用上( 6 ) ,( 7 ) 两式,( 5 ) 式可变形为: 5 ( 6 ) ( 7 ) f o 硕士学位论文 m a s t e r 。st h e s l s 七i 尸( c fl x ) = 口兀p ( 彳,= _ i e ) 尸( e ) = 口兀 ,= lj = l 型笙三璺:垒三兰l ( g ) 丝盟 ( 8 ) ( d ) 1 3 3 特征加权朴素贝叶斯分类器 朴素贝叶斯分类是基于属性独立性假设的基础上的,这在很多种情况下,是不 符合实际的;再者,在许多分类算法中,通常认为所有的属性( 特征) 都具有相同 的重要性。这种方式使得冗余的,与分类无关的,相互影响的以及被噪音污染的特 征和其他特征具有相同的地位,并使得分类的正确性降低。基于上述担心,人们提 出了各种特征加权算法,并将这些算法嵌入到具体的分类器中,以提高分类的精度。 对于其他机器学习算法,特征加权也逐渐得到广泛的重视。 首先在朴素贝叶斯分类器中采用特征加权思想的是b l 咖等,他们提出的半朴 素贝叶斯分类器l 做“概率调整朴素贝叶斯分类器”( a 由u s t e dp r o b a b i l 时n a i v e b a y e sc l a s s i f i e r ,a p n b c 。a p n b c 的加权参数作用于类别节点上,再用分离器计算 出各类别的后验概率后,通过二次加权调整后验概率,再完成分类。 和a p n b c 算法不同的是,本文提出的加权算法直接作用在每个分解的条件概 率项p ( 石,ic ,) 上,以更加直接的方式影响分类的过程。 令x j 是数据集d 中属性彳。取值等于工,的数据集合。如果存在某个样本 x x 6 ,满足类别c = c 。,则对于用贝叶斯定理计算后验概率的每一项 尸( x f = x “c = c 。) 给予一个系数w ,: w :里型:型! 垒三型 ( d )( d ) 这样,后验概率p ( gl ) 可以改进为: 尸( c ,j x ) = 口兀 = l( c ;)( d ) 卸密篙茅宰 竺! 竺三曼! 兰! 三兰! 母幽( 9 ) ( c f )( d ) ( 9 ) 为特征加权朴素贝叶斯公式。此算法称为特征加权朴素贝叶斯分类算法 ( f e a 哳ew d 曲t i n gn a j v eb a y e s i a nc l a s s i f i e r ,f w n b ) 【l2 】。和朴素贝叶斯分类算法 6 f o 、 硕士学位论史 m a s t r 。s 丁h e s i s 相比,f w n b 主要增加了对于特征加权参数w i 的计算。加权系数w ,可以看作在计 算类别g 的后验概率时,属性彳,的某个取值x ,对于此计算的影响程度。通过引入 此系数,朴素贝叶斯分类器更合理,分类效果得到了明显的改进。 1 3 4 拉普拉斯校准( 拉普拉斯估计) 由p ( x l c ,) = 卉户( 彳j = x jl c ) 发现一个潜在的问题:在c i 类中,如果属性彳= x ,的 样本个数为0 时,由( 7 ) 式知,属性彳,= x ,的类条件概率等于0 ,整个类条件概率 p ( x g ) 也等于o 。更极端地,x 二的个数也有可能为o ,由( 6 ) 知,特征加权系 数也为0 。而这就和实际的想法不一致了,即使事件出现的概率再小,也不可能概 率为o 。因此,简单地使用记录比例来估计类条件概率的方法显得太脆弱了,尤其 在训练样本很少而属性数目又很大时,此时训练样本不能覆盖那么多的属性,对于 这种极端的情况,解决问题的途径是使用拉普拉斯校准( 拉普拉斯估计) 【1 3 】,它 不仅可以使造成的类条件概率的变化忽略不计,还避免某些属性的类条件概率为0 。 拉普拉斯校准:假定数据库d 很大,已知数据共分成m 类,任一数据义有k 个属性,彳= ( z 。,工:,以) 。若属性4 有g ,个不同的可能取值,为其中一个,则 p f 4 :x c :c 、:竺! ! 三鱼:生三兰! :! ( 1 0 ) 以4 硝邝) = = 面苛# = q w :坐垡堂:竺! 垒三兰! !( 1 1 ) 。 ( d )( 四十g , 将( 1 0 ) ,( 1 1 ) 代入( 9 ) 中,有: 删耻a 舞枣瓮裂 7 。竺坚三璺:兰! 三兰2 ! ( c i ) + 鼋j f :1 2 ,朋 ( 1 2 ) 硕士学位论丈 m a s t e r s 丁h e s j s 第二章数据的获取 本次调查采用分层抽样调查的方法,对某师范院校的l9 个具有硕士生招生资 格的学院和研究所,共抽取了不同学院的3 0 名应届毕业研究生作为调查对象。 对这些同学采用封闭式调查问卷【1 4 】的方法,获取相关数据,并进行统计和分 析。根据师范类院校的实际情况,将应届毕业研究生的可能的就业出口大致分为读 博,高校教师,中学教师,公务员,公司职员,自主创业六种。对每个职业,本文 将就业意愿分为五个等级:极可能从事,很可能从事,可能从事,较不可能从事, 绝不可能从事五个等级,受访者对每个职业,根据自身的实际情况进行选择。我们 对受访者的选择给出相应的分数,选择极可能从事的职业得5 分,很可能从事的职 业得4 分,依次向下,绝不可能从事得1 分。本次调查收到有效的答卷2 7 份。 对受访者调查得到数据如下表: 应届研究生就业意愿得分 0 b s读博高校教师中学教师公务员公司职员自主创业 1 2 3 4 5 6 7 8 9 10 i l 12 13 14 1 5 1 6 1 7 18 19 2 0 2 1 2 2 2 3 2 4 2 5 2 6 2 7 8 11i112j1222111113 223214114l 5 5 5 5 54;33351 333454,42443551 5 5 6 4 5535345242 21543524 2 2 1 3 2 ,54 5 4 5 5552445 3 5 2 4 5 2 33,4,4 155324434334 3432343,43 3 3 4 2 3 ,4 3 1 3 5 1 211331531 342455442 硕士学位论丈 m a s t e r st h e s i s 第三章在某师范院校硕士研究生就业指导上的应用 3 1 就业指导工作的传统方法 传统的就业指导是“临阵磨枪 型的短平快模式,仅仅停留在毕业环节的择业 指导,具体表现为对毕业生进行政策解说、信息发布、技巧指导三个方面,尤其是 在就业指导的目的上,停留在战术的层面上,而不是战略层面上。大多数就业指导 人员和接受指导的学生都把提高毕业生一次就业率和顺利就业看作唯一目的,使得 就业指导工作成为“重服务、轻教育”的短期行为。由于就业指导忽视了学生职业 生涯规划和职业能力的发展这一核心任务,使得就业指导工作者把大部分精力都放 在应付事务性的工作上,在一定程度影响了就业指导工作的深入开展及其功能的有 效发挥,这样一来,效果自然不理想。 加之就业指导人员综合素质不高和就业经费、基础设施的投入不足等客观原 因,学校的就业指导工作无法正常有效的开展。 针对就业形势的变化,各学校也逐渐地加强了就业指导和心理辅导工作,比如: 构建全程化就业指导模式,就业指导应由“临阵磨枪”型转变为“长期备战”型, 推行全程化的就业指导,即从毕业班向低年级前移,贯穿大学教窍的全过程f 1 5 】。 虽然现在的就业指导课如火如荼地展开了很长时间,可是效果仍然不甚理想, 咎其原因为:就业指导课,仍然停留在大锅饭时代;就业指导课的针对性不强,忽 视学生个性的塑造、潜能的开发和创业创新能力的培养,缺乏职业生涯规划和职业 能力的测试;就业指导课在求职经验和具体技能方面的内容,难以满足学生就业过 程中的实际需要,学生认为听不听就业指导课,对将来就业帮助不大。 这就需要我们建立个面对个人的,交互的就业指导系统。 3 2 特征加权朴素贝叶斯分类在研究生就业指导上的应用 3 2 1 对原始数据的分类 对调查的原始数据以六种职业作为变量,对2 7 组数据使用平均距离法进行聚 类分析,在s a s 【1 6 】中得到图l : 9 硕士学位论丈 m a s t e r st h e s l s 3 2 2 结果分析 v e r a :ed i s t a r c ee e t 蚋,c il 略t e r s 图1以六种职业作为变量的聚类分析结果 从图中我们可以清楚地看到,可以将受访者分成四类: ( 1 ) l ,2 ,1 1 ,1 7 ,2 0 。这类受访者自己非常可能从事公务员和公司职员, 可能从事高校教师,自主创业,不可能读博和做高中教师。 ( 2 ) 3 ,4 ,5 ,6 ,8 ,9 ,1 0 ,1 3 ,1 4 ,1 6 ,1 8 ,2 2 ,2 4 。这类受访者兴趣比 较广泛,可能从事高校教师,中学教师,公务员,公司职员,对读博有些兴趣,但 不可能自主创业。 ( 3 ) 7 ,1 2 ,1 5 ,1 9 ,2 1 , 2 7 。这类受访者认为自己很有可能从事高校教师, 中学教师和读博,对公务员,公司职员,自主创业没有兴趣。 ( 4 ) 2 3 ,2 5 ,2 6 。这类受访者认为自己很有可能读博和做公司职员,有可能 从事高校教师和自主创业,对中学教师和公务员没有兴趣。 1 0 ;0 8 3 2 0 4;,;,) 加吲洲邮蚴嘟嘶叭l虽础舢蚴嘶蝴哪龇蚴邮唧舢龇蚴雠蚴蚴|量|耋 cr0tvresfomn 硕士学位论丈 m a s t e r st h e s l s 利用公式( 2 ) 、( 1 2 ) ,对以上分类进行回判分析,如下表( 表1 ) ,发现除了序 号9 和2 5 判错,其他均j 下确。回判正确率为9 2 6 。 样品序呼原类别尸( c ii ) 口 以c 2l x ) ,口p ( c ,i x ) 口p 4 x 、 a 问判类别后验概率 ll3 8 4 7 l o 。o1 0 0 5 + 1 0 8 0 4 3 lo 1 02 6 0 9 l o 8l0 5 l o 2l2 5 6 4 幸l o 。82 0 1 0 幸1 0 36 4 3 4 lo 1 04 3 4 8 + l o 。9l0 5 0 5 i l l 1 3 9 4 + 1 0 64 7 8 4 1 0 - s2 6 2 4 l o 母8 8 6 7 l o - 9 l 0 9 5 9 1 7l7 8 4 5 孛l o 。73 5 8 8 幸l o 93 2 8 0 幸1 0 。1 08 8 6 7 搴1 0 9lo 9 8 3 2 0l8 1 1 1 1 0 。91 3 8 0 l o 。”1 0 5 9 + lo - 7 1 6 2 l o l llo 9 8 8 3 2 5 1 2 9 1 0 85 3 6 2 1 0 8 7 2 3 8 + l 旷91 9 5 6 l 矿2o 4 0 7 423 1 1 2 1o 81 2 2 9 + l 矿4 6 8 4 1 0 83 1 6 5 l o 。20 9 1 8 522 8 4 9 1o 75 3 6 2 + l o - 75 3 6 2 l o 92 8 9 9 1 0 20 6 2 6 626 3 0 8 1 0 - 91 7 3 8 l o 71 0 6 8 1o - 84 o l o lo 92o 8 9 2 824 4 4 5 1o - 5 6 9 3 1 0 r 61 1 1 5 + l 盯2 5 1 2 1 0 82o 9 0 7 924 2 9 l 事l o 。1 08 8 3 2 lo - 92 6 1 6 幸1 0 _ 81 6 3 7 + 1 0 r 93o 7 0 5 l o2i 3 9 4 lo - s9 6 4 4 io - 7l ,8 8 9 lo - s3 5 4 7 + 1 旷2o 9 6 3 1 324 9 7 9 1 0 - 91 7 2 l l o 63 7 4 7 幸l o - 毫8 4 4 l 1 0 - 92o 9 7 l 1 42l ,3 6 7 1 0 + 81 3 5 l + 1 0 - 63 0 8 8 l o 71 6 8 8 l o - 82o 7 9 9 1 623 7 2 幸1 0 。1 01 9 7 0 l o s1 0 5 0 1 0 。93 7 8 8 1 0 92o 7 9 0 1 82 6 3 0 8 1 0 1 0 1 - 2 5 1 + l o 。7 6 4 0 9 + l o 。9 2 4 0 6 + 1 0 92 o 9 2 9 2 223 1 1 2 1 0 94 2 6 9 牛l o - s1 7 5 6 1 0 。81 0 5 5 + l o |2o 5 7 7 2 4 2 4 7 4 2 事1 0 。81 6 3 9 幸l o - 63 5 6 9 1 0 73 2 1 5 1 0 420 7 8 9 735 3 4 3 l o o o8 3 7 8 + i o “2 7 1 4 lo o2 1 7 4 + lo 93o 9 2 l 1 232 8 7 2 1 0 。95 0 6 7 l o 82 7 0 2 l o 79 7 4 0 + lo 93o 8 l o 1 53 2 。3 7 l l o 94 5 5 4 宰1 0 。52 6 7 6 + lo 7 1 6 0 7 1 0 83 o 8 0 7 1 938 7 1 7 丰l o 1 04 7 8 4 l o - 91 3 2 8 + 1 0 71 3 3 0 + 1 0 i3o 8 7 5 2 l35 1 4 9 l o 1 12 2 7 l 1o - 1 01 5 6 9 1 0 - s1 1 7 8 1 0 。93o 9 1 5 2 734 7 4 2 1 0 91 9 5 l 1 0 - |4 4 6 l + lo 78 0 3 9 1o - 93o 9 3 2 2 34 1 0 9 8 1 0 93 7 6 7 幸l0 。1 0 2 0 6 6 + lo 9 4 4 6 9 1 0 - l 4 o 9 2 6 2 542 3 0 8 1 0 。93 6 1 9 lo - 94 6 9 0 幸1 0 - l4 2 2 6 1 0 83o 4 9 3 2 6 4 3 0 1 7 1 0 。1 04 7 3 l 1 0 o1 0 2 l + lo - 1 03 3 1 5 l o s40 9 7 4 表1 回判分析图 硕士学位论文 m a s t e r st h e s l s 3 2 3 对新的受访者的预测归类 令选择读博为_ ,高校教师为x :,中学教师为x ,公务员为x 。,公司职员为黾, 自主创业为k 。 有一个新的受访者,在各个职业的选择上的得分为: z = ( 一,x :,屯,x 。,x ,吒) = ( 3 ,3 ,5 ,2 ,3 ,1 ) ,从得分的情况粗略的看,很符合第二类的受访者的基本特 征。 我们可以运用特征加权朴素贝叶斯分类法来验证我们的猜想,将这个新的受访 者进行归类,然后便可以对他进行判断是否需要进行就业指导和心理辅导了。 则由公式( 1 2 ) ,可以得到: p ( c ii x ) = 1 5 3 6 8 4 搴1 0 4 口 尸( c 2i x ) = 9 2 1 0 3 3 幸1 0 “口 尸( c 3x ) = 1 4 3 1 6 3 搴1 0 - 7 口 尸( c r 4jx ) = 1 5 6 3 3 宰1 0 _ 9 口 由( 2 ) 知: 朋戤以c ii 聊,毅qi j ) ,以c 3l 朋,夕( c 4i x ) = 9 2 1 0 3 3 枣1 0 - 7 口= 尹( c 2 x ) 所以将其归到第二类。由第二类可知,这类受访者的就业兴趣比较广泛,就业 途径较多,比较容易就业,无需特别的就业指导和心理辅导。 3 3 基于层次分析法的聚类分析在研究生就业指导中的应用 学生在选择工作的时候,往往考虑的因素很多,在作比较,判断,决策时,这 些因素的重要性不一样,难以量化,人的主观选择会起到主要的作用,但主观选择 难以让人信服。丁钇砂等人在七十年代提出了一种能有效处理这类问题的使用方 法,称为层次分析法( 彳卯) ,这是一种定性和定量相结合的、系统的、层次化的分 析方法【5 】。我们可以通过层次分析法,知道各个不同的职业选择在就业指数中的权 重。 1 2 硕士学位论丈 m a s 丁e r st h e s l s 3 3 1 层次分析法 3 3 1 1 建立层次结构模型 将就业意愿问题分成三层( 图2 ) ,第一层为目标层,也就我们需要做出决策的 结果:职业选择;第二层为准则层,也就是影响研究生就业意愿的因素,考虑的因 素分为:工资福利、工作稳定、工作舒适、工作环境、个人发展、个人兴趣、社会 需求等七个因素;第三层就是方案层,本文给出了某师范类院校研究生的六种最有 可能从事的职业选择:读博、高校教师、中学教师、公务员、公司职员、自主创业。 目标屡 准贝u 层 方案层 图2 职业选择结构模型 3 3 1 2 构造成对比较阵并比较各准则的权重 层次分析法,将定性分析和定量计算结合起来完成。各准则涉及到社会,经济, 人文等因素,对各准则权重的设定,困难在于这些因素通常不易定量测量。人们凭 自己的经验和知识来判断,当因素较多时给出的结果往往是不全面和不准确的,不 能被人接受,勋砂等人的做法,一是不把所有因素放在一起比较,而是两两的相 互对比;二是对比采取相对尺度,以尽可能的减少性质不同的因素相互比较的困难, 提高准确度。 硕士学位论文 m a s t e r s 丁l i e s j s 3 3 1 2 1 比较尺度 令q 与c ,为同一层的两个不同的因素,翰砂等人提出了1 9 尺度( 表2 ) ,含义如下 尺度乃含义 1 q 与c ,的影响相同 3 c ,比c j 的影响稍强 5 q 比c ,的影响强 7 c ,比c ,的影响明显的强 9 q 比巳的影响绝对的强 2 ,4 ,6 ,8 c f 与c j 的影响之比在上述两个相邻的等级之间 1 ,l 2 ,l 9 c ,与c ,的影响之比与上相反( 强改成弱) 表2 比较尺度 3 3 1 2 2 成对比较阵 令准则层的七个因素工资福利、工作稳定、工作舒适、工作环境、个人发展、 个人兴趣、社会需求分别为f l ,c 2 ,c 3 ,c 。,c ,c 6 ,f ,假设要比较这七个因素对目标层: 职业选择d 的影响,每次取两个因素q 与勺,用锡表示c ,与勺对d 的影响之比。 比如:薪水与个人发展对目标层的影响是稍弱,所以,他们的比是l 3 ,相反的,个 人发展与薪水对目标层的影响是稍强,他们的比应为3 ,也即是有这样的关系: 口 ,:去( f ,川,2 ,3 4 ,5 6 ,7 ) 特别地,当f = ,时,= 1 准则层各因素两两比较对目标层的影响,可表成对比较矩阵: 1 4 硕士学位论文 m a s t r s 丁 e s j s a = l24 三 l3 2 三三 1一一 - 43 1l1 452 223 三三 2 43 223 3 3 1 2 3 成对比较阵的一致性检验 在成对比较阵中c l :c 2 = 2 :l ,c 1 :c 5 = 1 :2 ,那么c 2 :c 5 = 1 :4 ,才能说明成对比较 是一致的,但实际上从爿中知:乞:c ;= l :2 ,与岛:乞= l :4 的一致性假设不一致, 要求一对就很难,要求矩阵中每一对都是一致的,这个要求就太苛刻了。 于是,我们引进了一致性比率瞅 傩:里 刚 其中,a :坐为一致性指标,五为矩阵的最大特征根,刀为矩阵的阶数。盯 ,z l 为随机一致性指标【5 】,当刀= 6 时,肼= 1 2 4 ;当刀= 7 时,肼= 1 3 2 。 如果c 尺 o 1 ,那么,我们说矩阵通过了致性检验。我们认为彳的不一致程 度在容许的范围之内,可以采用此矩阵。否则就要重新进行成对比较,对彳进行调 整。 对彳来说,z = 7 4 2 7 ,a = 0 0 7 l ,c r ,= c ,彤= 0 0 5 3 9 、 : 硕士学位论文 m a s t e r st h e s j s 太愿意从事教育类的工作,应进行职业指导,甚至心理辅导。 ( 3 ) 就业务实型。序号3 ,4 ,6 ,8 ,1 0 ,1 8 ,2 3 ,他们的教育类指数和非教 育类的指数中等或偏高。这类受访者的工作意愿主要在工作机会较大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论