【毕业学位论文】(Word原稿)对高校大学生就业的未来走向与应对策略的探析-统计教育学_第1页
【毕业学位论文】(Word原稿)对高校大学生就业的未来走向与应对策略的探析-统计教育学_第2页
【毕业学位论文】(Word原稿)对高校大学生就业的未来走向与应对策略的探析-统计教育学_第3页
【毕业学位论文】(Word原稿)对高校大学生就业的未来走向与应对策略的探析-统计教育学_第4页
【毕业学位论文】(Word原稿)对高校大学生就业的未来走向与应对策略的探析-统计教育学_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 对高校大学生就业的未来走向与应对策略的探析 目 录 摘要 3 1 问题的提出 4 2 基本假设与符号说明 4 型的假设 . 4 号说明 . 5 3 问题的分析与建模思路 5 题的分析 . 5 路流程图 . 6 4 新失业群体产生客观原因分析及其重要性排序 6 素体系的确定 . 6 序 模型的建立与求解 . 9 于事例与置信度的多因素重要性排序方法 . 9 色关联分析模型 . 15 5 未来高校招生规模的变化趋势的预测 16 分方程仿真模型 . 16 本微分方程模型的建立 . 17 型的求解及其应用 . 18 型的改进及其应用 . 19 量分析 . 21 散正交曲线拟合模型 . 24 散正交多项式 . 24 离散正交多项式作曲线拟合 . 24 6 给政 府的相关建议 26 弈论方法概述 . 26 场企业、高等学校、毕业生三方博弈 . 27 场企业与毕业生之间的博弈 . 27 等学校与毕业生之间的博弈 . 28 府应当采取的策略 . 29 7 模型的评价 29 型的优点 . 29 型的缺点 . 29 8 参考文献 30 9 附录 31 2 插图索引 图 3模思路流程图 . 6 图 5-1 真框图 . 23 图 5真曲线图 . 23 图 5散正交拟合曲线 . 26 图 6诺博弈 . 27 图 6业生就业承诺博弈 . 27 图 6场企业与毕业生之间的博弈关系 . 28 附表索引 表 4学科历年毕业生数量(单位:人) . 7 表 4动力市场对各学科毕业生需求量(单位:人) . 7 表 4同学历历年毕业生数量(单位:人) . 8 表 4动力市场对不同学历毕业生的需求量(单位:人) . 8 表 4年毕业生总数 . 8 表 4种矛盾因素的量化 . 9 表 4于事例与置信度模型的因素重要性 . 15 表 4色关联模型求解重要性 . 16 表 5年全国高校招生人数和失业率 . 22 表 5散正交曲线拟合系数 . 25 表 6校与学生 的博弈矩阵 . 29 3 摘 要 近年来, “大学生就业难 ”已经不再是一个新鲜话题,新的失业群体 大学毕业生 失业 群体正在形成 并不断壮大,已日益成为我国扩大社会就业、促进社会和谐稳定必须高度重视并妥善解决的独特社会问题。 本文收集了大量的关于 我国高校大学生就业 的数据 , 根据我国国情 ,继而综合各种影响因素 , 得出新失业群体产生的主要原因,建立了我国 高校毕业生的就业率 、 高校招生规模的扩大和现实社会需求之间调控问题 的 数学模型。 首先,本文在对我国目前高校大学生就业情况及特点进行详细的分析以后 ,把 影响我国新失业群体产生的 主要 客观 原因 进行探析 ,我们定义了各种供需矛盾作为影响因素,在此基础上本文 建立了基于事例和置信度的多因素重要性排序模型 ,由于 样 本量较少,得到的结果偏差较大,故而我们采用 基于灰色关联的权重分析模型 再次进行分析,最后得出新失业群体 产生的主要矛盾因素及权重 。 其次,针对我国现有的国情,本文综合考虑了 高校毕业生的就业率 和 高校招生规模的扩大 之间的关系,建立了定量分析的微分方程模型,并用 行仿真,随后又建 立了了离散正交曲线拟合模型对得出的结果进行了检验,并分析由两模型得出的结果得合理性。 最终得到生源数量与失业率之间的拟合多项式和拟合曲线 ,并预测出了 未来高校招生规模的变化趋势 。 接着, 在以上工作的基础上,本文又采用博弈论的方法就改善我国高校大学生就业状况的策略进行了分析,得出行之有效的应对策略, 并提出了我们对 高校大学生就业 的具体建议 ,这为政府部门在就高校大学生就业方面做出决策时提供很好的参考依据。 关键词: 大学生就业 灰色关联 微分方程模型 离散正交曲线拟合 件 4 1 问 题的提出 人才是一个国家强盛的根本 , 我们处于一个需要人才并不断涌现人才的时 代。按理 , 在我国现阶段人力资源水平总体不高的形势下 , 大量高校毕业生进入劳动力市场无疑会提高社会劳动力素质 , 其就业不应成为太大的问题 , 而事实却 并非如此。 近年来, “大学生就业难 ”已经不再是一个新鲜话题,新的失业群体 大学毕业生 失业 群体正在形成 并不断壮大,已日益成为我国扩大社会就业、促进社会和谐稳定必须高度重视并妥善解决的独特社会问题。 据统计, 2009 年,全国高校毕业生约有 611 万人,高校学子的就业问题成为社会和学校关注的焦点, 2009 年 1 月 19 日,国务院下发了国务院办公厅关于加强普通高等学校毕业生就业工作的通知,并指出,当前受国际金融危机影响,我国就业形势十分严峻,高校毕业生就业压力加大,要求各地区、各有关部门要把高校毕业生就业摆在当前就业工作的首位,采取切实有效措施,拓宽就业门路,鼓励高校毕业生到城乡基层、中西部地区和中小企业就业,鼓励自主创业,鼓励骨干企业和科研项目单位吸纳和稳定高校毕业生就业。各级政府对此非常重视,并都采取了相应的应对措施,使大学生就业形势得到了一定的缓解。 高校 毕业生是社会劳动力就业群体的一个重要组成部分 , 也是一个特殊群体的就业 , 属于 “高阶劳动力 ”的就业范畴。 因此, 高校毕业生就业的好坏 , 不仅影响一个学校的招生和生源质量 , 而且从长远看也直接关系到 国家的经济发展,高校毕业生就业是一个亟待解决的问题。 然而, 在就业过程中,究竟制约大学生就业的因素是什么?大学生对自身的职业充满什么样的期望?大学生如何正确的看待就业形势以及应对市场变化?社会如何正确引导大学生就业?这些问题都是大学生群体本身和社会普遍关心的问题。为了找到这些问题的症结和为有关部门提供决策依据 ,不少专家学在此方面做了很多研究。 文献 1就就业率本身又受 到 一些 因素的影响 做了论述; 文献 2对于高校毕业生的就业与招生规模问题 , 提出了几个微分方程与时滞微分方程模型 ; 文献 3从经济角度 去解释高校毕业生就业问题的成因 文献 4则 利用模糊数学方法去对大学生就业竞争力进行综合评价等 ; 文献 5对 大学生越来越高的就业成本进行实证研究 , 并提出降低就业成本的途径 。 但是已有的文献都没有从数学上去深入认识高校毕业生的就业率,高校招生规模的扩大和现实社会需求之间的调控问题。 本文在总结前人研究的基础上,对 高校大学生就业的未来走向与策略 问题做了更详尽的探析。本旨在解决的问题可描 述为: 问题一:试建立数学模型 分析新失业群体产生的主要原因,并就其重要性给出各种因素的排序。 该模型对于政府 指导就业 市场有何指导作用? 问题二:试建立数学模型阐述 新失业群体对高校招生生源的影响 。 预测未来高校招生规模的变化趋势 如何? 问题三: 就业率 作为 和谐 社会的一项重要指标,在 大 学生就业 健康稳定发展的前提下,政府应采取哪些 行之有效的应对策略 ? 2 基本假设与符号说明 型的假设 1 假设毕业生求职时竞争是公平的 ; 5 2 假设考研等继续深造的毕业生属于已就业人群 ; 3 假设每个毕业生都有就业或者继续深造的 意图 ; 4 假设 企业只招收满足他们要求的毕业生,毕业生也只去符合他们自定标准的企业应聘; 5 假设就业率和失业率之和为 1; 6 忽略学生中途退学或无法毕业的对毕业生总人数的影响 ; 7 假设本文搜集的数据全部真实可靠 ; 号说明 大学毕业生找到工作的概率 j 在其他因素不变化时 , 变化一个单位 ()刻 t 高校毕业生的总人数 ()刻 t 高校计划招生的总人数 ()刻 t 毕业生的就业率 (即:就业人数 /毕业总人数 ) ()时刻 t 社会对于毕业生的需求率 (即:需求人数 /毕业生总人数 ) 招生人数规模的实际增长率 与 就业人数 的比例系数 与未 就业人数 的比例系数 3 问题的分析与 建模 思路 题的分析 若要分析新失业群体产生 的主要 原因 ,并 就其重要性给出 各种因素的排序 ,就需要对搜集的数据进行整理,并进行系统的分析,划分为不同的体系和矛盾,然后我们考虑分别用 型、 基于事例和置信度 的多因素重要性排序 模型和基于灰色关联度的因素排序模型对导致失业的因素进行排序。 为了得到 新失业群体对高校招生生源的影响 和 预测未来高校招生规模的变化趋势 ,我们考虑建立基于微分方程的仿真模型和离散正交曲线拟合模型来进行求解,并将结果进行比较。 最后 我们 考虑 在大学生就业 健康稳定发展的前提下, 给出 政府 采取 的 行之有效的 策略 , 因此需要 我们利用博弈论来探析市场企业、高等学校和毕业生三者之间的关系,并结合和谐社会的特点,给出政府应当采取的有效策略。 6 路流程图 本文中,我们 结合 搜集的 数据和提出的假设,考虑采用以下 的思路 ( 图 3进行建模 和求解: 高 校 大 学 生 就 业 的 未 来 走 向 与 应 对 策 略现 有 数 据 采 集挖 掘分 析新 失 业 群 体 产 生 原 因分 析 及 其 重 要 性 排 序未 来 高 校 招 生 规 模 的 变化 趋 势 的 预 测给 政 府 的 相 关 建 议供 需 矛盾 体 系L o g i 基 于 事 例和 置 信 度的 多 因 素重 要 性 排序 模 型基 于灰 色关 联因 素排 序模 型基 于微 分方 程的 仿真 模型离 散正 交曲 线拟 合模 型各 因 素 按 重 要性 排 序对 政 府 的 指 导作 用高 校 招 生 规 模的 变 化 趋 势企 业 、 高 校 、毕 业 生 三 方 博弈企 业 与毕 业 生之 间 的博 弈高 校 与毕 业 生之 间 的博 弈政 府 应 当 采 取的 策 略模 型 的 改 进模 型 的 评 价 与 推 广问 题 的 分 析 、 模 型 的 准 备模 型 的 建 立 与 求 解模 型 的 评 价 与 推 广图 3模思路流程图 4 新失业群体产生 客观 原因分析及其重要性 排序 素体系的确定 影响高校毕业生就业的 主要因素的选取的基础是因素指标体系。由于 影响高校毕业生就业的因素有很多方面,而且有些因素 具有多方面表现特征, 因此 对其进行描述,必须借助因素和因素体系。根据科学性原则和定量与定性相结合的原则,我们将 影响高校毕业 生就业的因素 分为 高校扩招造成大学生就业市场供需失衡 因素、 教育结构与产业结构不协调 因素体系以及高校毕业生的自身因素体系 。 7 教育结构与产业结构不协调 因素体系是由于 我国高等教育生产规模不断扩大 ,但不符合教育规律的压缩式追求低成本造成教育资源结构失调 ,表现在两方面 : 1) 学科与专业的结构失衡 ,即学科结构和专业结构与社会经济结构不相适 应 。 表现为 :有些学科和专业人才的过度教育 ;有些学科和专业人才的教育资源配置不 足 目前我国高等教育的学科与专业设置基本上由各个学校自主决定 ,学校出于经济效益和学校发展 7 需要 ,主要考虑的 因素是市场行情 ,而市场调节的盲目性和滞后性使得不同专业稀缺程度的变化与经济结构转换的需求变化不同步 ,致使许多热门应用学科类专业低水平重复现象严重 ,并冲击专业教学的质量 ,造成这些专业的毕业生结构性 过剩 。 从学科专业设置的历史沿革看 ,许多高校的学科专业建设更多是以学科自身内在逻辑的发展为依据和基础 ,而较少参照现实社会经济建设和发展领域的需要。当社会经济结构特别是产业结构的变化迅速 ,高等教育结构未能迅速地做出相应的调整 ,其培养的人才则不能满足社会和劳动力市场的需要 , 因此产生了知识性失业与职位空缺的矛盾。 目前,我国 高校共开设了十 一 大类专业,它们分别是哲学、法学、经济学、教育学、文学、历史学、管理学、理学、工学、农学、医学。我国 根据行业分类标准,可分为如下二十大行业: 农、林、牧、渔业 , 采矿业 , 制造业 , 电力、煤气及水的生产和供应业 ,建筑业 , 交通运输、仓储和邮政业 , 信息传输、计算机服务和软件业 , 批发和零售业 ,住宿和餐饮业 , 金融业 , 房地产业 , 租赁和商务服务业 , 科学研究、技术服务和地质勘查业 , 水利、环境和公共设施管理业 , 居民服务和其他服务业 , 教育 , 卫生、社会保障和社会福利业 , 文化、体育和娱乐业 , 公共管理与社会组织 , 国际组织 。 根据各行业与专业的不同特点,本文将专业和行业之间做了如下的对应划分: A. 农学:包含的对口行业有 农、林、牧、渔业 , 水利、环境和公共设施管理业 ; B. 工学:包含的对口行业有 采矿业 , 制造业 , 电力、煤气及水的生产和供应业 ,建筑业 , 信息传输、计算机服务和软件业 ; C. 理学:包含的对口行业有 科学研究、技术服务和地质勘查业 ; D. 综合学科 1(包括哲学、经济学、管理学):包含的对口行业有 交通运输、仓储和邮政业 , 批发和零售业 , 住宿和餐饮业 , 金融业 , 房地产业 , 租赁和商务服务业 , 居民服务和其他服务业 , 公共管理与社会组织 , 国际组织 ; E. 综合学科 2(包括:教育学、文学、历史学):包含的对口行业有 教育 , 文化、体育和娱乐业 ; F. 综合学科 3(包括:法学、医学):包含的对口行业有 卫生、社会保障和社会福利业 ; 根据 搜集的 数据 , 我们分析 学科与专业的结构失衡 得到如下 表 4表 4 表 4学科历年毕业生数量(单位:人) 年份 农学 工学 理学 综合学科 1 综合学科 2 综合学科 3 2004 64729 868222 225030 523627 545486 314776 2005 75569 1163927 186895 704459 727106 399614 2006 84453 1468220 215825 942647 938594 480844 2007 99627 1708751 266149 1115469 1039391 560196 2008 115904 1813040 456450 1277012 1194108 633237 (该数据来 自中华人民共和国教育部) 表 4动力市场对各学科毕业生需求量(单位:人) 年份 农学 工学 理学 综合学科 1 综合学科 2 综合学科 3 2004 51396 778848 18017 1372612 23992 25915 2005 66086 1079070 24825 1838718 24878 28292 2006 108629 1180239 35259 1865869 80014 28041 2007 113208 1502537 43488 2044840 94354 32738 2008 135426 1597211 30711 2056138 96265 35110 (该数据来自中华人民共和国 人力资源和社会保障部 ) 2) 层次结构失衡 , 即高等学校的学历学位教育层次比例及构成与经济社会发展 的 8 需求结构不匹配 ,出现了职业刚性失业和职位空缺并存的现象。在我国目前的 高等人才培养中 ,社会需求存在对学历教育的 “符号效应 ”,即对能力的需求不如对学历的要求。而从需求看 ,社会对各级人才的需求结构呈 “金字塔型 ”。 社会不仅需要从事高深学问研究和创造发明的学术性人才 ,更需要把现有科技转化 为现实生产力和产品的大批熟练工人和技术人员。因此 ,教育供给应该在专科、 本科和研究生教育的数量上形成合理的比例。然而 ,整个教育层次的扩招和缺乏鲜明特色的学科内容 ,不仅使得这种比例开始失调 ,而且造成各层次的毕业生不能达到应有的质量要求。同时 ,替代性增加 ,引发了就业市场中的 “挤占效应 ”。 即博士研究生挤占硕士研究生位置 ,硕士研究生挤占本科生位置 ,本科生挤占专科生位置 ,专科生又因为其质量不高、特色不鲜明而找不到位置 1。 在本文中,将高校 毕业生按学历分为:专科生、本科生、硕士位以上的毕业生。 同样根据数据分析 层次结构失衡 得到如下 表 4表 4 表 4同学历历年毕业生数量(单位:人) 年份 大专 大学 硕士以上 2004 1194862 1196290 150777 2005 1602170 1465786 189728 2006 2048034 1726674 255902 2007 20481963 1995944 311839 2008 2680934 2099151 397925 (该数据来自中华人民共和国教育部) 表 4动力市场对不同学历毕业生的需求量(单位:人) 年份 大专 大学 硕士以上 2004 1593185 477155 38414 2005 2340830 881559 43955 2006 2337825 918826 43717 2007 2580811 1165512 63112 2008 2706145 1197895 48885 (该数据来自中华人民共和国 人力资源和社会保障部 ) 在此,本文引入“供求矛盾”一词,分为总的供求矛盾,即每一年高校毕业生总数与本年度社会各行业需求的人数之差;学科供求矛盾,即每一年某一专业高校毕业生与该年度社会上需要该行业毕业生数之差;学位供求矛盾,即每一年某一学历的毕业生数与该年度社会上需要该学历毕业生数之差。 根据以上数据我们分析总的毕业人数和总需求得到各年份的矛盾 如下 表 4 表 4年毕业生总数 年份 学校总招生 /万人 学校毕业人数 /万人 市场总需求 /万人 总供需矛盾 2004 2005 2006 2007 2008 (该数据来自中华人民共和国教育部) 9 根据我们对供需矛盾的定义以及上述得到的数据,经计算得到所有的供需矛盾如下表 4 表 4种矛盾因素的量化 年份 2004 年 2005 年 2006 年 2007 年 2008 年 失业率 共需 学市场 学市场 学市场 合学科 1 合学科 2 合学科 3 科 科 究生 中负值表示该项的市场情况是供小于求,因此对失业率产生负影响,故我们排除相应因素,最终得到产生新事业群体的因素为以下七方面的供求矛盾: 总共需 、工学市场、理学市场、综合学科 2、综合学科 3、本科、研究生 序 模型的建立与求解 于事例与置信度 的多因素重要性排序方法 9 理及算法 从粗糙集理论的属性相对重要性的定义可知 , 用粗糙集理论确定的重要性是针对已知的属性而言的 。 当各属性的重要性是针对全体属性的综合 体而言时 , 这种针对具体决策属性来确定条件属性重要性的方法就不可行 .。 此外 , 粗糙集理论中的属性约简是针对离散值进行的 , 当属性的取值范围为连续性时 , 运用约简的方法来进行属性约简也存在一定的问题 。 例如 ,企业的资产值从理论上说变化范围可以为 0 , 如果运用属性泛化则有可能丢失大量的信息 , 而且泛化区间的选取也相当困难 。 粗糙集理论是完全基于事例的 ,无需提供事例以外的主观信息 , 这是该理论与模糊理论最重要的区别也是该理论的最大的优点 。 模糊集合的聚类方法则可以在 不对属性进行泛化的基础上进行样本的综合归类 , 即具有对信息进行综合处理的能力 , 但该方法无法进行各个属性重要性的评价 。 因此 ,把这 2 种理论结合起来 , 在不丢失有用信息的情况下 , 基于事例来确定各属性的重要性 , 有着明显的意义 。 以下对粗糙集理论和模糊数学理论简单介绍。 糙集理论 12 信息系统 四元有序组 ),( 是一个信息系统。其中, U 为对象集,是一个表示对象的非空有限集合,即 U , 21 ,也被称作论域, U 中的每个元素 )( 称为 10 一个对象; A 为属性集,是一个表示属性的非空有限集合,即 ,21 , A 中的每个元素 )( 称为一个属性, ,其中 C 为条件 属性集, D 为决策属性集; Aa al ,F 为 U 与 A 之间的关系集,即)(: ,亦称作信息函数,它为每个对象的每个属性赋予一个信息量。 划分与等价关系 定义 1 若 )( 为 U 的子集, ki 1),(),( ,则称 为 U 的划分。 划分即为分类,即将研究对象分为不同类,这些类之间互不相交,且任何对象只能并且均包含在某一类中。 定义 2 设 ,称 R 为 U 上的关系。 R 若满足( 1)自反性: ),(,)( ( 2)对称性: ),( 时, ),(),( ;( 3)传递性: ),( ,),( ,则 ),(,),( ,称 R 为 U 上的一个等价关系。 表示 R 的所有等价类组成的集合, 示包含元素 的 R 等价类。 粗糙集及其近似 定义 3 给定近似空间 ),( 对于任意子集 ,记: )()(称 )(为 X 的下近似( )( 为 X 的上近似( )()()( 称为 X 的 R 边界域; )()( 称为 X 的 R 正域;)()( 称为 X 的 R 负域。 )(或 )( 是那些根据知识 R 判断肯定属于 X 的 U 中元素组成的集合;)(是那些根据知识 R 判断可能属于 X 的 U 中元素组成的集合; )(那些根据知识 R 既不能判断肯定属于 X 又不能判断肯定属于 X (即 )的 U 中元素组成的集合; )( 是那些根据知识 R 判断肯定不属于 X 的 U 中元素组成的集合。 如果 X 的 R 边界域为空,即 )( 那么集合 X 是关于 R 的普通集合;如果 X 11 的 R 边界域不为空,即 )( 那么集合 X 是关于 R 的粗糙集。 属性的约简与核 信息系统中的属性并不是同等重要的。属性约简是指可以找到一个较小的属性集,使得可用 A 描述的对象集合必然可用 B 描述。属性约简是粗糙集理论的核心内容 之一,通过属性约简,可以消除冗余属性,减轻评价工作量,提高评价效率。 令 R 为一族等价关系, ,如果 / 则称 r 为 R 中不必要的;否则,则称 r 为 R 中必要的。 如果每一个 都为 R 中必要的,则称 R 为独立的;否则称 R 为依赖的。 定义 4 设 ,如果 P 是独立的,且 ,则称 P 为 R 的一个约简,记作 )(显然, P 可以有多种约简。 P 中所有必要关系组成的集合称为 P 的核,记作)(核与约简有如下关系: )()( 其中, )(示 P 的所有约简。 指标权重的度量 粗糙集理论可以利用指标的相对重要性来度量指标权重: 指标 ,)()()( 对归一化处理后可以得到指标体的处理如下列公式: , ),2,1( 上 式中的 | 表示集合元素的个数,该式明了从指标子集 R 中去掉指标(影响,由此来衡量指标 a 在指标子集 R 中的相对重要性。 糊数学聚类分析 在经典的聚类分析方法中可用经典等价关系对样本集 X 进行聚类。设 R 是 X 上的经典等价关系。对 X 中的两个元素 x 和 y ,若 ( , )x y R ,则将 x 和 y 并为一类,否则 x 和 y 不属于同一类。 相应地,可用 X 上的模糊等价关系对样本集 X 进行模糊聚类。设 慒 是 X 上的模糊等价关系, s 是 慒 的隶属函数。对于任何 0,1a ,定义 慒 的 a 截关系 12 ( , ) ( , ) ; , sS x y x y x y X S 是 X 上的经典等价关系。根据 S 得到 X 的一种聚类 ,称为在 a 水平上的聚类。即对于 X 中的任意两个元素 x 和 y ,若 ( , )s ,则 x 和 y 属于同一类;否则 x 和 y 不属于同一类。 应用这种方法 ,分类的结果与 a 的取值大小有关。 a 取值越大 ,分的类数越多。 a 小到某一值时 ,X 中的所有样本归并为一类。这种方法的优点 在于可按实际需要选取 a 的值,以便得到恰当的分类。 系统聚类法的步骤如下: 用数字描述样本的特征。设被聚类的样本集为 12 , , , nX x x x 。每个样本均有 记作1( , , ) 1 , 2 , ,i i X i n ; 示描述样本 第 p 个特征的数。 规定样本之间的相似系数 ( 0 1; , 1 , , )ij r i j n 。 述样本 间的差异或相似的程度 。 接近于 1,表明样本 间的差异越小 ;接近于 0,表明 用主观评定或集体评分的方法规定,也可用公式计算,如采用夹角余弦法、最小最大法、算术平均最小法等。 因为 1( 自身没有差异 ), ij ( 间的差异等同于 间的差异 ),所以由 ( , 1 )i j n , , 可得 X 上的模糊相似关系: 1212 , ( ; ) R s Q Q s TR s s T 一般, R 不具备可传 递性,因而 R 不一定是 X 上的模糊等价关系。 运用合成运算 2R R R 求出最接近相似关系 R 的模糊等价关系 2。若 R 已是模糊等价关系,则取 。 选取适当水平 (0 1) ,得到 X 的一种聚类。 逐步聚类法 逐步聚类法是一种基于模糊划分的模糊聚类分析法。它是预先确定好待分类的样本应分成几类,然后按最优化原则进行再分类,经多次迭代直到分类比较合理为止。 在分类过程中可认为某个样本以某一隶属度隶属于某一类,又以另一隶属度隶属于另一类。这样,样本就不是明确地属于或不属于某一类。若样本集有 n 个样本要分成 c 类,则它的模糊划分矩阵为 : 40401 l n ( 1 ) 此 模 糊 划 分 矩 阵 有 下 列 特 性 : 0 , 1 ; 1 , , ; 1 , ,u i j i c j n 。 13 10 , 1 , ,n i c 即每一样本属于各类的隶属度之和为 1。 11 , 1 , ,c j n 即每一类模糊子集都不是空集。 模糊划分矩阵有无穷多个,这种模糊划分矩阵的全体称为模糊划分空间。最优分类的标准是样本与 聚类中心的距离平方和最小。因为一个样本是按不同的隶属度属 于各类的,所以应同时考虑它与每一类的聚类中心的距离。逐步聚类法需要反复迭代计算,计算工作量很大,要在电子计算机上进行。算出最优模糊划分矩阵后,还必须求得相应的常规划分。此时可将得到的聚类中心存在计算机中,将样本重新逐个输入,去与每个聚类中心进行比较,与哪个聚类中心最接近就属于哪一类。 型的具体算法步骤 (1) 确定需要处理的样本对象 , 抽取因素数据 根据需要处理的样本对象指标项目 , 设有待处理的 n 个样本 的组成集合12 , , , nA x x x , 每个样本用 m 个指标特征值向量表示 , 即 12 , , , j j j m jA x x x , 则可用下列 阶特征值矩阵对需要处理的样本对象进行聚类 : 1 1 1 2 12 1 2 2 212m m nx x xx x x x(2) 建立模糊相似关系 在建立模糊相似矩阵的过程中 , 由于各个属性指标特征值物理量的量纲不同 , 为了避免大数吃小数的现象 , 在进行聚类时首先要消 除属性指标特征值物理量纲的影响 , 使属性指标特征值规格化 , 规格化数在区间 0,1 范围内 。 采用何种类型的规格化公式 ,可根据实际情况而定 。 在本文中模糊相似矩阵的建立采用最大最小法建立 , 该方法如下 : 11()()ik x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论