




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 判别分析法 2011 05 05 管理研究方法论 2 Contents 3 1判别分析法的简介 4 1 1引言 与聚类法的异同 相同点 分类学是人类认识世界的基础科学 聚类分析和判别分析是研究事物分类的基本方法 广泛地应用于自然科学 社会科学 工农业生产的各个领域 聚类分析是根据事物本身的特性研究个体分类的方法 判别分析是根据表明事物特点的变量值和它们所属的类 求出判别函数 根据判别函数对未知所属类别的事物进行分类的一种分析方法 5 1 1引言 与聚类法的异同 不同点 判别分析和聚类分析主要不同点就是 在聚类分析中一般人们事先并不知道或一定要明确应该分成几类 完全根据数据来确定 而在判别分析中 至少有一个已经明确知道类别的 训练样本 利用这个数据 就可以建立判别准则 并通过预测变量来为未知类别的观测值进行判别了 6 1 1引言 与聚类法的异同 举例 物以类聚 人以群分 有一些昆虫的性别很难看出 只有通过解剖才能够判别 但是雄性和雌性昆虫在若干体表度量上有些综合的差异 于是统计学家就根据已知雌雄的昆虫体表度量 这些用作度量的变量亦称为预测变量 得到一个标准 并且利用这个标准来判别其他未知性别的昆虫 这样的判别虽然不能保证百分之百准确 但至少大部分判别都是对的 而且用不着杀死昆虫来进行判别了 7 1 2判别分析法的概念 判别分析 DiscriminatoryAnalysis 产生于20世纪30年代 是一种统计方法 其是利用已知类别的样本建立判别模型 以判别未知类别的样本 在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断 如动物学家对动物如何分类的研究和某个动物属于哪一类 目 纲的判断 近年来 判别分析在自然科学 社会学及经济管理学科中都有广泛的应用 8 1 2判别分析法的概念 判别分析的特点是根据已掌握的 历史上每个类别的若干样本的数据信息 总结出客观事物分类的规律性 建立判别公式和判别准则 当遇到新的样本点时 只要根据总结出来的判别公式和判别准则 就能判别该样本点所属的类别 判别分析的任务是根据已掌握的 批分类明确的样品 建立较好的判别函数 使产生错判的事例最少 进而对给定的1个新样品 判断它来自哪个总体 9 1 3判别分析法的分类及概要 判别分析按照判别的组数来区分 可以分为两组判别分析和多组判别分析 按照判别准则中含有的变量个数 可以分为一元判别分析和多元判别分析 根据资料的性质 分为定性资料的判别分析和定量资料的判别分析 根据数据的概率分布 分为参数方法和非参数方法 采用不同的判别准则 又有费歇 fisher 贝叶斯 BAYES 距离等判别方法 还有全模型判别法和逐步判别法 10 1 3判别分析法的分类及概要 距离判别思想 不用投影 是根据各样品与各母体之间的距离远近作出判别 即根据资料建立关于各母体的距离判别函数式 将各样品数据逐一代入计算 得出各样品与各母体之间的距离值 判样品属于距离值最小的那个母体 费歇 fisher 判别思想是投影 使多维问题简化为一维问题来处理 选择一个适当的投影轴 使所有的样品点都投影到这个轴上得到一个投影值 对这个投影轴的方向的要求是 使每一类内的投影值所形成的类内间离差尽可能小 而不同类间的投影值所形成的类间离差尽可能大 解析辅助图 11 1 3判别分析法的分类及概要 贝叶斯 BAYES 判别思想是根据先验概率求出后验概率 并依据后验概率分布作出统计推断 所谓先验概率 就是用概率来描述人们事先对所研究的对象的认识的程度 所谓后验概率 就是根据具体资料 先验概率 特定的判别规则所计算出来的概率 它是对先验概率修正后的结果 12 1 3判别分析法的分类及概要 逐步判别法 仅仅是在前面的方法中加入变量选择的功能 有时 一些变量对于判别并没有什么作用 为了得到对判别最合适的变量 可以使用逐步判别 也就是 一边判别 一边引进判别能力最强的变量 这个过程可以有进有出 一个变量的判别能力的判断方法有很多种 主要利用各种检验 例如Wilks Lambda Rao sV TheSquaredMahalanobisDistance SmallestFratio或TheSumofUnexplainedVariations等检验 13 1 4判别分析法的应用步骤 使用spss软件我们应用spss软件来建立判别分析模型 其过程为 对于分为k组的研究对象 可建立k 1个典型判别函数 原始自变量的线性组合 和k个fisher线性判别函数 然后将各样本的自变量回代到判别函数中 计算其判别分数或者属于各组的概率 根据数值的大小判别样本所属组别 对比样本的原始组别给出错分率 14 1 4判别分析法的应用步骤 具体步骤如下 1 选择自变量和组变量 2 计算各组单变量描述统计量 包括组内均值 组内标准差 总均值 总标准差 各组协方差矩阵 组间相关矩阵 并对组间均值相等及协方差矩阵相等的零假设进行检验 3 推导判别系数 给出标准或未标准化的典型判别函数系数 并对函数显著性进行检验 15 1 4判别分析法的应用步骤 4 建立fisher线性判别模型 5 按照一定的规则进行分组 6 进行样本回判分析 计算错分率 7 输出结果 8 结合实际情况进行分析 16 1 5判别分析法的计算简析 以参数和非参数方法为例 简要分析按照BAYES原理构造判别函数的计算过程 参数方法假定每个类的观测来自 多元 正态分布总体 各类的分布的均值 中心 可以不同 非参数方法不要求知道各类所来自总体的分布 它对每一类使用非参数方法估计该类的分布密度 然后据此建立判别规则 见word文件 17 1 5判别分析法的计算简析 参数方法的判别规则为 先决定是使用合并协方差阵还是单个类的协方差阵 计算x到各组的广义距离 把x判入最近的组 或者计算x属于各组的后验概率 把x判入后验概率最大的组 如果x的最大的后验概率都很小 小于一个给定的界限 则把它判入其它组 非参数判别方法仍使用BAYES后验概率密度的大小来进行判别 但这时第t组在x处的密度值ft x 不再具有参数形式 不象参数方法那样可以用mt和St 或St 表示出来 非参数方法用核方法或最近邻方法来估计概率密度ft x 18 1 6应用的范围及条件 范围判别分析又称 分辨法 是在分类确定的条件下 根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法 在气候分类 农业区划 土地类型划分中有着广泛的应用 在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断 近年来 判别分析在自然科学 社会学及经济管理学科中都有广泛的应用 19 1 6应用的范围及条件 条件构建判别函数前有足够多的统计数据 训练样本 训练样本中必须有所有要判别的类型 样本分类必须清楚 不能有混杂 要求前期判别数据量要大并且可靠 选择可能有用的 适宜的预测变量 选择适宜的判别函数模型及计算方法 20 2典型论文介绍 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 钩针套件编织工艺考核试卷及答案
- 催化裂化工工艺考核试卷及答案
- 电机转子噪声检测设备选型工艺考核试卷及答案
- 酸洗钝化工专业技能考核试卷及答案
- 海藻胶提取工技术考核试卷及答案
- 服务心理学(第四版)课件 项目四 任务二 激发消费动机
- 银行转型面试题及答案
- 儿科中级专业试题及答案
- 药学面试专业试题及答案
- 河南省濮阳市华龙区濮阳第一高级中学2025-2026学年高二上学期开学摸底检测生物试卷(含答案)
- 2025年湖南省长沙市开福区财政局招聘历年高频重点提升(共500题)附带答案详解
- DB31∕638-2020 铸钢件单位产品能源消耗限额
- 公安食堂采购合同范例
- 3.1生活在新型民主国家-(教学设计) 2024-2025学年统编版道德与法治九年级上册
- 针刺伤预防与处理-2024中华护理学会团体标准
- 急诊专科护士进修汇报课件
- 高速公路项目竣工决算审计服务投标方案(技术方案)
- 科研项目管理
- 2024-2025学年辽宁省点石联考高三(上)段考数学试卷(10月份)(含答案)
- 基于机器视觉的智能工业物料分拣系统设计研究
- 《计算机制图-中望CAD 2023》中职全套教学课件
评论
0/150
提交评论