




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、 实验题目:判别分析二、 实验内容:距离判别分析最常见的距离是欧氏距离,但在判别分析中直接采用欧氏距离是不慎合适的其原因是没有考虑总体分布的分散性信息。判别分析中通常采用马氏距离进行距离判别。设是两个不同的维已知总体,的均值,设是一个待判样品,距离判别准则为 两个总体的距离判别1总体协方差相等的情况考虑则有,其中 所以距离判别准则为如下线性判别函数: 在实际问题中通常是未知的,所具有的数据只是来自两个维总体的样本观测值,称为训练样本。设是来自总体的训练样本,是来自总体的训练样本,这时采用训练样本估计。其中为各样本训练均值,即 又两个训练样本的协方差矩阵各为当时,的一个联合估计为2总体协方差相等的情况令距离判别准则为如下二次判别函数: 在实际应用中往往未知,仍然可用各总体的训练样本进行估计。(二)多个总体的距离判别设有个总体,均值向量分别为,协方差分别为。类似两个总体距离判别方法,计算新样品到各总体的马氏距离,比较这些距离,判定属于其马氏距离最小的那个总体。1.总体协方差矩阵相等:对任意两个总体,到的马氏距离差为:,其中 显然,这样,得到如下多总体协方差矩阵相等时距离的判别准则:若总体满足 ,则判定2.总体协方差矩阵不全相等计算:记于是得到多总体距离判别法则:若,则判定Bayes判别距离判别不涉及总体的分布类型,它简单直观,但存在明显的缺点:没有考虑各总体出现的先验概率大小及错判后造成的损失。为了解决这一问题,产生了Bayes判别。Bayes判别的思想是:假定对各总体已有一定的认识,常用先验概率分布来描述这种认识,然后利用收取到的观测样本,修正已有的认识,得到后验概率分布进行判别分析。先验概率分布是先于抽样之前对于总体的认识。设有个总体,各总体出现的先验概率分别为且,总体的这种分布称为先验概率分布。确定它的常用方法有三种:(1) 直接假定各总体出现的概率相等,即;(2) 以训练样品占全部样品的比例作为的值,即;(3) 利用历史资料及经验来估计,例如,地震预报中需要判断有震还是无震,显然选取的要比小得多。当我们抽取样品x,利用Bayes定理可计算出它取自于第i各总体的后验概率:这里为第i个总体的p维密度函数。在假定错判损失均相等的条件下Bayes判别采用后验概率最大的原则。判别准则为若,对一切即x属于后验概率最大的那个总体。这里的错判损失,是指当样品实际属于总体而误判为的损失。 在应用Bayes判别时,通常假定各总体服从p维正态分布。此时后验概率为 其中是x到总体的广义平方距离。根据Bayes判别原则,利用的表达式,可以得到Bayes判别的判别函数与具体的判别准则。判别函数为判别准则为若对一切特别地,当时,判别函数可取为为x的线性函数,为判别系数, 具体计算时,未知叁数和V的估计与距离判别是完全一样的,由于不易确定,通常总是假定它们总相等。Bayes判别法充分利用了先验信息,又考虑了错判造成的影响,同时判别函数形式简单,因此成为广泛应用的一种方法。1、 误判率回代估计法设为两个总体,与是分别来自和的训练样本,其容量分别是与。以全体训练样本为个新样品,逐个代入已建立的判别准则中判别其归属,这个过程称为回判。回判结果作如下列表: 回判情况实际归类 其中是将属于的样品误判为属于的个数,是将属于的样品误判为属于的个数,总的误判个数是+,而两总体训练样本的总数是,误判率的回代估计为 误判率的回代估计易于计算,但是是由建立判别函数的数据反过来用作评估准则的数据而得到的,因此,往往比真实误判率小,当训练样本容量较大时,可以作为真实误判率的一种近似估计。 2.误判率的交叉确认估计法 误判率的交叉确认估计是每次剔除训练样本中的一个样品,利用其与容量为的训练样本建立相应判别准则,在用所建立的判别准则对剔除的那个样品作判别。对训练样本中的每个样品作上述分析,以其误判的比例作为误概率的估计。具体步骤如下:(1) 从总体的容量为的训练样本开始,依次剔除其中的一个样品,用剩余的容量为的训练样本和总体的容量为的训练样本建立相应的判别函数。(2) 用建立的判别函数对剔除的那个样本作判别。(3) 重复(1)和(2),直到的训练样本中的个样品依次被剔除,又依次进行判别,起误判的样品个数记为。(4) 对总体的训练样本重复步骤(1),(2)与(3)。并记其误判的样品个数为,以 作为误判率的估计。 此估计误判率的方法称为交叉确认估计法,所得到的估计称为误判了的交叉确认估计。此方法较回代估计法更合理,但计算量较大。调查了15个公司的组织文化、领导角色和员工发展3个方面内容作为预测变量,因变量为公司对员工的吸引力。为符合研究问题,将公司对员工的吸引力根据被测的实际填答情形,划分为高吸引力组(group=1)、中吸引力组(group=2)和低吸引力组(group=3)。数据表如下所示:三、操作步骤: 步骤 1 在”Analyze”菜单的”Classify”子菜单中选择”Discriminant”命令,如图 步骤 2 在弹出的”Discriminant”对话框中,从左侧的变量列表中选择“组织文化”、“领导角色”、“员工发展”变量,使之添加到”Independents”框中。 步骤 3 选择”group”变量使之添加到”Grouping Variable”框中。这时”Grouping Variable”框下的”Define Range”按钮变为可用,单击该按钮,弹出”discriminant Analysis: Define”对话框,输入最小值为1,最大值为3,单击”Continue”按钮返回。 步骤 4 选择判别分析的方式,单击”Method”按钮,弹出选择对话框,选择一种方式并单击”Continue”按钮,返回,选择”Enter independent together”选项。 步骤 5 单击”Statistics”按钮,弹出”Discriminant Analysis: Statistics”对话框选中”descriptives”框中各项,选中”Function Coefficients”框中的”Fishers”项,选中”Matrices”框中各项,单击”Continue”按钮,返回”Discriminant Analysis”对话框。 步骤 6 指定分类结果摘要。单击”Discriminant Analysis”对话框中的”Classify”按钮,弹出”Discriminat Analysis: Classification”对话框,选择”Prior Probabilities”框中的”All groups equal”项,”Display”框中的”Casewiseresults”和”Summary table”项,”Use Covariance Matrix”框中的”Within-groups”项,”Plots”框中的”Combined groups”项。单击”Continue”按钮,返回到”Discriminant Analysis”对话框。 步骤 7 保存判别分析结果。单击“Discriminat Analysis”对话框中的”Save”按钮,弹出”Discriminant Analysis: Save”选择其中的”Predicted group membership”项,单击”Continue”按钮 步骤 8 单击”Discriminant Analysis”对话框中的”OK”按钮,完成。 四、结果分析:组别的统计信息,分组给出各组中变量的均数与标准差 平均数差异型该表格是组内3个变量的相关性和方差矩阵。从相关性看,3个变量之间的独立性不太理想。该表格是两个判别函数的标准化系数,由此可以得到两个判别函数分别是:第一个判别函数D1=-0.550组织文化+0.827领导角色+(-0.062)员工发展第二个判别函数D2=0.726组织文化+0.373领导角色+0.399员工发展从中可以看出,组织文化和第二个判别式关系密切,领导角色和第一个判别函数关系密切,员工发展和第二个判别式关系密切。这是两个典型判别函数中各个个案上的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保健知识培训开头课件
- 企业节前安全培训检查表课件
- 企业的安全管理培训文件课件
- 烟草执法徽章管理办法
- 物业项目督查管理办法
- 新质生产力发展新动能
- 2025年全国中级导游等级考试(汉语言文学知识)自测试题及答案
- 2025年全民实践乡村振兴战略知识竞赛题库及含答案
- 出租车驾驶员培训教学课件
- 出租房安全知识培训课件
- 2025年城市燃气储气罐采购安装与运营维护服务合同范本
- 2025年国家公务员考录《行测》真题及参考答案
- 艾滋病科普宣传课件
- 江苏省淮阴县2025年上半年公开招聘村务工作者试题含答案分析
- 心脏解剖课件模板
- 中国系统性红斑狼疮诊疗指南(2025版)解读
- 2025年湖北城市建设专业国土空间规划高、中级职务水平能力测试(城乡规划)历年参考题库含答案详解(5卷)
- 2025-2026学年冀教版(2024)小学数学一年级上册教学计划及进度表
- 2025年福建省机关事业单位工勤人员技能等级考试(财务会计员·技师)历年参考题库含答案详解(5套)
- 2025年全国通信专业技术人员职业水平考试(通信专业实务·初级)历年参考题库含答案详解(5套)
- 2025年国企财务招聘笔试题和答案(基础知识测试题)
评论
0/150
提交评论