版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、应用多元统计分析,第六章部分习题解答,2,第六章 聚类分析,6-1 证明下列结论: (1) 两个距离的和所组成的函数仍是距离; (2) 一个正常数乘上一个距离所组成的函数仍是距离; (3)设d为一个距离,c0为常数,则 仍是一个距离; (4) 两个距离的乘积所组成的函数不一定是距离;,3,第六章 聚类分析,(2) 设d是距离,a 0为正常数.令d*=ad,显然有,4,第六章 聚类分析,故d*=ad是一个距离. (3) 设d为一个距离,c0为常数,显然有,5,第六章 聚类分析,故d*是一个距离.,6,第六章 聚类分析,7,第六章 聚类分析,6-2 试证明二值变量的相关系数为(6.2.2)式,夹角
2、余弦为(6.2.3)式.,证明:设变量Xi和Xj是二值变量,它们的n次观测值记为xti, xtj (t=1,n). xti, xtj 的值或为0,或为1.由二值变量的列联表(表6.5)可知:变量Xi取值1的观测次数为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的观测次数为a,取值均为0的观测次数为d 等等。利用两定量变量相关系数的公式:,8,第六章 聚类分析,9,第六章 聚类分析,故二值变量的相关系数为:,(6.2.2),10,第六章 聚类分析,利用两定量变量夹角余弦的公式:,其中,故有,11,第六章 聚类分析,6-3 下面是5个样品两两间的距离阵,试用最长距离法、类平均法作系统
3、聚类,并画出谱系聚类图. 解:用最长距离法: 合并X(1),X(4)=CL4, 并类距离 D1=1.,12,第六章 聚类分析, 合并X(2),X(5)=CL3,并类距离 D2=3., 合并CL3,CL4=CL2,并类距离 D3=8., 所有样品合并为一类CL1,并类距离 D4=10.,13,第六章 聚类分析,最长距离法的谱系聚类图如下:,14,第六章 聚类分析, 合并X(1),X(4)=CL4,并类距离 D1=1.,用类平均法:,15,第六章 聚类分析, 合并X(2),X(5)=CL3,并类距离 D2=3., 合并CL3,CL4=CL2,并类距离 D3=(165/4)1/2., 所有样品合并为
4、一类CL1,并类距离 D4=(121/2)1/2.,16,第六章 聚类分析,类平均法的谱系聚类图如下:,17,第六章 聚类分析,6-4 利用距离平方的递推公式,来证明当0,p0,q0,p+q+1时,系统聚类中的类平均法、可变类平均法、可变法、Ward法的单调性.,证明:设第L次合并Gp和Gq为新类Gr后,并类距离DL Dpq,且必有Dpq2Dij2 . 新类Gr与其它类Gk的距离平方的递推公式 ,当0,p0,q0, p+q+ 1 时,这表明新的距离矩阵中类间的距离均 Dpq DL ,故有DL1 DL ,即相应的聚类法有单调性.,18,第六章 聚类分析,对于类平均法,因,故类平均法具有单调性。
5、对于可变类平均法,因,故可变类平均法具有单调性。,19,第六章 聚类分析,对于可变法,因,故可变法具有单调性。 对于离差平方和法,因,故离差平方和法具有单调性。,20,第六章 聚类分析,6-5 试从定义直接证明最长和最短距离法的单调性. 证明:先考虑最短距离法: 设第L步从类间距离矩阵 出发,假设,故合并Gp和Gq为一新类Gr,这时第L步的并类距离:,且新类Gr与其它类Gk的距离由递推公式可知,设第L+1步从类间距离矩阵 出发,,21,第六章 聚类分析,故第L1步的并类距离:,即最短距离法具有单调性. 类似地,可以证明最长距离法也具有单调性.,22,第六章 聚类分析,6-6 设A,B,C为平面
6、上三个点,它们之间的距离为,将三个点看成三个二维样品,试用此例说明中间距离法和重心法不具有单调性.,解:按中间距离法,取=-1/4,将B和C合并为一类后,并类距离D1=1,而A与新类Gr=B,C的类间平方距离为,23,第六章 聚类分析,故中间距离法不具有单调性。 按重心法,将B和C合并为一类后,并类距离D1=1,而A与新类Gr=B,C的类间平方距离为,当把A与B,C并为一类时,并类距离,24,第六章 聚类分析,故重心法法不具有单调性。 并类过程如下:,当把A与B,C并为一类时,并类距离,A,B,C,25,第六章 聚类分析,解一: 利用 如果样品间的距离定义为欧氏距离,则有,6-7 试推导重心法
7、的距离递推公式(6.3.2);,26,第六章 聚类分析,27,第六章 聚类分析,28,第六章 聚类分析,解二:因样品间的距离定义为欧氏距离,利用,29,第六章 聚类分析,利用,30,第六章 聚类分析,故有,31,第六章 聚类分析,6-8 试推导Ward法的距离递推公式(6.3.3);,解:Ward法把两类合并后增加的离差平方和看成类间的平方距离,即把类Gp和Gq的平方距离定义为,利用Wr的定义:,32,第六章 聚类分析,33,第六章 聚类分析,34,第六章 聚类分析,(当样品间的距离定义为欧氏距离时),记GrGp,Gq,则新类Gr与其它类Gk的平方距离为,利用重心法的递推公式(6-7题已证明)
8、可得:,35,第六章 聚类分析,36,第六章 聚类分析,6-9 设有5个样品,对每个样品考察一个指标得数据为1,2,5,7,10.试用离差平方和法求5个样品分为k类(k5,4,3,2,1)的分类法bk及相应的总离差平方和W(k).,解:计算样品间的欧氏平方距离阵, 合并 1,2 CL4,并类距离D1=(0.5)1/2 =0.707 ,并利用递推公式计算新类与其它类的平方距离得,37,第六章 聚类分析,合并 5,7 CL3,并类距离D2=(2)1/2 =1.414 ,并利用递推公式计算新类与其它类的平方距离得, 合并 CL3,10=5,7,10 CL2,并类距离D3=(32/3)1/2 =3.266 ,并利用递推
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 统计与成对数据的统计分析课件-2026届高三数学二轮复习
- 海南护师考试试题及答案
- 2026年湖南中考试卷及答案英语
- 2026三年级数学上册 乘法解决问题
- 2026三年级数学上册 测量的实际操作
- 保安员岗位责任制度
- 中国水利知识试题及答案
- 企业园区保安岗位制度
- 人福危险辨识与风险评价、控制制度
- 小组讨论奖惩制度及细则
- 山东高考英语语法单选题100道及答案
- 职业道德与法治知识点总结中职高教版
- 2025年绿色低碳先进技术示范工程实施方案-概述及范文模板
- 2025上半年广西现代物流集团社会招聘校园招聘149人笔试参考题库附带答案详解
- 事故后企业如何进行危机公关与赔偿管理
- 2025年春新人教PEP版英语三年级下册全册教案
- OptixOSN3500智能光传输设备业务配置手册
- 【浙科综合实践】四上第四课项目一、美味的中秋月饼
- 深圳大学《算法设计与分析》2021-2022学年期末试卷
- 西泠印社三年级下册书法教案
- 大客户经理招聘笔试题及解答
评论
0/150
提交评论