




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据分析与R语言 第9周2012.7.20DATAGURU专业数据分析支持向量机 SVMn 问题的提出:最优分离平面(决策边界)2012.7.202DATAGURU专业数据分析优化目标n 决策边界边缘距离最远2012.7.203DATAGURU专业数据分析数学模型2012.7.204DATAGURU专业数据分析问题转化为凸优化2012.7.205DATAGURU专业数据分析乘子法未知数太多2012.7.206DATAGURU专业数据分析KKT变换和对偶公式2012.7.207DATAGURU专业数据分析问题的解决和神经化n 对偶公式是二次n 大部分的问题,有现成的数值方法可以求解乘子为0,不为
2、0的对应于“支持向量”(恰好在边界上的样本点)n 只要支持向量不变,修改其他样本点的值,不影响结果,当支持变量发生改变时,结果一般就会变化n 求解出乘子后,可以推出w和b,判别函数可以写成以下神经的样式2012.7.208DATAGURU专业数据分析支持向量机神经2012.7.209DATAGURU专业数据分析聚类聚类和分类判别有什么区别?2012.7.2010DATAGURU专业数据分析关键度量指标:距离n 距离的定义n 常用距离( 绝对值距离距离P469)闵可夫距离切比雪夫距离马氏距离Lance和Williams距离离散变量的距离计算2012.7.2011DATAGURU专业数据分析dis
3、t( )函数x1=c(1,2,3,4,5)x2=c(3,2,1,4,6)x3=c(5,3,5,6,2)x=data.frame(x1,x2,x3)2012.7.2012DATAGURU专业数据分析dist( )函数2012.7.2013DATAGURU专业数据分析数据中心化与标准化变换n 目的:使到各个变量平等地发挥作用n scale( )函数n 极差化。 sweep( )函数(P473)2012.7.2014DATAGURU专业数据分析对变量进行分类的指标:相似系数n 距离:对样本进行分类n 相似系数:对变量进行分类n 常用相似系数:夹角余弦,相关系数(P475)2012.7.2015DAT
4、AGURU专业数据分析(凝聚的)层次聚类法n 思想1 开始时,每个样本各自作为一类2 规定某种度量作为样本之间的距离及类与类之间的距离,并计算之3 将距离最短的两个类合并为一个新类4 重复2-3,即不断合并最近的两个类,每次减少一个类,直至所有样本被合并为一类2012.7.2016DATAGURU专业数据分析各种类与类之间距离计算的方法P476nn 最短距离法n 最长距离法n 中间距离法n 类平均法n 重心法n 离差平方和法2012.7.2017DATAGURU专业数据分析hclust( )函数n 简单的例子(P480)2012.7.2018DATAGURU专业数据分析各种谱系图画法n as.
5、dendrogram( )函数(书P482)dend1<-as.dendrogram(hc1)opar <- par(mfrow = c(2, 2),mar = c(4,3,1,2) plot(dend1)plot(dend1, nodePar=list(pch = c(1,NA), cex=0.8, lab.cex=0.8),type = "t", center=TRUE)plot(dend1, edgePar=list(col = 1:2, lty = 2:3), dLeaf=1, edge.root = TRUE)plot(dend1, nodePar=list(pch = 2:1, cex=.4*2:1, col=2:3),horiz=TRUE) par(opar)2012.7.2019DATAGURU专业数据分析对变量进行聚类分析n 例子(P483)2012.7.2020DATAGURU专业数据分析分多少个类?n rect.hclus
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新生命如何诞生从受孕到分娩全过程详解(课件)
- 骨盆骨折护理常规
- 食物过敏的护理
- 囊状淋巴管瘤的临床护理
- 人力资源试用期转正工作总结模版
- 大学生职业规划大赛《市场营销专业》生涯发展展示
- 子宫肌病护理
- 妇科产科护理流程
- 原发性心脏淋巴瘤的临床护理
- 儿科安全用药及护理
- 构音运动治疗法文档
- 特应性皮炎的诊断与治疗课件
- 燃气工程设计及施工验收规范
- 第13课《卖油翁》教学设计 2022-2023学年部编版语文七年级下册
- 井下测量放线安全要求
- 2023国家电网作业安全风险管控典型生产作业风险定级库
- 乡村振兴与规划建设知到章节答案智慧树2023年同济大学
- 5、白莲河抽水蓄能电站引水工程施工组织设计
- (完整版)六年级数学毕业考试试卷及答案
- 煤矿安全规程(2022版)解读
- 部编版七年级下册《古代诗歌五首》 阅读鉴赏题 中考题汇总(背诵 含答案)
评论
0/150
提交评论