版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、流形学习的理论和方法,主要内容,研究背景 几种算法 研究方向,研究背景,数据降维的目的是找出高维数据中所隐藏的低维结构。 高维数据: 低维数据: 分类 线性降维 非线性降维,研究背景,线性降维 通过降维得到的低维数据能够保持高维数据点之间的线性关系,即:若存在线性映射 使得 ,则这个高维数据点从降到低维的过程为线性降维。 两种算法 PCA MDS 非线性降维 KPCA 流形学习,流形学习,2000年,J B Tenenbaum等,A global geometric framework for nonlinear dimensionality reduction,Science,(Isomei
2、tric Mapping ,简称Isomap ) 2000年,S T Roweis等,Nonlinear dimensionality reduction by locally linear embedding,Science,(Locally Linear Embedding ,简称LLE ) 2000年, H S Seung等,Nonlinear dimensioinality reduction by locally linear embedding,Science,流形学习,基本思想:每个高维空间内的流形都有一个低维空间内的流形与之对应,只要找出一个光滑映射,就可以把高维原数据映射成其
3、低维目标空间内的对应。 流形的本质是局部化,用数学语言说,就是一个局部可坐标化的拓扑空间。“局部坐标”可以将问题分解为局部问题进行计算,而拓扑空间又能保证将局部计算结果合理、光滑地拼接起来,揭示问题的整体结构。,流形学习的方法,ISOMAP LLE HLLE LE LTSA,主成分分析(PCA),将方差的大小作为衡量信息量的标准,方差越大提供信息越多,反之提供信息越少。 通过原分量的线性组合构造方差大、含信息量多的若干主分量,这些主分量之间不相关,并且尽可能表示原始变量包含的信息,选取最大的几个主成分进行分析,就可以在尽可能少损失原有信息的基础上,降低数据的维度,提高运算的效率。 计算过程通过
4、矩阵奇异值分解SVD来实现。,PCA数学模型,PCA算法,多维尺度变换(MDS),MDS也是一种广泛应用的线性降维方法。 MDS 原用于差异性的几何表示,用在降维上,是将高维点的欧氏距离矩阵作为差异性矩阵。,MDS数学模型,MDS算法,等距映射(Isomap ),Isomap 建立在MDS 的基础上,力求保持数据点的内在几何性质,即保持两点间的测地距离。 它同MDS 的最大区别在于,MDS 构造的距离矩阵反映的样本点之间的欧氏距离,而Isomap 构造的距离矩阵反映的是样本点之间的测地距离。 测地距离的近似计算方法如下:样本点 和它的邻域点之间的测地距离用它们之间的欧氏距离来代替;样本点 和它
5、邻域外的点用流形上它们之间的最短路径来代替。,局部线性嵌入(LLE),海赛局部线性嵌入(HLLE),拉普拉斯特阵映射(LE),局部切空间排列( LTSA ),研究方向,基本算法研究 内在维数研究 定量化研究 监督学习算法研究 范畴问题研究 其他 领域因子选择问题 数据流的流行学习 流行学习的统一框架,内在维数研究,PCA方法基于方差比来确定约简维数 ISOMAP利用方差损失形成的拐点估计维数 其他 最近邻域 分形维 Packing Numbers 测地线最小生成树,基于Packing Numbers的内在维数研究,定量化研究,高维数据集的内在维数如何影响高维空间的流形结构?没有一般性研究 张军
6、平局部放大因子和延伸方向判别流行学习算法准确性的一种定量评估准则 放大因子,就是观测空间的数据点变化趋势与在嵌入空间的变化趋势的比值,这个比值在连续模型中相当于在降维的映射下,一个高维空间映射到低维空间后的“体积”比的比例微分几何中的”微观”放大因子Bishop的生成式拓扑映射 延伸方向,就是指嵌入空间的局部数据变化的主要方向,放大因子,放大因子,延伸方向,其他研究方向,领域因子选择问题 Kouropteva等,2002,为LLE自动选择领域因子 Samko等,2004,Selection of the optimal parameter value for the Isomap algorithm,为Isomap自动选择领域因子 Wang Jing, Zhang Zhenyue, Zha Hongyuan. Adaptive Manifold Learning,2004,在每个样本点上自适应地选择领域因子 张军平,通过集成的方式来改进流形学习产生的不稳定性 数据流的流
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国企招标采购制度
- 药企医疗采购管理制度
- 敬老院餐厅采购制度
- 危化品采购检查验收制度
- 事业采购单位验收制度
- 药物采购管控制度
- 招标采购防控追责制度
- 采购管理验收制度
- 采购部门6s管理制度
- 采购采购材料管理制度
- 《肾功能及尿液检查》课件
- 中国石油企业文化课件
- 电力工程建设资源投入计划
- 生物批签发管理办法
- 《酒店法律与法规实务》全套教学课件
- 高分子化学教材第七章逐步聚合反应
- 项目经理负责制与项目管理实施办法
- 2025年陕西省西安市碑林区西北工大附中中考数学三模试卷
- T-CASMES 428-2024 商业卫星太阳电池阵通.用规范
- 内蒙古机电职业技术学院单独招生(机电类)考试题(附答案)
- 应急疏散通道与标识设置
评论
0/150
提交评论