




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、机器学习和迁移学习,Machine Learning,制作者,2015年5月7日,机器学习和迁移学习,2,目录,1,2,3,4,机器学习,常见算法,集成方法,迁移学习,机器学习和迁移学习,3,1.机器学习,1.1 概念简介,机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。 由于机器学习是人工智能的一个核心领域,所以也有如下定义:“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性
2、能,机器学习和迁移学习,4,1.机器学习,1.2 分类,1)监督学习:从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。 (2)无监督学习:与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法为聚类。 (3)半监督学习:介于监督学习与无监督学习之间,如迁移学习。 (4)增强学习:通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断,机器学习和迁移学习,5,2.常见算法,2.1
3、简介,分类算法:最近邻居法、朴素贝叶斯、决策树、人工神经网络、支持向量机等。 聚类算法:K均值、DBSCAN算法、EM算法、模糊C均值、SOM(自组织映射)等,机器学习和迁移学习,6,2.常见算法,2.2 决策树(C4.5,机器学习和迁移学习,7,2.常见算法,2.2 决策树(C4.5,相亲决策树,机器学习和迁移学习,8,2.常见算法,2.3 支持向量机(SVM,机器学习和迁移学习,9,2.常见算法,2.3 支持向量机(SVM,机器学习和迁移学习,10,3.集成方法,3.1 概念简介,集成方法(ensemble)是机器学习领域中用来提升分类算法准确率的技术,主要包括Bagging和Boosti
4、ng即装袋和提升。前面介绍的决策树、朴素贝叶斯等均属于弱分类器,通过集成方法可以将不同的弱分类器组合起来,构造强分类器。比较有代表性的集成方法有:AdaBoost、随机森林(RandomForest)等,机器学习和迁移学习,11,3.集成方法,3.2 AdaBoost算法,1)在没有先验知识的情况下,初始的分布为等概分布,也就是训练集如果有n个样本,每个样本的分布概率为1/n,并设置迭代次数m。 (2)每次训练后得到一个基分类器,并根据准确率计算其权值。接着提高错误样本的分布概率,即让分类错误的样本在训练集中的权重增大,分类正确的样本权重减小,使得下一次训练的基分类器能集中力量对这些错误样本进
5、行判断。 (3)最后通过级联m个基分类器形成一个强分类器,机器学习和迁移学习,12,4.迁移学习,在传统分类学习中,为了保证训练得到的分类模型具有准确性和高可靠性,都有两个基本的假设: (1)用于学习的训练样本与新的测试样本满足独立同分布的条件; (2)必须有足够可利用的训练样本才能学习得到一个好的分类模型。 但是,在实际应用中我们发现,这两个条件往往无法满足。于是乎,迁移学 习应运而生。迁移学习,是一种运用已存有的知识对不同但相关领域的问题 进行求解的新的机器学习方法,4.1 概念简介,机器学习和迁移学习,13,4.迁移学习,针对源领域和目标领域样本是否标注以及任务是否相同,可以把迁移学习划
6、分为: 1、归纳迁移学习 2、直推式迁移学习 3、无监督迁移学习 而按照迁移学习方法采用的技术划分,又可以把迁移学习方法大体上分为: 1、基于特征选择的迁移学习算法研究 2、基于特征映射的迁移学习算法研究 3、基于权重的迁移学习算法研究,4.2 分类,机器学习和迁移学习,14,4.迁移学习,TrAdaBoost算法的目标就是从辅助的源数据中找出那些适合测试数据的实例,并把这些适合的实例迁移到目标领域中少量有标签样本的学习中去。该算法的关键思想是利用Boosting技术过滤掉源领域数据中那些与目标领域中少量有标签样本最不像的样本数据。 在TrAdaBoost算法中,AdaBoost被用于在目标领
7、域里少量有标签的样本中,以保证分类模型在目标领域数据上的准确性;而Hedge( )被用在源领域数据上,用于自动调节源领域数据的重要度,4.3 TrAdaBoost算法,机器学习和迁移学习,15,4.迁移学习,4.3 TrAdaBoost算法机制,训练数据,源训练数据,辅助训 练数据,基本分类器,AdaBoost,Hedge(,机器学习和迁移学习,16,4.迁移学习,4.4 TrAdaBoost算法示意图,机器学习和迁移学习,17,4.迁移学习,4.5 TrAdaBoost算法描述,输入:两个训练数据集 和 (训练数据集 ),一个基本分类算法以及迭代次数N。 初始化: 1. 初始化权重向量 ,各个元素均为1 。 For 1. 设置 满足: 2. 调用基本分类器,根据合并后的训练数据 以及 上的权重分布 ,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国游戏本地化翻译人才缺口分析与培养建议报告
- 利尿剂治疗心衰的应用与探讨
- 2025-2030中国智能交通信号优化算法与应用效果评估报告
- 罕溺水急救知识培训内容课件
- 高校与地方旅游开发合作协议范文
- 五年级数学(小数乘除法)计算题专项练习及答案
- 教师助理辞职报告范文
- 远程播放课件不显示问题
- 爆破工程业绩管理办法
- 物资计量配送管理办法
- 主题阅读1:大自然的文字
- 电梯周期日常维护保养项目表
- 工程项目进度管理-课件
- (中职中专)二维动画设计软件应用完整版课件汇总全书电子教案(最新)
- 国际贸易理论与实务ppt课件(完整版)
- GB∕T 6546-2021 瓦楞纸板边压强度的测定
- 历史选择性必修1 国家制度与社会治理(思考点学思之窗问题探究)参考答案
- 学前儿童发展心理学(第3版-张永红)教学课件1754
- 医学资料冠心病英文版
- 部编人教版九年级语文上册教学计划及教学进度表
- 干法——稻盛和夫
评论
0/150
提交评论