




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浅谈深度学习 DeepLearning 1 制作者 刘红敬专业 计算机技术 1 主要内容 2006年以来 机器学习领域中一个叫 深度学习 的课题开始受到学术界广泛关注 如今拥有大数据的互联网公司争相投入大量资源研发深度学习技术 一 机器学习二 为什么有Deeplearning Why 三 什么是Deeplearning What 四 怎么来的 五 Deeplearning与神经网络的异同 2 2 一 机器学习 机器学习 MachineLearning 是一门专门研究计算机怎样模拟或实现人类的学习行为 以获取新的知识或技能 重新组织已有的知识结构使之不断改善自身的性能的学科 简单的说 机器学习就是通过算法 使得机器能从大量的历史数据中学习规律 从而对新的样本做智能识别或预测未来 1959年美国的塞缪尔 Samuel 设计了一个下棋程序 这个程序具有学习能力 它可以在不断的对弈中改善自己的棋艺 4年后 这个程序战胜了设计者本人 又过了3年 这个程序战胜了美国一个保持8年之久的常胜不败的冠军 这个程序向人们展示了机器学习的能力 提出了许多令人深思的社会问题与哲学问题 这种程序水平达到一定程度很容易 但再进一步就不容易了 深蓝是90年代机器学习理论有了突破之后才出来的 3 3 二 Why 机器学习虽然发展了几十年 但还是存在很多没有良好解决的问题 例如以视觉感知为例 通过机器学习去解决这些问题的思路 InputFeatureRepresentationLearningAlgorithm手工选取特征不太好 那么能不能自动地学习一些特征呢 答案是能 DeepLearning就是用来干这个事情的 它有一个别名UnsupervisedFeatureLearning Why 答案 让机器自动学习良好的特征 而免去人工选取过程 4 4 三 What 深度学习是机器学习研究中的一个新的领域 其动机在于建立 模拟人脑进行分析学习的神经网络 它模仿人脑的机制来解释数据 例如图像 声音和文本 深度学习是无监督学习的一种 深度学习的概念源于人工神经网络的研究 含多隐层的多层感知器就是一种深度学习结构 深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征 以发现数据的分布式特征表示 5 5 四 怎么来的 从机器学习的模型结构层次来分 机器学习经历了两次浪潮 1 浅层学习 ShallowLearning 机器学习第一次浪潮2 深度学习 DeepLearning 机器学习第二次浪潮 6 6 1 浅层学习 20世纪80年代末期 由于人工神经网络的反向传播算法 BP算法 的发明 给机器学习带来了希望 掀起了基于统计模型的机器学习热潮 这个热潮一直持续到今天 基于统计的机器学习方法可以让一个人工神经网络模型从大量训练样本中学习统计规律 从而对未知事件做预测 这个时候的人工神经网络 虽也被称作多层感知机 Multi layerPerceptron 但实际是一种只含有一层隐层节点的浅层模型 7 7 1 浅层学习 20世纪90年代 各种各样的浅层机器学习模型相继被提出 例如支撑向量机 SVM Boosting 最大熵方法 LR 等 这些模型的结构基本上可以看成带有一层隐层节点 如SVM Boosting 或没有隐层节点 如LR 这些模型无论是在理论分析还是应用中都获得了巨大的成功 相比之下 由于理论分析的难度大 训练方法又需要很多经验和技巧 这个时期深度人工神经网络反而相对沉寂 8 8 2 深度学习 2006年 加拿大多伦多大学教授 机器学习领域的泰斗GeoffreyHinton等在 Science 上发表了一篇文章 1 开启了深度学习在学术界和工业界的浪潮 这篇文章有两个主要观点 1 多隐层的人工神经网络具有优异的特征学习能力 学习得到的特征对数据有更本质的刻画 从而有利于可视化或分类 2 深度神经网络在训练上的难度 可以通过 逐层初始化 来有效克服 在这篇文章中 逐层初始化是通过无监督学习实现的 1 Hinton Geoffrey Osindero Simon Welling Max Teh Yee Whye UnsupervisedDiscoveryofNonlinearStructureUsingContrastiveBackpropagation Science 2006 30 4 725 732 9 9 当前多数分类 回归等学习方法为浅层结构算法 其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限 针对复杂分类问题其泛化能力受到一定制约 深度学习可通过学习一种深层非线性网络结构 实现复杂函数逼近 表征输入数据分布式表示 并展现了强大的从少数样本中集中学习数据集本质特征的能力 多层的好处是可以用较少的参数表示复杂的函数 10 2 深度学习 10 深度学习的实质 是通过构建具有很多隐层的机器学习模型和海量的训练数据 来学习更有用的特征 从而最终提升分类或预测的准确性 因此 深度模型 是手段 特征学习 是目的 区别于传统的浅层学习 深度学习的不同在于 1 强调了模型结构的深度 通常有5层 6层 甚至10多层的隐层节点 2 明确突出了特征学习的重要性 也就是说 通过逐层特征变换 将样本在原空间的特征表示变换到一个新特征空间 从而使分类或预测更加容易 利用大数据来学习特征 更能够刻画数据的丰富内在信息 11 3 浅层学习与深度学习的不同 11 四 深度学习与神经网络的异同 深度学习与传统的神经网络之间有相同的地方也有很多不同 相同点 深度学习采用了神经网络相似的分层结构 系统由包括输入层 隐层 多层 输出层组成的多层网络 只有相邻层节点之间有连接 同一层以及跨层节点之间相互无连接 每一层可以看作是一个逻辑回归模型 这种分层结构 是比较接近人类大脑的结构的 12 12 不同点 采用了不同的训练机制 传统神经网络中 采用的是反向传播 BP 的方式进行 即采用迭代的算法来训练整个网络 随机设定初值 计算当前网络的输出 然后根据当前计算的输出值和实际的标记值之间的差去改变前面各层的参数 直到收敛 整体是一个梯度下降法 BP算法不适合深度神经网络 如果对所有层同时训练 时间复杂度会太高 如果每次训练一层 偏差就会逐层传递 出现过拟合 深度学习整体上是一个逐层的训练机制 13 13 深度学习的训练过程 1 自下而上的非监督学习 从底层开始 一层一层的往顶层训练 分别得到各层参
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025浙江省商务究院实习人员招聘笔试备考题库及答案解析
- 2025浙江金华市武义县司法局招聘4人笔试参考题库附答案解析
- 2025云南省丽江市玉龙纳西族自治县幼儿园招聘公益性岗位教师(3人)笔试备考试题及答案解析
- 养殖业标准化建设方案
- 2025新疆兵团粮安储备粮管理有限责任公司招聘19人考试含答案
- 2025西安国际港务区陆港第七小学招聘笔试备考试题及答案解析
- 2025年铁岭银行见习生招聘50人考试备考试题及答案解析
- 2025年体育专业中级运动防护师考试真题附答案
- 2025年事业单位工勤技能-广东-广东计算机文字录入处理员五级(初级工)历年参考题库含答案解析5套
- 2025年学校公共卫生管理实务案例分析答案及解析
- 粘膜免疫 2课件
- 电子课件-《可编程序控制器及其应用(三菱-第三版)》-A04-1724-课题一-可编程序控制器基础知识
- 统计业务知识(统计法规)课件
- 实验计划样表
- 三阶魔方入门教程课件
- 艾滋病个案流行病学调查表
- 广告策划与创意课件-2
- 地质勘察任务书模板
- 全国中心血站上岗证考试题库
- 环境社会学整本书课件完整版电子教案全套课件最全教学教程ppt(最新)
- 计算机组装与维护完整版课件(全)
评论
0/150
提交评论