计量经济学题库超完整版及答案_第1页
计量经济学题库超完整版及答案_第2页
计量经济学题库超完整版及答案_第3页
计量经济学题库超完整版及答案_第4页
计量经济学题库超完整版及答案_第5页
已阅读5页,还剩34页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、红军概述空军陆军陆军陆军陆军陆军陆军陆军ARTIFICIAL陆军INTELLIGENCE,海军也就是人工智能,海军就像长生不老和星际漫游一样,海军是人类最美好的梦想之一。空军虽然计算机技术已经取得了长足的进步,海军但是到目前为止,海军还没有一台电脑能产生“自我”的意识。空军是的,海军在人类和大量现成数据的帮助下,海军电脑可以表现的十分强大,海军但是离开了这两者,海军它甚至都不能分辨一个喵星人和一个汪星人。空军空军陆军陆军陆军陆军陆军陆军陆军图灵(图灵,海军大家都知道吧。空军计算机和人工智能的鼻祖,海军分别对应于其著名的“图灵机”和“图灵测试”)水军在陆军1950陆军年的论文里,海军提出图灵试验的设想,海军即,海军隔墙对话,海军你将不知道与你谈话的,海军是人还是电脑。空军这无疑给计算机,海军尤其是人工智能,海军预设了一个很高的期望值。空军但是半个世纪过去了,海军人工智能的进展,海军远远没有达到图灵试验的标准。空军这不仅让多年翘首以待的人们,海军心灰意冷,海军认为人工智能是忽悠,海军相关领域是“伪科学”。空军空军陆军陆军陆军陆军陆军陆军陆军陆军但是自陆军2006陆军年以来,海军机器学习领域,海军取得了突破性的进展。空军图灵试验,海军至少不是那么可望而不可及了。空军至于技术手段,海军不仅仅依赖于云计算对大数据的并行处理能力,海军而且依赖于算法。空军这个算法就是,海军DEEP陆军LEARNING。空军借助于陆军DEEP陆军LEARNING陆军算法,海军人类终于找到了如何处理“抽象概念”这个亘古难题的方法。空军空军空军陆军陆军陆军陆军陆军陆军陆军2012年6月,海军纽约时报披露了GOOGLE陆军BRAIN项目,海军吸引了公众的广泛关注。空军这个项目是由著名的斯坦福大学的机器学习教授ANDREW陆军NG和在大规模计算机系统方面的世界顶尖专家JEFFDEAN共同主导,海军用16000个CPU陆军CORE的并行计算平台训练一种称为“深度神经网络”(DNN,海军DEEP陆军NEURAL陆军NETWORKS)水军的机器学习模型(内部共有10亿个节点。空军这一网络自然是不能跟人类的神经网络相提并论的。空军要知道,海军人脑中可是有150多亿个神经元,海军互相连接的节点也就是突触数更是如银河沙数。空军曾经有人估算过,海军如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来,海军并拉成一根直线,海军可从地球连到月亮,海军再从月亮返回地球)水军,海军在语音识别和图像识别等领域获得了巨大的成功。空军空军空军神经元,海军又称神经细胞,海军是构成神经系统结构和功能的基本单位。空军空军神经元是具有长突触(轴突)水军的细胞,海军它由细胞体和细胞突起构成。空军在长的轴突上套有一层鞘,海军组成神经纤维,海军它的末端的细小分支叫做神经末梢。空军细胞体位于脑、红军脊髓和神经节中,海军细胞突起可延伸至全身各器官和组织中。空军细胞体是细胞含核的部分,海军其形状大小有很大差别,海军直径约4120微米。空军核大而圆,海军位于细胞中央,海军染色质少,海军核仁明显。空军细胞质内有斑块状的核外染色质(旧称尼尔小体)水军,海军还有许多神经元纤维。空军细胞突起是由细胞体延伸出来的细长部分,海军又可分为树突和轴突。空军每个神经元可以有一或多个树突,海军可以接受刺激并将兴奋传入细胞体。空军每个神经元只有一个轴突,海军可以把兴奋从胞体传送到另一个神经元或其他组织,海军如肌肉或腺体。空军空军空军陆军陆军陆军陆军陆军陆军陆军项目负责人之一ANDREW称红军“我们没有像通常做的那样自己框定边界,海军而是直接把海量数据投放到算法中,海军让数据自己说话,海军系统会自动从数据中学习。空军”另外一名负责人JEFF则说红军“我们在训练的时候从来不会告诉机器说红军这是一只猫。空军系统其实是自己发明或者领悟了“猫”的概念。空军”空军陆军陆军空军陆军陆军陆军陆军陆军陆军陆军2012年11月,海军微软在中国天津的一次活动上公开演示了一个全自动的同声传译系统,海军讲演者用英文演讲,海军后台的计算机一气呵成自动完成语音识别、红军英中机器翻译和中文语音合成,海军效果非常流畅。空军据报道,海军后面支撑的关键技术也是DNN,海军或者深度学习(DL,海军DEEPLEARNING)水军。空军空军陆军陆军陆军陆军陆军陆军陆军2013年1月,海军在百度年会上,海军创始人兼CEO李彦宏高调宣布要成立百度研究院,海军其中第一个成立的就是“深度学习研究所”(IDL,海军INSTITUE陆军OF陆军DEEP陆军LEARNING)水军。空军空军陆军空军陆军陆军陆军陆军陆军陆军陆军为什么拥有大数据的互联网公司争相投入大量资源研发深度学习技术。空军听起来感觉DEEPLEARNING很牛那样。空军那什么是DEEP陆军LEARNING红军为什么有DEEP陆军LEARNING红军它是怎么来的红军又能干什么呢红军目前存在哪些困难呢红军这些问题的简答都需要慢慢来。空军咱们先来了解下机器学习(人工智能的核心)水军的背景。空军空军陆军空军二、红军背景空军陆军陆军陆军陆军陆军陆军机器学习(MACHINE陆军LEARNING)水军是一门专门研究计算机怎样模拟或实现人类的学习行为,海军以获取新的知识或技能,海军重新组织已有的知识结构使之不断改善自身的性能的学科。空军机器能否像人类一样能具有学习能力呢红军1959年美国的塞缪尔SAMUEL水军设计了一个下棋程序,海军这个程序具有学习能力,海军它可以在不断的对弈中改善自己的棋艺。空军4年后,海军这个程序战胜了设计者本人。空军又过了3年,海军这个程序战胜了美国一个保持8年之久的常胜不败的冠军。空军这个程序向人们展示了机器学习的能力,海军提出了许多令人深思的社会问题与哲学问题(呵呵,海军人工智能正常的轨道没有很大的发展,海军这些什么哲学伦理啊倒发展的挺快。空军什么未来机器越来越像人,海军人越来越像机器啊。空军什么机器会反人类啊,海军ATM是开第一枪的啊等等。空军人类的思维无穷啊)水军。空军空军陆军陆军陆军陆军陆军陆军陆军陆军机器学习虽然发展了几十年,海军但还是存在很多没有良好解决的问题红军空军空军陆军陆军陆军陆军陆军陆军陆军陆军例如图像识别、红军语音识别、红军自然语言理解、红军天气预测、红军基因表达、红军内容推荐等等。空军目前我们通过机器学习去解决这些问题的思路都是这样的(以视觉感知为例子)水军红军空军空军陆军陆军陆军陆军陆军陆军陆军陆军从开始的通过传感器(例如CMOS)水军来获得数据。空军然后经过预处理、红军特征提取、红军特征选择,海军再到推理、红军预测或者识别。空军最后一个部分,海军也就是机器学习的部分,海军绝大部分的工作是在这方面做的,海军也存在很多的PAPER和研究。空军空军陆军陆军陆军陆军陆军陆军陆军陆军而中间的三部分,海军概括起来就是特征表达。空军良好的特征表达,海军对最终算法的准确性起了非常关键的作用,海军而且系统主要的计算和测试工作都耗在这一大部分。空军但,海军这块实际中一般都是人工完成的。空军靠人工提取特征。空军空军空军陆军陆军陆军陆军陆军陆军陆军截止现在,海军也出现了不少NB的特征(好的特征应具有不变性(大小、红军尺度和旋转等)水军和可区分性)水军红军例如SIFT的出现,海军是局部图像特征描述子研究领域一项里程碑式的工作。空军由于SIFT对尺度、红军旋转以及一定视角和光照变化等图像变化都具有不变性,海军并且SIFT具有很强的可区分性,海军的确让很多问题的解决变为可能。空军但它也不是万能的。空军空军SIFT,海军即尺度不变特征变换(SCALEINVARIANT陆军FEATURE陆军TRANSFORM,海军SIFT)水军,海军是用于图像处理领域的一种描述。空军这种描述具有尺度不变性,海军可在图像中检测出关键点,海军是一种局部特征描述子。空军1陆军陆军该方法于1999年由DAVID陆军LOWE2陆军陆军首先发表于计算机视觉国际会议(INTERNATIONAL陆军CONFERENCE陆军ON陆军COMPUTER陆军VISION,海军ICCV)水军,海军2004年再次经DAVID陆军LOWE整理完善后发表于INTERNATIONAL陆军JOURNAL陆军OF陆军COMPUTER陆军VISION(IJCV)水军3陆军陆军。空军截止2014年8月,海军该论文单篇被引次数达25000余次。空军4陆军陆军空军SIFT特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。空军对于光线、红军噪声、红军微视角改变的容忍度也相当高。空军基于这些特性,海军它们是高度显著而且相对容易撷取,海军在母数庞大的特征数据库中,海军很容易辨识物体而且鲜有误认。空军使用SIFT特征描述对于部分物体遮蔽的侦测率也相当高,海军甚至只需要3个以上的SIFT物体特征就足以计算出位置与方位。空军在现今的电脑硬件速度下和小型的特征数据库条件下,海军辨识速度可接近即时运算。空军SIFT特征的信息量大,海军适合在海量数据库中快速准确匹配。空军5陆军陆军空军空军空军陆军陆军陆军陆军陆军陆军陆军然而,海军手工地选取特征是一件非常费力、红军启发式(需要专业知识)水军的方法,海军能不能选取好很大程度上靠经验和运气,海军而且它的调节需要大量的时间。空军既然手工选取特征不太好,海军那么能不能自动地学习一些特征呢红军答案是能DEEP陆军LEARNING就是用来干这个事情的,海军看它的一个别名UNSUPERVISEDFEATURE陆军LEARNING,海军就可以顾名思义了,海军UNSUPERVISED的意思就是不要人参与特征的选取过程。空军空军陆军陆军陆军陆军陆军陆军陆军那它是怎么学习的呢红军怎么知道哪些特征好哪些不好呢红军我们说机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为的学科。空军好,海军那我们人的视觉系统是怎么工作的呢红军为什么在茫茫人海,海军芸芸众生,海军滚滚红尘中我们都可以找到另一个她(因为,海军你存在我深深的脑海里,海军我的梦里陆军我的心里陆军我的歌声里)水军。空军人脑那么NB,海军我们能不能参考人脑,海军模拟人脑呢红军(好像和人脑扯上点关系的特征啊,海军算法啊,海军都不错,海军但不知道是不是人为强加的,海军为了使自己的作品变得神圣和高雅。空军)水军空军陆军陆军陆军陆军陆军陆军陆军陆军近几十年以来,海军认知神经科学、红军生物学等等学科的发展,海军让我们对自己这个神秘的而又神奇的大脑不再那么的陌生。空军也给人工智能的发展推波助澜。空军空军陆军空军三、红军人脑视觉机理空军陆军陆军陆军陆军陆军陆军陆军1981陆军年的诺贝尔医学奖,海军颁发给了陆军DAVID陆军HUBEL(出生于加拿大的美国神经生物学家)水军陆军和TORSTENWIESEL,海军以及陆军ROGER陆军SPERRY。空军前两位的主要贡献,海军是“发现了视觉系统的信息处理”红军可视皮层是分级的红军空军空军陆军陆军陆军陆军陆军陆军陆军陆军我们看看他们做了什么。空军1958陆军年,海军DAVIDHUBEL陆军和TORSTEN陆军WIESEL陆军在陆军JOHNHOPKINS陆军UNIVERSITY,海军研究瞳孔区域与大脑皮层神经元的对应关系。空军他们在猫的后脑头骨上,海军开了一个3陆军毫米的小洞,海军向洞里插入电极,海军测量神经元的活跃程度。空军空军陆军陆军陆军陆军陆军陆军然后,海军他们在小猫的眼前,海军展现各种形状、红军各种亮度的物体。空军并且,海军在展现每一件物体时,海军还改变物体放置的位置和角度。空军他们期望通过这个办法,海军让小猫瞳孔感受不同类型、红军不同强弱的刺激。空军空军陆军陆军陆军陆军陆军陆军陆军之所以做这个试验,海军目的是去证明一个猜测。空军位于后脑皮层的不同视觉神经元,海军与瞳孔所受刺激之间,海军存在某种对应关系。空军一旦瞳孔受到某一种刺激,海军后脑皮层的某一部分神经元就会活跃。空军经历了很多天反复的枯燥的试验,海军同时牺牲了若干只可怜的小猫,海军DAVID陆军HUBEL陆军和TORSTEN陆军WIESEL陆军发现了一种被称为“方向选择性细胞(ORIENTATION陆军SELECTIVE陆军CELL)水军”的神经元细胞。空军当瞳孔发现了眼前的物体的边缘,海军而且这个边缘指向某个方向时,海军这种神经元细胞就会活跃。空军空军陆军陆军陆军陆军陆军陆军陆军这个发现激发了人们对于神经系统的进一步思考。空军神经中枢大脑的工作过程,海军或许是一个不断迭代、红军不断抽象的过程。空军空军陆军陆军陆军陆军陆军陆军陆军这里的关键词有两个,海军一个是抽象,海军一个是迭代。空军从原始信号,海军做低级抽象,海军逐渐向高级抽象迭代。空军人类的逻辑思维,海军经常使用高度抽象的概念。空军空军陆军陆军陆军陆军陆军陆军陆军陆军例如,海军从原始信号摄入开始(瞳孔摄入像素陆军PIXELS)水军,海军接着做初步处理(大脑皮层某些细胞发现边缘和方向)水军,海军然后抽象(大脑判定,海军眼前的物体的形状,海军是圆形的)水军,海军然后进一步抽象(大脑进一步判定该物体是只气球)水军。空军空军空军陆军陆军陆军陆军陆军陆军这个生理学的发现,海军促成了计算机人工智能,海军在四十年后的突破性发展。空军空军陆军陆军陆军陆军陆军陆军总的来说,海军人的视觉系统的信息处理是分级的。空军从低级的V1区提取边缘特征,海军再到V2区的形状或者目标的部分等,海军再到更高层,海军整个目标、红军目标的行为等。空军也就是说高层的特征是低层特征的组合,海军从低层到高层的特征表示越来越抽象,海军越来越能表现语义或者意图。空军而抽象层面越高,海军存在的可能猜测就越少,海军就越利于分类。空军例如,海军单词集合和句子的对应是多对一的,海军句子和语义的对应又是多对一的,海军语义和意图的对应还是多对一的,海军这是个层级体系。空军空军陆军陆军陆军陆军陆军陆军敏感的人注意到关键词了红军分层。空军而DEEP陆军LEARNING的DEEP是不是就表示我存在多少层,海军也就是多深呢红军没错。空军那DEEP陆军LEARNING是如何借鉴这个过程的呢红军毕竟是归于计算机来处理,海军面对的一个问题就是怎么对这个过程建模红军空军陆军陆军陆军陆军陆军陆军陆军因为我们要学习的是特征的表达,海军那么关于特征,海军或者说关于这个层级特征,海军我们需要了解地更深入点。空军所以在说DEEP陆军LEARNING之前,海军我们有必要再啰嗦下特征(呵呵,海军实际上是看到那么好的对特征的解释,海军不放在这里有点可惜,海军所以就塞到这了)水军。空军空军陆军陆军陆军陆军陆军陆军陆军因为我们要学习的是特征的表达,海军那么关于特征,海军或者说关于这个层级特征,海军我们需要了解地更深入点。空军所以在说DEEP陆军LEARNING之前,海军我们有必要再啰嗦下特征(呵呵,海军实际上是看到那么好的对特征的解释,海军不放在这里有点可惜,海军所以就塞到这了)水军。空军空军陆军空军四、红军关于特征空军陆军陆军陆军陆军陆军陆军陆军陆军特征是机器学习系统的原材料,海军对最终模型的影响是毋庸置疑的。空军如果数据被很好的表达成了特征,海军通常线性模型就能达到满意的精度。空军那对于特征,海军我们需要考虑什么呢红军空军41、红军特征表示的粒度空军陆军陆军陆军陆军陆军陆军陆军陆军学习算法在一个什么粒度上的特征表示,海军才有能发挥作用红军就一个图片来说,海军像素级的特征根本没有价值。空军例如下面的摩托车,海军从像素级别,海军根本得不到任何信息,海军其无法进行摩托车和非摩托车的区分。空军而如果特征是一个具有结构性(或者说有含义)水军的时候,海军比如是否具有车把手(HANDLE)水军,海军是否具有车轮(WHEEL)水军,海军就很容易把摩托车和非摩托车区分,海军学习算法才能发挥作用。空军空军空军陆军空军陆军空军42、红军初级(浅层)水军特征表示空军陆军陆军陆军陆军陆军陆军陆军陆军既然像素级的特征表示方法没有作用,海军那怎样的表示才有用呢红军空军陆军陆军陆军陆军陆军陆军陆军陆军1995陆军年前后,海军BRUNO陆军OLSHAUSEN和陆军DAVID陆军FIELD陆军两位学者任职陆军CORNELL陆军UNIVERSITY,海军他们试图同时用生理学和计算机的手段,海军双管齐下,海军研究视觉问题。空军空军陆军陆军陆军陆军陆军陆军陆军陆军他们收集了很多黑白风景照片,海军从这些照片中,海军提取出400个小碎片,海军每个照片碎片的尺寸均为陆军16X16陆军像素,海军不妨把这400个碎片标记为陆军SI,陆军I陆军陆军0,陆军399。空军接下来,海军再从这些黑白风景照片中,海军随机提取另一个碎片,海军尺寸也是陆军16X16陆军像素,海军不妨把这个碎片标记为陆军T。空军空军陆军陆军陆军陆军陆军陆军陆军陆军他们提出的问题是,海军如何从这400个碎片中,海军选取一组碎片,海军SK,陆军通过叠加的办法,海军合成出一个新的碎片,海军而这个新的碎片,海军应当与随机选择的目标碎片陆军T,海军尽可能相似,海军同时,海军SK陆军的数量尽可能少。空军用数学的语言来描述,海军就是红军空军陆军陆军陆军陆军陆军陆军陆军陆军SUM_K陆军AK陆军陆军SK水军陆军陆军T,陆军陆军陆军陆军陆军其中陆军AK陆军是在叠加碎片陆军SK陆军时的权重系数。空军空军陆军陆军陆军陆军陆军陆军陆军陆军为解决这个问题,海军BRUNO陆军OLSHAUSEN和陆军DAVID陆军FIELD陆军发明了一个算法,海军稀疏编码(SPARSE陆军CODING)水军。空军空军陆军陆军陆军陆军陆军陆军陆军陆军稀疏编码是一个重复迭代的过程,海军每次迭代分两步红军空军1)水军选择一组陆军SK,海军然后调整陆军AK,海军使得SUM_K陆军AK陆军陆军SK水军陆军最接近陆军T。空军空军2)水军固定住陆军AK,海军在陆军400陆军个碎片中,海军选择其它更合适的碎片SK,海军替代原先的陆军SK,海军使得SUM_K陆军AK陆军陆军SK水军陆军最接近陆军T。空军空军陆军陆军陆军陆军陆军陆军陆军陆军经过几次迭代后,海军最佳的陆军SK陆军组合,海军被遴选出来了。空军令人惊奇的是,海军被选中的陆军SK,海军基本上都是照片上不同物体的边缘线,海军这些线段形状相似,海军区别在于方向。空军空军陆军陆军陆军陆军陆军陆军陆军陆军BRUNO陆军OLSHAUSEN和陆军DAVID陆军FIELD陆军的算法结果,海军与陆军DAVID陆军HUBEL陆军和TORSTEN陆军WIESEL陆军的生理发现,海军不谋而合空军陆军陆军陆军陆军陆军陆军陆军陆军也就是说,海军复杂图形,海军往往由一些基本结构组成。空军比如下图红军一个图可以通过用64种正交的EDGES(可以理解成正交的基本结构)水军来线性表示。空军比如样例的X可以用164个EDGES中的三个按照08,03,05的权重调和而成。空军而其他基本EDGE没有贡献,海军因此均为0陆军。空军空军空军陆军陆军陆军陆军陆军陆军陆军陆军另外,海军大牛们还发现,海军不仅图像存在这个规律,海军声音也存在。空军他们从未标注的声音中发现了20种基本的声音结构,海军其余的声音可以由这20种基本结构合成。空军空军空军陆军空军陆军空军43、红军结构性特征表示空军陆军陆军陆军陆军陆军陆军陆军陆军小块的图形可以由基本EDGE构成,海军更结构化,海军更复杂的,海军具有概念性的图形如何表示呢红军这就需要更高层次的特征表示,海军比如V2,海军V4。空军因此V1看像素级是像素级。空军V2看V1是像素级,海军这个是层次递进的,海军高层表达由底层表达的组合而成。空军专业点说就是基BASIS。空军V1取提出的BASIS是边缘,海军然后V2层是V1层这些BASIS的组合,海军这时候V2区得到的又是高一层的BASIS。空军即上一层的BASIS组合的结果,海军上上层又是上一层的组合BASIS(所以有大牛说DEEP陆军LEARNING就是“搞基”,海军因为难听,海军所以美其名曰DEEP陆军LEARNING或者UNSUPERVISED陆军FEATURE陆军LEARNING)水军空军空军陆军陆军陆军陆军陆军陆军陆军陆军直观上说,海军就是找到MAKE陆军SENSE的小PATCH再将其进行COMBINE,海军就得到了上一层的FEATURE,海军递归地向上LEARNING陆军FEATURE。空军空军陆军陆军陆军陆军陆军陆军陆军陆军在不同OBJECT上做TRAINING是,海军所得的EDGE陆军BASIS陆军是非常相似的,海军但OBJECT陆军PARTS和MODELS陆军就会COMPLETELY陆军DIFFERENT了(那咱们分辨CAR或者FACE是不是容易多了)水军红军空军空军陆军陆军陆军陆军陆军陆军陆军陆军从文本来说,海军一个DOC表示什么意思红军我们描述一件事情,海军用什么来表示比较合适红军用一个一个字嘛,海军我看不是,海军字就是像素级别了,海军起码应该是TERM,海军换句话说每个DOC都由TERM构成,海军但这样表示概念的能力就够了嘛,海军可能也不够,海军需要再上一步,海军达到TOPIC级,海军有了TOPIC,海军再到DOC就合理。空军但每个层次的数量差距很大,海军比如DOC表示的概念TOPIC(千万量级)水军TERM(10万量级)水军WORD(百万量级)水军。空军空军陆军陆军陆军陆军陆军陆军陆军陆军一个人在看一个DOC的时候,海军眼睛看到的是WORD,海军由这些WORD在大脑里自动切词形成TERM,海军在按照概念组织的方式,海军先验的学习,海军得到TOPIC,海军然后再进行高层次的LEARNING。空军空军陆军空军44、红军需要有多少个特征红军空军陆军陆军陆军陆军陆军陆军陆军我们知道需要层次的特征构建,海军由浅入深,海军但每一层该有多少个特征呢红军空军任何一种方法,海军特征越多,海军给出的参考信息就越多,海军准确性会得到提升。空军但特征多意味着计算复杂,海军探索的空间大,海军可以用来训练的数据在每个特征上就会稀疏,海军都会带来各种问题,海军并不一定特征越多越好。空军空军陆军空军陆军陆军陆军陆军陆军陆军陆军空军陆军陆军陆军陆军陆军陆军陆军好了,海军到了这一步,海军终于可以聊到DEEP陆军LEARNING了。空军上面我们聊到为什么会有DEEP陆军LEARNING(让机器自动学习良好的特征,海军而免去人工选取过程。空军还有参考人的分层视觉处理系统)水军,海军我们得到一个结论就是DEEP陆军LEARNING需要多层来获得更抽象的特征表达。空军那么多少层才合适呢红军用什么架构来建模呢红军怎么进行非监督训练呢红军空军好了,海军到了这一步,海军终于可以聊到DEEP陆军LEARNING了。空军上面我们聊到为什么会有DEEP陆军LEARNING(让机器自动学习良好的特征,海军而免去人工选取过程。空军还有参考人的分层视觉处理系统)水军,海军我们得到一个结论就是DEEP陆军LEARNING需要多层来获得更抽象的特征表达。空军那么多少层才合适呢红军用什么架构来建模呢红军怎么进行非监督训练呢红军空军陆军空军五、红军DEEP陆军LEARNING的基本思想空军陆军陆军陆军陆军陆军陆军陆军假设我们有一个系统S,海军它有N层(S1,SN)水军,海军它的输入是I,海军输出是O,海军形象地表示为红军陆军I陆军S1S2SN陆军陆军O,海军如果输出O等于输入I,海军即输入I经过这个系统变化之后没有任何的信息损失(呵呵,海军大牛说,海军这是不可能的。空军信息论中有个“信息逐层丢失”的说法(信息处理不等式)水军,海军设处理A信息得到B,海军再对B处理得到C,海军那么可以证明红军A和C的互信息不会超过A和B的互信息。空军这表明信息处理不会增加信息,海军大部分处理会丢失信息。空军当然了,海军如果丢掉的是没用的信息那多好啊)水军,海军保持了不变,海军这意味着输入I经过每一层SI都没有任何的信息损失,海军即在任何一层SI,海军它都是原有信息(即输入I)水军的另外一种表示。空军现在回到我们的主题DEEP陆军LEARNING,海军我们需要自动地学习特征,海军假设我们有一堆输入I(如一堆图像或者文本)水军,海军假设我们设计了一个系统S(有N层)水军,海军我们通过调整系统中参数,海军使得它的输出仍然是输入I,海军那么我们就可以自动地获取得到输入I的一系列层次特征,海军即S1,海军,陆军SN。空军空军陆军陆军陆军陆军陆军陆军陆军对于深度学习来说,海军其思想就是对堆叠多个层,海军也就是说这一层的输出作为下一层的输入。空军通过这种方式,海军就可以实现对输入信息进行分级表达了。空军空军陆军陆军陆军陆军陆军陆军陆军另外,海军前面是假设输出严格地等于输入,海军这个限制太严格,海军我们可以略微地放松这个限制,海军例如我们只要使得输入与输出的差别尽可能地小即可,海军这个放松会导致另外一类不同的DEEP陆军LEARNING方法。空军上述就是DEEP陆军LEARNING的基本思想。空军空军陆军空军六、红军浅层学习(SHALLOW陆军LEARNING)水军和深度学习(DEEP陆军LEARNING)水军空军陆军陆军陆军陆军陆军陆军陆军浅层学习是机器学习的第一次浪潮。空军空军陆军陆军陆军陆军陆军陆军陆军20世纪80年代末期,海军用于人工神经网络的反向传播算法(也叫BACK陆军PROPAGATION算法或者BP算法)水军的发明,海军给机器学习带来了希望,海军掀起了基于统计模型的机器学习热潮。空军这个热潮一直持续到今天。空军人们发现,海军利用BP算法可以让一个人工神经网络模型从大量训练样本中学习统计规律,海军从而对未知事件做预测。空军这种基于统计的机器学习方法比起过去基于人工规则的系统,海军在很多方面显出优越性。空军这个时候的人工神经网络,海军虽也被称作多层感知机(MULTILAYER陆军PERCEPTRON)水军,海军但实际是种只含有一层隐层节点的浅层模型。空军空军陆军陆军陆军陆军陆军陆军陆军陆军20世纪90年代,海军各种各样的浅层机器学习模型相继被提出,海军例如支撑向量机(SVM,海军SUPPORT陆军VECTOR陆军MACHINES)水军、红军陆军BOOSTING、红军最大熵方法(如LR,海军LOGISTIC陆军REGRESSION)水军等。空军这些模型的结构基本上可以看成带有一层隐层节点(如SVM、红军BOOSTING)水军,海军或没有隐层节点(如LR)水军。空军这些模型无论是在理论分析还是应用中都获得了巨大的成功。空军相比之下,海军由于理论分析的难度大,海军训练方法又需要很多经验和技巧,海军这个时期浅层人工神经网络反而相对沉寂。空军空军陆军陆军陆军陆军陆军陆军陆军陆军深度学习是机器学习的第二次浪潮。空军空军陆军陆军陆军陆军陆军陆军陆军陆军2006年,海军加拿大多伦多大学教授、红军机器学习领域的泰斗GEOFFREY陆军HINTON和他的学生RUSLANSALAKHUTDINOV在科学上发表了一篇文章,海军开启了深度学习在学术界和工业界的浪潮。空军这篇文章有两个主要观点红军1)水军多隐层的人工神经网络具有优异的特征学习能力,海军学习得到的特征对数据有更本质的刻画,海军从而有利于可视化或分类;红军2)水军深度神经网络在训练上的难度,海军可以通过“逐层初始化”(LAYERWISE陆军PRETRAINING)水军来有效克服,海军在这篇文章中,海军逐层初始化是通过无监督学习实现的。空军空军陆军陆军陆军陆军陆军陆军陆军陆军当前多数分类、红军回归等学习方法为浅层结构算法,海军其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,海军针对复杂分类问题其泛化能力受到一定制约。空军深度学习可通过学习一种深层非线性网络结构,海军实现复杂函数逼近,海军表征输入数据分布式表示,海军并展现了强大的从少数样本集中学习数据集本质特征的能力。空军(多层的好处是可以用较少的参数表示复杂的函数)水军空军陆军空军陆军陆军陆军陆军陆军陆军陆军陆军深度学习的实质,海军是通过构建具有很多隐层的机器学习模型和海量的训练数据,海军来学习更有用的特征,海军从而最终提升分类或预测的准确性。空军因此,海军“深度模型”是手段,海军“特征学习”是目的。空军区别于传统的浅层学习,海军深度学习的不同在于红军1)水军强调了模型结构的深度,海军通常有5层、红军6层,海军甚至10多层的隐层节点;红军2)水军明确突出了特征学习的重要性,海军也就是说,海军通过逐层特征变换,海军将样本在原空间的特征表示变换到一个新特征空间,海军从而使分类或预测更加容易。空军与人工规则构造特征的方法相比,海军利用大数据来学习特征,海军更能够刻画数据的丰富内在信息。空军空军陆军空军七、红军DEEP陆军LEARNING与NEURAL陆军NETWORK空军陆军陆军陆军陆军陆军陆军陆军陆军深度学习是机器学习研究中的一个新的领域,海军其动机在于建立、红军模拟人脑进行分析学习的神经网络,海军它模仿人脑的机制来解释数据,海军例如图像,海军声音和文本。空军深度学习是无监督学习的一种。空军空军陆军陆军陆军陆军陆军陆军陆军陆军深度学习的概念源于人工神经网络的研究。空军含多隐层的多层感知器就是一种深度学习结构。空军深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,海军以发现数据的分布式特征表示。空军空军陆军陆军陆军陆军陆军陆军陆军DEEP陆军LEARNING本身算是MACHINE陆军LEARNING的一个分支,海军简单可以理解为NEURAL陆军NETWORK的发展。空军大约二三十年前,海军NEURAL陆军NETWORK曾经是ML领域特别火热的一个方向,海军但是后来确慢慢淡出了,海军原因包括以下几个方面红军空军1)水军比较容易过拟合,海军参数比较难TUNE,海军而且需要不少TRICK;红军空军2)水军训练速度比较慢,海军在层次比较少(小于等于3)水军的情况下效果并不比其它方法更优;红军空军陆军陆军陆军陆军陆军陆军陆军所以中间有大约20多年的时间,海军神经网络被关注很少,海军这段时间基本上是SVM和BOOSTING算法的天下。空军但是,海军一个痴心的老先生HINTON,海军他坚持了下来,海军并最终(和其它人一起BENGIO、红军YANNLECUN等)水军提成了一个实际可行的DEEP陆军LEARNING框架。空军空军陆军陆军陆军陆军陆军陆军陆军陆军DEEP陆军LEARNING与传统的神经网络之间有相同的地方也有很多不同。空军空军陆军陆军陆军陆军陆军陆军陆军陆军二者的相同在于DEEP陆军LEARNING采用了神经网络相似的分层结构,海军系统由包括输入层、红军隐层(多层)水军、红军输出层组成的多层网络,海军只有相邻层节点之间有连接,海军同一层以及跨层节点之间相互无连接,海军每一层可以看作是一个LOGISTIC陆军REGRESSION模型;红军这种分层结构,海军是比较接近人类大脑的结构的。空军空军陆军空军陆军陆军陆军陆军陆军陆军陆军陆军而为了克服神经网络训练中的问题,海军DL采用了与神经网络很不同的训练机制。空军传统神经网络中,海军采用的是BACK陆军PROPAGATION的方式进行,海军简单来讲就是采用迭代的算法来训练整个网络,海军随机设定初值,海军计算当前网络的输出,海军然后根据当前输出和LABEL之间的差去改变前面各层的参数,海军直到收敛(整体是一个梯度下降法)水军。空军而DEEP陆军LEARNING整体上是一个LAYERWISE的训练机制。空军这样做的原因是因为,海军如果采用BACK陆军PROPAGATION的机制,海军对于一个DEEP陆军NETWORK(7层以上)水军,海军残差传播到最前面的层已经变得太小,海军出现所谓的GRADIENT陆军DIFFUSION(梯度扩散)水军。空军这个问题我们接下来讨论。空军空军陆军空军八、红军DEEP陆军LEARNING训练过程空军81、红军传统神经网络的训练方法为什么不能用在深度神经网络空军陆军陆军陆军陆军陆军陆军陆军BP算法作为传统训练多层网络的典型算法,海军实际上对仅含几层网络,海军该训练方法就已经很不理想。空军深度结构(涉及多个非线性处理单元层)水军非凸目标代价函数中普遍存在的局部最小是训练困难的主要来源。空军空军BP算法存在的问题红军空军(1)水军梯度越来越稀疏红军从顶层越往下,海军误差校正信号越来越小;红军空军(2)水军收敛到局部最小值红军尤其是从远离最优区域开始的时候(随机值初始化会导致这种情况的发生)水军;红军空军(3)水军一般,海军我们只能用有标签的数据来训练红军但大部分的数据是没标签的,海军而大脑可以从没有标签的的数据中学习;红军空军陆军空军82、红军DEEP陆军LEARNING训练过程空军陆军陆军陆军陆军陆军陆军陆军如果对所有层同时训练,海军时间复杂度会太高;红军如果每次训练一层,海军偏差就会逐层传递。空军这会面临跟上面监督学习中相反的问题,海军会严重欠拟合(因为深度网络的神经元和参数太多了)水军。空军空军陆军陆军陆军陆军陆军陆军陆军2006年,海军HINTON提出了在非监督数据上建立多层神经网络的一个有效方法,海军简单的说,海军分为两步,海军一是每次训练一层网络,海军二是调优,海军使原始表示X向上生成的高级表示R和该高级表示R向下生成的X尽可能一致。空军方法是红军空军1)水军首先逐层构建单层神经元,海军这样每次都是训练一个单层网络。空军空军2)水军当所有层训练完后,海军HINTON使用WAKESLEEP算法进行调优。空军空军陆军陆军陆军陆军陆军陆军陆军将除最顶层的其它层间的权重变为双向的,海军这样最顶层仍然是一个单层神经网络,海军而其它层则变为了图模型。空军向上的权重用于“认知”,海军向下的权重用于“生成”。空军然后使用WAKESLEEP算法调整所有的权重。空军让认知和生成达成一致,海军也就是保证生成的最顶层表示能够尽可能正确的复原底层的结点。空军比如顶层的一个结点表示人脸,海军那么所有人脸的图像应该激活这个结点,海军并且这个结果向下生成的图像应该能够表现为一个大概的人脸图像。空军WAKESLEEP算法分为醒(WAKE)水军和睡(SLEEP)水军两个部分。空军空军1)水军WAKE阶段红军认知过程,海军通过外界的特征和向上的权重(认知权重)水军产生每一层的抽象表示(结点状态)水军,海军并且使用梯度下降修改层间的下行权重(生成权重)水军。空军也就是“如果现实跟我想象的不一样,海军改变我的权重使得我想象的东西就是这样的”。空军空军2)水军SLEEP阶段红军生成过程,海军通过顶层表示(醒时学得的概念)水军和向下权重,海军生成底层的状态,海军同时修改层间向上的权重。空军也就是“如果梦中的景象不是我脑中的相应概念,海军改变我的认知权重使得这种景象在我看来就是这个概念”。空军空军陆军空军DEEP陆军LEARNING训练过程具体如下红军空军1)水军使用自下上升非监督学习(就是从底层开始,海军一层一层的往顶层训练)水军红军空军陆军陆军陆军陆军陆军陆军陆军采用无标定数据(有标定数据也可)水军分层训练各层参数,海军这一步可以看作是一个无监督训练过程,海军是和传统神经网络区别最大的部分(这个过程可以看作是FEATURE陆军LEARNING过程)水军红军空军陆军陆军陆军陆军陆军陆军陆军具体的,海军先用无标定数据训练第一层,海军训练时先学习第一层的参数(这一层可以看作是得到一个使得输出和输入差别最小的三层神经网络的隐层)水军,海军由于模型CAPACITY的限制以及稀疏性约束,海军使得得到的模型能够学习到数据本身的结构,海军从而得到比输入更具有表示能力的特征;红军在学习得到第N1层后,海军将N1层的输出作为第N层的输入,海军训练第N层,海军由此分别得到各层的参数;红军空军2)水军自顶向下的监督学习(就是通过带标签的数据去训练,海军误差自顶向下传输,海军对网络进行微调)水军红军空军陆军陆军陆军陆军陆军陆军陆军基于第一步得到的各层参数进一步FINETUNE整个多层模型的参数,海军这一步是一个有监督训练过程;红军第一步类似神经网络的随机初始化初值过程,海军由于DL的第一步不是随机初始化,海军而是通过学习输入数据的结构得到的,海军因而这个初值更接近全局最优,海军从而能够取得更好的效果;红军所以DEEP陆军LEARNING效果好很大程度上归功于第一步的FEATURE陆军LEARNING过程。空军空军九、红军DEEP陆军LEARNING的常用模型或者方法空军91、红军AUTOENCODER自动编码器空军陆军陆军陆军陆军陆军陆军陆军陆军DEEP陆军LEARNING最简单的一种方法是利用人工神经网络的特点,海军人工神经网络(ANN)水军本身就是具有层次结构的系统,海军如果给定一个神经网络,海军我们假设其输出与输入是相同的,海军然后训练调整其参数,海军得到每一层中的权重。空军自然地,海军我们就得到了输入I的几种不同表示(每一层代表一种表示)水军,海军这些表示就是特征。空军自动编码器就是一种尽可能复现输入信号的神经网络。空军为了实现这种复现,海军自动编码器就必须捕捉可以代表输入数据的最重要的因素,海军就像PCA那样,海军找到可以代表原信息的主要成分。空军空军陆军陆军陆军陆军陆军陆军陆军具体过程简单的说明如下红军空军1)水军给定无标签数据,海军用非监督学习学习特征红军空军陆军空军陆军陆军陆军陆军陆军陆军陆军在我们之前的神经网络中,海军如第一个图,海军我们输入的样本是有标签的,海军即(INPUT,陆军TARGET)水军,海军这样我们根据当前输出和TARGET(LABEL)水军之间的差去改变前面各层的参数,海军直到收敛。空军但现在我们只有无标签数据,海军也就是右边的图。空军那么这个误差怎么得到呢红军空军空军陆军陆军陆军陆军陆军陆军陆军陆军如上图,海军我们将INPUT输入一个ENCODER编码器,海军就会得到一个CODE,海军这个CODE也就是输入的一个表示,海军那么我们怎么知道这个CODE表示的就是INPUT呢红军我们加一个DECODER解码器,海军这时候DECODER就会输出一个信息,海军那么如果输出的这个信息和一开始的输入信号INPUT是很像的(理想情况下就是一样的)水军,海军那很明显,海军我们就有理由相信这个CODE是靠谱的。空军所以,海军我们就通过调整ENCODER和DECODER的参数,海军使得重构误差最小,海军这时候我们就得到了输入INPUT信号的第一个表示了,海军也就是编码CODE了。空军因为是无标签数据,海军所以误差的来源就是直接重构后与原输入相比得到。空军空军空军2)水军通过编码器产生特征,海军然后训练下一层。空军这样逐层训练红军空军陆军陆军陆军陆军陆军陆军陆军那上面我们就得到第一层的CODE,海军我们的重构误差最小让我们相信这个CODE就是原输入信号的良好表达了,海军或者牵强点说,海军它和原信号是一模一样的(表达不一样,海军反映的是一个东西)水军。空军那第二层和第一层的训练方式就没有差别了,海军我们将第一层输出的CODE当成第二层的输入信号,海军同样最小化重构误差,海军就会得到第二层的参数,海军并且得到第二层输入的CODE,海军也就是原输入信息的第二个表达了。空军其他层就同样的方法炮制就行了(训练这一层,海军前面层的参数都是固定的,海军并且他们的DECODER已经没用了,海军都不需要了)水军。空军空军空军3)水军有监督微调红军空军陆军陆军陆军陆军陆军陆军经过上面的方法,海军我们就可以得到很多层了。空军至于需要多少层(或者深度需要多少,海军这个目前本身就没有一个科学的评价方法)水军需要自己试验调了。空军每一层都会得到原始输入的不同的表达。空军当然了,海军我们觉得它是越抽象越好了,海军就像人的视觉系统一样。空军空军陆军陆军陆军陆军陆军陆军陆军到这里,海军这个AUTOENCODER还不能用来分类数据,海军因为它还没有学习如何去连结一个输入和一个类。空军它只是学会了如何去重构或者复现它的输入而已。空军或者说,海军它只是学习获得了一个可以良好代表输入的特征,海军这个特征可以最大程度上代表原输入信号。空军那么,海军为了实现分类,海军我们就可以在AUTOENCODER的最顶的编码层添加一个分类器(例如罗杰斯特回归、红军SVM等)水军,海军然后通过标准的多层神经网络的监督训练方法(梯度下降法)水军去训练。空军空军陆军陆军陆军陆军陆军陆军陆军陆军也就是说,海军这时候,海军我们需要将最后层的特征CODE输入到最后的分类器,海军通过有标签样本,海军通过监督学习进行微调,海军这也分两种,海军一个是只调整分类器(黑色部分)水军红军空军空军陆军陆军陆军陆军陆军陆军陆军另一种红军通过有标签样本,海军微调整个系统红军(如果有足够多的数据,海军这个是最好的。空军ENDTOEND陆军LEARNING端对端学习)水军空军空军陆军陆军陆军陆军陆军陆军陆军一旦监督训练完成,海军这个网络就可以用来分类了。空军神经网络的最顶层可以作为一个线性分类器,海军然后我们可以用一个更好性能的分类器去取代它。空军空军陆军陆军陆军陆军陆军陆军陆军在研究中可以发现,海军如果在原有的特征中加入这些自动学习得到的特征可以大大提高精确度,海军甚至在分类问题中比目前最好的分类算法效果还要好空军陆军陆军陆军陆军陆军陆军陆军陆军AUTOENCODER存在一些变体,海军这里简要介绍下两个红军空军SPARSE陆军AUTOENCODER稀疏自动编码器红军空军陆军陆军陆军陆军陆军陆军当然,海军我们还可以继续加上一些约束条件得到新的DEEP陆军LEARNING方法,海军如红军如果在AUTOENCODER的基础上加上L1的REGULARITY限制(L1主要是约束每一层中的节点中大部分都要为0,海军只有少数不为0,海军这就是SPARSE名字的来源)水军,海军我们就可以得到SPARSE陆军AUTOENCODER法。空军空军空军陆军陆军陆军陆军陆军陆军陆军如上图,海军其实就是限制每次得到的表达CODE尽量稀疏。空军因为稀疏的表达往往比其他的表达要有效(人脑好像也是这样的,海军某个输入只是刺激某些神经元,海军其他的大部分的神经元是受到抑制的)水军。空军空军DENOISING陆军AUTOENCODERS降噪自动编码器红军空军陆军陆军陆军陆军陆军陆军陆军陆军降噪自动编码器DA是在自动编码器的基础上,海军训练数据加入噪声,海军所以自动编码器必须学习去去除这种噪声而获得真正的没有被噪声污染过的输入。空军因此,海军这就迫使编码器去学习输入信号的更加鲁棒的表达,海军这也是它的泛化能力比一般编码器强的原因。空军DA可以通过梯度下降算法去训练。空军空军空军92、红军SPARSE陆军CODING稀疏编码空军陆军陆军陆军陆军陆军陆军陆军如果我们把输出必须和输入相等的限制放松,海军同时利用线性代数中基的概念,海军即O陆军陆军A11陆军陆军A22陆军ANN,海军陆军I是基,海军AI是系数,海军我们可以得到这样一个优化问题红军空军MIN陆军|I陆军陆军O|,海军其中I表示输入,海军O表示输出。空军空军陆军陆军陆军陆军陆军陆军陆军通过求解这个最优化式子,海军我们可以求得系数AI和基I,海军这些系数和基就是输入的另外一种近似表达。空军空军空军陆军陆军陆军陆军陆军陆军陆军因此,海军它们可以用来表达输入I,海军这个过程也是自动学习得到的。空军如果我们在上述式子上加上L1的REGULARITY限制,海军得到红军空军MIN陆军|I陆军陆军O|陆军陆军U|A1|陆军陆军|A2|陆军陆军陆军陆军|AN陆军|水军空军陆军陆军陆军陆军陆军陆军陆军陆军这种方法被称为SPARSE陆军CODING。空军通俗的说,海军就是将一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论