




已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
深度学习及其视觉应用 丁贵广 GuiguangDing清华大学软件学院dinggg 深度学习及视觉应用 深度学习概述视觉应用 深度学习 神经网络是多层函数嵌套形成的模型 受到生物神经机制的启发 构建多隐层的模型 深度学习 本质 通过构建多隐层的模型和海量训练数据 可为无标签数据 来学习更有用的特征 从而最终提升分类或预测的准确性 深度模型 是手段 特征学习 是目的 与浅层学习区别 1 强调了模型结构的深度 通常有5 10多层的隐层节点 2 明确突出了特征学习的重要性 通过逐层特征变换 将样本在原空间的特征表示变换到一个新特征空间 从而使分类或预测更加容易 与人工规则构造特征的方法相比 利用大数据来学习特征 更能够刻画数据的丰富内在信息 深度学习的里程碑 2006年 加拿大多伦多大学教授 机器学习领域的泰斗GeoffreyHinton在 科学 上发表论文提出深度学习主要观点 1 多隐层的人工神经网络具有优异的特征学习能力 学习得到的特征对数据有更本质的刻画 从而有利于可视化或分类 2 深度神经网络在训练上的难度 可以通过 逐层初始化 layer wisepre training 来有效克服 逐层初始化可通过无监督学习实现的 DeepLearning的效果 CNN 卷积神经网络 ConvolutionalNeuralNetworks CNN 深度学习的具体模型及方法 深度学习的具体模型及方法 卷积波尔兹曼机 ConvolutionalRBM 局部感受权值共享 减少参数的方法 每个神经元无需对全局图像做感受 只需感受局部区域 FeatureMap 在高层会将这些感受不同局部的神经元综合起来获得全局信息 每个神经元参数设为相同 即权值共享 也即每个神经元用同一个卷积核去卷积图像 深度学习的具体模型及方法 卷积波尔兹曼机 ConvolutionalRBM 隐层神经元数量的确定 神经元数量与输入图像大小 滤波器大小和滤波器的滑动步长有关 例如 输入图像是1000 x1000像素 滤波器大小是10 x10 假设滤波器间没有重叠 即步长为10 这样隐层的神经元个数就是 1000 x1000 10 x10 10000个 深度学习的具体模型及方法 卷积波尔兹曼机 ConvolutionalRBM 多滤波器情形 不同的颜色表示不同种类的滤波器 每层隐层神经元的个数按滤波器种类的数量翻倍每层隐层参数个数仅与滤波器大小 滤波器种类的多少有关例如 隐含层的每个神经元都连接10 x10像素图像区域 同时有100种卷积核 滤波器 则参数总个数为 10 x10 1 x100 10100个 深度学习的具体模型及方法 卷积波尔兹曼机 ConvolutionalRBM CNN的关键技术 局部感受野 权值共享 时间或空间子采样CNN的优点 1 避免了显式的特征抽取 而隐式地从训练数据中进行学习 2 同一特征映射面上的神经元权值相同 从而网络可以并行学习 降低了网络的复杂性 3 采用时间或者空间的子采样结构 可以获得某种程度的位移 尺度 形变鲁棒性 3 输入信息和网络拓扑结构能很好的吻合 在语音识别和图像处理方面有着独特优势 对象识别 CNN 5个卷积层和2个全连接层每层卷积核个数96 256 384 384 256 监督学习 卷积神经网络 96个低级卷积核 监督学习 卷积神经网络 网络庞大 但容易收敛唯一不需要特定初始化参数就可以训练成功比较容易并行化训练 并且可以利用GPU加速在计算机视觉 CV 领域取得成功 深度学习及视觉应用 深度学习概述深度视觉应用 Classification Detection Segmentation ImageCaptioning ImageGenerator ImageCaptioning ImageGenerator CNNModel ConvolutionalNeuralNetworkBasedonCaffeFrameworkBasicModelZFNetVGGNetGoogleNetResNetDenseNetSqueezeNet Classification ObjectDetection 模型 R CNN FastR CNN FasterR CNN YOLO SSD等知名框架精度 PASCALVOC上的mAP 从R CNN的53 3 FastRCNN的68 4 FasterR CNN的75 9 FasterRCNN结合残差网 Resnet 101 达到83 8 速度 从最初的RCNN模型 处理一张图片要用2秒多 到FasterRCNN的198毫秒 张 再到YOLO的155帧 秒 最后出来了精度和速度都较高的SSD 精度75 1 速度23帧 秒 ObjectDetection R CNN 2013 ObjectDetection FastR CNN 2015 Results FasterR CNN FasterR CNN FasterRCNN物体检测系统 Problem SmallObjectDetection ObjectRecognition PersonandCarDetectionBasedonFasterR CNN Input conv3 conv4 conv5 fc6 pooling normalize concatenate convolute IRNN ContextInformation SkipLayerPooling ImprovementBasedonFasterR CNN ImprovementBasedonFasterR CNN 扩大输入图像分辨率修改Anchor的长宽比HardNegativeSampleMining SomeResults SomeResults VOCObjectDetectionTask SomeResults PedestrianDetection Tracking CarDetection Tracking DetectionandClassification DetectionandClassification 行人检索与属性识别 监控视频分析原型系统 系统演示 监控视频中的汽车分类 FaceDetection Recognition Segmentation FullyConvolutionalNetworks FullyConvolutionalNetworks SemanticSegmentation 检测与分割 语义分割 ImageCaptioning ImageCaptioning thebigbenclocktowertoweringoverthecityofLondon BasedStructure NIC Encoder decodermodelNIC NeuralImageCaption modelCNN encodetheimageforsentencesLSTM decodetheimagevectortoasentence Model GAN及ReinforcementLearning 生成器网络编码器 解码器结构NIC模型为图像生成描述解码器网络分类网络分辨句子是真实数据还是生成的有多种结构可以选择Gated CNNText CNN基准值网络 MLP 优化分布 减少策略梯度过程中估计的方差 Experiments Dataset MSCOCO12
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北省高阳县2025年上半年事业单位公开遴选试题含答案分析
- 基于多源数据的交通事故预测模型研究-洞察及研究
- 灌肠术操作课件教学
- 胰腺囊肿免疫标志物研究-洞察及研究
- 仓储机器人协同-洞察及研究
- 员工体验优化方案-洞察及研究
- 知识付费培训骗局套路课件
- 铁矿山行业基本知识培训课件
- 钻石行业知识培训总结课件
- 危机应对机制-洞察及研究
- 中级政工考试题库及答案
- (2025年标准)工作就业协议书
- 医疗公司加盟管理办法
- 2025年浙江省中考道德与法治试题答案详解讲评(课件)
- 如何用飞书高效讲解
- 广州南沙深化面向世界的粤港澳全面合作白皮书(2022.06-2025.06)
- 2025年陕西教师编制招聘考试笔试试题(含答案)
- 信息公开条例培训课件
- 2025年留疆战士考试题库及答案
- 新初一入学分班考试语文卷(含答案)
- 2025年高考英语新课标Ⅱ卷点评及2026备考方向 课件
评论
0/150
提交评论