版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
研究生教学版第二章卷积神经网络CNN从卷积原理、训练机制到典型网络与视觉任务面向2026:从经典CNN走向视觉基础模型与高效部署本章建议•页数约15页,可覆盖1–2节课•主线:原理→架构→任务→2026扩展•重点:卷积/池化、LeNet/AlexNet/VGG/GoogLeNet、检测/分割/识别•难点:感受野、反向传播、尺度建模、CNN与Transformer的关系关键词:局部连接|参数共享|感受野|检测|分割1/15学习目标与教学安排2/15神经网络与深度学习|研究生教学版学习目标•解释卷积、池化、步长、填充、感受野与参数共享的数学与工程意义•掌握LeNet、AlexNet、VGG、GoogLeNet的设计动机与结构差异•理解CNN在检测、识别、分割中的基本范式•能够从2026视角评价CNN与Transformer/基础模型的关系建议授课节奏•第1课:卷积与池化、训练算法、典型网络•第2课:检测/识别/分割与2026扩展建议课前提问•为什么图像任务不直接使用全连接网络?•卷积为什么能显著减少参数量?•池化为什么既帮助泛化,也会损失细粒度位置信息?•在Transformer很强的今天,为什么CNN仍未消失?课堂产出•原理层:卷积/池化/反传•架构层:LeNet→Inception•应用层:检测/识别/分割教材结构与本章主线3/15神经网络与深度学习|研究生教学版2.1–2.3基础原理•卷积运算•池化•卷积层/池化层/全连接层•多通道与感受野2.4–2.5训练与典型网络•反向传播•SGD与Fine-Tune•LeNet•AlexNet/VGG/GoogLeNet2.6–2.8应用展开•人脸检测与目标检测•关键点定位与人脸识别•图像分割•图形学/NLP2.9历史与发展•CNN的历史演进•与2026模型生态的关系课堂抓手:不要只记模型名称,更要理解它们分别在解决什么瓶颈,例如参数量、可训练性、尺度建模、速度与定位精度。为什么CNN在图像上有效4/15神经网络与深度学习|研究生教学版局部连接•图像相关性主要发生在局部邻域。卷积核只看局部窗口,避免了全连接的参数爆炸。参数共享•同一个卷积核在整幅图像上重复使用,本质上是“同一模式到处找”。参数量与存储成本显著下降。平移等变•输入发生平移时,特征图会相应平移。它不是完全不变,而是“以同样方式变化”。层次表征•前层学边缘与纹理,后层学部件与对象。深层网络把局部模式逐层组合成语义概念。要点:CNN的优势不是“神秘”,而是把图像先验写进了结构之中。卷积运算:从公式到输出尺寸5/15神经网络与深度学习|研究生教学版核心公式教材强调:神经网络实现中常用的是不翻转卷积核的互相关(cross-correlation),工程实现更直接。尺寸关系•P:padding;S:stride;K:kernelsize•步长变大,分辨率下降更快•填充用于控制边界信息与输出尺寸教材示意图池化、下采样与感受野6/15神经网络与深度学习|研究生教学版池化在做什么?•用局部区域的统计值替代原始响应•常见形式:最大池化、平均池化•作用:降维、增强局部平移不敏感性、减少下层计算量教材中的数值示例感受野为什么重要?•浅层感受野小,抓边缘与纹理•深层感受野大,聚合更宽上下文•堆叠小卷积核可在控制参数量的同时扩大有效感受野课堂提醒:池化不是无条件更好•优点:更稳、更省算力、更抗微小扰动•代价:精细位置信息丢失,密集预测任务受影响•因此检测与分割网络常改用步长卷积、空洞卷积、FPN或上采样路径从正向传播到训练:本章需要抓住的工程逻辑7/15神经网络与深度学习|研究生教学版输入图像张量卷积局部感受野+共享参数非线性ReLU等池化/步长降采样分类头输出概率或回归量反向传播关注什么?•卷积层要把“误差对输出的梯度”传回卷积核与输入特征图•池化层没有可学习参数,但要把梯度正确路由回最大值位置或均匀分配•Mini-batchSGD用少量样本估计整体梯度,是深度学习训练的基本工作流为什么2012之后CNN能真正跑起来?•ReLU缓解深层网络梯度消失•Dropout、数据增强、归一化改善泛化与稳定性•GPU/TPU与大数据集使深层卷积网络具备现实可训练性•迁移学习/Fine-Tune让预训练特征在新任务上复用典型网络谱系:LeNet→AlexNet→VGG→GoogLeNet8/15神经网络与深度学习|研究生教学版1998LeNet-5卷积+池化首次成型2012AlexNetReLU+Dropout+GPU2014VGG小卷积核堆叠,深度提升2014GoogLeNetInception,多尺度并行每一步改进都在回答同一个问题:如何让CNN更深、更准、更快、参数更省?LeNet与AlexNet:从可行原型到工程拐点9/15神经网络与深度学习|研究生教学版LeNet-5(1998)•面向手写数字识别,输入为28×28灰度图•卷积层+池化层+全连接层的经典范式•参数规模小,体现了“结构化先验胜过全连接暴力建模”AlexNet(2012)•在ImageNet上大幅领先第二名,重新点燃CNN热潮•关键工程点:ReLU、Dropout、GPU训练、更深网络•说明“足够数据+足够算力+训练技巧”可让深层CNN发挥威力教学结论:LeNet证明CNN可行;AlexNet证明CNN可扩展、可工业化。VGG与Inception:两种“变深”的不同答案10/15神经网络与深度学习|研究生教学版VGG的答案:堆叠小卷积核•统一使用3×3卷积核,把大卷积核的感受野拆解为多层小卷积•优点:参数更省、非线性层更多、结构规则整齐•代价:计算量仍然较大,后期成为很多检测/分割模型的骨干网络Inception的答案:多尺度并行+1×1降维•同一层同时做1×1、3×3、5×5卷积与池化,再拼接输出•核心目标:既要多尺度建模,又要控制计算量•1×1卷积在这里是“通道重排与降维工具”,不是简单线性层比较视角:VGG更规整;Inception更强调计算预算下的多尺度表达。检测、关键点与识别:CNN如何走向“结构化输出”11/15神经网络与深度学习|研究生教学版CascadeCNN•逐级筛掉非人脸窗口,保证速度。DenseBox•全卷积网络直接输出框与置信度。MTCNN•Proposal/Refinement/Output三阶段逐步求精。关键点定位•从分类走向坐标回归,支撑对齐与识别。研究生应理解的不是算法名字本身,而是输出空间从“类别标签”扩展到“矩形框+坐标+关键点”的过程。通用目标检测:从R-CNN系列到YOLO/SSD12/15神经网络与深度学习|研究生教学版一条线索:候选框是“先提再判”,还是“直接回归”?R-CNNSelectiveSearch+CNN+SVMSPP/FastR-CNN共享卷积特征+RoIPoolingFasterR-CNNRPN生成候选框YOLO网格化直接预测SSD多尺度特征图+默认框教材评价逻辑:检测精度看mAP,定位质量看IoU,工程取舍还要同时看速度、尺度适应性和候选框生成成本。人脸识别:从分类损失走向度量学习13/15神经网络与深度学习|研究生教学版教材中的三条路线•DeepFace:3D对齐+CNN特征提取•DeepID:多图像块、多网络与识别/验证联合监督•FaceNet:直接学习到嵌入空间,使用TripletLossTripletLoss思路•anchor与positive应更近•anchor与negative至少拉开marginα•本质是直接优化“相似性几何结构”研究问题•损失函数如何更稳?•数据噪声与类内变化如何处理?•对齐、遮挡、姿态变化如何影响嵌入?•在大规模身份库中如何高效检索?这一页对应的是一个重要转向:CNN不再只输出“类别”,而是输出一个可以比较距离的表征空间。图像分割:FCN、SegNet、DeepLab与下一章的接口14/15神经网络与深度学习|研究生教学版教材中的关键转折•分类网络输出一个标签;分割网络需要对每个像素给出类别•因此必须把“下采样得到的语义”重新映射回高分辨率空间•FCN用全卷积+上采样打通了像素级预测的基本框架从本章走向第7章•本章只建立分割问题的总体视角•第7章将系统展开FCN、U-Net等网络•建议学生把“空间分辨率恢复”作为连接两章的抓手教材图2-16与2-17:FCN/SegNet2026视角:CNN的位置、视觉基础模型与部署效率15/15神经网络与深度学习|研究生教学版CNN还重要吗?•在通用视觉理解上,Transformer/多模态基础模型已成为主流接口•但在边缘设备、实时检测、早期特征提取与多尺度金字塔中,CNN仍有很强生命力•工程上大量系统采用“卷积stem+Transformer主体”的混合结构SAM2/Gemini2.5•SAM2代表promptablesegmentation,从固定类别像素分类走向可交互视觉接口•Gemini2.5的视频理解说明视觉模型不再只输出
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【 生物 】人与自然和谐共生教学课件-2025-2026学年人教版生物八年级下册
- 髌骨骨折康复宣教
- 2023年浙江自贸区海泰石化科技有限公司招聘考试真题
- 广电系统消防安全培训方案
- 青霉素使用须知
- 期中考试后教师会议上校长的讲话:以考促教抓落实深耕细研提质效
- 2024工程维修简单的合同范本
- 2024-2025学年高二数学上学期期末-专题07 数列的概念与通项公式(解析版) 人教A
- 2023年普通高等学校招生全国统一考试模拟考试语文试题及答案
- 职业病隐患排查记录表
- (2025)CSCO小细胞肺癌诊疗指南
- 消除艾滋病、梅毒和乙肝母婴传播乡村医生培训会-课件
- 《建设工程设计优化服务标准》
- 辣椒课件教学课件
- 2025建安杯信息通信建设行业安全竞赛题库及答案
- DBJ51-T 252-2024 四川省城市综合管廊检测与评估技术标准
- 省委党校研究生现代管理学试题及答案
- 人工智能+行动高校人工智能+人才培养模式创新研究报告
- 手外伤课件教学课件
- 国资委问题清单及整改措施
- 输液导管相关静脉血栓形成防治中国专家共识解读
评论
0/150
提交评论