版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、LOGO 机器学习(ML第11组) 图像压缩图像压缩 (BP神经网络) 神经网络应用神经网络应用 手写数字识别手写数字识别 (概率神经网络) 求解最优策略求解最优策略 (利用基于值迭代的 MDP算法求解最优策 略) 马尔科夫决策过程马尔科夫决策过程 应用应用 ML BP神经网络实现图像压缩神经网络实现图像压缩 唐 璇 E13201073 罗威亚 E13201055 LOGO Contents 问题背景1 BP神经网络建模2 BP神经网络压缩的实现3 结果与分析4 LOGO 问题背景 v常见的文件压缩软件如WinZip、WinRAR等采用 的是无损压缩,能够完全完全恢复原文件内容。 v多媒体信息
2、具有信息量大、冗余信息多的特点, 往往采用有损压缩技术。 JPEG压缩(变换编码与熵编码) 基于小波变换的图像压缩算法 分形压缩编码 矢量量化压缩编码 图像压缩算法图像压缩算法 LOGO 问题背景 vBP神经网络是一种多层前向神经网络,是 整个人工神经网络体系中的精华,广泛应用 于分类识别、逼近、回归和压缩。实际应用 中80%的神经网络模型采取了BP网络或者BP的 变化形式。 vBP神经网络实现图像压缩,依赖BP网络的 非线性映射能力非线性映射能力进行数据压缩。 v实验结果表明,采用BP神经网络对灰度图 像进行压缩,在保证较好峰值信噪比(PSNRPSNR) 的情况下,达到了较高的压缩比。 LO
3、GO BP神经网络建模(模型的压缩原理) BP神经网络用于压缩的网络模型构建: v 采用一个隐含层,则整体构成一个三层的网络。 v 把一组输入模式通过少量的隐含层单元映射到一组输出模式, 并使输出模式尽可能等于输入模式。(隐含层神经元的值和 相应的权值向量可以输出一个与原输入模式相同的向量) 输入层输入层隐含层隐含层输出层输出层 解码解码 编码编码 补充:理论已经证明, 单个隐含层单个隐含层的网络可以 通过适当增加神经元节 点的个数实现任意非线任意非线 性映射性映射。所以,单个隐 含层可满足大部分应用 需要。 压缩原理压缩原理:当隐含层神 经元的个数较少时,就 意味着隐含层隐含层能用更少更少
4、的数来表现输入模式的数来表现输入模式, 而这,实际上就是压缩压缩。 LOGO BP神经网络建模(压缩解压过程) v 假设网络的输入层和输出层均有M个神经元组成,隐含层包 含I个神经元,且IM,则输入模式必须进行压缩编码,结果 保存在隐含层。 v 输入层到隐含层的变换相当于压缩的编码过程;隐含层到输 出层的变换相当于压缩的解码过程。 编码 编码结果编码结果 解码 输入层,M个神经元 隐含层,I个神经元,IM 输出层,M个神经元 输入数据 重建数据 LOGO BP神经网络建模(图像压缩编码) v 输入图像数据:假设图像为像素NN大小,以KK为单位 进行划分,将图像细分为一个个图像块。图像块中每一个
5、像 素点与一个输入或输出神经元相对应,如下模型。 v 样本学习:网络随机地抽取图像中各KK图像块作为学习 模式,使用反向传播算法进行学习,通过调整网络中神经元 之间的连接权值,使训练集图像的重建误差E=f-g的均值达 到最小。训练好的网络隐含层神经元矢量隐含层神经元矢量便是数据压缩的结 果,而输出层神经元矢量输出层神经元矢量便是重建后的数据。 原始图像 重建图像 K K K K LOGO BP神经网络建模 vBP网络的计算模型 wij,bj x2x3xM y1 y2y3yM wji,bi hj x1 编码过程 解码过程 I1 ,fh M 1 j jbxw i jiij M1 ,gy I 1 i
6、 ibhw i ijji 隐含层第j个神经元输出值: 输出层第i个神经元输出值: LOGO BP神经网络压缩的实现 图像块划分归一化 BP网络 训练 保存结果 将图像的二 维矩阵分成 KK的一 个个块,输 出K2N 矩阵 (样矩阵) 除以255,得 数据位于01 之间。 (这样能提高 压缩率,灰度 图像的灰度值 0255) l采用神经网 络工具箱函数 feedforward创 建前向BP网络 l采用LM训练 法(收敛快) lnet的权值 lnet的阈值 l每个图像块 对应的隐含层 单元的输出 压缩步骤: 256256 164096 LOGO BP神经网络压缩的实现 load 图像块重建 (BP
7、网络解码) 反归一化 图像块恢复 l载入压缩文件 的数据 l预处理 for i=1:4096 Y(:,i)=com.lw* (com.d(:,i) +com.b; end 乘上255 164096矩阵 的每一列抽取 出来,重新排 列44矩阵, 并对44矩阵 按行排列以恢 复图像。 PSNR RATE 解压缩步骤: LOGO 结果 BP神经网络的训练(N=4): 程序设计: 两个函数 vblock_divide函数,用于图像块划分, 形成K2*N矩阵 vre_divide函数,用于图像块恢复 v脚本文件 vbp_imageCompress.m脚本负责压缩 lena.bmp图像(需要调用block
8、_divide 图像划分函数),压缩结果保存于 comp.mat中 vbp_imageRecon.m脚本负责解压 comp.mat(需要调用re_divide图像块 恢复函数) 训 练函数确定了 输入输出层向 量的维数 LOGO 结果 原始图像lena.bmp:重建图像: 块与块之间差异 较大,即出现块 效应现象。 PSNR: 32.4148 rate: 0.1465 LOGO 分析 v 现象:正如刚刚所看到的,块与块之间差异较大, 即出现块效应现象。这是由于设计的算法将图像 强行分割为44的块,并分别进行训练,所以出 现块效应现象。 v 压缩比率:由于后续没有进行熵编码等原因,算 法的压缩比率(14%)并不高。 v 图像质量:峰值信噪比(PSNR)为32.4148,其实 修改算法的参数(如改变隐含层神经元个数)可以 调节图像压缩的质量。 LOGO Table 压缩比提高, 但图像质量降 低 LOGO 重建效果对比(部分) N=1: N=2: N=4: N=10: 压缩率最高 重建质量最差 L
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年初中生学业规划与社区资源利用
- 2026年中考生物学一轮专题复习(河北) 人教版 八年级下册检测试卷(含答案)
- 采购货物定金退还协议书
- 广东企业协议书样本
- 智慧城镇的合同协议书模板
- 打伤赔偿协议书范本
- 防渗贴施工方案(3篇)
- 花园景区策划活动方案(3篇)
- 学院小活动策划方案(3篇)
- 芳香沙龙活动策划方案(3篇)
- 2025年医院党支部书记党建工作述职报告
- 羊水栓塞的急救与处理课件【文档课件】
- 大疆创新软件测试工程师晋升答辩含答案
- 2025 机器人售后运维服务报告:远程诊断、备件管理与盈利模式
- GB/T 46595-2025排水泵站一体化设备
- 输电线路工程试验检测项目计划
- 2025年高职汽车电子(汽车电子技术)试题及答案
- 幼儿园黄河介绍
- 内衣定制代加工合同
- 公司人事管理系列表格(从面试、入职、转正、到离职)模板
- 2026年新乡职业技术学院单招职业技能考试必刷测试卷新版
评论
0/150
提交评论