基于人工智能算法的图像识别与生成

上传人：神*** IP属地：江西上传时间：2020-04-10 格式：DOC 页数：8 大小：30KB 积分：12 举报 版权申诉

免费预览已结束，剩余3页可下载查看

 付费下载

下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

基于人工智能算法的图像识别与生成摘要本次报告的工作是利用 PCA SVM 以及人工神经网络 ANN 实现对人脸的特征提取分类和预测然后利用 GAN 生成对抗网络实现对手写数字的生成并用 SVM 做预测验证生成效果本次报告采用的数据源自剑桥大学的 ORL 人脸数据库其中包含 40 个人共 400 张人脸图像关键词人工智能图像识别数据中图分类号 TP18 文献标识码 A 文章编号 1009 3044 2018 13 0173 02 1 PCA 降维 PCA principal components analysis 即主成分分析又称主分量分析旨在利用降维的思想把多指标转化为少数几个综合指标首先我们给出了数据库的平均脸的图像并利用 PCA 对人脸降维通过改变降低到的维度研究了保留维度的多少带来的影响最后给出了每一个维度的特征脸图像讨论了每一个维度所能够代表的人脸信息 1 1 平均脸首先我们将数据库中 400 张人脸按行存储到一个矩阵中即每一行为一张人脸 10304 像素每张人脸共 10304 维特征我们对每一个维度去平均构成一个新的行向量这就是平均脸平均脸反映了数据库中 400 张人脸的平均特征可以看清人脸的轮廓但无法识别人脸的局部细节 1 2 降低至不同维度时还原脸的情况从左到右从上到下依次是同一张脸降低至 10 30 50 100 200 250 300 350 400 的图像可以看到随着保留维数的增多图像越清晰与原图的差异越小 1 3 提取单一维度的特征做还原为了研究不同维度所代表的人脸的信息我们把 PCA 之后的每一个特征向量单独提取出来对人脸做还原还原的时候不加入平均脸并且做直方图均衡化结果如下每一张图像下方的数字代表了 PCA 之后按特征值从大到小排序的顺序比如第一张图代表 PCA 之后最大特征值所对应的特征向量还原出的人脸特征累积图的纵坐标代表了所保留的特征占总特征的比例它是这样计算出来的假设保留 k 维信息则纵坐标值为这 k 个特征值的和除以总的 400 400 10304 的矩阵最多有 400 个非零特征值个特征值的和从图 4 可以看出当保留维数为 100 维时即能保留人脸 90 的信息而之后随着保留维数的增多保留信息的增多变缓同样的结论也可由提取每个维度所代表的特征获得从前到后观察实验所得的图像我们可以发现人脸变得越来越模糊到 100 维以后已经分辨不清人脸了这就说明前面的维度反映了大众脸的特征而越往后面的维度则反映不同人脸的细节比如头发长短等等以及图片噪声 2 SVM 对人脸分类 SVM 支持向量机是 Corinna Cortes 和 Vapnik 等于 1995 年首先提出的在机器学习中支持向量机是与相关的学习算法有关的监督学习模型可以分析数据识别模式用于分类和回归分析 2 1 制作多分类器用 PCA 对人脸降维以后我们用 SVM 将 400 张人脸进行分类我们取每个人的前五张照片合并起来共 200 张作为训练集每个人后五张照片合并起来共 200 张作为测试集 40 个人即有 40 个标签也就是有 40 类但 SVM 只能作二分类器因此我们利用二分类器生成多分类器基本思想是制作 C 40 2 个一对一分类器也就是每两个类别一个每一张照片都分别用所有一对一分类器分类分类结果存储到投票矩阵中分类结果就是投票矩阵中数字最大的那个分类前我们还需对 PCA 后的数据进行归一化处理将图像矩阵的每一个元素映射到 1 1 之间 2 2 参数选择及程序结果 1 分类数据每人取前五张做训练后五张做测试不加入自己的人脸 SVM 参数设定 k 75 PCA 降至 75 维 Sigma 30 c 15 预测准确率 accuracy 0 8950 2 每人取前五张做训练后五张做测试加入自己的人脸 SVM 参数同上预测准确率 accuracy 0 8585 我们发现当加入自己拍摄的人脸图像后预测准确率有一定的下降这可能是由于拍照时的光线角度等造成的 3 ANN 对人脸分类人工神经网络 Artificial Neural Networks 简写为 ANNs 也简称为神经网络 NNs 或称作连接模型 Connection Model 它是一种模仿动物神经网络行为特征进行分布式并行信息处理的算法数学模型这种网络依靠系统的复杂程度通过调整内部大量节点之间相互连接的关系从而达到处理信息的目的为了方便与 SVM 的结果作比对 ANN 的训练集和测试集与 SVM 相同并且不加入自己人脸 3 1 ANN 结果及与 SVM 分类比较 ANN 分类结果 ANN 参数设定为 1 个隐层含 200 个神经元学习率 1 dropout fraction 0 5 激活函数 sigmoid L2 正则 0 0001 epoch 200 batchsize 50 分类错误率即分类准确率 accuracy 为 93 5 验过程中可以发现通过对神经网络多个参数的调节准确率的变化是很复杂的最终的 93 5 的准确率应该还有上升的空间参数还待进一步调整与 SVM 比较起来 ANN 准确率更高但分析表明对于本次报告所采用的数据库 ANN 和 SVM 的准确度不会有太大差异因此 SVM 的参数或许还可以进一步优化 4 GAN 生成手写数字生成对抗网络 GAN 是一种深度学习模型是近年来复杂分布上无监督学习最具前景的方法之一模型通过框架中至少两个模块生成模型 Generative Model 和判别模型 Discriminative Model 的互相博弈学习产生相当好的输出原始 GAN 理论中并不要求 G 和 D 都是神经网络只需要是能拟合相应生成和判别的函数即可但实用中一般均使用深度神经网络作为 G 和 D 在下面的工作中我们利用已有的手写数字 0 9 图片 60000 张用于训练 10000 张用于测试对生成对抗网络 GAN 进行训练并生成手写数字每个数字提取 5000 个样本作为训练集最后用 SVM 对电脑生成的手写数字分类看是否能骗过分类器 4 1 参数设定及程序结果首先我们选取一个想要生成的手写字体将已有数据中所有该字体挑出并取前 5000 个作为训练集参数设定生成器 generator 输入层隐层和输出层分别有 100 512 784 个神经元识别器 discriminator 输入层隐层和输出层分别有 784 200 1 个神经元学习率 0 01 Batchsize 50 更新判别器时的迭代次数设为 1 生成训练集 load mnist uint8 classify num 9 classify matrix zeros 1 10 classify matrix classify num 1 1 choose zeros size train x 1 1 for i 1 size train x 1 if train y i classify matrix choose i choose i 1 end end choose logical choose train x train x choose train x train x 1 5000 train x double reshape train x 5000 28 28 255 train x permute train x 1 3 2 train x reshape train x 5000 784 生成器损失虽然不是很低但是最终基本稳定 4 2 SVM 对生成手写数字做分类我们用 GAN 分别生成 0 到 9 的手写数字将生成的图片作为测试集用 SVM 做分类看是否能分到正确的类别 Result 是 SVM 中的投票矩阵投票数最多的一个的序号减一即为所分到的类别数字 0 9 这里的 SVM 别于前面所讨论的人脸识别的 SVM 它是由 45 个 C 10 2 一对一分类器生成的多分类器可以看到每一个由 GAN 生成的手写数字均被 SVM 分到了正确的类别如此可见 GAN 实在强大 5 总结运用 PCA 对原始数据进行降维不仅能够保留原始的主要信息而且可以

人人文库> 全部分类> 应用文书 > 作业报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于人工智能算法的图像识别与生成

文档简介

温馨提示

最新文档

评论

基于人工智能算法的图像识别与生成

文档简介

温馨提示

最新文档

评论

相关文档