基于人工智能算法的图像识别与生成

上传人：m*** IP属地：天津上传时间：2022-02-06 格式：DOCX 页数：8 大小：14.60KB 积分：18 举报 版权申诉

已阅读5页，还剩3页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、基于人工智能算法的图像识别与生成摘要：本次报告的工作是利用 PCA ， SVM 以及人工神经网络（ ANN ）实现对人脸的特征提取、分类和预测。然后利用 GAN （生成对抗网络）实现对手写数字的生成，并用SVM 做预测，验证生成效果。本次报告采用的数据源自剑桥大学的 ORL 人脸数据库，其中包含40 个人共 400 张人脸图像。关键词：人工智能；图像识别；数据中图分类号： TP18 文献标识码： A 文章编号： 1009-3044（2018） 13-0173-021 PCA 降维PCA （ principal components analysis ）即主成分分析，又称主分量分析。旨在利用

2、降维的思想，把多指标转化为少数几个综合指标。首先我们给出了数据库的平均脸的图像，并利用 PCA对人脸降维，通过改变降低到的维度研究了保留维度的多少带来的影响。最后给出了每一个维度的特征脸图像，讨论了每一个维度所能够代表的人脸信息。1.1 平均脸首先，我们将数据库中 400 张人脸按行存储到一个矩阵中，即每一行为一张人脸（ 10304 像素），每张人脸共10304维特征。我们对每一个维度去平均，构成一个新的行向量，这就是平均脸。平均脸反映了数据库中 400 张人脸的平均特征，可以看清人脸的轮廓，但无法识别人脸的局部细节。1.2 降低至不同维度时还原脸的情况从左到右从上到下依次是同一张脸降低至

3、 10 ， 30 ， 50，100 ， 200， 250 ， 300 ， 350， 400 的图像。可以看到，随着保留维数的增多，图像越清晰，与原图的差异越小。1.3 提取单一维度的特征做还原为了研究不同维度所代表的人脸的信息，我们把 PCA之后的每一个特征向量单独提取出来对人脸做还原，还原的时候不加入平均脸并且做直方图均衡化。结果如下：每一张图像下方的数字代表了 PCA 之后按特征值从大到小排序的顺序，比如第一张图代表PCA 之后最大特征值所对应的特征向量还原出的人脸。特征累积图的纵坐标代表了所保留的特征占总特征的比例。它是这样计算出来的，假设保留k维信息，则纵坐标值为这 k 个特征值的和

4、除以总的 400 （400*10304 的矩阵，最多有400 个非零特征值）个特征值的和。从图4 可以看出，当保留维数为100维时，即能保留人脸 90% 的信息，而之后随着保留维数的增多，保留信息的增多变缓。同样的结论也可由提取每个维度所代表的特征获得。从前到后观察实验所得的图像，我们可以发现，人脸变得越来越模糊，到 100 维以后已经分辨不清人脸了。这就说明前面的维度反映了大众脸的特征，而越往后面的维度则反映不同人脸的细节，比如头发长短等等，以及图片噪声。2 SVM 对人脸分类SVM （支持向量机）是 Corinna Cortes 和 Vapnik 等于 1995年首先提出的，在机器学习中，

5、支持向量机是与相关的学习算法有关的监督学习模型，可以分析数据，识别模式，用于分类和回归分析。2.1 制作多分类器用 PCA 对人脸降维以后，我们用 SVM 将 400 张人脸进行分类。我们取每个人的前五张照片合并起来共200 张作为训练集，每个人后五张照片合并起来共200 张作为测试集。40 个人即有 40 个标签，也就是有40 类，但 SVM 只能作二分类器，因此我们利用二分类器生成多分类器，基本思想是制作 C（ 40 ， 2）个一对一分类器（也就是每两个类别一个），每一张照片都分别用所有一对一分类器分类，分类结果存储到投票矩阵中，分类结果就是投票矩阵中数字最大的那个。分类前，我们还需对

6、PCA 后的数据进行归一化处理，将图像矩阵的每一个元素映射到（ -1 ， 1）之间。2.2 参数选择及程序结果1）分类数据：每人取前五张做训练，后五张做测试（不加入自己的人脸）SVM 参数设定： k = 75 （PCA 降至 75维）Sigma = 30c = 15预测准确率： accuracy=0.89502）每人取前五张做训练，后五张做测试（加入自己的人脸）SVM 参数同上，预测准确率： accuracy=0.8585我们发现，当加入自己拍摄的人脸图像后，预测准确率有一定的下降，这可能是由于拍照时的光线，角度等造成的。3 ANN 对人脸分类人工神经网络（ Artificial

7、 Neural Networks ，简写为 ANNs ）也简称为神经网络（NNs ）或称作连接模型（ConnectionModel ），它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。为了方便与SVM 的结果作比对， ANN 的训练集和测试集与 SVM 相同，并且不加入自己人脸。3.1 ANN 结果及与 SVM 分类比较ANN 分类结果：ANN 参数设定为： 1 个隐层，含200 个神经元学习率： 1dropout fraction ： 0.5激活函数： sigmoidL2

8、正则： 0.0001epoch： 200batchsize： 50分类错误率：即分类准确率（accuracy）为：93.5%?验过程中可以发现，通过对神经网络多个参数的调节，准确率的变化是很复杂的，最终的93.5% 的准确率应该还有上升的空间，参数还待进一步调整。与 SVM 比较起来， ANN 准确率更高，但分析表明，对于本次报告所采用的数据库， ANN 和 SVM 的准确度不会有太大差异，因此 SVM 的参数或许还可以进一步优化。4 GAN 生成手写数字生成对抗网络（ GAN ）是一种深度学习模型，是近年来复杂分布上无监督学习最具前景的方法之一。模型通过框架中（至少）两个模块：生成模

9、型（ Generative Model ）和判别模型( Discriminative Model )的互相博弈学习产生相当好的输出。原始 GAN 理论中，并不要求 G 和 D 都是神经网络，只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为 G 和 D 。在下面的工作中，我们利用已有的手写数字( 0-9 ) 图片( 60000 张用于训练， 10000 张用于测试) ，对生成对抗网络( GAN )进行训练并生成手写数字，每个数字提取5000 个样本作为训练集。最后用 SVM 对电脑生成的手写数字分类，看是否能“骗过”分类器。4.1 参数设定及程序结果首先，我们选取一个

10、想要生成的手写字体，将已有数据中所有该字体挑出并取前 5000 个作为训练集。参数设定：生成器(generator) ：输入层、隐层和输出层分别有 100 ， 512 ， 784 个神经元。识别器(discriminator ) ：输入层、隐层和输出层分别有784 ， 200， 1 个神经元。学习率：0.01Batchsize ： 50更新判别器时的迭代次数设为 1生成训练集：load ( 'mnist_uint8' ) ；classify_num = 9 ；classify_matrix = zeros （ 1 ， 10 ）；classify_matrix （ classi

11、fy_num+1 ） = 1 ；choose = zeros（ size（train_x ， 1）， 1）； for i=1 ： size（ train_x ， 1） if （ train_y （ i ，：） =classify_matrix ）choose（ i ） = choose（ i） +1 ；end end choose = logical （ choose）；train_x = train_x （ choose，：）；train_x = train_x （ 1： 5000，：）；5000， 28 ， 28））train_x = double （ reshap

12、e（ train_x ，/255；train_x = permute （ train_x ， 1 ， 3， 2 ）；train_x = reshape （ train_x ， 5000 ， 784 ）；生成器损失虽然不是很低，但是最终基本稳定。4.2 SVM 对生成手写数字做分类我们用 GAN 分别生成 0 到 9 的手写数字，将生成的图片作为测试集用 SVM 做分类，看是否能分到正确的类别。Result 是 SVM 中的投票矩阵，投票数最多的一个的序号减一即为所分到的类别（数字0-9）。这里的SVM?八别于前面所讨论的人脸识别的 SVM ，它是由 45 个（ C （ 10， 2））一对一分类器生成的多分类器。可以看到，每一个由 GAN 生成的手写数字均被SVM 分到了正确的类别，如此可见 GAN 实在强大。5 总结运用 PCA 对原始数据进行降维，不仅能够保留原始的主要信息，而且可以

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于人工智能算法的图像识别与生成

文档简介

温馨提示

最新文档

评论

基于人工智能算法的图像识别与生成

文档简介

温馨提示

最新文档

评论

相关文档