




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录第一章绪论 2第二章预备知识 3 42.1.1一神经元 42.1.2前馈神经网络模型 4 2.2.1卷积神经网络结构 5 6 63.2网络结构和参数设置 73.2.1网络模型结构 73.2.2参数设置 83.2.3手写数字识别代码及注释 83.3实验结果及分析 8 94.1人脸数据集介绍 4.2网络结构和参数设置 4.2.1网络结构 4.2.2参数设置 14.2.3人脸识别代码及注释 14.3实验结果及分析 4.3.1卷积核数量对识别率的影响 4.3.2特征维度对识别率的影响 第五章LBP和神经网络卷积的人脸识别 5.1LBP算子 5.2结合方式 5.3人脸识别LBP代码及注释 5.4实验探究 本文中利用卷积神经网络实现图像的分类问题,实践使用的是谷歌的深度学习框架第一章绪论图像识别是模式识别的重要领域之一,它涉及到手写数字识别、人脸识别、物体识别等多项识别技术。图像识别是指利用数字图像处理技术和人工智能技术,使计算机能够自动提取图像特征并对其进行识别。图像识别因其重要的商业应用价值而得到广泛研究和迅速发展,如信封上的邮政编码识别4、车牌识别、门禁中的人脸识别等。目前,图像识别技术逐渐成熟,并在日常生活中普及,给人类生活带来了巨大的便利。图像识别技术这一研究具有着重要的意义。深度学习是人工智能领域的重要研究方向之一。它可以通过模拟人脑的思维方式来处理人们现实生活中的问题。实际上,深度学习就是通过利用计算机技术的机器学习算法,从大量数据中,学习数据的潜在规律和特征,进而对新样本进行分类或识别。卷积神经网络是深度学习的一个非常重要的分支领域。它是模式识别和人工智能领域不可或缺的机器学习算法。受到研究人员和学者的追捧,相应的科研论文和报告不断大量出现。为解决神经网络的训练问题,Hinton在一九八六年给出了反向传播算法15(BackPropagation,BP)。反向传播算法能够在网络训练过程中通过自动调整网络参数,使网络模型的参数正确与最大程度地获取数据信息,进而利用训练中大量样本信息来掌握数据的内部计算规1989年,LeCun在多层神经网络中使用它来识概念的最早提出。直到1998年,LeCun提出了LeNet-5模型,并完成了神经网深度学习推动了机器学习的积极发展,并受到和技术公司的审查。广泛使用的主题包括了图像识别、语言理解以及自然语言自愿神经网络可以被重要因素取代:大量的数据集和强大GPU加速的大数据和硬件条件下,快速连接的神经网络已经发展起来2012年在ImageNet大赛中获得神经网络卷积冠军,把神经网络卷积在图像识别的地位放在了首要位置。因此,由于应用空间不再局限于手簿识识别已成为最重要的应用领域之一。2014年,Facebook提出了一种名为DeepFacel101的卷积8层神经网络,在LFW认证数据库中取得了非常好的识别率。香港大学唐晓鸥教授的一项调查提出了最和额外的认证监控,LFW识别率超过了人眼的识别率。2015年,深度学习的三大巨头LeCun、Bengioo和Hinton联合在Nature上发表了评论,传播高水平教学。2016年3月,AlphaGo击败李世石。第二章预备知识然后是神经网络的旋转,特别介绍了神经网络的结构、体Rosenblatt122在生物神经系统中的神经元系统基础上,于一九五八年提出了一个人工神经元操作方法,并引进了"感知器"技术来处理在字符识别领域的若干问题。其中感知器系统是一个人工神经网络。感知器是一种具有神经元数量和功能激活阈值的前馈网络。作为学习网络参数,认知效果能够经由零或一响应给定的输入数据而产生,因此也实现了目标对象的所有输入输出数据神经元是神经网络的基本处理单元。通常有多个输入和一个输出。基本结构示例如图所示。图1神经元结构图2.1.2前馈神经网络模型网络前馈神经网络是具有多个数据单元的网络。该网络包括输入层、输出层和可变层。每个隐藏层的神经元只与上层神经元或后层神经元相连,每层神经元不相连。图1是只有一个隐藏层的令人厌恶的中央神经网络图的示例。输入层有三个神经元ar、r_和xs。隐藏层也有3个神经元a2',ax和ag,这里代表第1个网络中第一个神经元的活跃值。输出层只有一个神经元hwo(z)输出层是计算层,增加了隐藏的利益冲突限制。如果将激活函数f(●被定义)定义为w作为第1层第j个神经元和1+1层第i个神经元之间的链接参数,而b"是第1+1层神经元Bias边界,神经元隐藏层的值计算如下:a²一f(W₂f"xr+W₂2²x2+Was²一f(Ws"x+W₂2²x2+WS“x3+by")图2神经元计算图图3各值之间的联系图2.2卷积神经网络卷积神经网络(CNN)是深度学习方法中最常用的网络结构。专门设计了一隐藏。每层由若干个神经元组成,最近的神经元的每一层都与第一层的两个相邻神经元之间的每一层相连。在图像问题的分析或分类中,将给定图像的输出绘制成向量结构,其中的每个神经元代表像素值。然而所以图像的精度非常有限;其次,在相邻的两的输入数据是三维空间图像的主要输入结构,保证了图像的空间完整性。同时,互联性的传播和连接神经网络通信的重要性大第三章基于卷积神经网络的手写数字识别本章内容是对一组数字中的连通神经网络的实验研究。MNIST首先引入了液滴和网络深度的影响,分别在LeNet-5网络上设计了各种网络结构。当完全MNIST数据存储是一个5英寸的签名数据集,内容是一张0到9阿拉伯数字的灰度图。MNIST数据存储在6万到1万张测试图片之间。学科和考试是相MNIST数据中放置的所有图像都经过尺寸标准化和中心化,每张图像组合成28×28灰度图像,像素值范围为0到255。部分数字图像如下图所示。从图中可以看出,不同的数字非常相似,相同的数字差异B3734P5在手写审查任务中,LeNet-5网络是已知的网络结构,示。网络结构包括输入层、三连接层、二连接层、全连接和输出层。输入数据输入层为32×32,第一层101为旋转层。它使用6卷积核5-5。输入数据经过卷积C1层的运算后,得到28×286个特征。图片。然后,将S2的第一层放在一起,将前一层的电影框内为6×14帧。C3层为第二个卷积层,使用了16个5-5卷积核,从S2层得到的特征图对16个10×10图再次进行卷积运算。屏幕S4是收集的第二层,面板5-5和16是在下降采样后获得的。C5第三层旋转。120寸5×5的核心后,得到120的1×1的帧数。卷积层本质上是一个全连接的次通过全连接将84维乘客复制到输出维向量。其中10维是因为分类类别数为络。例如,向量“1000000000”表示属于第一个类别的模型,即类别号“2”;。图5LeNet-5网络结构我们使用CAFÉ2库来训练卷积神经网络,所有网络结构如表所示。我们使用随机梯度下降(SGD)在单个GPU上安装网络模型。训练批量大小设置为64,测试质量设置为100,动量设置为0.9,并设置失真权重。是0.0005。一开始的学习器率设置为0.01,数据设计逐渐递减。该模型总共重复10,000次,在500次迭代中每一次测试一次,最后与最终测试一起被选为网络确认。functionnet=cnnbp(net,y)n=numel(net.layers);%网络层数%53.3实验结果及分析根据上面的设置,在一个GPU下训练了五个网络结构,每个网络的平均训练时间约为4分钟。确认率可以从他们的网络获得,如下表所示。结果发现,使用更宽的网络结构和更高的整体网络能力,使用5-5核比使用3×3核更好,在全连接设备后增加一个dropout层也好过没有。使用辍学。下面讨论个别培训问题。每个网络训练过程的价值损失与迭代次数的关系以及见证人准确率与网络类型准确率检查准确率和迭代次数之间的关系,如图所示。可以发现,LeNet-D和LeNet-E网络的识别率高于其他三个网络,说明网络深度和dropout策略对识别率的影响更大。较高的网络积累和辍学率有助于策略识别。前进。从LeNet-A曲线可以看出,随着迭代次数的增加,识别准确率有下降的趋势。这种情况会导致过拟合。由于网络宽度不足以表示数据输入,随着网络迭代次数的增第四章基于卷积神经网络的人脸识别本章探讨了卷积神经网络在面对图像时的实验。我们首先介绍了部分数据集,然后介绍了用于测试的神经网络结构。本次测试使用的网络结构是文章所有层都转换为卷积的层,减少了网络参数,提高了训练速度。我们安排了不同内核和连接内核的网络结构以及不同羽毛维度的网络结构,并检查了卷积核在大量数据和深度神经网络的推动下,面部识别的效果逐渐压倒人们。许脸认证集中进行训练并实现深度验证。虽然很多开源是神经网络的代码,但是数据训练的大规模特征并没有公开发表。人脸识别领域的现状比数据算法更强它是来自Internet的图像集合,生成了包含10557个人的广泛数据库,其中包图6人脸数据图见证数据集使用LFW数据集,其中包括5749位名人的13,233张照片,例接层。i该网络包括3个卷积层、3个局部卷积、4个堆叠层和1个全连接层。损失中心将在下一节介绍。卷积核和层的局部卷积的卷积大小统一固定为3×3,度数大小为1,然后将阈值PReLU1连接到非线性单元。卷积maple和局部卷积层的数量分别为128和256。将样本大小为2的2×2核全部开火。比较的第四层和旋转的第三层的输出是同时的,这样第一层的输入是全连接的,输出维度是完全连接的。层数为512。为了通过实验研究参数对网络结构的影响,我们设计了三种不同的网络结构,如表所示。为了减少网络环境,提高网络性能,网络层不使用局部卷积,只使用包裹层。这三个结构的网络高度与地图上的网中心深度相同。它们都包含6层织物,4层和1层全连接。每层网络连接内核数设置为32-32-64-128-192-256,网络网络每层连接内核数设置为32-32-64-128-192-256,每层网络的连接网络数为-2,网络卷积。它的铭文编号为64-64-128-256-384-512。全连接网络的特征维度设置为512个网络,全连接网络的特征维度设置为1024。卷积操作后羽毛的表面保持不变,因为我们没有使用自由卷积操作。与核心配合使用的构造网络选择2×2的长度级别,使刺绣层的表面尺寸一层一层地缩小到原来的四分之一。在推出每一帧后使用PReLU激活函数。我们使用caffe的副本。详细的模式结构见表4-1。模型在单GPU上训练,batchsize达到256。首字母设置为0.1。随着训练迭代16,000次和24,000次,学习率已降低到十个原始研究。最后,当有28,000次迭代时,保存训练限制和模型训练模块。NET-1、NET-1、NET-2的训练时长分别为2小时、5.5小时和6小时。4.2.3人脸识别代码及注释部分主要代码及注释:加载olivettifaces后,划分为train_data,valid_data,test_data三个数据集defload_data(dataset_path):img_ndarray=numpy.asarray(img,dtype='float64')/faces[row*20+column]=numpy.ndarray.flatt[row*57:(row+1)*57,col参数设置相同的三个网络的训练结果如表2所示。分别显示迭代次数与损失值的关系以及迭代次数与识别的关系。最后,建立在LFW人脸认证数据上的三个网络的识别率如表所示。表2为各网络的识别率比较网络类型准确率4.3.1卷积核数量对识别率的影响为了研究多个隐藏卷积核对实验结果的影响,我们构建了相同深度和不同宽度的神经网状网状结构。每个网络网络层的连接核数为双NET-1,其他设置相同。从实验结果可以发现,网络训练的性能比较差,网络参与困难。训练性能NET-2不错,训练集的损失值可以降的很低,训练集的知识率也很高。最后,LFW测试的认证精度高于网络1。为了研究特征维度对NETs估计的影响,我们对比了netting和nettingnetting。它们的网络结构完全相同。唯一的区别是全连接层(即羽毛的维度不同。网络网络的一个特征是512,而网络维数是1024。在实验中发现,两个网络在训练时间内的效果差别不大。从表2可以看出,网络冲突在训练团队中表现良好,差异不大,并且每个训练网络的准确率是不同的第五章LBP和神经网络卷积的人脸识别本章内容是在上一章主题中提出的一种新的人在人脸识别方面获得了优势,而且还克服了从神经网络中的问题。缺乏人脸局部结构特征。因此,我们怀疑,通过结合二元空间先介绍了空间二元算子,然后介绍了LBP和RGB图像的组成,最后是实验部5.1LBP算子LBP是对网络运营商的描述。它的主要出发点是选择平均图像像素作为阈值。通过比较字段串中的像素值得到二进制码。此代码二进制文件中描述了图像的局部纹理。具体计算方法是将大于等于阈值的元素记为1;否则为0。将二进制码一—读取,转换成十进制数,如中心点LBP的值。为方便计算,极值像素LBP的值为原图的值。为了纠正准确的人脸识别,我们提出了一种方法,不仅可以学习原始图片信息,还可以从原始图片中学习二进制模式信息。但mode的数据卷积表。输入信息集中在神经网络上。链接特定格式如图所示。原提取局部信息,然后执行该过程。另一方面,输入图片经卷积层。最后,一层互连的信息将这两种类型的信息连接起来作为卷积神经网正则化图9链接特定格式图5.3人脸识别LBP代码及注释%%导入原始图像(640*480).其中srcPath路径下有若干个文件夹,%每个文件夹下为同一个人的图片(至少15张,越多越好),文件夹名字为该人的姓名imds=imageDatastore(srcPath,...为验证本文提出的方法的有效性,选择测试公共人脸代码WebFace集为传统数组,并在自由条件下选择您的LFW库进行人脸识别测试。测试中,训练网络使用6G显存NVIDIATitanGPU进行,每次网络训练大约需要24小时。进行了三个实验:(1)比较了不同输入数据类型对实验结果的影响。通过经验比较增加结构数量的效果。(3)本文提出的方法与其他方法的比较。实验1:探索不同输入数据类型对实验事件的影响。让我们输入原始RGB然后使用获得的模型参数对LFW测试集进行认证。结果如表5-1所示。可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年贵州省事业单位公开招聘工作人员笔试历年典型考题及考点剖析附带答案详解
- 2025年资料员之资料员基础知识模拟考试试卷B卷含答案
- 中职教学创新优化课件
- 第三节重量分析仪器和基本操作一目的1.掌握沉淀重量法中的样
- Brand KPIs for milk:Italac in Brazil-英文培训课件2025
- 2025年信息系统项目管理师考试有效资源推试题及答案
- 2025年宪法知识题库及参考答案【夺分金卷】
- 2025年小学语文教师招聘考试测试卷及参考答案
- 2025年工业互联网平台量子密钥分发技术全球市场动态及竞争格局分析
- 企业投资开发管理办法
- 成都国资委采购管理办法
- 提高情商的培训课件
- JJG 597-2025交流电能表检定装置检定规程
- 2025年广州市中考物理试题(含答案)
- 2024年漳州市常山开发区招聘笔试真题
- 服务外包合同服务外包协议
- 定额〔2025〕1号文-关于发布2018版电力建设工程概预算定额2024年度价格水平调整的通知
- 个人在职证明模板.docx
- 探究影响空气阻力的因素
- hs编码对照表.xls
- 《普通混凝土配合比设计规程》JGJ55-2011
评论
0/150
提交评论