卷积神经网络在人机交互中的应用获奖科研报告_第1页
卷积神经网络在人机交互中的应用获奖科研报告_第2页
卷积神经网络在人机交互中的应用获奖科研报告_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卷积神经网络在人机交互中的应用获奖科研报告

【摘要】人工智能时代,现实生活的方方面面都在发生智能化的转变。本文以手势识别为例,讲述了基于Tensorflow的卷积神经网络人工智能技术,在人机交互的实际应用中是如何实现的,包括了手势图像数据的采集和预处理、卷积神经网络的搭建、模型训练、以及如何应用到实际工程项目中。

【关键词】人工智能;卷积神经网络;人机交互;手势识别

人机交互是指人与计算机之间使用某种语言,以一定的方式进行信息交换的过程[1]。常见的人机交互方式有大家比较熟悉的键盘、鼠标、图形化界面、触摸屏等,随着信息技术的发展,越来越智能化的交互方式也逐渐出现,比如语音识别、智能客服、手势识别等。本文论述手势识别这个人机交互功能利用卷积神经网络的实现原理和过程。

1.卷积神经网络

卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一种包含卷积计算且具有深度结构的前馈神经网络,是深度学习的最经典算法之一。卷积神经网络避免了对参数的过度依赖,相比全连接神经网络,能更好地识别高维数据。

卷积神经网络有输入层、卷积层、激活函数、池化层、全连接层构成。卷积层(Convolutionallayer)有多个卷积核单元组成,是神经网络中不可缺少的部分,主要作用是提取图像中的特征数据。激活函数(ActivationFunction)是在卷积之后加入偏置形成的,它的作用是增加卷积神经网络的非线性能力。池化层(Poolinglayer),也叫降采样层(subsampling),的作用是将卷积层提取到的不重要特征数据去掉,留下主要的特征数据,即降低特征空间。全连接层(Full-Connectedlayer)是卷积神经网络隐含层的最后部分,并只向其它全连接层传递信号,它的作用则是对提取的特征进行非线性组合以得到输出,即利用现有的高阶特征完成学习目标。

2.数据集采集和预处理

由于手势操作的人机交互方式适合全年龄段的人,所以采集的数据集包括了老年人、中年人、青年和儿童,男女各5组数据,每组数据包括了上、下、左、右、停止五种手势,因此总共有200个数据。

首先,通過电脑的摄像头进行采集手势视频的每一帧图像,并将其保存到一个指定的目录images中,且目录images下再细分为up、down、right、left、stop五个子文件夹,分别保存上、下、左、右、停止五种手势的图片,然后将labels用数组[0,0,0,0,0]标识,对应位置为1标识分类值。如图1所示。

最后,将预处理好的数据使用shuffle()方法打乱,并且划分为80%的训练数据集和20%的测试数据集,如图2、图3所示。

3.卷积神经网络搭建及训练

本文的手势识别卷积神经网络设置三层卷积层,使用relu激活函数增加网络的非线性,同时池化层使用max_pooling进行降采样,网络的最后搭建两层全连接层,具体如下。

(1)定义卷积神经网络的一些参数,输入图像尺寸f_height为64,滤波器的宽度filter_width为3,滤波器的高度filter_height为3,输入数据通道数depth_in为3,隐含层1的通道数(特征数目)depth_out1为32,隐含层1的通道数(特征数目)depth_out2为32,隐含层2的通道数(特征数目)depth_out3为64,手势分类数n_classes为5种。

(2)初始化权重weight和偏置值bias。

(3)定义卷积层和池化层如下图所示,conv2d是卷积层,maxpool2d是池化层。卷积层的步长是1,池化层的步长是2,同时padding设置为same,即对图像边缘进行填充,避免卷积后图像大小大幅度减小。

(4)构建卷积神经网络,包括全连接层,如下图所示,conv1、conv2、conv3分别是卷积层1、卷积层2、卷积层3,卷积层与全连接层的连接,全连接层fc1、fc2,如图4所示。

(5)模型训练如图所示,激活函数使用softmax(),损失函数使用Tensorflow中reduce_mean()方法进行计算,然后优化器采用AdamOptimizer算法,此算法可以寻找全局最优,它通过反向传播不断修正权重和偏置值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论