




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人脸检测原理及示例(OpenCV+Python)前言关于opencvOpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C+ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库 尽管也可以使用某些外部库。 OpenCV 对非商业应用和商业应用都是免费 的。同时 OpenCV 提供了对硬件的访问,可以直接访问摄像头,并且 opencv 还提供了一个简单的 GUI(graphics user interface) 系统 :highgui 。 我们就通过 OpenCV 提供的一些方法来构造出这个人脸检测 ( face detection ) 程序来。 opencv的python包装OpenCV 本身是有 C/C+ 编写的,如果要在其他语言中使用,我们可以通过对其动态链接库文件进行包装即可,幸运的是, Python 下有很多个这样的包装,本文中使用的是 Cvtypes 。 事实上,在 Python 中很多的包都是来自第三方的,比如 PIL(Python Image Library) 即为 C 语言实现的一个图形处理包,被包装到了 Python 中,这些包装可以让你像使用 Python 的内建函数一样的使用这些 API 。 人脸检测原理人脸检测属于目标检测(object detection) 的一部分,主要涉及两个方面1. 先对要检测的目标对象进行概率统计,从而知道待检测对象的一些特征,建立起目标检测模型。 2. 用得到的模型来匹配输入的图像,如果有匹配则输出匹配的区域,否则什么也不做。 计算机视觉计算机的视觉系统,跟人的眼睛是大不相同的,但是其中也有类似之处。人眼之能够看到物体,是通过物体上反射出来的光线刺激人眼的感光细胞,然后视觉神经在大脑中形成物体的像。计算机通过摄像头看到的东西要简单的多,简单来说,就是一堆由数字组成的矩阵。这些数字表明了物体发出的光的强弱,摄像头的光敏元件将光信号转化成数字信号,将其量化为矩阵。如何从这些数字中得出:这是一个人脸的结论,是一个比较复杂的事情。物理世界是彩色的,一般来说,计算机中的彩色图片都是由若干个色彩通道累积出来的,比如RGB模式的图片,有红色通道(Red),绿色通道(Green)和蓝色通道(Blue),这三个通道都是灰度图,比如一个点由8位来表示,则一个通道可以表示28=256个灰度。那样三个通道进行叠加以后可以表3*8=24位种色彩,也就是我们常说的24位真彩。对这样的图片做处理,无疑是一件很复杂的事,所以有必要先将彩色图转为灰度图,那样可以减少数据量(比如RGB模式,可以减少到原图片的1/3),同时可以去掉一些噪声信号。先将图片转化为灰度图,然后将这个灰度图的对比度增高,这样可以使得图片本来暗的地方更暗,亮的地方更亮一些。这样处理以后,图片就更容易被算法设别出来了。Harr特征级联表OpenCV在物体检测上使用的是haar特征的级联表,这个级联表中包含的是boost的分类器。首先,人们采用样本的haar特征进行分类器的训练,从而得到一个级联的boost分类器。训练的方式包含两方面:1. 正例样本,即待检测目标样本2. 反例样本,其他任意的图片首先将这些图片统一成相同的尺寸,这个过程被称为归一化,然后进行统计。一旦分类器建立完成,就可以用来检测输入图片中的感兴趣区域的检测了,一般来说,输入的图片会大于样本,那样,需要移动搜索窗口,为了检索出不同大小的目标,分类器可以按比例的改变自己的尺寸,这样可能要对输入图片进行多次的扫描。什么是级联的分类器呢?级联分类器是由若干个简单分类器级联成的一个大的分类器,被检测的窗口依次通过每一个分类器,可以通过所有分类器的窗口即可判定为目标区域。同时,为了考虑效率问题,可以将最严格的分类器放在整个级联分类器的最顶端,那样可以减少匹配次数。基础分类器以haar特征为输入,以0/1为输出,0表示未匹配,1表示匹配。Haar特征 边界特征,包含四种 线性特征,包含8种 中心围绕特征,包含两种 在扫描待检测图片的时候,以边界特征中的(a)为例,正如前面提到的那样,计算机中的图片是一个数字组成的矩阵,程序先计算整个窗口中的灰度值x,然后计算矩形框中的黑色灰度值y,然后计算(x-2y)的值,得到的数值与x做比较,如果这个比值在某一个范围内,则表示待检测图片的当前扫描区域符合边界特征(a),然后继续扫描。关于这个算法的更详细描述已经超出了本文的范围,可以在参考资源中获得更多的信息。非固定大小目标检测因为是基于视频流的目标检测,我们事先不太可能知道要检测的目标的大小,这就要求我们的级联表中的分类器具有按比例增大(或者缩小)的能力,这样,当小的窗口移动完整个待检测图片没有发现目标时,我们可以调整分类器的大小,然后继续检测,直到检测到目标或者窗口与待检测图片的大小相当为止。步骤一:图片预处理在从摄像头中获得一个帧(一张图片)后,我们需要先对这张图片进行一些预处理:1. 将图片从RGB模式转为灰度图将灰度图 2. 进行灰度图直方图均衡化操作 这两个步骤在OpenCV中是非常简单的:Python代码 1. image_size=cv.cvGetSize(image)#获取原始图像尺寸 2. 3. grayscale=cv.cvCreateImage(image_size,8,1)#建立一个空的灰度图 4. cv.cvCvtColor(image,grayscale,cv.CV_BGR2GRAY)#转换 5. 6. storage=cv.cvCreateMemStorage(0)#新建一块存储区,以备后用 7. cv.cvClearMemStorage(storage) 8. 9. cv.cvEqualizeHist(grayscale,grayscale)#灰度图直方图均衡化image_size = cv.cvGetSize(image)#获取原始图像尺寸grayscale = cv.cvCreateImage(image_size, 8, 1)# 建立一个空的灰度图cv.cvCvtColor(image, grayscale, cv.CV_BGR2GRAY)#转换storage = cv.cvCreateMemStorage(0)#新建一块存储区,以备后用cv.cvClearMemStorage(storage)cv.cvEqualizeHist(grayscale, grayscale)# 灰度图直方图均衡化步骤二:检测并标记目标OpenCV中,对于人脸检测的模型已经建立为一个XML文件,其中包含了上面提到的harr特征的分类器的训练结果,我们可以通过加载这个文件而省略掉自己建立级联表的过程。有了级联表,我们只需要将待检测图片和级联表一同传递给OpenCV的目标检测算法即可得到一个检测到的人脸的集合。Python代码 1. #detectobjects 2. cascade=cv.cvLoadHaarClassifierCascade(haarcascade_frontalface_alt.xml, 3. cv.cvSize(1,1) 4. faces=cv.cvHaarDetectObjects(grayscale,cascade,storage,1.2,2, 5. cv.CV_HAAR_DO_CANNY_PRUNING, 6. cv.cvSize(50,50)#设置最小的人脸为50*50像素 7. 8. iffaces: 9. printfacedetectedhere,cv.cvGetSize(grayscale) 10. foriinfaces: 11. cv.cvRectangle(image,cv.cvPoint(int(i.x),int(i.y), 12. cv.cvPoint(int(i.x+i.width),int(i.y+i.height), 13. cv.CV_RGB(0,255,0),1,8,0)#画一个绿色的矩形框 # detect objects cascade = cv.cvLoadHaarClassifierCascade(haarcascade_frontalface_alt.xml, cv.cvSize(1,1) faces = cv.cvHaarDetectObjects(grayscale, cascade, storage, 1.2, 2, cv.CV_HAAR_DO_CANNY_PRUNING, cv.cvSize(50, 50)#设置最小的人脸为50*50像素 if faces: print face detected here, cv.cvGetSize(grayscale) for i in faces: cv.cvRectangle(image, cv.cvPoint( int(i.x), int(i.y), cv.cvPoint(int(i.x + i.width), int(i.y + i.height), cv.CV_RGB(0, 255, 0), 1, 8, 0)#画一个绿色的矩形框步骤三:用highgui画出视频窗口Python代码 1. highgui.cvNamedWindow(camera,highgui.CV_WINDOW_AUTOSIZE) 2. highgui.cvMoveWindow(camera,50,50) 3. 4. highgui.cvShowImage(camera,detimg) highgui.cvNamedWindow (camera, highgui.CV_WINDOW_AUTOSIZE) highgui.cvMoveWindow (camera, 50, 50) highgui.cvShowImage(camera, detimg) 可以看到,OpenCV的API相当清晰,使用Python的包装,可以使得代码非常小。好了,我们可以看看程序的运行结果:由于视频流是动态的,所以我们可以在程序的入口中使用一个无限循环,在循环中,每次从视频中读入一个帧,将这个帧传输给人脸检测模块,检测模块在这个帧上进行标记(如果有人脸的话),然后返回这个帧,主程序拿到这个帧后,更新显示窗口。opencv的其他特性拉普拉斯边缘检测Python代码 1. deflaplaceTransform(image): 2. laplace=None3. colorlaplace=None4. planes=None,None,None 5. 6. image_size=cv.cvGetSize(image) 7. ifnotlaplace: 8. foriinrange(len(planes): 9. planesi=cv.cvCreateImage(image_size,8,1) 10. laplace=cv.cvCreateImage(image_size,cv.IPL_DEPTH_16S,1) 11. colorlaplace=cv.cvCreateImage(image_size,8,3) 12. 13. cv.cvSplit(image,planes0,planes1,planes2,None) 14. 15. forplaneinplanes: 16. cv.cvLaplace(plane,laplace,3) 17. cv.cvConvertScaleAbs(laplace,plane,1,0) 18. 19. cv.cvMerge(planes0,planes1,planes2,None,colorlaplace) 20. colorlaplace.origin=image.origin 21. 22. returncolorlaplacedef laplaceTransform(image): laplace = None colorlaplace = None planes = None, None, None image_size = cv.cvGetSize(image) if not laplace: for i in range(len(planes): planesi = cv.cvCreateImage(image_size, 8, 1) laplace = cv.cvCreateImage(image_size, cv.IPL_DEPTH_16S, 1) colorlaplace = cv.cvCreateImage(image_size, 8, 3) cv.cvSplit(image, planes0, planes1, planes2, None) for plane in planes: cv.cvLaplace(plane, laplace, 3) cv.cvConvertScaleAbs(laplace, plane, 1, 0) cv.cvMerge(planes0, planes
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025中国能建葛洲坝三公司公开竞聘1人笔试题库历年考点版附带答案详解
- 2025年放射科医生影像学报告书写规范考试答案及解析
- 2025年健康管理行业健康管理平台创新发展研究报告
- 2025年自动驾驶行业自动驾驶技术与智能交通研究报告
- 2025年海洋资源行业海洋环境保护与海洋资源开发利用研究报告
- 2025年医疗健康行业健康管理平台应用研究报告
- 2025年快递物流行业智能物流解决方案研究报告
- 2026华能北京热电有限责任公司校园招聘笔试备考试题及答案解析
- 2025年肝胆胰外科常见疾病手术治疗模拟测试卷答案及解析
- 2025年甘肃省临夏州永靖县人民医院招聘临聘专业技术人员20人笔试模拟试题及答案解析
- 民间借贷抗诉申请书
- 国家基层高血压防治管理指南(2025版)
- 2025年B2B企业生成式引擎优化(GEO)实战指南
- 2025年宁波辅警考试题库(附答案)
- 2025年考研护理综合全程真题及答案
- 电力市场风险管理办法
- 小学道德与法治五年级上册《烟酒有危害》教学课件
- 2025四川能投合江电力有限公司员工招聘11人笔试参考题库附答案解析
- 测漏培训课件
- 2025年军事理论知识竞赛题库及答案
- 《生成式人工智能基础与应用》高职AIGC应用基础课程全套教学课件
评论
0/150
提交评论