(计算机应用技术专业论文)特定敏感图像的检测与过滤.pdf_第1页
(计算机应用技术专业论文)特定敏感图像的检测与过滤.pdf_第2页
(计算机应用技术专业论文)特定敏感图像的检测与过滤.pdf_第3页
(计算机应用技术专业论文)特定敏感图像的检测与过滤.pdf_第4页
(计算机应用技术专业论文)特定敏感图像的检测与过滤.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 信息技术的发展尤其是互联网技术的飞速发展给人们的工作生产生活带来 了极大的便利,网络信息成为一种人们熟知的便捷信息来源和休闲生活方式,但 网络上大量的色情淫秽等不良信息已经严重干扰了正常的网络生活,严重毒害着 青少年的身心健康。网络空间的色情传播已在全球引起了关注,如何净化网络环 境,增加对网络活动的监控手段,提高信息识别的能力便成为一种强烈的需求, 作为其技术支持,基于内容的不良信息识别技术日益引起人们的重视。 基于内容的不良图像的识别和检测技术近年来已引起人们的极大兴趣,同时 它也是基于内容的网络过滤系统所面临的一个重要且亟待解决的研究课题。色情 图像的识别问题实际上是图像分类问题,我们使用基于内容的方法对图像进行研 究,利用统计分类方法实现对色情图像的识别。采用的关键技术有:肤色检测、 图像特征的提取和分类器的设计。 肤色检测在基于内容的不良图像信息识别研究中具有重要地位,是统计分类 方法中特征提取的基础。通过对肤色特征、肤色检测过程中颜色空间的选择、多 种肤色模型的进行比较后,我们综合一种被称为脉冲耦合神经网络的方法,结合 y i q 颜色空间进行肤色检测。2 0 世纪9 0 年代,研究者基于哺乳动物视觉皮层神 经活动提出了脉冲耦合神经网络( p u l s ec o u p l e dn e u r a ln e t w o r k - - p c n n ) 模型。 因为p c n n 具有生物视觉的现实依据,所以在图像处理存在着优势,许多的研究 者把脉冲耦合神经网络应用于图像分割,图像滤波,图像编码等方面,人们已经 做了大量的研究工作。对于把脉冲耦合神经网络应用于图像的分割,已经取得了 很大的成绩,但是把神经网络应用于人体肤色检测,这方面的研究还较少。传统 的肤色检测多是基于像素点的检测,这种检测方法没有考虑肤色像素之间关系的 特性,本文中,结合着区域增长的思想,研究了把p c n n 用于人体肤色检测的相 关技术,这种肤色检测技术是基于区域的检测,它结合了肤色像素之间的相互关 系信息,实验表明,它能够有效地检测出图像的皮肤区域。 分类器设计是统计分类方法的关键。不良图像识别问题是一个小样本问题, a d a b o o s t 分类器具有极好的学习性能,它的基本思想就是按照所给出的具有自适 应性的阈值条件训练出一定数量的弱分类器,再将这些弱分类器级联成强分类器 用于目标检测。我们首先对a d a b o o s t 的原理进行了介绍,明确了特征的选择,以 及简化计算等方法。通过对测试图像集中目标区域的标注,计算出敏感区域的h a r r 特征,采用积分图的方法进行简化,降低了计算的复杂度。接着从敏感区域的大 量的h a r r 特征中,选择描述目标区域最有力的特征,用这些特征构成弱分类器, 在此基础上,把这些弱分类器相互级联,构成强分类器,来完成对敏感图像的检 北京t 业人学丁学硕l j 学位论文 测。简言之,利用a d a b o o s t 可以分为三步:训练样本的准备,分类器的训练和目 标区域的检测。通过实验,我们提出的这种基于内容的不良图像识别方案的,达 到了很好的效果。 关键词敏感图像检测;人体肤色检测;脉冲耦合神经网络;a d a b o o s t 分类 a b s t r a c t a b s t r a c t d e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g ye s p e c i a l l yi n t e m e th a v eb r o u g h tg r e a t c o n v e n i e n c et oh u m a n sw o r ka n dh u m a n sl i f e n e t w o r ki n f o r m a t i o nb e c o m e sa1 6 n d o fc o n v e n i e n ti n f o r m a t i o ns o u r c ea n dr e c r e a t i o n a lw a yt h a tb ef a m i l i a rw i t h b u tl a r g e n u m b e r so fs m u t t i n e s si n f o r m a t i o na n de r o t i c ai m a g e sh a v ea l r e a d ys e r i o u s l y i n t e r f e r e dt h en o r m a ln e t w o r kl i v i n g ,h a r m e dt h et e e n a g e r sm i n da n dt h eb o d y s h e a l t h t h es p r e a do fe r o t i c aa n ds m u t t i n e s si n f o r m a t i o nh a sc a u s e dc o n ce :i t ia l lo v e r t h ew o r l d h o wt op u n f yt h en e t w o r ke n v i r o n m e n t ,i n c r e a s es u p e r v i s e sa n dc o n t r o l t h em e a n st ot h en e t w o r ka c t i v i t ya n di m p r o v i n gt h ea b i l i t yt h a ti n f o r m a t i o ni d e n t i f y h a v eb e c o m eak i n do fs t r o n gn e e d a si t st e c h n i q u e ss u p p o r t s ,b a di n f o r m a t i o n i d e n t i f i c a t i o n t e c h n i q u e s b a s e do nc o n t e n th a v ec a u s e d p e o p l e sr e c o g n i t i o n i n c r e a s i n g l y t h ed e t e c t i o na n dr e c o g n i t i o nt e c h n o l o g yo fe r o t i ci m a g e sb a s e do ni m a g e s c o n t e n th a v ec a u s e dp e o p l eg r e a ti n t e r e s tr e c e n t l yy e a r s i ta l s oi sar e s e a r c hl e s s o ni n n e t w o r kp e r c o l a t i o ns y s t e mb a s e do nt h ec o n t e n t s i nf a c t ,e r o t i ci m a g ei d e n t i f i c a t i o n i sap r o b l e mo fi m a g ec l a s s i f i c a t i o n b a s e do ni m a g e sc o n t e n t , w er e s e a r c hi nt h i s a r e aa d o p t i n gt h ee o v a r i a n c ec l a s s i f i c a t i o nm e t h o dt oi d e n t i f ye r o t i cp i c t u r e t h ek e y t e c h n i q u e si n c l u d e :s k i nd e t e c t i o n ,i m a g ec h a r a c t e rp i c k - u pa n dc l a s s i f i e rd e s i g n h u m a ns k i nd e t e c t i o ni st h ek e yp o i n ti ne r o t i ci m a g er e c o g n i t i o nb a s e do n i m a g ec o n t e n t i ti st h eb a s i c so fc h a r a c t e rp i e k - u p a f t e rw er e s e a r c hh u m a ns k i n c h a r a c t e r s ,c o l o rs p a c ea n dm a n yo t h e rh u m a ns k i nm o d e l s ,b yc o m b i n i n gy i qc o l o r s p a c e ,w eu s ep c n nm e t h o dt od e t e c th u m a ns k i n i n19 9 0 s ,r e s e a r c h e sp r o p o s e d p u l s ec o u p l e dn e u r a ln e t w o r k ( p c n n ) m o d e lo nt h eb a s i so ft h ee x p e r i m e n t a l o b s e r v a t i o n so fs y n c h r o n o u sp u l s eb u r s t si nt h em a m m i f e r o u sv i s u a lc o r t e x b e c a u s e o fb i o l o g i c a lb a c k g r o u n d , i ti sv e r ys u i t a b l ef o ri m a g ep r o c e s s i n g , e s p e c i a l l yi m a g e s e g m e n t a t i o n , p e o p l eh a dg o tal o tas u c c e s si nt h e s ea s p e c t s b u tn o w f e wr e s e a r c h e r s h a v ep a ya t t e n t i o nt ou s i n gp c n nt od e t e c th u m a ns k i n t r a d i t i o n a l l yh u m a ns k i n d e t e c t i o nm e t h o d sa r eb a s e do ni m a g ep i x e l s ,m e yd o n tt h i n ka b o u tt h er e l a t i o n s h i p o fh u m a ns k i n ,i nt h i sp a p e r , c o m b i n i n gt h ei d e ao fr e g i o ng r o w t h ,w ed os o m e r e s e a r c ho fh u m a ns k i nd e t e c t i o nw i t hp c n n ,t h i sm e t h o db a s e so nr e g i o n ,i tc o n s i d e r a b o u tt h er e l a t i o n s h i po fh u m a ns k i np i x e l s ,t h ee x p e r i m e n t ss h o wt h a ti tc a nd e t e c t h u m a ns k i nr e g i o ne f f e c t i v e l y t h ed e s i g no fc l a s s i f i e ri st h ek e yp o i n to fc l a s s i f i c a t i o ni ns t a t i s t i c sm e t h o d t h e p r o b l e mo fe r o t i cp i c t u r ei d e n t i f i c a t i o ni sa s m a l ls a m p l ep r o b l e m a d a b o o s tc l a s s i f i e r i i i n a sas t r o n gp e r f o r m a n c ei nl e a r n i n g ;i t sb a s i ci d e ai st o t r a i n i n gam e m b e ro fw e a k c l a s s i f i e r sb yu s i n gs e l f - a d a p t a b i l i t yt h r e s h o l d sw h i c h a s s i g n e db e f o r e a f t e rt h i s w e r e s t r u c t u r et h e s ew e a kc l a s s i f i e r si ns e r i e st oc o n s t r u c ta s t r o n gc l a s s i f i e r , t h e nu s i n g t h i ss t r o n gc l a s s i f i e rt od e t e c t o b j e c tt a r g e t s f i r s t , w ei n t r o d u c et h ep r i n c i p l eo f a d a b o o s tt od e f i n i t u d et h em e t h o do fc h a r a c t e rp i c k u pa n dp r e d i g e s tc a l c u l a t i o n m e m o d - t h e nw em a r k e dt h et a r g e tr e g i o n si ne v e r yi m a g e i nt e s t i n gl i b r a r y b yu s i n g m e s em a r k e da r e a s ,w ec a l c u l a t eh a r rc h a r a c t e r so f e r o t i ci m a g e s i nt h i ss t e p w el o w t h ec a l c u l a t ec o m p l e xb y u s i n gi n t e g r a lm e t h o d t h e r ea r eal o to fh a r rc h a r a c t e r s w en e e dt oc h o o s ea p a r to fc h a r a c t e r sw h i c hc a nd e s c r i b et h et a r g e ts t r o n g e s ti na l l t h eh a r rc h a r a c t e r s b yu s i n gt h ec h a r a c t e r sw e c h o o s e ,w ec o n s t r u c ts 们n gc l a s s i f i e r l a s ts t e p1 5t ou s et h es t r o n gc l a s s i f i e rt od e t e c tt a r g e to b j e c t s u s i n ga d a b o o s t t 0 d e t e c t 钌0 t l ct m a g e ,t h e r ea r et h r e em a i ns t e p s :f i r s t , p r e p a r a t i o nt r a i n i n g l i b r a r y : s e c o n d ,t r a i nc l a s s i f i e r ;, t h i r d ,d e t e c t i o nt a r g e t s t h ee x p e r i m e n t s h o w s 吐l a t l i s m e t h o dc a ng e ta g o o dp e r f o r m a n c e k e y w o r d se r o t i ci m a g ed e t e c t i o n ;h u m a ns k i nd e t e c t i o n ;p c n n ;a d a b o o s t i v 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签名:拄! 圭主曼日期:丕翌望:亟:l 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 弛懿琵翩虢缉嗍逻丛2 第1 章绪论 第1 章绪论 1 1 研究背景与研究意义 互联网的出现是人类有史以来最伟大的发明之一,它在刚出现的几年中就获 得了空前的发展。网上的信息量以指数形式飞长,信息类型也由单一的文本方式 逐步变为以图形、图像、动画、视频等多媒体信息为主的表现方式。互联网正在 逐渐发展成为普通大众都触手可及的媒体传播手段和通讯工具,它给人们的生活 质量,生活方式带来了革命性的变化。网络作为一个新的媒体传播介质,对全球 经济、文化的交流起到了巨大的推动作用。 互联网技术的发展,一方面极大地丰富了普通网络用户对资讯的需求,另一 方面也为色情制造者、传播者提供了更为先进的传播手段与渠道。各种不良信息 如色情小说、色情图像、视频等,也越来越多地借助于互联网这种跨地域、跨国 界、开放式的通讯方式进行传播,给人们日常生活带来了极大的负面影响。 据保守估计,目前全世界互联网色情网站至少有7 0 万个,而且仍以每天2 0 0 至3 0 0 个的速度增加。可以说,目前网络色情无论是在内容上、数量上,还是在 传播速度与覆盖范围上都超过以往任何时期。色情内容对青少年的危害尤其巨 大。2 0 0 6 年7 月1 9 日,中国互联网络信息中心( c n m c ) 在北京发布第十八次中 国互联网络发展状况统计报告,报告显示,截止到2 0 0 6 年6 月3 0 日,我国 网民人数达到了1 2 3 亿人,报告指出,在2 亿中小学生中,上网学生己达3 0 0 0 万,中小学生互联网渗透率达到1 5 4 ,其中高中生互联网渗透率己达半数以上。 根据中国社会科学院“互联网对新时期青年与青年工作的影响 课题组的调查, 大约三成的青年上过色情网站。在青少年的思想意识还未成熟的重要阶段,网络 色情对青少年的思想造成错误的引导,严重影响青少年身心的健康成长。为了净 化网络,2 0 0 5 年9 月以来,公安部会同国务院新闻办、信息产业部,在全国联 合组织开展了打击利用互联网从事淫秽色情活动专项行动,这是继2 0 0 4 来的又 一专项行动。如何有效的采用技术手段来过虑、检测网络色情信息是我们面临的 重大挑战。 目前的网络内容自动审查系统主要是针对文字内容的,对网页中的文本采 用一些关键词检测和文本分类的方法。在图像内容自动审查方面,已有一些工 具已经出现,主要采用肤色检测的方法进行敏感图像过滤,因此很难把艺术图 像、体育图像、一般人脸图像和不良图像有效分开。这些系统存在的主要问题 是在系统没有把握敏感图像的本质,不能有效检测出裸露器官、淫亵动作等不 良信息内容。 不良图像内容检测系统研究有着十分重要的理论和现实意义。对构建绿色、 北京t 业人学t 学硕l :学位论文 健康、和谐的网络环境,保障青少年健康成长有重要作用;对网络文明管理、建 设和自主创新目标的实现必将产生积极的贡献。此外,该技术也可应用于图像中 其它目标的自动搜索和定位识别中。 1 2 课题来源 本课题来源于北京市教育委员会科技发展计划面上项目“校园网络环境中的 不良图像内容检测系统”( n o k m 2 0 0 6 1 0 0 0 2 0 1 2 ) 和国家自然科学基金项目“基于 时间振荡相关与空间整合编码的视觉感知眼动控制神经网络系统的模拟研 究与应用( n o 6 0 6 7 3 0 9 1 ) 。 1 3 本文研究内容及结构 本论文主要研究了如何把p c n n 与区域增长方法相结合,利用基于区域增长 的p c n n 进行人体肤色检测,取得了良好的效果。然后研究了a d a b o o s t 分类算法 的原理,并把它用于敏感图像中敏感区域的检测。 第l 章介绍了敏感图像检测的研究背景和研究意义。说明了传统敏感图像检 测的局限性,以及利用图像内容进行敏感图像检测的优点。然后介绍了课题来源, 最后介绍论文的主要研究内容及结构安排。 第2 章首先介绍了敏感图像检测中,国内外的研究状况,主要介绍了已经出 现的检测工具,以及这些工具所采用的主要检测技术,并对这些工具和技术作了 简要的分析。 第3 章首先介绍了彩色图像处理中常用的几种颜色空间,分析了它们各自的 特性和应用背景。 第4 章介绍了把p c n n 用于人体肤色检测的相关方法。在这一部分中第一步 介绍了人体肤色的基本属性,分析了肤色在不同的颜色空间中所具有的特性。第 二步介绍了肤色检测的相关理论及现有的一些肤色检测方法,分析对比了三种肤 色检测模型:第三步介绍了p c n n 算法的相关理论以及把p c n n 应用于人体肤色的 检测的相关方法,得出实验结果,并对实验结果进行了分析。 第5 章首先介绍了分类算法相关的技术,对分类技术进行了简单的概述。然 后详细介绍了a d a b o o s t 算法相关的技术及应用。具体如下:先简述了a d a b o o s t 算法的发展过程,然后详细介绍了a d a b o o s t 分类器进行分类检测的流程和步骤, 并对a d a b o o s t 分类算法中影响性能的特征提取和简化技术进行了分析。最后分 析介绍了a d a b o o s t 进行分类检测中,训练数据集,测试数据集的相关准备情况, 并利用a d a b o o s t 进行训练得到女性胸部分类器,利用此分类器进行敏感图像中 女性胸部的检测,得到实验结果。最后为结论,总结本文的工作,探讨下一步可 以开展的研究工作。 2 第2 章国内外研究现状 目前,针对网络信息的过滤主要采用以下三种方式进行乜3 :( 1 ) 单纯依赖i p 地 址或u r l 访问控制列表的网络过滤技术:( 2 ) 通过网页中文本信息的截取和分析实 现过滤功能:( 3 ) 基于对图像内容的分析和理解基础之上的图像过滤技术。 采用前两种方式的过滤系统较多,下面给出一些采用此技术的典型系统。 2 1 基于u r l 封锁与文本过滤的敏感信息过滤系统 表2 1 基于u r l 封锁与文本过滤的敏感信息过滤系统 t a b l e2 1s e n s i t i v ei n f o r m a t i o nf i i t e rs y s t e mb a s e do nu r l a n dt e x t 软件名称 开发的公司功能 守护天使是一个集网络反黄反黑和个人微机安全 管理于一体的工具。通过内置的数据库。守护天使能 守护天使 北京华旗资讯科技 自动判定网站是否为不良站点:色情、暴力、毒品等。 发展有限公司 当检测到符合设定条件的站点,程序将自动切断主 机与该站点的联系并纪录在案。为了达到有效的监 测,华旗资讯建立了世界范围内最大的不良信息数 据库,系统可以自动获取最新的数据库资料。 是中国第一个反黄软件,能有效地识别来自网络、 磁盘、光盘等各种载体而最终出现在电脑终端上的 五行卫士清华大学各种编码,中文简繁体及英文色情文章、网站及 部分图片。该软件是实时监测型软件,遇到色情内 容将自动予以关闭并作记录。 学生浏览器科利华多媒体教育依据公安部所提供的全球不良网址,能够禁止通过 技术有限公司不良网址、网址关键词、网页内容关键词、网页链 接等方式登录不良网站。 包括三项过滤工具:分别是控管每个使用者可以上 电脑终极技术全景软件公司的网站、自动定时下载色情网站名单及制定过滤网 站。 s n i p e r 不当资亚洲互动网通过自动管制网址。自动限制搜索引擎关键字,客户 讯阻击手端即时监看等功能实现对色情网站的过滤。 使用先进的网址拦截技术和网页内容过滤技术对 美就谷反黄专家美威谷科技 浏览器进行即时监控,当用户访问色情、暴力等网 站时,会立刻阻挡浏览请求,并连接至管理者预设 置的网站。 蓝陵反黄卫士蓝陵计算机软件工蓝陵反黄卫士主要用于屏蔽设定关键字的网址,禁 作室止访问色情或非法反动站点。 可防止一般的计算机使用者利用浏览器观赏色情 n o p o r n 防色软久晋资讯股份有限网站、利用中文或英文的搜寻引擎寻找色情网站; 件公司若尝试连上色情网站时,计算机会实时拦截并自动 提供健康网站连结;用户所浏览过的网站均会在计 算机中留下使用记录:一般的使用者无法关闭色情 防止功能,只有知道密码的管理者才可关闭该功 能。n o p o r n 数据库随时增加最新的色情网站信息, 以供使用者下载更新。 色情网站过滤闸台湾全景软件公司 用户定期到全景公司的服务器中下载最新的色情 网站网址。该软件可以对这此色情网址进行过滤。 w iz g u a r dw i z g u a r d 公司 过滤,管理,监视w e b 上的色情网站存取,它在下载 前检查其内容,所以不需要更新黑名单。 n e tn a n n yn e tn a n n y 软件公n e tn a n n y 是一款对上网进行安全控制的工具,包 司 括网站过滤,搜索功能,互联网监控功能,上网时间 控制功能,保存聊天记录功能,新闻组封锁功能以 及隐私控制功能。 s u r fw a t c hs u r f c o n t r o l 能过滤色情网页,但是对言论偏激或暴力网址没有 多作限制。 c y b e rs i t t e r s o l i do a k 可对浏览的网页进行监控,可过滤掉8 0 的不良网 s o f t w a r e 页,可对聊天情况进行纪录,过滤器具备自动升级 功能,支持自定义过滤。 c y b e rp a t r o l s u r f c o n t r o l 是一个互联网访问管理工具,同时它也能管理p c 机上的应用软件的使用,以对内容进行有效的过滤 著称。c y b e rp a t r o l 可以防阻9 0 的色情网站。 x - s t o p 能有效的阻止色情网站,同时也能把其他有 x - s t o p ( 网络色 8 e 6t e c h n 0 1 0 9 i e s害资讯阻隔起来,x - s t o p 资料库是每日更新线上资 情锁)料库名单,也是能过滤嗍( 全球资讯网) 、 n e w s g r o u p ( 新闻群组) 、f t p 等色情资讯。 w e b b 1 0 c k e r w e w e b c o r p c o m能过滤掉“儿童不宜”的网站,可随时线上更新网 站资料库,依资料库,关键字,制定过滤条件。 从表2 - 1 可见看出,基于u r l 封锁与文本过滤的敏感信息过滤系统较多,现阶 段大部分防火墙通过安装一定的处理程序都可以实现这些基本功能。例如,美籍 华人施颖裕推出的网络色情防范系统软件“网络色情锁 ( x s t o p ) 和清华大学开 发的“五行卫士b 砌等,这些系统主要采用网址库的形式来封锁色情网址,或者 进一步对进入计算机的中、英文信息进行分析甄别,主要依据是判断是否为给定 的敏感词汇,因此它们存在明显的缺陷,特别是对图像中信息的识别过滤存在严 重不足。( 1 ) 很多词汇具有多义性,仅凭某些关键词的出现就断言某一网页是不良 的,常常会导致一些正常的网络信息被屏蔽( 误判) ,同时也存在漏判的发生;( 2 ) 一些不良网络信息的提供者采取了回避某些敏感词汇,将文本嵌入到图像文件中, 或直接以图像文件的形式出现等方法,从而可以轻易地通过防火墙等网络过滤 和监测系统。为克服上述缺点,人们提出基于图像内容的动态监视和过滤技术。 通过采用先进的图像分割识别技术和人工智能的方法,实现不良网络信息的实 时发现和过滤,在技术上已有突破。下面列举了一些采用不同技术的基于图像内 容的敏感信息过滤系统。 4 第2 章国内外研究现状 2 2 基于图像内容的敏感信息过滤系统 表2 2 基于图像内容的敏感信息过滤系统1 t a b l e2 2s e n s i t i v ei n f o r m a t i o nf i l t e rs y s t e mb a s e do ni m a g ec o n t e n t 软件名称开发的公司功能 可以检查电子邮件附件中的图像是否含有色情内 容,主要采用肤色检测和人脸识别相结合的技术。 p o r n s w e e p e rc l e a r s w i f t 公司c l e a r s w i f t 公司称p o r n s w e e p e r 的不良图像正确识 别率可以达到8 5 ,而误判率为1 5 ,不过来自 d a n sd a t a 的性能评价在认同其不良图像正确识 别率的同时,认为其误判率要高得多,达5 0 h 1 。 基于肌肤色调、形状特征、分类技术开发的不良图 b a i r ( b a s i c像过滤软件。e x o t r o p e 称b a i r 在同时利用文本和 a r t i f i c i a l e x o t r o p e 公司图像信息进行过滤时准确率可达9 9 8 。但来自 i n t e l l i g e n c e w i r e dn e w s 的测试结果却表明,在没有文本信息时, r o u t i n e ) b a i r 会阻拦全部测试图像的9 0 9 5 ,在通过的图 像中也有大约5 0 9 6 是不良的,其余则是正常的旧1 。 基于内容的图像、视频搜索引擎e v e ( e v i s i o n v i s u a le n g i n e ) 可用于不良图像信息的过滤。先利 用颜色和纹理特征判断图像中是否存在大的皮肤 区域,如果不存在,则判定图像为正常,否则根据 e v e ( e v i s i o ne v i s i o n 公司颜色和纹理检测的结果分割图像,计算皮肤区域的 v i s u a le n g i n e ) 视觉特征,最后计算待判定图像的视觉特征与预先 设定的不良图像集的视觉特征的相似程度,如果有 相似度超过7 0 ,则把图像判为不良图像;如果相 似度在4 0 - 7 0 之间,则由人工判定;如果相似度在 4 0 以下,则判为正常图像。因此,利用e v e 构建 不良图像过滤软件的性能与相似程度的阈值设定 相关钔。 加州大学巴巴拉分校和斯坦福大学的研究者们创 办的m o r p h o 软件公司开发了不良图像和网站过滤 器m o r p h o b l o c k ,综合运用了u r l 控制列表、文本 m o r p h o b l o c k m o r p h o 软件公司 分析及基于感知的图像分析技术,准确率达9 5 。 进行图像分析时,使用了1 5 0 个以上的参数,可以 区分出色情裸体图片与艺术作品、医疗信息中正常 的裸体图片u 。 5 它先提取形状、颜色、纹理等图像特征,然后根据 这些特征对图像进行分类。l t u 称i m a g e f i l t e r i m a g e f il t e r l t u 公司 可以过滤掉9 6 的色情图像。不过,l 1 1 j 没有给出 相应的误判率,事实上,如果降低敏感度的判定阈 值,可以大幅度地提高不良图像正确识别率,但误 判率也会急剧增加n 。 在儿童网络浏览器中应用了一种图像过滤技术,主 要是基于肌肤色调和曲线检测,h e a r t s o f t 声称其 g a u n tl e t h e a r t s o f t 公司算法应用了n a s a ( 美国国家航空和宇宙航行局) 在 2 0 世纪8 0 年代研究的人工智能技术,准确率达 9 9 6 。 n a k e dp e o p l ef i n d e r 是衣阿华大学m m f le c k 教 授与加州大学伯克利分校d a f o r s y t h 等人研制 的不良图像搜索引擎h 副,该软件完全基于图像内容 的分析,其不良人体图像检测算法分为三步:1 检 测图像内是否存在纹理且具有皮肤颜色的大的区 n a k e dp e o p l e 衣阿华大学与加州域;2 在皮肤颜色区域内,寻找圆柱状投影区;3 f i n d e r 大学伯克利分校将圆柱状投影区聚合成可能的人体肢体,并将这些 可能的人体肢体依据其结构和相互间的空间关系 进行连接,如果图像内存在足够的可能是人体肢体 的区域,则判定有不良人体目标存在。该算法在有 5 6 5 幅不良图像和4 2 8 9 幅正常图像的数据库中, 正确检测出2 4 1 幅不良图像,同时将1 8 2 幅正常图 像判定为不良图像,不良图像正确识别率为4 3 , 误判率为4 。 w i p e ( w a v e l e t 斯坦福大学j a m e s该系统利用d a u b e c h i e s 小波和颜色直方图特征进 i m a g e zw a n g 等人 行敏感图像检测1 4 1 ,对4 3 7 幅敏感图像的检测率达 p o r n o g r a p h y 到9 5 2 ,对1 0 8 0 9 幅非敏感图像的误检率为 e li m i n a ti o n )1 0 7 ,执行时间为1 0 秒幅。 表2 2 中给出了国外在基于内容的敏感图像过滤系统方面的研发情况。近年 来,国内一些重要科研机构对基于内容的图像过滤非常重视,使其成为计算机领 域的一个研究热点。东北大学软件中心的许强提出了图像内容过滤智能防火墙系 统,采用了基于d a u b e c h i e s 小波与正则中心矩相结合的轮廓特征抽取技术和基 于多智能的特征检索技术,实现了基于语义的特征向量匹配,系统的不良图像正 确识别率达9 5 2 ,误判率为1 0 7 n 钉。中科院自动化所的杨金锋等采用图像肤色 分割、感兴趣区域检测、轮廓提取等方法实现了敏感图像检测n 们。尹显东等n 7 1 提出将人体肤色模型、面部模型以及图像轮廓、面积等多项图像特征识别技术相 结合的色情图像识别过滤方法。段立娟等人提出了多层次特定类型图像过滤方法 n 印、多特征特定类型图像过滤方法n 印,在1 2 万幅图测试集上的识别率为9 4 ,接 6 第2 章国内外研究现状 近国际领先水平。王宇石等提出运用局部形态s i f t 描述法过滤网络淫秽图像,首 先检测图像中局部形态变化突出的位置,并建立关于该区域形态的s i f t 描述向 量;把这些描述向量抽象地看作视觉“单词”,并收集淫秽图像中常见的单词; 依据图像中单词出现的情况,来检测是否包含淫秽成分。徐欣欣等提出一种基于 自适应小波不变矩的色情图像过滤方法,先利用统计颜色空间模型分割出疑似皮 肤区域,再利用自适应小波不变矩来描述皮肤的纹理特征,最后将该方法用于色 情图像的过滤。 需要说明的是,一方面由于对识别和分类正确率认识上的分歧和测试图库的 不同,系统的正确率也存在着一些波动,有些机构自己宣称的准确率非常高,但 第三方测试的结果却并不令人十分满意。总体来说,系统的正确率基本上都在 6 0 - - 7 0 之间,还不是十分满意。仔细分析,发现主要存在如下一些因素: ( 1 ) 当景物也具有与肤色相近的区域时,系统容易发生误判。 ( 2 ) 当人物穿着与肤色相近的衣服,识别也存在一定的困难。 ( 3 ) 一些体育运动项目,如跳水运动、游泳图片也存在一定程度的误判。 ( 4 ) 当照片的光照条件不好,或者采用了特殊处理过的图像,识别也存在 问题。 传统的基于内容的敏感图像过滤系统提取肤色特征,并利用一些基于肤色的 统计特征( 肤色面积、肤色矩) 来进行图像分类,所以误检率比较高。少数的过 滤系统除了提取肤色特征以外,还提取人体姿态的几何特征,通过对这两类信息 的判断确定图像是否具有敏感内容,但是由于对人体姿态的多样性,描述模型过 于简单,导致一些敏感图像未能被检测出来。总之,基于内容的敏感图像过滤已 经成为社会发展的迫切需要,尽管已有很多的过滤系统产生,但是网络色情问题 依然比较严峻。一方面需要各个部门齐心协力,加强网络内容管理制度。另一方 面也有必要继续研究其他方法,把握敏感图像的本质,有效检测出裸露器官、淫 亵动作等不良信息内容。 2 3 敏感图像过滤系统的研究方向 敏感图像过滤系统是一系列复杂技术的综合应用,它包含着许许多多的技 术,存在着许多的研究方向,综合起来,最主要的研究方向有以下几个方面。 2 3 1 皮肤检测技术 皮肤检测不但在基于内容的敏感图像过滤技术中有着广泛的应用,而且是人 脸检测与识别、高级人机交换、手臂检测与识别、动态场景监测等系统的重要组 成部分。图像过滤技术通常是在皮肤检测的基础上进行分析与处理的,因而如何 7 北京t 业人学t 学硕 :学位论文 准确有效地检测图像中的皮肤区域对于后续的分析处理将起着至关重要的作用, 仍将是以后研究的重点。 2 3 2 综合多特征的图像过滤技术 一副图像具有多种特征,对于同一特征有多种不同的表示方法,敏感图像也 是如此,在不同的光照,阴影,背景条件下,人体表现形式的多样性很难用一个 统一的模型把所有的特征表示出来,并且什么是敏感图像最为突出的特征目前还 没有统一的定义。为了有效的过滤敏感图像,必须有机的组织这些特征。综合还 意味着采纳其它学科领域的研究成果,如文本语义分析技术,人工智能技术、人 脸检测与定位和关键部位识别技术。 2 2 3 高层语义与低层特征的关联 图像中是否有色情内容实际上是一个高层次的语义特征,但是,计算机视觉 技术所能直接抽取的图像特征大都为底层特征,图像的低级视觉特征和高级语义 之间存在着较大的语义间隔,因而导致图像过滤难于实现。如何减小低级视觉特 征和高级语义间的语义间隔将是实现基于内容的敏感图像过滤的关键。 2 2 4 分级策略标准的定义 类似于电影行业中的分级内容,根据图像内容来确定图像的级别,从而决定 该图像适合的对象。目前,图像内容分级策略可以借鉴电影内容分级标准。实验 过程中,我们只是认为的将图像分为敏感图像与非敏感图像两类。 2 2 6 分类方法的选择 敏感图像的检测说到底就是一个分类的问题,因此分类方法的好坏对分类结 果有着直接的影响,考滤到敏感图像对于检测的准确性以及时间性的要求,在现 在形成的许许多多种分类方法中,选择合适的分类方法也是一个重要的研究内 容。 2 2 5 过滤性能的提高 用户在访问网络时希望得到很小的延迟或没有延迟,如果一个系统的延迟较 大的话,用户是不能容忍的。这就要求过滤系统的高性能是必须的。通常,图像 处理本身就是一项很耗资源与时间的任务,过滤算法的复杂度更加使得图像过滤 第2 帝罔内外研究现状 系统的性能低下。如何提高过滤系统的性能,使得过滤信息达到实时的要求也将 是未来研究的主要问题。 2 4 本章小结 由敏感图像的主要研究方向以及上述所提及的系统所采用的各种方法可以 看出,肤色信息在敏感图像的检测过程中有着十分重要的意义,图像中肤色检测 性能的好坏对于最终敏感图像的检测,分类器性能的好坏有着直接的影响。但是 传统的肤色检测算法多数是基于点的检测,这种检测方法往往都是以单个的点像 素作为肤色检测算法的基本单位,检测的结果往往会出现许许多多的小片区域。 对于肤色像素之间的相互关系,在基于点的肤色检测算法中并没有考滤。在本文 中,基于一种新的被称为脉冲耦合的神经网络,结合区域增长的思想,提出一种 新的基于区域的肤色检测方法。 9 第3 章颜色窄问介绍 第3 章颜色空间介绍 肤色检测过程是一个十分复杂的过程,肤色检测除了受肤色本身的一系列属 性影响之外,检测的结果还受到高光照,阴影,图像饱和度等许多因素的影响, 因此肤色检测过程中选择合适的颜色空间是一个十分重要的问题。下面对于常用 的颜色空间进行简单介绍,分析他们在应用背景和特性,选取适合用于肤色检测 的颜色空间。 3 1r g b 空间 红色( r ) ,绿色( g ) 和蓝色( b ) 被称作三种基本的颜色,人类感知到的颜色就 是这三种基本颜色联合产生的。利用这三种基本颜色,通过它们的线性或非线性 表示能得到其它彩色空间的表示。我们利用光分别通过三个红、绿、蓝颜色过滤 器得到的亮度值来表示红、绿、蓝三个颜色分量,如下式所示: r = j e ( 2 ) s r ( a ) d 见 ( 3 一i ) j g = i e ( 名) & ( 旯) d 力 ( 3 2 ) j b = i e ( 五) 是( 兄) d 元 ( 3 3 ) 二 其中,最,品,& 是三个颜色过滤器,e ( 旯) 表示射入过滤器的光或射线, 名是波长。r g b 彩色空间用图像表示如图3 - 1 所示,是一个立方体,立方体中每 个点的坐标都能用r ,g ,b 三个值表示。 在电视系统和数码相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论