




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图像论文:基于多特征集成的图像自动标注方法研究【中文摘要】随着数码设备和计算机网络的发展及广泛应用,数字图像在计算机中的存储量呈爆炸式的增长。为了实现计算机对海量图像的自动管理,图像检索特别是图像自动标注成为近年来研究的重点和热点。针对图像的多标注问题和“语义鸿沟”问题,本文研究使用多特征集成的图像自动标注方法,以进一步提高图像自动标注的性能。本文的主要研究内容和创新点如下:(1)为解决传统图像标注中标注词与图像区域之间缺乏对应关系的问题,本文在对未标注图像进行标注之前,引入分割算法将图像划分成若干个图像区域,并对每个图像区域分别进行图像自动标注的策略,使图像区域与标注词之间建立起一一对应的关系。(2)鉴于目前图像自动标注中只有少量已标注样本的实际情况,本文采用半监督学习方法思想来建立标注模型。该方法同时将已标注样本和未标注样本用于机器学习中,并利用图像底层视觉特征空间的分布信息,来度量未标注图像到各标注词之间的视觉特征距离,从而为未标注图像选择标注关键词。(3)针对图像自动标注系统多采用单个分类器,从而导致标注准确率较低问题,本文研究并提出基于多特征集成的图像自动标注算法EMDAIA。该算法将图像自动标注问题看作是图像的多分类问题,构造并集合多个分类器的分类结果,选择出现概率最大的预测词来对图像进行标注。EMDAIA使用LabelMe图像数据库进行实验,实验结果表明,EMDAIA比仅使用单一特征进行图像自动标注的准确率提高了约10%。(4)研究并提出一种基于感兴趣区域的图像自动标注方法ROIAIA,该方法在对未标注图像进行标注前,先采用Itti模型提取图像的感兴趣区域,然后对提取的感兴趣区域进行标注。实验表明,基于感兴趣区域的图像自动标注能有效地减少图像次要区域对主要区域的影响,将图像自动标注的注意力集中到用户感兴趣的图像区域。(5)研究了特征子集的选择对图像自动标注性能的影响,对提取的10种视觉特征选择后组合成10个不同的特征子集,在PASCAL VOC 2008图像数据库上进行实验,结果表明:使用多特征集成可以提高分类器的分类性能,8种视觉特征构造特征子集时图像标注的平均准确率最高,继续增加特征的种类反而会降低标注结果的准确率。【英文摘要】With the development of digital equipment and computer network, the number of digital images is growing dramatically. In order to manage the large volumes of digital images automatically, various image retrieval techniques, especially image automatically annotation algorithms, draw a lot of attentions in recent years. Aiming at handling the problem of multiple annotations and“semantic gap”of images, this paper investigates how to utilize multiple visual descriptors to improve the performance of automatically image annotation.The major contents and contributions of this paper are:(1) In order to cope with the problem of lacking linkages between images regions and label keywords, this paper employs a Normalized Cuts algorithm to segment each image into image regions before annotation, and then uses an image annotation strategy on each image region respectively, so as to create one-VS-one linkages between image regions and label keywords.(2) As currently only limited labeled samples are available while a large amount of unlabeled samples exist in a given image annotation system, this paper adopts the idea of semi-supervised learning to construct learning models. The model utilizes both labeled and unlabeled samples for training, and then uses visual descriptors to measure the distance between unlabeled images and labeled keywords, so as to choose the appropriate keywords for the unlabeled image.(3)As most available automatic image annotation algorithms use only a single classifier to predict keywords, the accuracy of these algorithms are relatively low. This paper proposes a novel algorithm, EMDAIA, for automatic image annotation. EMDAIA regards the image annotation task as an image classification task, and integrates the classification results of multiple classifiers, i.e., selects the keywords with the maximum probability to label the images. Experimental results on LabelMe dataset demonstrate that EMDAIA achieves approximately 10% improvement in accuracy over the single descriptor approachs.(4) The paper also proposes a ROIAIA algorithm for automatic image annotation. Before annotating an unlabeled image, ROIAIA firstly uses the Itti model to extract the region of interest, and then annotates the interest regions by keywords. Experimental results show that, ROIAIA can effectively reduce the impact of the secondary regions, and greatly improve the speed of automatic image annotation.(5) In order to evaluate the efficiency of annotation by different feature subsets, this paper extracts several of features, and chooses 10 different feature subsets for experiments. Experimental results on the PASCAL VOC 2008 database show that using ensemble of multiple descriptors can improve the accuracy of annotation. It achieves the best annotation performance while integrating 8 descriptors. Afterwards, its performance will degrade while keeping increasing the use of descriptors.【关键词】图像 自动标注 多特征集成 分类 感兴趣区域 特征选择【英文关键词】Image Automatic annotation Ensemble descriptors classification Region of interest Feature extraction【目录】基于多特征集成的图像自动标注方法研究摘要5-6ABSTRACT6-7第一章 绪论10-171.1 研究目的与意义10-131.1.1 图像自动标注是图像检索的关键技术10-121.1.2 图像自动标注具有广泛的应用前景12-131.2 国内外研究现状13-141.2.1 国内研究现状131.2.2 国外研究现状13-141.3 存在问题14-151.4 本文的研究内容151.5 论文的组织结构15-17第二章 图像自动标注的相关技术17-242.1 图像自动标注基本框架172.2 图像的视觉特征表示17-212.2.1 图像分割18-202.2.2 图像视觉特征提取20-212.3 图像的相似性度量21-222.4 标注模型22-232.5 本章小结23-24第三章 基于多特征集成的图像自动标注方法24-393.1 EMDAIA 基本思想24-253.2 集成学习25-293.2.1 为什么使用集成学习253.2.2 集成学习的思想和方法25-293.2.3 单分类器分类结果的整合方法293.3 EMDAIA 基本框架29-333.3.1 模型训练阶段30-313.3.2 测试阶段31-333.4 实验结果与分析33-383.4.1 实验数据333.4.2 特征提取33-353.4.3 几种距离度量方法标注结果比较35-363.4.4 多特征集成和单一特征实验结果及分析36-383.5 本章小结3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年医生初级面试技巧与模拟题解析
- 2025年特岗教师招聘考试物理模拟试题及答案解析
- 2025年水利行业高级职位面试必-备灌区管理模拟题解析
- 2025年餐饮企业审计部门笔试模拟题集
- 胆囊癌护理查房
- 甲状腺癌病例讨论课件
- 甲状腺功能亢进护理
- 使用课件的教学方法
- 新解读《GB-T 36806-2018甘蔗杆状病毒实时荧光PCR检测方法》
- 做教学课件反思与总结
- 采油工培训教学计划
- 设计概论讲课课件(第三版杨晓琪)
- 小学数学分数四则混合运算200题带答案
- 《血管活性药物静脉输注护理》团体标准解读
- 行政管理内控制度模版(3篇)
- GB/T 3324-2024木家具通用技术条件
- 小学音乐跨学科教学的常见问题与应对策略
- 小红书食用农产品承诺书示例
- 《碳酸氢钠注射液的药学探究》12000字(论文)
- 农村兄弟二人分家协议书范文
- 改造雨水篦子施工方案
评论
0/150
提交评论