1 绪论
1.1 研究背景与意义
网络时代的大背景下,大数据成为了研究的主流。人作为网络时代的参与者和建设者以视觉作为获取信息的主要来源,据统计每秒大概有 108—109 比特的视觉信息量进入人眼[1],如此大量的视觉信息需要通过更多的图像数据来保存和传输。如何利用计算机解决人脑处理海量图像数据所面临的局限,给了人们更多的想象空间,于是计算机视觉与图像处理学科应运而生。显著性目标检测作为计算机视觉与图像处理学科的一个研究方向,自 Itti 等人[2]对其的开创性研究论文发表后,国际计算机视觉与模式识别会议(IEEE Conference on ComputerVision and Pattern Recognition,CVPR)、国际计算机视觉大会(IEEE International Conferenceon Computer Vision,ICCV)和欧洲计算机视觉国际会议(European Conference on ComputerVision,ECCV),以每期十几篇论文的刊量足以说明,显著性目标检测现已成为该领域的研究热点之一[3]。显著性目标检测的由来是研究者意图利用计算机算法模拟人眼的视觉选择性注意机制[4],即快速从复杂的场景中定位几点相对突出区域,进而对少数几点区域进行细致处理,这通常也被认为是视觉显著性机制。那么,人眼是如何完成这种机制的,生物的生理学研究证明[5],人脑的大部分区域都参与了视觉信息的处理,主要分为两个信息流:背部流和腹侧流,前者处理感兴趣的位置信息,后者处理目标识别的高级理解。根据两种处理方式的不同,前者的衍生是显著性目标检测的自底向上处理方法,后者的衍生是自顶向下的处理方法[6]。自底向上的显著性目标检测方法,无需具备先验知识,利用图像的底层特征如颜色、方向、纹理等从复杂的场景中快速定位几点显著性区域,如在无星夜天中的一轮明月,无需具备主观意识的情况下,人眼便能自觉的被明月所吸引,这就是自底向上的处理方式。该方法是以底层的特征为依据的数据驱动式目标检测方法[7],从待检测的图像中提取底层特征,通过空域特征对比、频域差减等简单的处理得到检测显著性目标的显著性图。自顶向下的显著性目标检测方法,需具备目标的先验知识,利用学习到的目标特征从复杂的场景中突出目标特征显著的指定目标区域,如在烦乱的梳妆台上寻找一把梳子,需要人脑具备梳子的主观意识,在此情况下,人眼便查找梳妆台中符合梳子特征的目标,这就是自顶向下的处理方式。该方法是以学习的目标特征为依据的任务驱动式的目标检测方法,从目标中提取特征训练判别模型,通过判别的方式突出图像中目标特征显著的区域得到指定查找目标的显著性图[8]。通常论述中所说的显著性检测与显著性目标检测,被认为表达的意思相同,但是其实质是不同的,显著性目标检测一般指的是自顶向下的检测方法。
..........
1.2 国内外研究现状
近年来,国内外的研究学者对于显著性目标检测的研究取得了突破式的进展,比较知名的团队如国外的 Itti 团队、Koch 团队等,国内大连理工大学的卢湖川团队、上海交通大学的侯晓迪团队、南开大学的程明明团队等,这些研究团队为显著性目标检测作出了重大贡献。无论是自底向上还是自顶向下的显著性目标检测方法,检测输出结果都为显著性图(灰度图),图中较亮区域为显著性目标区域,理想的显著性图如图 1.1 所示。自底向上的显著性目标检测方法模拟人眼在无意识的情况下盲目搜索图像中的感兴趣区域,多应用于广告、标志的预测,图像压缩、存储等领域。自顶向下的显著性目标检测方法通过学习目标的特征形成具备目标特征先验的模型模拟人脑通过后天学习有目的的查找图像中的指定目标,多应用于图像分类和目标检测、识别、跟踪等领域[16]。无论是自底向上还是自顶向下显著性目标检测方法,根本上都是通过特征的对比、匹配方法来模拟人类视觉系统对观察对象注意力的竞争、选择机制,大体分为特征提取、显著性计算和生成显著性图三个阶段。特征提取阶段通常提取图像的底层特征如 Lab 特征、SIFT 特征等,生成显著性图阶段通常采用线性插值的拉伸方式等,显著性计算阶段是研究的重点,对此本文主要总结了四类基于不同方式的计算方法如下:基于对比度的显著性目标检测。最初的显著性目标检测方法都是通过对比度的方法实现的,通过局部与局部之间或局部与整体之间的对比,从而产生特征显著的区域即显著性目标区域得到显著性图[17]。Itti 等人提出了最初的显著性目标检测方法[2],简称为 Itti 方法,利用金字塔模型,融合多尺度的方向、亮度和颜色特征图,线性相加三种特征图得到显著性图。这种融合多特征图的方法,提供了一种显著性目标检测的系统性方案,目前的显著性目标检测方法多应用这种特征图的提取方式。Achanta 等人提出了一种简单的基于局部对比度的显著性目标检测方法[18],简称为 AC方法,采用滑动窗口的方式提取亮度和颜色特征,它在不同尺度邻域图像区域上的局部对比度,作为它的显著值,形成显著性图。
........
2 背景抑制与显著性目标检测的相关方法
2.1 背景抑制的相关方法
2.1.1 傅立叶变换(FT)
傅立叶变换(Fourier Transform,FT)是一种线性的积分变换,由法国学者约瑟夫·傅里叶提出,常作用于信号在空域和频域之间的变换方法,最初作为热过程的解析分析工具,后来在物理学和工程学中有许多应用。对于图像处理的应用已经相当成熟,通过将图像转换到频域上,采集空域上难发现的图像特征。在显著性目标检测的应用中同样是利用其对背景和目标显示的特征差异,进而起到消除背景保留目标的目的[24]图 2.1 a 为单周期和不同周期信号,图 2.1 b 为对应的振幅谱,通过对比发现,信号重复周期越多对应的振幅谱波峰越尖锐,由此可知,图像的振幅谱中包含描述图像内容的重要信息。在周期信号基础上,加入频率不同的显著性信号部分,对比振幅谱的变化如图 2.2所示[24]。
......
2.2 显著性目标检测的相关方法
2.2.1 字典学习(DL)
人工智能研究的成果以广泛应用到的了人们的日常生活中,随处可见的人工智能标题,以及每日论坛上人工智能研究动态的频繁更新,如今已经真正进入了人工智能的时代。机器学习作为人工智能时代的标志性产物,其理论主要是模拟人脑学习过程,设计与分析可以自动“学习”的算法,即从已知数据中分析规律,并利用获得的规律对未知数据进行预测的算法。算法学习中涉及大量统计学理论,因此一些领域又被称为统计学习理论,已广泛应用于计算机视觉、数据挖掘、自然语言处理和机器人等领域。字典学习(Dictionary Learning,DL)作为机器学习理论的一个研究方向,由 Aharon等人[32]提出,不在是以前根据先验知识预先设定字典,它是根据样本数据进行训练获得,这一训练过程被称为字典学习,经典的字典学习方法有最优方向法(MOD)、K-SVD 法、在线字典学习法和贝叶斯字典学习法等。近十几年来,稀疏已经成为信号处理及其应用领域中最热门的概念之一,它表示从冗余的信号中得到的比较紧缩的元素代表原信号,稀疏概念源自于新的抽样理论,即压缩感知,这是对香农采样理论的一种变形,利用的是信号本身的稀疏先验知识,建立采样与稀疏直接关联的方法。原子是信号的组成元素,字典是一个原子排列集合的矩阵。常作为特征提取方法被采用,引入字典学习方法获得稀疏的特征编码提高特征的判别能力。在图像处理领域中,稀疏表示方法通常从一组图像中采集部分小的图像块作为训练样本,通过图像块特征稀疏表示得到图像字典,可以利用这个字典表示这类图像。以图像处理领域为例,字典学习分为初始化字典和字典更新两个阶段。
........
3 背景抑制的显著性目标检测方法............14
3.1 基于 DL-CRF 的显著性目标学习 ............14
3.2 基于背景抑制的显著性目标定位 ............18
3.2.1 超复数傅立叶变换的背景抑制方法 ....18
3.2.2 背景抑制的显著性目标定位 ....19
3.3 基于背景抑制的显著性图生成 .....21
3.4 背景抑制的显著性目标检测方法实现步骤 ........24
3.5 本章小结 ......25
4 背景抑制的显著性目标检测方法实验与分析 ....26
4.1 显著性目标检测的评价体系 .........26
4.2 背景抑制的显著性目标检测方法的参数设置.....27
4.3 背景抑制的显著性目标检测方法对不同对象类的实验............28
4.3.1 行人对象类.........30
4.3.2 汽车对象类.........36
4.3.3 自行车对象类 .....42
4.4 本章小结 ......47
4 背景抑制的显著性目标检测方法实验与分析
4.1 显著性目标检测的评价体系
实验环境能够充分满足实验条件要求。软件环境为 64 位 Windows10 操作系统、MATLAB R2010b 实验编译实现软件平台;硬件环境为 8G 内存、主频为 2.20GHz 的英特尔处理器。实验采用 Graz-02 数据集[38]作为检验本文方法的图像集。该数据集是由格拉茨科技大学建立的一个比较流行的自然场景下对象类图像数据集,目标对象类包括刚体和非刚体分别为人、汽车和自行车,每个对象类共包括 300 幅图像,图像尺寸为 640×480 或 480×640像素,多拍摄于高复杂度和高类内差异的杂乱检测环境,常作为目标检测和分类方法的测试和对比。实验从主观视觉的愉悦度和客观数据两个方面来评价证明本文提出方法的有效性和准确率。主观视觉愉悦度主要是通过人眼观察评价实验效果,虽然具有很强的主观性,但是计算机视觉的研究内容多为模拟人眼对图像的处理过程,人眼往往对图像观察具有得天独厚的能力,因此主观视觉的评价不可或缺。然而,对于细微的差别,客观评价的数据更具说服力,客观评价如准确率、召回率、综合评价指标 F-meansure 和平均绝对误差,本文通过阈值方法将显著性检测结果进行二值化,然后把得到的二值化掩膜结果与人工标定的真实掩膜进行对比,可能的结果见表 4.1。本章以行人类、汽车类和自行车类分别为显著性检测的目标,对本文提出的背景抑制的显著性目标检测方法(以下简称为 CFM 方法)和其中间的显著性目标定位(以下简称为 CF 方法)阶段的检测结果分别进行论证,并与其它经典方法进行主观和客观上的比较。显著性目标定位的准确性对于背景抑制的显著性目标检测方法起到提高准确率的关键作用,因此,在实验部分将背景抑制的显著性目标检测的中间 CF 方法进行单独实验以证明该阶段的有效性和对 CFM 整体方法的重要性。

........
结 论
显著性目标检测方法的思想来源于人眼视觉注意机制的模拟,具有理论简单、方法实现简单、对参数设置不敏感等优势。但是显著性目标检测作为目标检测研究的一种尝试方法,还存在许多亟待解决的问题,如自底向上显著性目标检测方法缺乏目标先验知识而忽略指定目标,自顶向下显著性目标检测方法受复杂背景干扰造成误检,以及得到的显著性图中目标边界模糊、不完整等问题。傅立叶变换方法作为图像处理领域的成熟方法经历了研究的考验,从频率域上解决了许多空间域上难以解决的问题,从另一角度分析背景普遍存在的特征,方法简单且速度极快。流型排序方法作为数据分类的常用方法,具有半监督特性,能引入事先的估计,得到 0~1 范围内的评分序列达到分类目的。针对复杂背景的干扰问题,利用傅立叶变换方法具有的背景抑制特性,改进基于 DL-CRF 的显著性目标学习方法,消去重复的复杂背景,有效的抑制复杂背景,准确定位显著性目标;针对显著性图中目标边界模糊、不完整问题,利用流型排序方法的半监督特性引入显著性目标前景估计的位置,得到平滑且完整的显著性目标。具体而言,文章的研究成果主要包括以下几个方面:
(1)超像素分割的分块方法得到了目标的明确边界,利用联合字典与条件随机场学习目标特征检测图像中的指定目标。同时利用超复数傅立叶变换改进的背景抑制方法,在频域上消除重复性背景抑制误检背景的情况,准确定位显著性目标在图像中的位置。
(2)消除重复背景的显著性目标定位后,提出流型排序引入边缘背景先验空域上再次抑制背景的改进方法,最后扩展显著性目标得到最终的显著性图。
(3)结合频域与空域处理方式,通过两次抑制背景达到突出显著性目标目的,增加扩展显著性目标环节得到平滑且目标完整的显著性图。
..........
参考文献(略)
提供海量毕业论文,论文格式,论文格式范文,留学生论文,商务报告相关资料检索服务。