


















颜色直方图是在许多图像检索系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。颜色直方图特别适于描述那些难以进行自动分割的图像。
当 然,颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB颜色空间,原因在于大部分的数字图像都是用这种颜色空间表达的。然而,RGB 空间结构并不符合人们对颜色相似性的主观判断。因此,有人提出了基于HSV空间、Luv空间和Lab空间的颜色直方图,因为它们更接近于人们对颜色的主观 认识。其中HSV空间是直方图最常用的颜色空间。它的三个分量分别代表色彩(Hue)、饱和度(Saturation)和值(Value)。
计算HSV空间中两种颜色的距离由多种不同的方法。例如在[2]中提出了如下的颜色距离计算公式.这种相似度量方法相当于一个圆柱形颜色空间中的欧 拉距离,该空间中的颜色值表示为(scosh, ssinh, v)。在[3]中这样的圆柱空间被进一步变形称为圆锥性空间,其中的颜色表示为(svcosh, svsinh, v)。这些改变使v值较小的时候,降低了直方图对h和s分量的分辨能力。
计算颜色直方图需要将颜色空间划分成若干个小的颜色区间,每个小区间成为 直方图的一个bin。这个过程称为颜色量化(color quantization)。然后,通过计算颜色落在每个小区间内的像素数量可以得到颜色直方图。颜色量化有许多方法,例如向量量化、聚类方法或者神经网 络方法。最为常用的做法是将颜色空间的各个分量(维度)均匀地进行划分。相比之下,聚类算法则会考虑到图像颜色特征在整个空间中的分布情况,从而避免出现 某些bin中的像素数量非常稀疏的情况,使量化更为有效。另外,如果图像是RGB格式而直方图是HSV空间中的,我们可以预先建立从量化的RGB空间到量 化的HSV空间之间的查找表(look-up table),从而加快直方图的计算过程。
上述的颜色量化方法会产生一定的问题。设想两幅图像的颜 色直方图几乎相同,只是互相错开了一个bin,这时如果我们采用L1距离或者欧拉距离(见3.1.1节)计算两者的相似度,会得到很小的相似度值。为了克 服这个缺陷,需要考虑到相似但不相同的颜色之间的相似度。一种方法是采用二次式距离[4](见3.1.3节)。另一种方法是对颜色直方图事先进行平滑过 滤,即每个bin中的像素对于相邻的几个bin也有贡献。这样,相似但不相同颜色之间的相似度对直方图的相似度也有所贡献。
选择合适的颜色小区间 (即直方图的bin)数目和颜色量化方法与具体应用的性能和效率要求有关。一般来说,颜色小区间的数目越多,直方图对颜色的分辨能力就越强。然而,bin 的数目很大的颜色直方图不但会增加计算负担,也不利于在大型图像库中建立索引。而且对于某些应用来说,使用非常精细的颜色空间划分方法不一定能够提高检索 效果,特别是对于不能容忍对相关图像错漏的那些应用。另一种有效减少直方图bin的数目的办法是只选用那些数值最大(即像素数目最多)的
bin来 构造图像特征,因为这些表示主要颜色的bin能够表达图像中大部分像素的颜色。实验证明这种方法并不会降低颜色直方图的检索效果。事实上,由于忽略了那些 数值较小的bin,颜色直方图对噪声的敏感程度降低了,有时会使检索效果更好。两种采用主要颜色构造直方图的方法可以在文献[5,6]中找到。
===============================
| [日期:2008-06-24] | 来源: 作者:费晶晶 孙劲光 张新 | [字体:大 中 小] |
摘 要随着信息技术的 发展 ,基于 内容 的图像检索技术已经成为一个 研究 热点。文章提出了一种颜色和纹理相结合的图像检索算法。首先在RGB颜色空间中对已经分割好的图像块求其三个通道的颜色平均值,进行离散余弦变换后取其低 频分量作为颜色特征。用边缘直方图提取其纹理特征。最后综合利用这两个特征进行图像检索。实验结果表明,本文的算法具有较好的检索效果,有效地提高了检索 的查准率和查全率。
关键词 RGB颜色空间;颜色平均值;二维离散余弦变换;边缘直方图;纹理特征
近年来由于互联 网络 的快速发展,数字信息正海量的增长。传统的以文本的查询方式远远满足不了人们的要求,因此,基于内容的图像检索越来越受到人们的关注,成为了研究的热点。 在基于内容的图像检索中,颜色和纹理是人们使用的最为频繁的视觉特征。人们单一的对颜色或者纹理特征提出了各种各样的算法,但是一种特征的 方法 只能表达图像的部分属性,往往满足不了人们的视觉需求。因此本文提出了一种综合利用颜色和纹理的图像检索算法。实验表明,综合颜色和纹理这两种特征可以得 到比使用单一特征进行图像检索更好的效果。
在国际标准MPEG-7中建议了一种描述符颜色布局[1],它表达了颜色的 空间分布信息。在颜色布局描述符中,对分割好的8×8的图像取每一块图像的颜色平均值,形成一个颜色平均值矩阵,然后对其用二维离散余弦进行变换,取低频 分量作为颜色特征。考虑到本文所选的测试图片都是bmp图片,以及减少 计算 量,提高检索速度的因素,本文的颜色布局描述符[2,3]的提取方法如下:
(1)将整幅图像分成4×4块,计算每一块中所有象素RGB三个颜色通道的颜色平均值,并以此作为该块的代表颜色(主颜色)。
(2)将各块的颜色平均值进行离散余弦变换(DCT),得到DCT系数矩阵。DCT是一种分离的变 换,是国际静止图像压缩标准JPEG的基础。由于大多数图像的高频分量较小,相应于图像高频分量的系数经常为零,加上人眼对高频成分的失真不太敏感,所以 可用更粗的量化。因此,在一般检索中可以利用部分DCT系数作为特征向量。
(3)对DCT系数矩阵进行之字形扫描和量化,得到DCT系数。
(4)对于R、G、B三个通道,分别从DCT系数中取出4个低频分量,形成12个参数,共同构成该图像的颜色特征向量。
国际标准MPEG-7中建议的颜色布局描述符在匹配时使用欧式距离公式,因此在本算法中匹配时也使用欧式距离公式,即为:

其中,各个分量的W为权重,Ri,Gi,Bi分别为各个分量的第i(i=0,1,2,3)个DCT系数。
在国际标准MPEG-7中建议了一种纹理特征描述符——边缘直方图[1]。边缘直方图是基于图像边缘的统计特征,能较好地反映目标的边缘和纹理特征,而且运算速度较高[4]。因此在本文中选取边缘直方图来提取图像的纹理特征。下面介绍一下提取的具体步骤:
(1)将bmp图像转换成灰度图。每个象素的灰度值可以根据RGB颜色分量按下列公式计算得到: 。
(2)将整幅图像分成4×4块。
(3)分别对16块1/16子图像进行sobel边缘算子运算,得到边缘图像。
(4)统计子图像中的边缘直方图,该直方图包括4个直方条。(横轴为0,1,2,3四个边缘方向,纵轴为该方向上的象素数占子图像总的象素数的比率)
(5)将16个子图像的直方条综合起来,得到包括64个直方条的整幅图像的边缘直方图。
下面介绍用sobel算子[5]提取图像边缘的具体算法:
首先介绍一下sobel算子中用到的4个核模板:


(1)将图像中的象素点的灰度值分别与以上四个方向的核模板相乘。
(2)比较四个乘积数值,取最大的那个数值,作为该象素点的新的灰度值。
(3)取适当的阈值T,若新的灰度值≥T,则认为该象素点为边缘点。
通过以上算法提取出图像的边缘。
仍然采用欧式距离公式作为相似度的计算公式,如下:

其中;Qi,Di为图像Q,D在边缘直方图中对应的第i个直方条的值。

对于以上三幅图像,假设它们是原图像的1/4图像(其余3/4图像与此1/4图像相同),如果按照本文中的利用颜色特征进行检索,那么将得出完全相似的结 论,但是实际上这三幅图像给人的感觉是完全不同的。因此说单一的依靠提取一种特征来进行检索,得出的结果往往是不尽如人意的。在本文中,利用颜色布局描述 符结合了颜色特征和空间关系的特点;利用边缘直方图作为纹理特征弥补了颜色特征缺乏空间分布信息的不足,考虑到图像中的边缘多对应目标的边界或轮廓,边缘 直方图描述符在一定程度上还反映了图像中目标的形状信息。
因此这两种特征描述符达到了不同特征的优势互补的效果,而且,这两种特征在提取的过程中都归一化到了[0,1]区间,可以综合在一起进行图像检索。设颜色特征的权重为Wc,纹理特征权重为Wt,并且Wc+Wt=1,则综合特征的相似度计算公式为:

本文验证的系统的开发平台为Microsft Windows XP操作系统,赛扬2.0G的CPU,1G的内存。开发工具为vc++6.0。本文的实验图库为从标准测试图像库Corel图像库中选取的由海滩、恐龙、 大象、马、花等组成的102幅图片。表1、表2给出这几类图片的查准率和查全率。
表1 六类图片的查准率
|
利用颜 色特征 |
利用纹 理特征 |
利用综 合特征 |
|
|
海滩 |
0.583 |
0.500 |
0.833 |
|
恐龙 |
0.500 |
1.000 |
1.000 |
|
大象 |
0.417 |
0.333 |
0.583 |
|
马 |
0.583 |
0.833 |
1.000 |
|
雪景 |
0.167 |
0.250 |
0.333 |
|
花 |
0.500 |
0.667 |
0.833 |
表2 六类图片的查全率
|
利用颜 色特征 |
利用纹 理特征 |
利用综 合特征 |
|
|
海滩 |
0.350 |
0.300 |
0.500 |
|
恐龙 |
0.300 |
0.600 |
0.600 |
|
大象 |
0.250 |
0.150 |
0.350 |
|
马 |
0.583 |
0.833 |
1.000 |
|
雪景 |
0.100 |
0.150 |
0.250 |
|
花 |
0.300 |
0.400 |
0.500 |
从表1、表2中的数据可以看出,利用综合特征进行图像检索得到的查准率和查全率都要高于使用任何一 种单一的 方法 进行图像检索得到的查准率和查全率。通过以上的实验结果图片和结果数据可以看出本文中综合利用颜色和纹理特征进行图像检索的效果比使用单一特征进行检索的 效果更好,更符合人的视觉要求。因此,本文提出的综合颜色和纹理特征进行图像检索的方法是有效的,有意义的方法。
[1]章毓晋.基于 内容 的视觉信息检索[M].北京: 科学 出版社.2003
[2]郑楚君,杨志勇,何惠玲,常鸿森.DCT压缩域中图像颜色布局描述符的提取[J]. 计算机工程与 应用 ,2005,35:167-168
[3]顾红飞,张佑生,江巨浪.基于颜色布局的压缩图像检索 研究 [J].合肥 工业 大学学报( 自然 科学版),2006,29(1):1-4
[4]F Malgouyres,F Guichard.Edge Direction Preserving Image Zooming:A Mathematical and Numerical Analysis[J]. SIAM Journal on Numerical Analysis,2001,39(1):1369-1390
[5]刘彩.一种改进的Sobel图像边缘检测算法[J].贵州工业大学学报(自然科学版),2004,33(5):77-79
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。