本文共 1999 字,大约阅读时间需要 6 分钟。
HOG特征即局部归一化的梯度方向直方图,是一种对图像局部重叠区域的密集型描述符。通过计算图像局部区域的梯度方向直方图来构成特征,HOG特征是一种在计算机视觉和图像处理中广泛应用于物体检测的特征描述子。
HOG特征的核心思想在于利用图像局部区域的梯度方向分布来描述图像的视觉特征。这种方法能够很好地捕捉图片中的轮廓、边缘以及纹理信息,同时对光照变化和阴影的影响得到了有效的抑制。
标准化Gamma空间和颜色空间
对输入图像进行Gamma校正,调整颜色空间,使得图像的光照变化和阴影对比度得以减少,从而降低噪声的影响。计算图像梯度
采用标准的梯度算子,对图像进行平移 convolution,分别计算水平和竖直方向的梯度分量,并计算每个像素点的梯度大小和方向。构建梯度方向直方图
将图像划分为6×6像素的单元格(cell),在每个单元格内对梯度方向进行统计划分,通常采用9个方向区间(bin)来构建直方图。块归一化
将相邻的多个单元格组成一个2×2的块(block),对块内的直方图进行归一化处理,使得不同块的直方图特征更加相似,从而增强对光照变化的鲁棒性。特征向量构建
将每个block的归一化后的直方图特征串联起来,形成一个高维的特征向量,这就是HOG特征描述符。HOG特征相比于其他特征方法具有以下优势:
灰度化处理
将原图像转换为灰度图像,便于后续的梯度计算和特征提取。Gamma校正
使用Gamma=1/2对图像进行调节,减少光照对比度对特征提取的影响。梯度计算
依次使用水平和竖直方向的梯度算子,计算每个像素点的梯度大小和方向。单元格划分
将图像划分为6×6像素的单元格,确保每个cell的大小适中,以便于后续的直方图统计。直方图构建
对每个单元格的梯度方向进行统计,固定9个方向区间,统计每个方向的梯度点数。块归一化与特征串联
将相邻的4个单元格组成一个2×2的block,对block内各单元格的直方图进行归一化处理,最后将block内的归一化后特征串联起来形成一个完整的特征向量。图像滑动窗口
将滑动窗口移动到图像的不同位置,提取每个窗口下的HOG特征,得到完整的HOG特征图。LBP(Local Binary Pattern)特征是一种基于局部纹理的图像描述方法,通过编码每个像素周围的纹理信息来构建特征描述符。
LBP特征的基本原理是对图像局部纹理信息进行编码,通过将纹理信息转化为二进制形式,来描述图像的局部表象特性。这种方法能够捕捉图像的细节纹理,同时具有一定的影像无关性。
纹理编码
以中心像素为基准,统计其周围3×3邻域中的纹理特征,将纹理差异转化为二值特征。常用的编码方式有旋转Invariant编码(如Haar wavelet等)。特征编码
将纹理信息转化为二进制形式,通常采用旋转不变的方式,确保特征的不变性。特征提取
对图像中的每个像素进行纹理编码,生成一张纹理特征图。特征提取提升
通过小窗口滑动过图像,提取图像的纹理特征描述符。Haar特征是基于代数方法构建的纹理描述符,通过对图像像素的线性变换来提取纹理特征。
Haar特征通过对图像的二维小窗口进行多次傅里叶变换,将图像纹理信息转化为频域中的低频和高频成分,从而得到图像的纹理特征描述。
傅里叶转换
对原始图像进行傅里叶变换,转换到频域。低频和高频分离
提取图像的低频成分和高频成分,其中低频成分主要描述纹理特征。图像反变换
对频域的纹理特征进行反变换,得到纹理特征图。特征提取提升
通过小窗口滑动过图像,提取独立于位置的纹理特征,形成Haar特征描述符。HOG、LBP、Haar特征各具特色,适用于不同范围的图像特征提取任务。在目标检测和图像识别中,HOG特征因其对几何和光学变形的鲁棒性而受到广泛关注;LBP特征则凭借其对纹理信息的精确描述,成为在某些实时检测任务中的首选;Haar特征则因其简单高效,常作为基础特征之一在多个特征学习算法中得到应用。
这三种特征方法各有优势,在实际应用中可以根据具体任务需求进行选择和结合,以实现更好的图像理解效果。
转载地址:http://ljwtz.baihongyu.com/