博客
关于我
svm训练特征提取——图像特征提取三大法宝:HOG特征,LBP特征,Haar特征
阅读量:576 次
发布时间:2019-03-11

本文共 1999 字,大约阅读时间需要 6 分钟。

图像特征提取三大法宝:HOG特征、LBP特征、Haar特征

一、HOG特征

HOG特征即局部归一化的梯度方向直方图,是一种对图像局部重叠区域的密集型描述符。通过计算图像局部区域的梯度方向直方图来构成特征,HOG特征是一种在计算机视觉和图像处理中广泛应用于物体检测的特征描述子。

HOG特征的主要思想

HOG特征的核心思想在于利用图像局部区域的梯度方向分布来描述图像的视觉特征。这种方法能够很好地捕捉图片中的轮廓、边缘以及纹理信息,同时对光照变化和阴影的影响得到了有效的抑制。

HOG特征的具体实现方法

  • 标准化Gamma空间和颜色空间

    对输入图像进行Gamma校正,调整颜色空间,使得图像的光照变化和阴影对比度得以减少,从而降低噪声的影响。

  • 计算图像梯度

    采用标准的梯度算子,对图像进行平移 convolution,分别计算水平和竖直方向的梯度分量,并计算每个像素点的梯度大小和方向。

  • 构建梯度方向直方图

    将图像划分为6×6像素的单元格(cell),在每个单元格内对梯度方向进行统计划分,通常采用9个方向区间(bin)来构建直方图。

  • 块归一化

    将相邻的多个单元格组成一个2×2的块(block),对块内的直方图进行归一化处理,使得不同块的直方图特征更加相似,从而增强对光照变化的鲁棒性。

  • 特征向量构建

    将每个block的归一化后的直方图特征串联起来,形成一个高维的特征向量,这就是HOG特征描述符。

  • HOG特征的优点

    HOG特征相比于其他特征方法具有以下优势:

  • 几何和光学不变性:HOG特征能够很好地保持图像的几何形变和光学形变,这在人体姿态检测中表现尤为突出。
  • 对细微动作的容忍能力:HOG特征对小范围内的肢体动作变化不敏感,因此在实体检测中能够很好地自动适应 slight运动。
  • 高效特征表达:HOG特征通过对局部区域的细致描述,能够充分表现出物体的视觉特征。
  • HOG特征提取的实现过程

  • 灰度化处理

    将原图像转换为灰度图像,便于后续的梯度计算和特征提取。

  • Gamma校正

    使用Gamma=1/2对图像进行调节,减少光照对比度对特征提取的影响。

  • 梯度计算

    依次使用水平和竖直方向的梯度算子,计算每个像素点的梯度大小和方向。

  • 单元格划分

    将图像划分为6×6像素的单元格,确保每个cell的大小适中,以便于后续的直方图统计。

  • 直方图构建

    对每个单元格的梯度方向进行统计,固定9个方向区间,统计每个方向的梯度点数。

  • 块归一化与特征串联

    将相邻的4个单元格组成一个2×2的block,对block内各单元格的直方图进行归一化处理,最后将block内的归一化后特征串联起来形成一个完整的特征向量。

  • 图像滑动窗口

    将滑动窗口移动到图像的不同位置,提取每个窗口下的HOG特征,得到完整的HOG特征图。

  • 二、LBP特征

    LBP(Local Binary Pattern)特征是一种基于局部纹理的图像描述方法,通过编码每个像素周围的纹理信息来构建特征描述符。

    LBP特征的主要思想

    LBP特征的基本原理是对图像局部纹理信息进行编码,通过将纹理信息转化为二进制形式,来描述图像的局部表象特性。这种方法能够捕捉图像的细节纹理,同时具有一定的影像无关性。

    LBP特征的具体实现方法

  • 纹理编码

    以中心像素为基准,统计其周围3×3邻域中的纹理特征,将纹理差异转化为二值特征。常用的编码方式有旋转Invariant编码(如Haar wavelet等)。

  • 特征编码

    将纹理信息转化为二进制形式,通常采用旋转不变的方式,确保特征的不变性。

  • 特征提取

    对图像中的每个像素进行纹理编码,生成一张纹理特征图。

  • 特征提取提升

    通过小窗口滑动过图像,提取图像的纹理特征描述符。

  • 三、Haar特征

    Haar特征是基于代数方法构建的纹理描述符,通过对图像像素的线性变换来提取纹理特征。

    Haar特征的主要思想

    Haar特征通过对图像的二维小窗口进行多次傅里叶变换,将图像纹理信息转化为频域中的低频和高频成分,从而得到图像的纹理特征描述。

    Haar特征的具体实现方法

  • 傅里叶转换

    对原始图像进行傅里叶变换,转换到频域。

  • 低频和高频分离

    提取图像的低频成分和高频成分,其中低频成分主要描述纹理特征。

  • 图像反变换

    对频域的纹理特征进行反变换,得到纹理特征图。

  • 特征提取提升

    通过小窗口滑动过图像,提取独立于位置的纹理特征,形成Haar特征描述符。

  • 结论

    HOG、LBP、Haar特征各具特色,适用于不同范围的图像特征提取任务。在目标检测和图像识别中,HOG特征因其对几何和光学变形的鲁棒性而受到广泛关注;LBP特征则凭借其对纹理信息的精确描述,成为在某些实时检测任务中的首选;Haar特征则因其简单高效,常作为基础特征之一在多个特征学习算法中得到应用。

    这三种特征方法各有优势,在实际应用中可以根据具体任务需求进行选择和结合,以实现更好的图像理解效果。

    转载地址:http://ljwtz.baihongyu.com/

    你可能感兴趣的文章
    Qt之QImage无法获取图片尺寸(宽和高)
    查看>>
    推荐几篇近期必看的视觉综述,含GAN、Transformer、人脸超分辨、遥感等
    查看>>
    ERROR 1840 (HY000) at line 24: @@GLOBAL.GTID_PURGED
    查看>>
    Java-类加载过程
    查看>>
    BUU-MISC-认真你就输了
    查看>>
    BUU-MISC-caesar
    查看>>
    【专题2:电子工程师 之 上位机】 之 【36.事件重载】
    查看>>
    【专题3:电子工程师 之 上位机】 之 【46.QT音频接口】
    查看>>
    一文学会JVM常见参数设置+调优经验(JDK1.8)
    查看>>
    一文理解设计模式--命令模式(Command)
    查看>>
    VTK:可视化之RandomProbe
    查看>>
    block多队列分析 - 2. block多队列的初始化
    查看>>
    Java时间
    查看>>
    不编译只打包system或者vendor image命令
    查看>>
    MySQL
    查看>>
    The wxWindows Library Licence (WXwindows)
    查看>>
    leetcode——第203题——虚拟头结点
    查看>>
    【编程】C语言入门:1到 100 的所有整数中出现多少个数字9
    查看>>
    MySQL----基础及常用命令
    查看>>
    模拟集成:MOS管的工作区小误区(简单版)
    查看>>