惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
PCI Perspectives
PCI Perspectives
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Google Online Security Blog
Google Online Security Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
The GitHub Blog
The GitHub Blog
S
Secure Thoughts
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
WordPress大学
WordPress大学
SecWiki News
SecWiki News
B
Blog
小众软件
小众软件
Hacker News - Newest:
Hacker News - Newest: "LLM"
Webroot Blog
Webroot Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
L
LINUX DO - 热门话题
Recent Commits to openclaw:main
Recent Commits to openclaw:main
酷 壳 – CoolShell
酷 壳 – CoolShell
IT之家
IT之家
The Cloudflare Blog
Google DeepMind News
Google DeepMind News
Know Your Adversary
Know Your Adversary
Y
Y Combinator Blog
F
Fortinet All Blogs
W
WeLiveSecurity
博客园 - Franky
MongoDB | Blog
MongoDB | Blog
Last Week in AI
Last Week in AI
The Last Watchdog
The Last Watchdog
S
Schneier on Security
爱范儿
爱范儿
V
V2EX - 技术
L
LINUX DO - 最新话题
月光博客
月光博客
博客园 - 【当耐特】
Latest news
Latest news
阮一峰的网络日志
阮一峰的网络日志
博客园 - 司徒正美
U
Unit 42
Schneier on Security
Schneier on Security
E
Exploit-DB.com RSS Feed
J
Java Code Geeks
Cyberwarzone
Cyberwarzone
T
The Blog of Author Tim Ferriss
TaoSecurity Blog
TaoSecurity Blog
博客园 - 叶小钗
T
Troy Hunt's Blog
大猫的无限游戏
大猫的无限游戏
AI
AI
Security Latest
Security Latest

又见苍岚

COLMAP PatchMatch Stereo 算法详解 事件驱动的状态机框架:从理论到工程实践 Git 在国内网络环境下无法 Push 的排查与修复 —— 配置 Clash 代理 分段五次多项式插值原理详解 路径插值方法深度对比研究 Claude Code 使用指南 OpenClaw 记忆管理与技能创建指南 CBS(Conflict-Based Search)算法详解 A* 算法及其变种详解 OpenClaw 配置多 Agents Windows Powershell 无法加载文件,因为在此系统上禁止运行脚本问题的解决方案 MaxClaw 安装流程 大模型 AI 名词介绍 AList 网盘聚合工具简介 Protobuf 简介与测试 Claude Code 简介以及 GLM 4.7 模型接入 Github 歌词下载工具 163MusicLyrics Python __getattr__ 懒加载 Python TypedDict 机器人仿真平台 Gazebo 安装记录 机器人仿真平台 Gazebo 简介 多机器人路径规划问题(Multi-Agent Path Finding, MAPF)简介 Python exifread 读取修改过的 jpeg 信息错误问题修复 3D 坐标系变换的理解 3D 旋转矩阵基本概念 MongoDB Compass 介绍 Python 环境管理工具 uv Flutter 开发指南 Snipaste 安装下载与黑屏问题解决方案 全局路径规划算法记录 2025 Python 版本性能测试 Flutter Hello World Flutter 安装环境配置 Ubuntu VMware 硬盘扩容后 SMBus Host controller not enabled 报错问题解决 Python NetworkX 教程 Docker GPU 报错 - Failed to initialize NVML Unknown Error 解决方案 Python matplotlib 图表绘制 cuda-toolkit 安装替代 Cuda 与 Cudnn Jinja2 Python 利用 docxtpl 和 Jinja2 生成基于模板的 Word 文档 Docker 实现 CPU 核心隔离 LoFTR 基于 Transformer 的特征提取匹配算法 OmniGlue 特征匹配 SuperGlue 使用图神经网络学习特征匹配 Ubuntu 下将 xlsx 文件按照 sheet 转换为 图片 Python 使用 SQLAlchemy Python FastAPI 教程 openwrt 软路由配置安装 Nav2 地图文件(PGM/YAML)规范标准 3D OBJ 模型转换为 glb 瓦片格式 Python 源码 Redis 数据库介绍 Ubuntu 22.04 内核自动升级导致 MongoDB 7.0.12 错误记录 ubuntu 20.04 安装 ROS Noetic ubuntu 18.04 安装 ROS Melodic VMware Workstation Pro 个人免费版下载、安装、使用指南 Hybrid A-star 路径规划 Reeds-Shepp 曲线 Dubins 曲线 Linux kvm 虚拟机网络不通的问题解决方法 Ubuntu 自动内存清理 BiliBili 缓存视频转 mp4 Python 求解线性规划 3D Gaussian Splatting 官方源码实践记录 ImageMagick 教程 Ubuntu 22.04 安装 Colmap 对数几率 odds Ubuntu nmcli 网络管理工具使用指南 SuperPoint 自监督深度学习特征点提取 SyncTV Music Tag Web 在线音乐信息整理工具 ncm 格式转 mp3 MusicBrainz 音乐元数据百科数据库 Ubuntu 网络流量监控工具 私人云音乐平台 Navidrome 入门 手眼标定 四元数(Quaternions) OHTTPS 实现免费自动 https 证书申请、更新、部署 ubuntu 22.04 安装 CloudCompare 单机 KVM 虚拟机冷迁移 Ubuntu 22.04 使用 mdadm 实现软 raid 小鱼 一键安装 ROS-humble Fluid -46- 基于 Simpletex API 构建公式识别页面 公式识别 API 简介 -- Simpletex 使用 Python web 部署库 waitress 3D Gaussian Splatting for Real-Time Radiance Field Rendering Ubuntu Swap 简介与空间扩展 Ubuntu 24.04 安装 forticlient Clash Verge 使用 MongoDB 7.0.17 集群 Docker 构建源码 Error code - 2013. Lost connection to MySQL server during query 问题解决 Python 日志记录库 loguru 使用指北 Python 实现 Web 日志查看服务 MySQL LOAD DATA LOCAL INFILE 极速数据加载 Image size exceeds limit of 89478485 pixels 解决方案 Docker 使用 NVIDIA GPU 驱动错误解决 阿里云 docker 镜像仓库 Ubuntu中没有wired connected的解决方案 MinIO 简介 subconverter 代理订阅格式转换 修复 node –openssl-legacy-provider is not allowed in NODE_OPTIONS 错误
GLCM 灰度共生矩阵与 Haralick 特征
Yiwei Zhang · 2023-01-10 · via 又见苍岚

灰度共生矩阵(GLCM, Gray-level co-occurrence matrix) 是一种灰度图像纹理特征提取的方法, 是目前最常见、应用最广泛、效果最好的一种纹理统计分析方法之一, Haralick 据此定义了14种纹理特征 ,本文记录相关内容。

简介

  • 灰度共生矩阵法(GLCM, Gray-level co-occurrence matrix),就是通过计算灰度图像得到它的共生矩阵,然后透过计算该共生矩阵得到矩阵的部分特征值,来分别代表图像的某些纹理特征 (纹理的定义仍是难点) 的方法。
  • 灰度共生矩阵能反映图像灰度关于方向、相邻间隔、变化幅度等综合信息,它分析图像的是图像局部模式和它们排列规则的基础。

GLCM 灰度共生矩阵

定义

  • 灰度共生矩阵是一个统计描述影像中的一个局部区域或整个区域相邻象元或一定间距内两象元灰度呈现某种关系的矩阵。
  • 该矩阵中的元素值代表灰度级之间联合条件概率密度 $P(i,j|d,θ) $,表示在 给定空间距离 $d$ 和方向 $θ$ 时,灰度以 $i$ 为始点,出现灰度级为 $j$ 的概率。
  • 算例:

左边是一幅 $5 \times 5$ 的图像,其中灰阶为 ${0,1,2}$,三阶灰度,因此共生矩阵维度为 $3 \times 3$,在定义好向量方向后,统计图像中按照向量方向产生的数据对,将数据对的总数量填入共生矩阵的对应位置。

  • 共生矩阵数学表示:

$$ \mathbf{G}=\left[\begin{array}{cccc}p(1,1) & p(1,2) & \cdots & p\left(1, N_{g}\right) \\ p(2,1) & p(2,2) & \cdots & p\left(2, N_{g}\right) \\ \vdots & \vdots & \ddots & \vdots \\ p\left(N_{g}, 1\right) & p\left(N_{g}, 2\right) & \cdots & p\left(N_{g}, N_{g}\right)\end{array}\right] $$

$p(i,j)$ 是通过计算一个值为 $i$ 的像素与值为 $j$ 的像素相邻的次数,然后将整个矩阵除以所进行比较的总次数而产生的。

  • 统计方向,常用的统计方向为像素的 8 邻域方向:

相关概念

  • 共生矩阵的大小

    在不对原图像灰度级别进行压缩的情况下,共生矩阵的大小为原图像灰度的级数的平方;

    在实际应用中,从纹理特征的计算效率以及共生矩阵的存储方面考虑,通常先把原始图像的灰度等级进行压缩比如从灰度级别为 0-255 的 8bit 图像压缩为灰度级别为 0-31的 5bit 图像,相应的共生矩阵的维数从 $256\times256$ 降低到 $32 \times32 $

  • 基准窗口

    当前像素为中心的某一个窗口,尺寸通常为奇数方阵,大小可设为$3 \times3$,$5 \times5 $,$7 \times7 $等

  • 移动窗口

以基准窗口为参考窗口,通过设定的移动方向和步长进行移动的窗口。尺寸大小与基准窗口的一样,位置由移动方向与步长决定

  • 移动方向

    基准窗口与移动窗口的相对方向。移动方向可以任意设定,通常为0°,45°,90°,135°

  • 移动步长

    基准窗口中心像元和移动窗口中心像元的距离 (用像素表示)

特点

  1. 共生矩阵是一个方阵, 该方阵的大小取决于原始图像灰度的级数,与原始图像尺度大小无关
  2. 共生矩阵与统计方向距离有关
  3. 矩阵元素值的分布与图像的信息丰富程度密切相关:如果灰度共生矩阵非零元素集中在主对角线上,则说明图像信息量在该方向上低,如果非零元素值在非主对角线上离散分布,说明在该方向上图像灰度变化频繁,信息量大。
  4. 共生矩阵元素值的大小相对于主对角线的分布与图像的纹理粗细程度密切相关:移动步长一定,如果靠近主对角线的元素值较大,则图像的纹理比较粗糙,反之,如果离主对角线较远的元素值较大,则表明图像的纹理较细。即灰度共生矩阵元素相对于主对角线的分布情况反映图像纹理的粗细程度。

  1. 基于GLCM的纹理分析需要综合考虑以下几个因素:
  2. 图像的灰度级
  3. 光谱波段
  4. 不同特征值选择
  5. 移动方向
  6. 窗口大小和移动步长(基于像素GLCM计算中)

示例

  • 棋盘格图像:

  • 定义两种方向 $d$ 后,计算共生矩阵:

Haralick 特征

  • 灰度共生矩阵提供了影像灰度方向间隔变化幅度的信息,但它并不能直接提供区别纹理的特性,因此需要在灰度共生矩阵的基础上提取用来定量描述纹理特征的统计属性。
  • Haralick定义了14种纹理特征。

  • 常用的特征统计量主要有: 均值(Mean) 、方差(Variance) 、同质性(Homogeneity)、对比度 (Contrast)、非相似性 (Dissimilarity)、熵 (Entropy )、角二阶矩( Angular Second Moment )、相关性 ( Correlation ) 等。

均值 (Mean)

  • 均值反映纹理的规则程度,纹理杂乱无章、难以描述的,值较小;规律性强、易于描述的,值较大
  • 公式:

$$
Mean =\sum_{i} \sum_{j} p(i, j)· i
$$

方差 (Variance)

  • 方差、标准差反映像元值与均值偏差的度量,当图像中灰度变化较大时,方差、标准差值较大。

  • 公式

$$
Variance =\sum_{i} \sum_{j} p(i, j)· (i-Mean)^2
$$

标准差 (Std)

  • 方差、标准差反映像元值与均值偏差的度量,当图像中灰度变化较大时,方差、标准差值较大。
  • 公式:

$$
Std = \sqrt{Variance}
$$

同质度 (Homogeneity)

  • 也叫 **inverse difference moment (逆差距) **,是图像局部灰度均匀性的度量,如果图像局部的灰度均匀,同质度取值较大。
  • 公式:

$$
Homogeneity=\sum_{i} \sum_{j} \frac{1}{1+(i-j)^{2}} p(i, j)
$$

对比度 (Contrast)

  • 反映图像中局部灰度变化总量。在图像中,如局部像素对的灰度差别越大,则图像的对比度越大,图像的视觉效果越清晰。
  • 公式

$$
Contrast=\sum_{i=1}^{N_{s}} \sum_{j=1}^{N_{s}} p(i, j) (i-j)^2
$$

非相似性 (Dissimilarity)

  • 度量与对比度相类似,但是是线性增加。如果局部的对比度越高,则非相似度也越高。

  • 公式:

$$
Dissmilarity =\sum_{i} \sum_{j} p(i, j){·}|i-j|
$$

熵 (Entropy)

  • 是图像所具有的信息量的度量,是测量灰度级分布随机性的特征参数,表征了图像中纹理的复杂程度。图像的纹理越复杂,熵值越大;反之,图像中的灰度越均匀,则熵值就越小。
  • 公式:

$$
Entropy =-\sum_{i} \sum_{j} p(i, j){·} \ln p(i, j)
$$

角二阶矩 ( Angular Second Moment )

  • 也叫能量,是图像灰度分布均匀性的度量。当GLCM中元素分布较集中于主对角线附近时,说明局部区域内图像灰度分布较均匀,ASM取值相应较大;相反,如果共生矩阵的所有值均相等,则ASM值较小。

  • 公式:

$$
ASM = \sum_{i} \sum_{j} p(i, j)^{2}
$$

相关性(Correlation)

  • 描述 GLCM 中行或列元素之间的相似程度的,它反映某种灰度值沿某方向的延伸长度,若延伸的越长,则相关性越大,它是灰度线性关系的度量。
  • 公式:

$$ Correlation =\sum_{i} \sum_{j} \frac{(i-\text { Mean }) (j-\text { Mean }) p(i, j)^{2}}{\text { Variance }} $$

参考资料

文章链接:
https://www.zywvvd.com/notes/study/image-processing/feature-extraction/image-glcm/image-glcm/