惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
PCI Perspectives
PCI Perspectives
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Google Online Security Blog
Google Online Security Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
The GitHub Blog
The GitHub Blog
S
Secure Thoughts
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
WordPress大学
WordPress大学
SecWiki News
SecWiki News
B
Blog
小众软件
小众软件
Hacker News - Newest:
Hacker News - Newest: "LLM"
Webroot Blog
Webroot Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
L
LINUX DO - 热门话题
Recent Commits to openclaw:main
Recent Commits to openclaw:main
酷 壳 – CoolShell
酷 壳 – CoolShell
IT之家
IT之家
The Cloudflare Blog
Google DeepMind News
Google DeepMind News
Know Your Adversary
Know Your Adversary
Y
Y Combinator Blog
F
Fortinet All Blogs
W
WeLiveSecurity
博客园 - Franky
MongoDB | Blog
MongoDB | Blog
Last Week in AI
Last Week in AI
The Last Watchdog
The Last Watchdog
S
Schneier on Security
爱范儿
爱范儿
V
V2EX - 技术
L
LINUX DO - 最新话题
月光博客
月光博客
博客园 - 【当耐特】
Latest news
Latest news
阮一峰的网络日志
阮一峰的网络日志
博客园 - 司徒正美
U
Unit 42
Schneier on Security
Schneier on Security
E
Exploit-DB.com RSS Feed
J
Java Code Geeks
Cyberwarzone
Cyberwarzone
T
The Blog of Author Tim Ferriss
TaoSecurity Blog
TaoSecurity Blog
博客园 - 叶小钗
T
Troy Hunt's Blog
大猫的无限游戏
大猫的无限游戏
AI
AI
Security Latest
Security Latest

又见苍岚

COLMAP PatchMatch Stereo 算法详解 事件驱动的状态机框架:从理论到工程实践 Git 在国内网络环境下无法 Push 的排查与修复 —— 配置 Clash 代理 分段五次多项式插值原理详解 路径插值方法深度对比研究 Claude Code 使用指南 OpenClaw 记忆管理与技能创建指南 CBS(Conflict-Based Search)算法详解 A* 算法及其变种详解 OpenClaw 配置多 Agents Windows Powershell 无法加载文件,因为在此系统上禁止运行脚本问题的解决方案 MaxClaw 安装流程 大模型 AI 名词介绍 AList 网盘聚合工具简介 Protobuf 简介与测试 Claude Code 简介以及 GLM 4.7 模型接入 Github 歌词下载工具 163MusicLyrics Python __getattr__ 懒加载 Python TypedDict 机器人仿真平台 Gazebo 安装记录 机器人仿真平台 Gazebo 简介 多机器人路径规划问题(Multi-Agent Path Finding, MAPF)简介 Python exifread 读取修改过的 jpeg 信息错误问题修复 3D 坐标系变换的理解 3D 旋转矩阵基本概念 MongoDB Compass 介绍 Python 环境管理工具 uv Flutter 开发指南 Snipaste 安装下载与黑屏问题解决方案 全局路径规划算法记录 2025 Python 版本性能测试 Flutter Hello World Flutter 安装环境配置 Ubuntu VMware 硬盘扩容后 SMBus Host controller not enabled 报错问题解决 Python NetworkX 教程 Docker GPU 报错 - Failed to initialize NVML Unknown Error 解决方案 Python matplotlib 图表绘制 cuda-toolkit 安装替代 Cuda 与 Cudnn Jinja2 Python 利用 docxtpl 和 Jinja2 生成基于模板的 Word 文档 Docker 实现 CPU 核心隔离 LoFTR 基于 Transformer 的特征提取匹配算法 OmniGlue 特征匹配 SuperGlue 使用图神经网络学习特征匹配 Ubuntu 下将 xlsx 文件按照 sheet 转换为 图片 Python 使用 SQLAlchemy Python FastAPI 教程 openwrt 软路由配置安装 Nav2 地图文件(PGM/YAML)规范标准 3D OBJ 模型转换为 glb 瓦片格式 Python 源码 Redis 数据库介绍 Ubuntu 22.04 内核自动升级导致 MongoDB 7.0.12 错误记录 ubuntu 20.04 安装 ROS Noetic ubuntu 18.04 安装 ROS Melodic VMware Workstation Pro 个人免费版下载、安装、使用指南 Hybrid A-star 路径规划 Reeds-Shepp 曲线 Dubins 曲线 Linux kvm 虚拟机网络不通的问题解决方法 Ubuntu 自动内存清理 BiliBili 缓存视频转 mp4 Python 求解线性规划 3D Gaussian Splatting 官方源码实践记录 ImageMagick 教程 Ubuntu 22.04 安装 Colmap 对数几率 odds Ubuntu nmcli 网络管理工具使用指南 SuperPoint 自监督深度学习特征点提取 SyncTV Music Tag Web 在线音乐信息整理工具 ncm 格式转 mp3 MusicBrainz 音乐元数据百科数据库 Ubuntu 网络流量监控工具 私人云音乐平台 Navidrome 入门 手眼标定 四元数(Quaternions) OHTTPS 实现免费自动 https 证书申请、更新、部署 ubuntu 22.04 安装 CloudCompare 单机 KVM 虚拟机冷迁移 Ubuntu 22.04 使用 mdadm 实现软 raid 小鱼 一键安装 ROS-humble Fluid -46- 基于 Simpletex API 构建公式识别页面 公式识别 API 简介 -- Simpletex 使用 Python web 部署库 waitress 3D Gaussian Splatting for Real-Time Radiance Field Rendering Ubuntu Swap 简介与空间扩展 Ubuntu 24.04 安装 forticlient Clash Verge 使用 MongoDB 7.0.17 集群 Docker 构建源码 Error code - 2013. Lost connection to MySQL server during query 问题解决 Python 日志记录库 loguru 使用指北 Python 实现 Web 日志查看服务 MySQL LOAD DATA LOCAL INFILE 极速数据加载 Image size exceeds limit of 89478485 pixels 解决方案 Docker 使用 NVIDIA GPU 驱动错误解决 阿里云 docker 镜像仓库 Ubuntu中没有wired connected的解决方案 MinIO 简介 subconverter 代理订阅格式转换 修复 node –openssl-legacy-provider is not allowed in NODE_OPTIONS 错误
2D 离散傅里叶变换
Yiwei Zhang · 2022-11-23 · via 又见苍岚

本文最后更新于:2024年5月11日 下午

2D DFT变换在数字图像处理中有着重要应用,本文记录相关概念和简单应用。

简介

  • 傅里叶变换 是一种分析信号的方法, 将时域信号在频域的基中重新表示,而在频域中可能会有时域难以实现的操作效果。
  • 对于数字图像处理来说,离散的 2D 傅里叶变换是更加实用的理论,根据傅里叶变换的性质 我们可以使用傅里叶变换进行时域的卷积、相关等操作

2D 傅里叶变换

1D 傅里叶变换是将时域信号用频域空间的基——不同频率的正弦、余弦波表示后的结果,那么 2D 傅里叶变换本质是什么呢

一维傅里叶变换

  • 回顾一维傅里叶变换:

$$
F(w)=\int_{-\infty}^{+\infty} f(x) e^{-j w x} d x
$$

  • 通俗来讲,一维傅里叶变换是将一个一维的信号分解成若干个复指数波 $ e^{j w x} $ 。而由于 $ e^{j w x}=\cos (w x)+i \sin (w x) $ ,所以可以将每一个复指数波 $ e^{j w x} $ 都视为是 $余弦波 +\mathrm{j} {\times} 正弦波$ 的组合。

  • 对于一个正弦波而言,需要三个参数来确定它:频率 $w$ ,幅度 $A$ ,相位 $φ$ 。因此在频域中,一维坐标代表频率,而每个坐标对应的函数值也就是 $F(w)$ 是一个复数,其中它的幅度 $|F(w)|$ 就是这个频率正弦波的幅度 $A$ ,相位 $∠F(w)$ 就是 $φ$ 。下图右侧展现的只是幅度图,在信号处理中用到更多的也是幅度图。

  • 一维傅里叶变换就是一个基变换,在时域中,基是一族冲激信号 $ {\delta(x-n)} $

  • 在频域中; 基是 $ \left\{e^{j w x}\right\} $ ,而且这组基是正交基。

类比:从一维到二维

一维信号是一个序列,傅里叶变换将其分解成若干个一维的简单函数之和。

二维的信号可以说是一个图像,类比一维,那二维傅里叶变换是不是将一个图像分解成若干个简单的图像呢?

  • 事实上二维傅里叶变换将一个图像分解成若干个复平面波 $ e^{j 2 \pi(u x+v y)} $ 之和。

  • 二维连续傅里叶变换的公式:

$$
F(u, v)=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) e^{-j 2 \pi(u x+v y)} d x d y
$$

  • 通过公式,我们可以计算出,每个平面波在图像中成分是多少。从公式也可以看到,二维傅里叶变换就是将图像与每个不同频率的不同方向的复平面波做内积,也就是一个求在基 $ \left\{e^{-j 2 \pi(u x+v y)}\right\} $ 上的投影的过程。

    应该知道 $ \frac{\vec{a} \cdot \vec{b}}{|\vec{a}|} $ 是b在a上的投影,只不过这里的|a|的值被设 为 1 , 所以只有内积。

二维频域 K-SPACE (K空间)
  • 对于正弦平面波,可以这样理解,在一个方向上存在一个正弦函数,在法线方向上将其拉伸。前面 说过三个参数可以确定一个一维的正弦波。哪几个参数可以确定一个二维的正弦平面波呢? 答案是 四个,其中三个和一维的情况一样 (频率 $ w $, 幅度 $ A $ ,相位 $ \varphi $ ),但是具有相同这些参数的平面波 却可以有不同的方向 $ \vec{n} $ 。如下图所示:

  • 类比一维中,幅度和相位可以用一个复数表示,它可以作为我们存储的内容。但是还有两个:一个频率一个方向。这时想到向量是有方向的,也是有长度的。所以我们用一个二维的矩阵的来保存分解之后得到的信息。这个矩阵就是K空间。(一般用k来表示空间频率)

  • 就是说一个二维矩阵点 $ (u, v) $ 代表这个平面波的法向量 $ \vec{n} $ ,这个向量的模$ \sqrt{u{2}+v{2}} $ 代表这个平面波的频率 $ w $ ,这个点里面保存的内容复数就是此平面波的幅度和相位。 下面这个图很好的体现了这一点:

  • 也因比K空间的中心对于低频,周围对于高频。如下图,K空间中只有(0,0)处有值,也就是信号都是直流即不存在变化,所以实空间就是一张白纸。

  • 中心低频贡献了图像的主体,周围高频提供图像的细节和边缘。

  • k空间的每一个位置存储诸的数代表了所在位置复平面波在图像中占多少成分,我们就河以用每个系数 $\times$ 所代表的平面波相加得到原来的图像。所以k空间和对应图像储存的信息含量是一样的,只不过表现形式不同,或者说基不同。

旋转和平移

  • 如果旋转时域图像,由于旋转没有改变平面波的幅度相位,只是将所有的平面波都旋转了一个角度,那么频域图像也会旋转相应的角度。
  • 平移时域图像,相当于周期信号没有变,仅是相位发生了变化,因此在频域中的表示是相位变化,而能量谱不变。

  • 生成代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import numpy as np
import mtutils as mt

if __name__ == '__main__':

golden_img = np.zeros([600, 600])
golden_img[250:350, 250:350] = 255

H, W = golden_img.shape[:2]

gloden_fft = np.fft.fft2(golden_img)
ori_fft_res = np.abs(np.fft.fftshift(gloden_fft))

rotate_img = mt.img_rotate(golden_img, 30)
rotate_fft = np.fft.fft2(rotate_img)
rotate_fft_res = np.abs(np.fft.fftshift(rotate_fft))

roi = [100, 100, W+100, H+100]
moved_img = mt.crop_data_around_boxes(golden_img, roi)
moved_fft = np.fft.fft2(moved_img)
moved_fft_res = np.abs(np.fft.fftshift(moved_fft))

roi = [100, 100, W+100, H+100]
moved_rotated_img = mt.crop_data_around_boxes(rotate_img, roi)
moved_rotated_fft = np.fft.fft2(moved_rotated_img)
moved_rotated_fft_res = np.abs(np.fft.fftshift(moved_rotated_fft))

mt.PIS(golden_img, rotate_img, moved_img, moved_rotated_img, ori_fft_res, rotate_fft_res, moved_fft_res, moved_rotated_fft_res, row_num=2)

去噪应用

一个大佬的PPT中提到了一个指纹去噪的傅里叶变换应用,很有意思

  • 对于周期的背景信号,在频域空间中就会产生规律的亮点,如果将这些亮点去掉则可以起到去噪的效果

参考资料

文章链接:
https://www.zywvvd.com/notes/study/math/fourier-transform/2d-dft-corr/2d-dft/


“觉得不错的话,给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信二维码

微信支付

支付宝二维码

支付宝支付