惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
PCI Perspectives
PCI Perspectives
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Google Online Security Blog
Google Online Security Blog
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
The GitHub Blog
The GitHub Blog
S
Secure Thoughts
cs.CV updates on arXiv.org
cs.CV updates on arXiv.org
WordPress大学
WordPress大学
SecWiki News
SecWiki News
B
Blog
小众软件
小众软件
Hacker News - Newest:
Hacker News - Newest: "LLM"
Webroot Blog
Webroot Blog
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
L
LINUX DO - 热门话题
Recent Commits to openclaw:main
Recent Commits to openclaw:main
酷 壳 – CoolShell
酷 壳 – CoolShell
IT之家
IT之家
The Cloudflare Blog
Google DeepMind News
Google DeepMind News
Know Your Adversary
Know Your Adversary
Y
Y Combinator Blog
F
Fortinet All Blogs
W
WeLiveSecurity
博客园 - Franky
MongoDB | Blog
MongoDB | Blog
Last Week in AI
Last Week in AI
The Last Watchdog
The Last Watchdog
S
Schneier on Security
爱范儿
爱范儿
V
V2EX - 技术
L
LINUX DO - 最新话题
月光博客
月光博客
博客园 - 【当耐特】
Latest news
Latest news
阮一峰的网络日志
阮一峰的网络日志
博客园 - 司徒正美
U
Unit 42
Schneier on Security
Schneier on Security
E
Exploit-DB.com RSS Feed
J
Java Code Geeks
Cyberwarzone
Cyberwarzone
T
The Blog of Author Tim Ferriss
TaoSecurity Blog
TaoSecurity Blog
博客园 - 叶小钗
T
Troy Hunt's Blog
大猫的无限游戏
大猫的无限游戏
AI
AI
Security Latest
Security Latest

又见苍岚

COLMAP PatchMatch Stereo 算法详解 事件驱动的状态机框架:从理论到工程实践 Git 在国内网络环境下无法 Push 的排查与修复 —— 配置 Clash 代理 分段五次多项式插值原理详解 路径插值方法深度对比研究 Claude Code 使用指南 OpenClaw 记忆管理与技能创建指南 CBS(Conflict-Based Search)算法详解 A* 算法及其变种详解 OpenClaw 配置多 Agents Windows Powershell 无法加载文件,因为在此系统上禁止运行脚本问题的解决方案 MaxClaw 安装流程 大模型 AI 名词介绍 AList 网盘聚合工具简介 Protobuf 简介与测试 Claude Code 简介以及 GLM 4.7 模型接入 Github 歌词下载工具 163MusicLyrics Python __getattr__ 懒加载 Python TypedDict 机器人仿真平台 Gazebo 安装记录 机器人仿真平台 Gazebo 简介 多机器人路径规划问题(Multi-Agent Path Finding, MAPF)简介 Python exifread 读取修改过的 jpeg 信息错误问题修复 3D 坐标系变换的理解 3D 旋转矩阵基本概念 MongoDB Compass 介绍 Python 环境管理工具 uv Flutter 开发指南 Snipaste 安装下载与黑屏问题解决方案 全局路径规划算法记录 2025 Python 版本性能测试 Flutter Hello World Flutter 安装环境配置 Ubuntu VMware 硬盘扩容后 SMBus Host controller not enabled 报错问题解决 Python NetworkX 教程 Docker GPU 报错 - Failed to initialize NVML Unknown Error 解决方案 Python matplotlib 图表绘制 cuda-toolkit 安装替代 Cuda 与 Cudnn Jinja2 Python 利用 docxtpl 和 Jinja2 生成基于模板的 Word 文档 Docker 实现 CPU 核心隔离 LoFTR 基于 Transformer 的特征提取匹配算法 OmniGlue 特征匹配 SuperGlue 使用图神经网络学习特征匹配 Ubuntu 下将 xlsx 文件按照 sheet 转换为 图片 Python 使用 SQLAlchemy Python FastAPI 教程 openwrt 软路由配置安装 Nav2 地图文件(PGM/YAML)规范标准 3D OBJ 模型转换为 glb 瓦片格式 Python 源码 Redis 数据库介绍 Ubuntu 22.04 内核自动升级导致 MongoDB 7.0.12 错误记录 ubuntu 20.04 安装 ROS Noetic ubuntu 18.04 安装 ROS Melodic VMware Workstation Pro 个人免费版下载、安装、使用指南 Hybrid A-star 路径规划 Reeds-Shepp 曲线 Dubins 曲线 Linux kvm 虚拟机网络不通的问题解决方法 Ubuntu 自动内存清理 BiliBili 缓存视频转 mp4 Python 求解线性规划 3D Gaussian Splatting 官方源码实践记录 ImageMagick 教程 Ubuntu 22.04 安装 Colmap 对数几率 odds Ubuntu nmcli 网络管理工具使用指南 SuperPoint 自监督深度学习特征点提取 SyncTV Music Tag Web 在线音乐信息整理工具 ncm 格式转 mp3 MusicBrainz 音乐元数据百科数据库 Ubuntu 网络流量监控工具 私人云音乐平台 Navidrome 入门 手眼标定 四元数(Quaternions) OHTTPS 实现免费自动 https 证书申请、更新、部署 ubuntu 22.04 安装 CloudCompare 单机 KVM 虚拟机冷迁移 Ubuntu 22.04 使用 mdadm 实现软 raid 小鱼 一键安装 ROS-humble Fluid -46- 基于 Simpletex API 构建公式识别页面 公式识别 API 简介 -- Simpletex 使用 Python web 部署库 waitress 3D Gaussian Splatting for Real-Time Radiance Field Rendering Ubuntu Swap 简介与空间扩展 Ubuntu 24.04 安装 forticlient Clash Verge 使用 MongoDB 7.0.17 集群 Docker 构建源码 Error code - 2013. Lost connection to MySQL server during query 问题解决 Python 日志记录库 loguru 使用指北 Python 实现 Web 日志查看服务 MySQL LOAD DATA LOCAL INFILE 极速数据加载 Image size exceeds limit of 89478485 pixels 解决方案 Docker 使用 NVIDIA GPU 驱动错误解决 阿里云 docker 镜像仓库 Ubuntu中没有wired connected的解决方案 MinIO 简介 subconverter 代理订阅格式转换 修复 node –openssl-legacy-provider is not allowed in NODE_OPTIONS 错误
几何哈希
Yiwei Zhang · 2022-11-18 · via 又见苍岚

几何散列(几何哈希,Geometric Hashing)是一种最初在计算机视觉中开发的, 用于将几何特征与这些特征的数据库相匹配的技术, 可用于许多其他领域。 即使可识别的数据库对象经历了变换或仅存在部分信息, 也可以进行匹配。 该技术高效且多项式复杂度低。

背景

  • 物体识别(object recognition)是大多数计算机视觉研究的终极目标。 理想的物体识别系统应该能够识别图像中被部分遮挡或经历了几何变换的物体。 大多数系统将使用大型模型数据库并应用基于模型的识别。

  • 假设想让机器人能够识别工厂车间的所有物体和工具。 如果只有几百个对象, 您可以设计这些对象的数据库并将其存储在机器人的内存中。 当机器人从摄像机或距离传感器接收其环境的感官图像时, 它应该能够从存储器中快速检索出现在图像中的对象。 虽然在人类视觉中很自然, 但机器人中的这项任务需要解决几个复杂的问题:

  1. 获取场景中的对象相对于其初始数据库位置显示为旋转和平移, 并且整个场景经历依赖于传感器的变换, 例如摄像机的投影变换。( 说白了, 看到的角度和方向要跟数据库保存的状态一直哦 )
  2. 场景中的对象可能部分地相互遮挡, 并且场景可能包括未包括在数据库中的其他对象。
  3. 从数据库中检索每个单独的对象并将其与搜索匹配的观察场景进行比较在计算上是低效的。 例如, 如果场景仅包含圆形对象, 则检索与其匹配的矩形对象没有意义。

需要一种允许直接访问相关信息的方法 - 例如基于索引的方法。 例如, 如果要查找长文本字符串中的单词, 则可以使用由作为单个单词的函数的索引访问的表。 该表包含单词出现的字符串以及单词在字符串中的位置。 通过从表中检索所有出现情况来定位单词很容易。

  • 几何散列是一种基于索引方法的方法, 起源于Schwartz和Sharir的工作。这些第一步努力集中在使用边界曲线匹配技术从轮廓中识别旋转, 平移和部分遮挡的二维物体。与简化的文本类比相反, 实现技术更复杂, 需要形状信息而不仅仅是局部特征的位置。 两种形状可以具有相同的局部特征, 但在外观上完全不同。 如果形状的刚性是保守的, 那么不仅局部特征而且它们的相对空间配置也很重要。

  • 为了利用几何一致性并在二维和三维环境中处理基于模型的物体识别, Schwartz, Wolfson和Lamdan开发了一种新的几何散列技术, 适用于任意点集或constellations, 在各种几何变换下。 他们开发了有效的算法, 用于识别由点集或由透视变换的仿射近似下的曲线表示的平面刚体, 并且它们扩展了在任意变换下识别点集的技术, 并将刚性3D对象与单个2D图像区分开来

举例说明

为简单起见, 此示例不会使用太多的点要素, 并假设它们的描述符仅由其坐标给出。

训练阶段 Preprocessing phase

  1. 找到模型的特征点。 假设在具有坐标的模型图像中找到5个特征点 $(12,17); (45,13); (40,46); (20,35); (35,25)$

​ 图像坐标系中对象的点, 以及基础坐标系的轴 (P2, P4)

  1. 引入描述特征点位置的基础。 对于2D空间和相似性变换, 基础由一对点定义。 原点( point of origin)位于连接两个点(在我们的例子中为P2, P4)的段的中间, $x’$ 轴指向其中一个, $y’$ 是正交的并且穿过原点( point of origin)。 选择标度使得两个基点的x’的绝对值为1。

  2. 描述相对于该基础的特征位置, 即计算这些点到新坐标轴的投影。 坐标应该是离散的, 以使更好识别噪声, 我们将箱尺寸设为0.25。 因此我们得到坐标$(-0.75, -1.25);(1.00,0.00)😭 - 0.50,1.25)😭-1.00,0.00);(0.00,0.25)$

  3. 将基础存储在由要素索引的哈希表中(在这种情况下仅转换坐标)。 如果有更多对象要匹配, 我们还应该将对象编号与基础对一起存储。

  4. 对不同的基础对重复该过程(步骤2)。 需要处理遮挡。 理想情况下, 应列举所有非共线对。 我们在两次迭代后提供哈希表, 为第二次迭代选择对(P1, P3)。

  • 哈希表:

大多数哈希表不能将相同的键映射到不同的值。 因此在现实生活中, 不会在哈希表中对基本键(1.0,0.0)和(-1.0,0.0)进行编码。

识别阶段 Recognition Phase

  1. 在输入图像中查找有趣的特征点。

  2. 选择任意的基础。 如果没有合适的任意基础, 则输入图像可能不包含目标对象。

  3. 描述新基础中特征点的坐标。 量化获得的坐标, 如前所述。

  4. 将输入图像中的所有变换点要素与哈希表进行比较。 如果点要素相同或相似, 则增加相应基础的计数(以及对象的类型, 如果有的话)。

  5. 对于每个基数使得计数超过某个阈值, 验证其对应于在步骤2中选择的图像基础的假设。将图像坐标系转移到模型1(对于假定的对象)并尝试匹配它们。 如果成功, 则找到该对象。 否则, 请返回步骤2。

参考资料

文章链接:
https://www.zywvvd.com/notes/study/image-processing/geo-hash/geo-hash/