惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

P
Palo Alto Networks Blog
T
The Blog of Author Tim Ferriss
Engineering at Meta
Engineering at Meta
博客园_首页
博客园 - 三生石上(FineUI控件)
G
Google Developers Blog
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - 【当耐特】
Microsoft Security Blog
Microsoft Security Blog
P
Privacy & Cybersecurity Law Blog
Recent Commits to openclaw:main
Recent Commits to openclaw:main
S
Secure Thoughts
爱范儿
爱范儿
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
H
Help Net Security
The Cloudflare Blog
Recorded Future
Recorded Future
Attack and Defense Labs
Attack and Defense Labs
J
Java Code Geeks
O
OpenAI News
T
Tor Project blog
B
Blog RSS Feed
D
Darknet – Hacking Tools, Hacker News & Cyber Security
PCI Perspectives
PCI Perspectives
V
Visual Studio Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
A
About on SuperTechFans
www.infosecurity-magazine.com
www.infosecurity-magazine.com
W
WeLiveSecurity
Cyberwarzone
Cyberwarzone
云风的 BLOG
云风的 BLOG
Security Latest
Security Latest
S
Schneier on Security
Know Your Adversary
Know Your Adversary
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
V
Vulnerabilities – Threatpost
D
DataBreaches.Net
宝玉的分享
宝玉的分享
T
Troy Hunt's Blog
V
V2EX
Cisco Talos Blog
Cisco Talos Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
美团技术团队
Application and Cybersecurity Blog
Application and Cybersecurity Blog
Latest news
Latest news
量子位
Microsoft Azure Blog
Microsoft Azure Blog

迷途小书童的Note

微软开源了一个帮 Agent 打磨技能的工具,思路很野 - 迷途小书童的Note X上如何下载视频? - 迷途小书童的Note 装完Hermes之后,我被这5个东西救了 - 迷途小书童的Note 从此写代码,只需要在旁边看着 小模型大野心 跑大模型,最贵的不是 GPU,是这个东西 vLLM的Rust前端PR了,预处理吞吐量直接翻了5倍! 大模型跑在端侧,到底有多难?我们踩过的那些坑 AI 生成的前端界面,为什么总是不够好看? 阿里通义VimRAG:让AI同时”读文档、看图片、看视频” 一个让你像聊天一样做PPT的AI工具 上下文工程:会话与记忆 颠覆视频创作!一键替换3D角色,你还不来试试? AI证件照,一键搞定! 26.2k,收下这个FastAPI全栈模板! Star马上破万,这款AI知识库你一定要看看! 超级Prompt! 不懂编程也没关系,Cursor AI帮你轻松写代码! 推理能力超博士,OpenAI发布最强模型o1
U2-Net:图像分割中的背景移除技术
2024-09-14 · via 迷途小书童的Note

在数字图像处理的世界里,背景移除技术一直是热门话题。无论是在电影制作、广告设计还是医疗影像分析中,这项技术都扮演着至关重要的角色。今天,我们要一起探索一种革命性的技术 — U2-Net,它在图像分割领域中以其高效和精确的背景移除能力著称。

U2-Net:图像分割中的背景移除技术

U2-Net简介

U2-Net,这个听起来有些未来感的名字,其实是一个基于深度学习的语义分割模型。它的核心优势在于能够将图像中的前景与背景分离,而且操作简便、效果显著。想象一下,你手中有一张杂乱背景的照片,U2-Net能在几秒钟内帮你将主角完美抠出,这在以前几乎是不可能完成的任务。

传统的图像分割模型,如全卷积网络(FCN),虽然能够捕捉到丰富的语义信息,但往往忽略了全局上下文信息。而U2-Net通过其独特的结构设计,能够在不同尺度上提取多级深度特征,同时保持特征的空间分辨率,这使得它在处理复杂图像时更加游刃有余。

U2-Net架构

U2-Net的架构基于一个创新的模块——ReSidual U-block(RSU)。这个模块结合了残差块和U-Net对称编解码器结构的特点,能够在不增加显著计算成本的情况下,学习到多尺度的特征。简单来说,RSU模块就像是U2-Net的大脑,它能够处理和理解图像中的复杂信息。

U2-Net:图像分割中的背景移除技术

RSU主要用于提升图像分割任务中的边缘检测能力,它结合了U-Net结构和残差块的优势,通过跳跃连接保留特征信息,避免深度网络中的梯度消失问题。每个RSU由一系列卷积层和跳跃连接组成,能够在不同尺度上提取图像特征,同时增强了模型的鲁棒性和分割精度。

IS-Net

在U2-Net的基础上,研究者们进一步开发了IS-Net,这是一个通过中间监督学习策略优化的版本。IS-Net不仅继承了U2-Net的所有优点,还通过自我监督学习,进一步提升了分割的精度。这意味着IS-Net在处理更加复杂的图像时,能够提供更加精细的分割结果。下图展示了所提出的IS-Net训练管道的框图

U2-Net:图像分割中的背景移除技术

训练使用了 1024×1024 分辨率的输入图像,作者采用了一个两阶段的训练管道,具体包括以下阶段:

第一阶段:训练一个自监督的真实标签编码器模型,学习高维度的掩码级特征。
编码器由 6 阶段的 RSU 编码器块组成。具体来说,第 1-4 阶段分别使用 RSU-7、RSU-6、RSU-5 和 RSU-4 模块,而第 5-6 阶段使用 RSU-4F 模块。

注意:为了降低计算成本,编码器各阶段通过步幅为2的卷积接收下采样后的真实标签掩码(由 1024×1024 高分辨率下采样为 512×512)。

训练过程中,使用了简单的二元交叉熵损失,将各阶段编码器输出的侧边输出图(通过在编码器输出上执行 3×3 卷积得到)与真实标签掩码进行比较。

第二阶段:图像分割组件由 5 个解码器阶段(DE_1 – DE_5,分别采用 RSU7-RSU4F 模块)和 6 个编码器阶段(EN_1 – EN_6,依次采用 RSU-7 到 RSU-4F)组成。

该分割模型生成侧边输出概率图和来自解码器阶段(DE_1 – DE_5)以及最后一个编码器阶段(EN_6)的中间特征(未经过 sigmoid 激活的 logits)。

U2-Net:图像分割中的背景移除技术

U2-Net和IS-Net的出现,不仅仅是技术上的突破,更是对传统图像处理方法的一次革新。它们以其高效、精确的特性,正在逐渐改变我们对图像分割任务的认知。如果你对图像处理充满热情,那么U2-Net和IS-Net绝对是值得你深入了解和尝试的工具。

基于U2-Net的项目推荐

以下是一些基于U2-Net的开源项目,你可以研究和使用

1. U2-Net官方代码库

描述: 这是U2-Net的官方代码库,由原作者提供。它包含了U2-Net模型的实现和一些预训练的权重,可以用于快速开始图像分割任务。

链接:https://github.com/xuebinqin/U-2-Net

2. rembg

描述: rembg 是一个流行的开源工具,基于U2-Net模型用于自动去除图像背景。它支持命令行工具和Python API,并且易于集成到各种项目中。

链接:https://github.com/danielgatis/rembg

3. Background Removal

描述: 这个工具同样基于U2-Net模型,可以自动去除图像中的背景,适用于电子商务、照片处理等场景。

链接:https://github.com/OPHoperHPO/image-background-remove-tool

好了,今天的分享就到这里,你还知道哪些基于U2-Net的项目,留言告诉我,我们下期见!