惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Hugging Face - Blog
Hugging Face - Blog
Jina AI
Jina AI
宝玉的分享
宝玉的分享
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
人人都是产品经理
人人都是产品经理
博客园 - 聂微东
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
J
Java Code Geeks
博客园 - 【当耐特】
小众软件
小众软件
博客园 - Franky
S
SegmentFault 最新的问题
WordPress大学
WordPress大学
雷峰网
雷峰网
The Cloudflare Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
量子位
Last Week in AI
Last Week in AI
博客园_首页
月光博客
月光博客
IT之家
IT之家
阮一峰的网络日志
阮一峰的网络日志
Webroot Blog
Webroot Blog
Stack Overflow Blog
Stack Overflow Blog
腾讯CDC
云风的 BLOG
云风的 BLOG
cs.AI updates on arXiv.org
cs.AI updates on arXiv.org
W
WeLiveSecurity
Recent Commits to openclaw:main
Recent Commits to openclaw:main
D
Docker
The Last Watchdog
The Last Watchdog
有赞技术团队
有赞技术团队
Hacker News - Newest:
Hacker News - Newest: "LLM"
D
DataBreaches.Net
S
Security @ Cisco Blogs
Blog — PlanetScale
Blog — PlanetScale
GbyAI
GbyAI
TaoSecurity Blog
TaoSecurity Blog
S
Security Affairs
Y
Y Combinator Blog
O
OpenAI News
罗磊的独立博客
MongoDB | Blog
MongoDB | Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Forbes - Security
Forbes - Security
P
Palo Alto Networks Blog
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
K
Kaspersky official blog
Cloudbric
Cloudbric

迷途小书童的Note

微软开源了一个帮 Agent 打磨技能的工具,思路很野 - 迷途小书童的Note X上如何下载视频? - 迷途小书童的Note 装完Hermes之后,我被这5个东西救了 - 迷途小书童的Note 从此写代码,只需要在旁边看着 小模型大野心 跑大模型,最贵的不是 GPU,是这个东西 vLLM的Rust前端PR了,预处理吞吐量直接翻了5倍! 大模型跑在端侧,到底有多难?我们踩过的那些坑 AI 生成的前端界面,为什么总是不够好看? 阿里通义VimRAG:让AI同时”读文档、看图片、看视频” 一个让你像聊天一样做PPT的AI工具 上下文工程:会话与记忆 颠覆视频创作!一键替换3D角色,你还不来试试? AI证件照,一键搞定! 26.2k,收下这个FastAPI全栈模板! Star马上破万,这款AI知识库你一定要看看! 超级Prompt! 不懂编程也没关系,Cursor AI帮你轻松写代码! 推理能力超博士,OpenAI发布最强模型o1
U2-Net:图像分割中的背景移除技术
2024-09-14 · via 迷途小书童的Note

在数字图像处理的世界里,背景移除技术一直是热门话题。无论是在电影制作、广告设计还是医疗影像分析中,这项技术都扮演着至关重要的角色。今天,我们要一起探索一种革命性的技术 — U2-Net,它在图像分割领域中以其高效和精确的背景移除能力著称。

U2-Net:图像分割中的背景移除技术

U2-Net简介

U2-Net,这个听起来有些未来感的名字,其实是一个基于深度学习的语义分割模型。它的核心优势在于能够将图像中的前景与背景分离,而且操作简便、效果显著。想象一下,你手中有一张杂乱背景的照片,U2-Net能在几秒钟内帮你将主角完美抠出,这在以前几乎是不可能完成的任务。

传统的图像分割模型,如全卷积网络(FCN),虽然能够捕捉到丰富的语义信息,但往往忽略了全局上下文信息。而U2-Net通过其独特的结构设计,能够在不同尺度上提取多级深度特征,同时保持特征的空间分辨率,这使得它在处理复杂图像时更加游刃有余。

U2-Net架构

U2-Net的架构基于一个创新的模块——ReSidual U-block(RSU)。这个模块结合了残差块和U-Net对称编解码器结构的特点,能够在不增加显著计算成本的情况下,学习到多尺度的特征。简单来说,RSU模块就像是U2-Net的大脑,它能够处理和理解图像中的复杂信息。

U2-Net:图像分割中的背景移除技术

RSU主要用于提升图像分割任务中的边缘检测能力,它结合了U-Net结构和残差块的优势,通过跳跃连接保留特征信息,避免深度网络中的梯度消失问题。每个RSU由一系列卷积层和跳跃连接组成,能够在不同尺度上提取图像特征,同时增强了模型的鲁棒性和分割精度。

IS-Net

在U2-Net的基础上,研究者们进一步开发了IS-Net,这是一个通过中间监督学习策略优化的版本。IS-Net不仅继承了U2-Net的所有优点,还通过自我监督学习,进一步提升了分割的精度。这意味着IS-Net在处理更加复杂的图像时,能够提供更加精细的分割结果。下图展示了所提出的IS-Net训练管道的框图

U2-Net:图像分割中的背景移除技术

训练使用了 1024×1024 分辨率的输入图像,作者采用了一个两阶段的训练管道,具体包括以下阶段:

第一阶段:训练一个自监督的真实标签编码器模型,学习高维度的掩码级特征。
编码器由 6 阶段的 RSU 编码器块组成。具体来说,第 1-4 阶段分别使用 RSU-7、RSU-6、RSU-5 和 RSU-4 模块,而第 5-6 阶段使用 RSU-4F 模块。

注意:为了降低计算成本,编码器各阶段通过步幅为2的卷积接收下采样后的真实标签掩码(由 1024×1024 高分辨率下采样为 512×512)。

训练过程中,使用了简单的二元交叉熵损失,将各阶段编码器输出的侧边输出图(通过在编码器输出上执行 3×3 卷积得到)与真实标签掩码进行比较。

第二阶段:图像分割组件由 5 个解码器阶段(DE_1 – DE_5,分别采用 RSU7-RSU4F 模块)和 6 个编码器阶段(EN_1 – EN_6,依次采用 RSU-7 到 RSU-4F)组成。

该分割模型生成侧边输出概率图和来自解码器阶段(DE_1 – DE_5)以及最后一个编码器阶段(EN_6)的中间特征(未经过 sigmoid 激活的 logits)。

U2-Net:图像分割中的背景移除技术

U2-Net和IS-Net的出现,不仅仅是技术上的突破,更是对传统图像处理方法的一次革新。它们以其高效、精确的特性,正在逐渐改变我们对图像分割任务的认知。如果你对图像处理充满热情,那么U2-Net和IS-Net绝对是值得你深入了解和尝试的工具。

基于U2-Net的项目推荐

以下是一些基于U2-Net的开源项目,你可以研究和使用

1. U2-Net官方代码库

描述: 这是U2-Net的官方代码库,由原作者提供。它包含了U2-Net模型的实现和一些预训练的权重,可以用于快速开始图像分割任务。

链接:https://github.com/xuebinqin/U-2-Net

2. rembg

描述: rembg 是一个流行的开源工具,基于U2-Net模型用于自动去除图像背景。它支持命令行工具和Python API,并且易于集成到各种项目中。

链接:https://github.com/danielgatis/rembg

3. Background Removal

描述: 这个工具同样基于U2-Net模型,可以自动去除图像中的背景,适用于电子商务、照片处理等场景。

链接:https://github.com/OPHoperHPO/image-background-remove-tool

好了,今天的分享就到这里,你还知道哪些基于U2-Net的项目,留言告诉我,我们下期见!