惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

GbyAI
GbyAI
Vercel News
Vercel News
F
Fortinet All Blogs
Y
Y Combinator Blog
The GitHub Blog
The GitHub Blog
P
Proofpoint News Feed
M
MIT News - Artificial intelligence
Blog — PlanetScale
Blog — PlanetScale
H
Help Net Security
B
Blog RSS Feed
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Engineering at Meta
Engineering at Meta
爱范儿
爱范儿
V
Visual Studio Blog
Stack Overflow Blog
Stack Overflow Blog
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
B
Blog
宝玉的分享
宝玉的分享
云风的 BLOG
云风的 BLOG
U
Unit 42
博客园 - 司徒正美
大猫的无限游戏
大猫的无限游戏
D
DataBreaches.Net
博客园 - 叶小钗
Hugging Face - Blog
Hugging Face - Blog
MongoDB | Blog
MongoDB | Blog
The Cloudflare Blog
酷 壳 – CoolShell
酷 壳 – CoolShell
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
T
Tailwind CSS Blog
S
Schneier on Security
Exploit-DB.com RSS Feed
Exploit-DB.com RSS Feed
Apple Machine Learning Research
Apple Machine Learning Research
Attack and Defense Labs
Attack and Defense Labs
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
A
About on SuperTechFans
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
L
LangChain Blog
博客园 - 【当耐特】
Recorded Future
Recorded Future
K
KPMG report finds enterprise disconnect between AI and its ROI | CIO
aimingoo的专栏
aimingoo的专栏
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
Hacker News: Ask HN
Hacker News: Ask HN
Jina AI
Jina AI
Schneier on Security
Schneier on Security
W
WeLiveSecurity
Microsoft Security Blog
Microsoft Security Blog
博客园_首页
博客园 - 聂微东

博客园 - ZERO-

博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 GEM: 增强MLLM模型,通过时间序列与图像实现接地心电图理解《GEM: Empowering MLLM for Grounded ECG Understanding with Time Series and Images》(多模态、模态对齐(MLP)、ECG时序+图像+文本解释、工程整合、构造高颗粒度指令数据集、提示工程) SDForger: 语言锻造时间序列:一种基于大型语言模型的合成数据生成方法《Forging Time Series with Language: A Large Language Model Approach to Synthetic Data Generation》(时间序列、序列文本化embedding、大语言模型、大模型、LLM、时序生成、LLM间接生成时序) CLVS: 基于可变相似度增强对比学习《Enhancing Contrastive Learning with Variable Similarity》(图像、对比学习、可变相似度、扩展对比学习、语义与增强表示对齐、理论分析泛化误差边界、模型学习将语义变化与增强程度进行对应) 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 摸鱼混子回归 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 博文阅读密码验证 - 博客园 AimTS: 用于时间序列分类的增强序列和图像对比学习《AimTS: Augmented Series and Image Contrastive Learning for Time Series Classification》(时间序列分类、对比学习、自监督预训练框架、多源泛化范式、原型(平均表征)、时序(数值)-图像表征融合对齐)
对比学习/表示学习/深度学习的一些细节内容
ZERO- · 2025-11-19 · via 博客园 - ZERO-

现在是2025年11月17日,在写论文的博客,顺带记录一下一些小细节的内容(因为没脑子,所以要记录):

1. 对比学习和度量学习:

概念:

度量学习:学习一个嵌入空间,使得该空间中的距离度量(欧氏距离、余弦距离或其他可学习的距离度量)能够反映样本之间的语义相似性。(语义上相似的样本距离近,不相似的样本距离远。)

对比学习:是度量学习中的一种具体实现方式,通过设计正样本对合负样本对,并使用一个如InfoNCE或Triplet Loss的对比损失函数来间接实现这个距离结构的学习。

优化目标:

度量学习:直接学习样本间的语义距离。

对比学习:通过数据增强和自监督信号学习特征空间。

目标空间属性:

度量学习:语义结构化(inter/intra-class distances)。

对比学习:表征一致性(instance-level semantics)

有监督/无监督:

度量学习:有监督的语义间距学习。(样本关系:明确语义标签)

对比学习:无监督的表征一致性学习(但隐含地也在优化语义结构)。(样本关系:正样本(同源增强)、负样本(不同实例))

语义目标差异:

度量学习:显式的语义一致性(例如同类样本)(通过标签定义语义一致性)

对比学习:隐式的语义一致性(通过数据增强或上下文约束推导出的语义)(通过数据生成过程和结构约束去逼近语义一致性)

2. 分布外泛化:

分布外泛化(Out-of-Distribution Generalization, OOD Generalization):是“模型泛化能力”中的一种更强、更严格的衡量标准,但不是泛化能力的全部。

泛化能力(generalization ability)是一个广义概念,而分布外泛化(OOD generalization)是其中一个特定情形或评估维度。

泛化能力:定义:模型在未见过的样本(但来自同一分布)上保持性能的能力,典型场景:训练集和测试集独立同分布(i.i.d.),如:训练和测试数据都来自同一传感器、同一环境。(泛化能力:同分布泛化+分布外泛化)

分布外泛化:定义:模型在分布发生变化(非i.i.d)的样本上仍能保持性能的能力,典型场景:存在域偏移(domain shift)或分布漂移,如:训练在晴天图像,测试在雨天图像;训练在A医院数据,测试在B医院数据。(分布外泛化:域泛化、分布漂移鲁棒性、数据扰动鲁棒性、因果不变性泛化...)

泛化能力测试模型是否没有过拟合,分布外泛化测试模型是否真的学到了语义或因果本质,而不是只记住分布特征。

3. Top-1指标:

(2025年11月23日,周日,继续.)

Top-1 Accurary(Top-1准确率)是分类任务中最常用的指标之一,用于衡量模型在图像分类任务重预测最可能类别的正确率。

image

Top-1指标本质上衡量的是:模型在区分输入图像语义类别方面的直接判别能力。

也就是:模型能否正确地将一张图片分到最可能的语义类别。

所以这个指标反映的能力是:

语义识别能力(semantic discrimination)、特征表征的判别性(feature separability)、模型最终决策层(softmax分类头)的有效性。

在ImageNet等视觉任务中,除了Top-1外,还常用Top-5指标。

Top-1指标是预测的第一个类别是否正确,反映模型的精确分类能力。

Top-5指标是真实类别是否出现在预测概率前5名中,反映模型的粗粒度语义识别能力(容错性)。

4. 少样本分类任务中的5-way 1-shot和5-way 5-shot setting:

在少样本学习(Few-shot Learning)中,不是训练一个模型去识别所有类别,而是模拟模型在新任务中快速学习的能力。因此,每次训练或测试都会构造一个小任务(称为一个episode或few-shot task)。

5-way 1-shot,就描述了这个小任务的结构:5-way:这个任务中有5个类别,1-shot:每个类别只有1张带标签的样本可用于学习(support)。

模型需要用极少的样本去分类未见过的类别。

image

少样本任务中,模型并不是在传统意义上“泛化到测试集”,而是在测试时面对从未见过的新类别,仅用少量样本就能:学习区分这些新类别的语义结构,并在查询样本上正确分类。

因此它衡量的是:模型的快速泛化能力或跨任务迁移能力。比普通的泛化(in-distribution generalization)更严格,因为类别是新的,数据分布也不同。

(现在是11月23日,21:33,呜呜呜,没写完,我有罪,但是打算下班了,不强迫自己必须今晚写完,放过自己。)