






















요약: 몇 단계 생성 모델을 맞추는 것은 어려운 일입니다. 그 이유는 기존의 맞추기 프레임워크가 일반적으로 제한적인 가정에 의존하기 때문입니다: 처리 가능한 확률, 특정 ODE/SDE 해결기, 또는 특정 모델 가족. 우리는 FAV, 샘플 기반 변이 추론을 통한 몇 단계 생성 모델 맞추기(Few-step Generative Models Alignment via Sample-based Variational Inference), 일반적인 맞추기 프레임워크를 소개합니다. 이 프레임워크는 생성기와 참조 분포에 대한 샘플 접근만 필요합니다. 우리는 맞추기를 참조 분포에 고정된 보상 기울기 분포에서 샘플링으로 설정합니다. 우리는 스테인 변이 경사 하강법을 샘플 기반 변이 추론 스케마로 활용하고, 고정점 회귀를 통해 그 파티클 업데이트를 생성기 매개변수에 분산시킵니다. 우리는 로봇 조작 및 이미지 생성기 맞추기 두 도메인에서 FAV를 평가합니다. 로봇 조작 생성 정책 맞추기에서 FAV는 56개 오프라인 및 30개 오프라인-온라인 RL 작업에 걸쳐 주류 정책 추출 기준을 모두 능가합니다. 이미지 생성기 맞추기에 대해서는 FAV가 GAN, 이동 모델, 일관성 모델 및 흐름 맵을 포함한 다양한 몇 단계 백본을 미세 조정하며, ImageNet-$256$에서 1024$^2$ 텍스트-이미지 합성으로 확장합니다. 코드는 다음에 제공됩니다.이 https URL.
| コメント: | レビュー中 |
| トピック: | 機械学習 (cs.LG); 人工知能 (cs.AI) |
| 引用: | arXiv:2605.26552 [cs.LG] |
| (または arXiv:2605.26552v1 [cs.LG]) for this version) | |
| https://doi.org/10.48550/arXiv.2605.26552 DataCite를 통한 arXiv 발행 DOI (등록 예정) |
From: Jaewoo Lee [이메일 보기]
[v1]
화, 26 5월 2026 05:02:49 UTC (18,419 KB)
이 콘텐츠는 인셔셔RSS(RSS 리더)가 자동으로 집계한 것으로 읽기 참고용입니다. 원문 출처 — 저작권은 원저작자에게 있습니다.