





















摘要:根检索,即配对缺失之根于既定之音轨,乃当世之要务,然受限于弃时序之模型。吾等创PHALAR,为对比框架,较之当世最优,相对精度增约70%,而所需者<半参数,七倍速。以习得频谱池化层与复值头,PHALAR立音高等变、相位等变之偏。PHALAR于MoisesDB、Slakh、ChocoChorales立检索之最,与人类连贯性判断相合甚高,远胜语义基线。终以零样本节拍追踪、线性和弦探测证PHALAR能捕捉检索任务外之强健音乐结构。
| 评述: | 于ICML二零二六年录用 |
| 主题: | 声学 (cs.SD);人工智能 (cs.AI);机器学习 (cs.LG);信号处理 (eess.SP) |
| 引文格式: | arXiv:2605.03929 [cs.SD] |
| (或 arXiv:2605.03929v4 [cs.SD])为此版本) | |
| https://doi.org/10.48550/arXiv.2605.03929 arXiv-所颁DOI经DataCite |
此內容由慣性聚合(RSS閱讀器)自動聚合整理,僅供閱讀參考。 原文來自 — 版權歸原作者所有。