










IT之家 5 月 20 日消息,微軟員工 @客村小蔣 昨晚分享了一則好消息,微軟 AI 团隊的模式識別中心憑藉論文《Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants》,在 5 月份西班牙巴塞羅那舉行的 ICASSP 2026 上拿下了最佳工業論文獎。

IT之家註:ICASSP 全稱是 IEEE 國際聲學、語音與信號處理會議,是全球最大、最綜合的信號處理技術會議,過去的最佳工業論文獎,一般是 META、微軟、Spotify 這樣的國外公司拿下。此次微軟團隊獲獎也是這個獎項自 2016 年設立以來,首次頒給中國企業團隊。
據介紹,微信 AI �團隊的工作人員提出了 WalkVLM-LR —— 一個為視障人士行走輔助設計的視覺語言模型,核心創新是減少冗餘:既減少「說得太多」(輸出冗餘),也減少「說得太頻繁」(時間冗餘)。同時,這個模型解決了「什麼時候該提醒」的問題,視覺語言模型不應該無時無刻每幀提醒,而更應該在需要提醒的時候再開口。
有網友詢問延遲情況如何,微信員工 @客村小蔣 表示:「目前延遲整體控制在百毫秒量級,主要依賴環境感知判斷器和 VLM 共享視覺編碼器來減少等待,離真實落地還有優化空間,但實時性已經比較可用。」

廣告聲明:文內含有的對外跳轉鏈接(包括不限於超連結、二維碼、口令等形式),用於傳遞更多信息,節省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。
此內容由慣性聚合(RSS閱讀器)自動聚合整理,僅供閱讀參考。 原文來自 — 版權歸原作者所有。