





















IT之家 6 月 18 日消息,当地时间 6 月 17 日,Canonical 公布了一项名为 Project Myna 的新项目,旨在为 Ubuntu 桌面操作系统引入本地化的语音转文字功能。
该项目得名于擅长模仿人类说话的鹩哥 / 八哥鸟,首个版本计划随 Ubuntu 26.10(Stonking Stingray)一同发布,并成为 Ubuntu 桌面体验的核心组成部分。

Myna 被定位为一款原生桌面听写工具,而非语音助手或语音控制系统。IT之家注意到,用户按下键盘快捷键后即可开始说话,转录后的文字会直接插入当前正在使用的应用程序中,听写过程中屏幕会显示明确的视觉反馈。
Canonical 表示,首版功能范围将刻意收窄,不会涉及语音助手、语音命令、桌面控制、翻译工具或自动语言检测等功能,目标是把基础听写体验做扎实。
在技术架构上,Myna 使用 AI 语音识别模型,所有识别任务均在用户本地机器上运行,下载安装必要的模型后无需任何互联网连接。首版以 Wayland 上的 Ubuntu 桌面为目标,GNOME 是主要验证环境,架构保持开放以便未来支持更多桌面环境。
另外,麦克风仅在用户主动激活听写时才会被访问,音频数据在内存中处理后即被丢弃,不会上传至任何外部服务。整体架构采用模块化设计,语音识别、用户交互、听写管理和文本注入分别由独立组件处理,以便后续对各部分单独改进而不影响整体使用体验。
Canonical 桌面团队成员 Jean Baptiste Lallement 表示,该团队希望“在过多的设计决策被固定下来之前”获得社区反馈,尤其欢迎依赖听写或辅助技术的用户、已在 Linux 上使用语音识别的用户、开发者、测试人员及文档编写者参与进来。项目源码和架构文档已在 GPLv3 协议下托管于 GitHub。
在 Ubuntu 26.10 之后,Canonical 计划持续改善 Myna 与桌面的集成度,并探索让听写更自然、更准确的方法。后续功能的优先级将取决于早期用户的反馈和更多社区意见。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
此内容由惯性聚合(RSS阅读器)自动聚合整理,仅供阅读参考。 原文来自 — 版权归原作者所有。