首页 > 教程攻略 > 软件教程 >Canonical 推出本地语音转文字项目 Myna,为 Ubuntu 26.10 引入 AI 听写功能

Canonical 推出本地语音转文字项目 Myna,为 Ubuntu 26.10 引入 AI 听写功能

来源:互联网 时间:2026-06-19 09:22:29

6月17日,Canonical正式对外公布了一项名为Project Myna的新项目,目标是在Ubuntu桌面操作系统中实现原生的语音转文字功能。项目名字取得相当形象——Myna,取自那种擅长模仿人类说话的鹩哥(八哥)鸟。首个版本计划随Ubuntu 26.10(代号Stonking Stingray)一同发布,并且会成为Ubuntu桌面体验的核心组成部分。

Canonical 推出本地语音转文字项目 Myna,为 Ubuntu 26.10 引入 AI 听写功能

需要特别说明的是,Myna被定位为一款原生的桌面听写工具,而不是语音助手或语音控制系统。用户只需按下键盘快捷键就能开始说话,转录后的文字会直接插入当前正在使用的应用程序中,整个听写过程屏幕上会有明确的视觉反馈。虽然功能听起来有些单薄,但Canonical有意为之——首版的功能范围刻意收窄,不涉及语音助手、语音命令、桌面控制、翻译工具或自动语言检测,目标就是把基础听写体验做扎实。

在技术架构上,Myna使用AI语音识别模型,所有识别任务都在用户本地机器上运行。下载安装必要的模型后,完全不需要互联网连接,这对于隐私敏感的场景来说是个不小的加分项。首版以Wayland上的Ubuntu桌面为目标,GNOME是主要验证环境,但架构保持开放,未来可以支持更多桌面环境。

隐私方面也做了周全考虑:麦克风仅在用户主动激活听写时才会被访问,音频数据在内存中处理后即被丢弃,不会上传到任何外部服务。整体架构采用模块化设计,语音识别、用户交互、听写管理和文本注入分别由独立组件处理,这样后续可以对各部分单独改进,而不影响整体使用体验。

Canonical桌面团队成员Jean Baptiste Lallement表示,团队希望在“过多的设计决策被固定下来之前”获得社区反馈。尤其欢迎那些依赖听写或辅助技术的用户、已经在Linux上使用语音识别的用户、开发者、测试人员以及文档编写者参与进来。项目源码和架构文档已经在GPLv3协议下托管于GitHub。

在Ubuntu 26.10之后,Canonical计划持续改善Myna与桌面的集成度,并探索让听写更自然、更准确的方法。后续功能的优先级将取决于早期用户的反馈和更多社区意见。