首页 > 教程攻略 > ai资讯 >声忆 - AI 语音输入法,支持本地 ASR 离线识别

声忆 - AI 语音输入法,支持本地 ASR 离线识别

来源:互联网 时间:2026-06-15 15:18:08

声忆是什么

先聊个大家可能都遇到过的场景:打字速度跟不上说话的速度。尤其用Mac干活的时候,各种聊天、邮件、文档堆在一起,敲键盘敲得手指酸,脑子里想的东西却总是一闪而过,根本来不及记。后来有人推荐了一款叫“声忆”的小工具,用了一段才明白,它主打的“说得比打字快”这个概念,不是虚的——按住右Option开始说,松手,1.4秒,文字就直接出现在光标该待的位置上,中英文混杂着说也没问题,而且用的是本地离线识别,不联网也行。每句话还会自动存进它那个可搜索的“记忆层”,方便以后翻出来看。此外,它内置的AI智能整理和中文排版引擎在本地处理,毫秒级修正标点、空格和品牌名大小写。所有数据都留在本机上,隐私这方面很让人放心。基础功能永久免费,Pro版解锁云端无限识别。

声忆的主要功能

  • 快捷语音输入(L1 / SPEAK)

    :按住右 Option(或 Fn / 右 ⌘)说话,松开后 1.4 秒成文并自动插入当前光标位置。支持中英混输、同音字和口头禅后台处理,无需切换窗口。
  • AI 智能整理

    :可选接入豆包 / DeepSeek / Kimi / OpenAI 等 LLM,仅修复同音字、删口头禅、加标点,不篡改原意;confidence < 0.5 时保留原文。双击右 Option 可临时跳过 AI。
  • 记忆与回顾(L2 / RECALL)

    :每句话自动归档到本地,记录应用来源、时间、标签,支持全文搜索、过滤和导出(Markdown / JSON / CSV)。
  • 智能层洞察(L3 / REFLECT)

    :基于 Big5 等模型生成周画像、MBTI 分析和金句提取,7 个视角点评你的一周。
  • 中文排版引擎

    :本地规则处理空格、标点、大小写、品牌名自动修正(如“Cursor”不再变“苦色”),参照 pangu.js、GB/T 15834-2011 等标准,全部 < 5 ms 完成,零网络调用。
  • AI 翻译 + 对照

    :支持 50+ 语言,菜单栏一键切换「整理 / 翻译 / 对照」模式。
  • 学习闭环

    :你每次编辑 AI 的修正,自动提取为候选规则,菜单栏一键采纳。
  • 目标窗口锁定

    :录音时锁定当前 App,切窗口不插错,fallback 到剪贴板 + toast。

如何使用声忆

  • 下载安装

    :去官方渠道下载 DMG(22.6 MB),支持 macOS 14.0+ 的 Apple Silicon 与 Intel Mac,非 App Store 分发,Sparkle 自动更新。
  • 首次授权

    :首次启动时按引导页一次性授予麦克风、输入监控、辅助功能三项权限,授权后点击一键重启即可立即生效。
  • 语音输入

    :按住右 Option(或 Fn / 右 ⌘)开始说话,松开后 1.4 秒内文字自动插入当前光标位置,中英混输、同音字和口头禅由后台自动处理。
  • 配置 AI 整理(可选)

    :在设置中填入 OpenAI 兼容 API Key(支持 DeepSeek / Kimi / OpenAI / 本地服务),即可启用智能纠错、删口头禅和加标点功能,月费约 ¥5–20。
  • 使用翻译/对照模式

    :在菜单栏一键切换「整理 / 翻译 / 对照」模式,支持 50+ 语言实时翻译或原文译文并排输出。
  • 查看记忆与回顾

    :每句话自动归档到本地记忆层,按 App、时间、标签分类,支持全文搜索、过滤,以及 Markdown / JSON / CSV 一键导出。
  • 获取智能洞察

    :智能层基于 Big5 模型自动生成周画像、MBTI 分析和金句提取,帮你回顾一周的表达与思考。
  • 训练个人规则

    :编辑 AI 修正结果后,系统会自动提取为候选规则,在菜单栏一键采纳,形成越用越准的学习闭环。
  • 临时跳过 AI

    :双击右 Option 可临时跳过 AI 整理,直接输出原始语音识别结果。
  • 数据迁移

    :将数据库文件拷贝到新 Mac 的相同路径,即可完整迁移所有历史记录与配置。

声忆的核心优势

  • 中文场景速度领先

    :1.4 秒成文,对比 TypeLess / Wispr Flow 等竞品的 3–10 秒优势明显
  • 不只是输入法

    :每句话沉淀为可搜索的记忆层,具备数据回顾和智能洞察能力
  • 隐私优先

    :所有语音和文字写入 App 专属本地目录,启动前自动备份;API Key 存系统 Keychain,卸载即可带走全部数据
  • 轻量无负担

    :DMG 仅 22.6 MB,macOS 14.0+ 即可运行,Apple Silicon 与 Intel 通用

声忆的同类竞品对比

对比维度 声忆(VoiceInput) TypeLess Wispr Flow

产品定位

macOS 语音输入法 + 本地记忆层 跨平台 AI 语音听写工具 跨平台 AI 语音输入层

支持平台

macOS 14.0+(Apple / Intel) macOS、Windows、iOS、Android macOS、Windows、iOS、Android

中文速度

1.4 秒成文,中文场景优化 约 220 wpm,云端处理 约 184 wpm,云端 AI 重写

定价模式

免费本地版 / 自带 Key $0 / Pro $9/月或$49一次性 免费 2,000–8,000 词/周 / Pro $12/月(年付)或$30/月 免费 2,000 词/周 / Pro $15/月 / Team $12/人/月

离线能力

✅ 三套本地 ASR 完全离线 ❌ 云端处理,无离线模式 ❌ 云端 AI,需联网

记忆回顾

✅ L2 数据层归档 + L3 智能洞察(MBTI/周画像) ⚠️ 本地历史记录,无智能分析 ⚠️ 仪表盘统计 + 语音笔记

隐私策略

100% 本地,数据不离机,Keychain 存密钥 零数据保留,本地历史,不上传训练 隐私模式,内容云端处理后不留存

中文排版

✅ 本地引擎 <5ms,pangu.js/GB/T 15834 标准 ❌ 通用 AI 清理,无中文排版专项 ❌ 通用 AI 重写,无中文排版专项

核心差异

每句话沉淀为可搜索记忆层,不只是输入 跨平台最广,AI 自动编辑 + 语调适配 实时编辑(mid-sentence 改口),长会话支持

声忆的应用场景

  • 日常高效文字输入

    :在聊天软件、邮件、社交媒体中按住快捷键说话,1.4 秒成文自动插入,比键盘打字更快,尤其适合长句表达和快速回复。
  • 写作与内容创作

    :撰写文章、博客、笔记时语音输入灵感,AI 自动清理口头禅和修正同音字,中文排版引擎自动处理标点空格,让创作者专注于思路而非格式。
  • 编程与开发工作

    :快速输入代码注释、技术文档、API 设计说明,内置 200+ 开发热词(如 Cursor、Kimi、DeepSeek)自动识别,避免专有名词被误转。
  • 会议与访谈记录

    :实时语音转文字记录会议内容,每句话自动归档到本地记忆层,支持按应用和时间搜索回顾,方便后续整理会议纪要。
  • 翻译与跨语言沟通

    :开启翻译或对照模式,说话直接输出 50+ 语言的译文,或原文与译文并排显示,适合跨国协作和多语言内容生产。
  • 个人知识管理与日记

    :用记忆层沉淀日常表达,通过全文搜索找回曾经的想法,智能层自动生成周画像和金句提取,帮助回顾个人成长轨迹。

相关下载