CosyVoice - 阿里云推出的新一代 AI 语音输入法
来源:互联网
时间:2026-06-26 14:03:47
最近阿里云悄悄上线了一款有意思的产品——CosyVoice语音输入法。乍一听名字,可能觉得不过是又一款语音转文字工具,但仔细拆解之后会发现,它和传统的语音输入法完全不是一个物种。核心区别在于:它背后站着千问大模型,不只是做声学转写,而是真能在语义层面“读懂”你说的话,然后再帮你把话说得更得体。下面我们就来把这个产品的里里外外说清楚。
CosyVoice输入法是什么
CosyVoice是阿里云推出的新一代 AI 语音输入法,搭载千问大模型。工具能能将语音实时转写为文字,自动过滤口语冗余、识别自我修正、结构化整理内容、理解意图生成制式文稿,支持多方言转普通话。工具覆盖 macOS 和 Android,定位为让说话成为最自然的写作方式。
CosyVoice输入法的主要功能
- :自动过滤“嗯”“啊”“那个”这类口语填充词,直接输出干净利落的文字。
智能净化
- :散乱的口述内容,自动给你排成编号列表、表格或者层级大纲,不用再手动排版。
结构化整理
- :一句话指令,就能生成完整的邮件、会议邀请、脚本等制式文档,省掉从零敲字的功夫。
意图理解成稿
- :支持上海话、粤语、四川话等多种方言实时转写成标准普通话,口音不再是障碍。
方言转普通话
- :可以自定义专属词汇,让输入法更懂你的专业术语,识别准确率会越用越高。
热词 Skill
如何使用CosyVoice
- :访问 CosyVoice 官网 https://qwentype.com/,根据系统下载安装包,完成安装后打开应用。
下载安装
- :用手机号验证码或淘宝账号即可完成登录注册。
登录账号
- :按照引导依次启用文本粘贴、麦克风和录屏权限,确保输入法能正常监听和输出。
开启权限
- :对着麦克风说话,确认看到声波条形图正常移动后点击继续。
测试麦克风
- :在任意页面按下右 Option 键开始说话,松开后自动转写并粘贴到当前文本框。
语音输入
- :先选中已有文本,再按右 Option 键口述修改指令(比如“改成周四”),系统会自动修正内容。
语音改稿
- :根据职业选择对应标签,让 AI 输出更贴合你的专业语境。
选择身份
- :看到动态声波图标即表示正在识别,所有历史记录仅保存在本地设备。
开始使用
CosyVoice输入法的核心优势
- :传统语音输入法只做声学转写,而 CosyVoice 基于千问大模型实现语义级理解与文本再生成,输出更得体。
大模型深度赋能
- :自动过滤冗余、修正口误、结构化排版、生成制式文稿,大大减少后期编辑工作。
口语到成稿一步到位
- :支持多种方言实时转普通话,打破地域口音限制。
方言无障碍沟通
- :通过热词 Skill 功能持续学习用户专属词汇,越用越准。
热词自定义进化
- :历史记录仅存储在本地设备,不上传云端,数据安全有保障。
本地隐私保护
CosyVoice输入法的同类竞品对比
| 维度 | CosyVoice | 讯飞输入法 |
|---|---|---|
核心定位 |
AI 语音输入法,主打大模型润色与成稿 | 综合输入法,语音输入为子功能 |
口语处理 |
自动净化填充词、识别自我修正、结构化输出 | 基础语音转写,支持语音修改指令 |
意图成稿 |
支持,可一句指令生成完整邮件/脚本 | 不支持,需依赖模板或手动编辑 |
方言支持 |
上海话、粤语、四川话等转普通话 | 支持多方言识别,但转写为原方言文字 |
热词自定义 |
热词 Skill 批量导入专属术语 | 支持个人词库与语音个性化 |
大模型能力 |
搭载千问大模型,深度语义理解 | 讯飞星火大模型辅助,侧重语音识别 |
平台覆盖 |
macOS、Android(iOS/Windows 待上线) | 全平台覆盖(iOS、Android、Windows、macOS) |
CosyVoice输入法的应用场景
- :会议中口述会议纪要与待办事项,自动整理为结构化清单,会后不用再花时间整理。
职场办公
- :自媒体作者口述文章初稿,自动过滤口语冗余并排版,快速产出可发布的文字内容。
内容创作
- :口述邮件内容,自动生成包含主题、称谓、问候和签名的完整商务邮件格式。
商务沟通
- :方言区团队成员用家乡话口述,自动转写为标准普通话,沟通效率直线提升。
跨地域协作
- :口述财报数据与计算公式,自动将中文数字转为标准数值与公式符号,直接用于报告。
金融研报撰写