某种程度上,2025年是AI语音录入应用真正起飞的一年。语音录入应用已经存在多年,但过去它们一直表现缓慢且不够准确——除非你说话时带有特定的口音并且咬字清晰。
但是大语言模型和语音转文本模型的进步帮助改善了这些系统,让它们能够更好地解读语音,同时保持上下文来格式化文本。开发者还构建了自动格式化文本、去除填充词和忽略口误的功能,从而输出需要较少编辑的文本。
但随着AI相关技术的火爆,市场上出现了数十款此类应用。因此,我们整理了今年最佳和最实用的语音录入应用。
Wispr Flow
Wispr Flow是一款资金充足的AI语音录入应用,允许用户为语音录入添加自定义词汇和指令。该应用拥有MacOS、Windows和iOS的原生应用,Android版本正在开发中。
该应用允许你通过选择"正式"、"随意"和"非常随意"的风格来定制系统转录笔记的方式,适用于个人消息、工作和邮件等不同类型的写作。如果你将其与Cursor等编程工具配合使用,可以开启功能来自动识别变量或在聊天中标记文件。
在任何桌面版本上,该应用每月免费提供2000字的转录,iOS版本每月免费1000字。订阅计划提供无限制转录,起价15美元/月。
Willow
Willow将自己宣传为不喜欢打字者的重大时间节省工具。除了自动编辑和格式化等常见功能外,该应用还有一个功能,利用大语言模型仅从几个语音词汇就生成完整的文本段落。
Willow还采用更注重隐私的AI辅助笔记方法,将所有转录本存储在设备本地,并允许用户选择不参与模型训练。它还允许用户向应用添加自定义词汇,帮助其适应行业术语或当地方言。
Willow在其桌面应用上每月免费提供2000字语音录入。个人订阅计划起价15美元/月,提供无限制语音录入并能让应用记住你的写作风格。
Monologue
如果你专注于隐私保护,Monologue允许你下载其模型,这样就可以在设备上运行转录功能,避免将数据发送到云端。此外,该应用还允许你根据所使用的应用自定义语调。
Monologue每月免费提供1000字记录,订阅费用为10美元/月或100美元/年。如果你成为该应用的顶级用户,公司还会向你发送一个有趣的Monokey来配合应用使用。
Superwhisper
Superwhisper主要是一款语音录入应用,但也可以从音频或视频文件进行转录。该应用让你自由选择和下载AI模型,包括其自有的具有不同速度和准确性的模型,以及NVIDIA的Parakeet语音识别模型。
该应用还允许你编写自定义提示来指导输出。你可以轻松查看与系统键盘集成的已处理和未处理转录本。
基本语音转文本功能免费使用,你可以获得15分钟时间来测试翻译和转录等专业功能。付费层级让你使用自己的AI API密钥,并可以无限制地插入云端和本地模型。
月度计划费用为8.49美元/月,年度计划费用为84.99美元/年,或者你可以支付249.99美元购买终身订阅。
VoiceTypr
这款应用采用离线优先、无订阅的方式,让你使用本地模型进行转录。对于想要自己托管和运行开源版本的用户,还有一个GitHub代码库。VoiceTypr支持99种以上语言,适用于Mac和Windows。
VoiceTypr提供三天免费试用,之后你可以购买终身许可证。该应用单设备费用为35美元,两台设备56美元,四台设备98美元。
Aqua
Aqua是另一款由Y Combinator支持的Windows和MacOS语音输入客户端,声称在延迟方面是该类别中最快的工具之一。
除了处理语法和标点符号外,Aqua还允许你通过说短语来自动填充文本——例如,你可以说"我的地址",让Aqua输入你的地址。
该应用还为其他应用提供自己的语音转文本API。
免费层级每月提供1000字。付费计划起价8美元/月(年度计费),解锁无限制字数和800个自定义词典值。
Handy
Handy是一款开源免费的转录工具,可以在Mac、Windows和Linux上运行。该应用功能相当基础,不提供太多定制选项,但如果你想开始更多使用语音而不想付费,这是一个不错的选择。
该应用有一个基本设置菜单,允许你切换按键说话模式,并更改激活转录的热键。
Typeless
Typeless是这个类别中另一款具有高免费字数的应用。该公司声称不会保留任何数据或用于训练模型。如果你可能说错了一句话,Typeless还会建议更好的句子版本。
该应用在免费层级每周允许语音录入4000字(大约每月16000字)。你可以支付12美元/月(年度计费)来解锁无限制字数并获得新功能。Typeless仅适用于Windows和MacOS。
Q&A
Q1:Wispr Flow有什么特色功能?
A:Wispr Flow允许用户添加自定义词汇和指令,提供"正式"、"随意"和"非常随意"三种转录风格,适用于不同写作场景。还可以与编程工具Cursor配合使用,自动识别变量或标记文件。
Q2:哪些AI语音录入应用更注重隐私保护?
A:Willow将转录本存储在设备本地,允许用户选择不参与模型训练。Monologue可下载模型在设备上运行,避免数据上传云端。VoiceTypr采用离线优先方式使用本地模型。
Q3:免费用户可以获得多少语音录入额度?
A:各应用的免费额度不同:Wispr Flow桌面版2000字/月、iOS版1000字/月;Willow桌面版2000字/月;Monologue 1000字/月;Typeless每周4000字(约16000字/月);Aqua 1000字/月。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。