某种程度上,2025年是AI语音录入应用真正起飞的一年。语音录入应用已经存在多年,但过去它们一直表现缓慢且不够准确——除非你说话时带有特定的口音并且咬字清晰。
但是大语言模型和语音转文本模型的进步帮助改善了这些系统,让它们能够更好地解读语音,同时保持上下文来格式化文本。开发者还构建了自动格式化文本、去除填充词和忽略口误的功能,从而输出需要较少编辑的文本。
但随着AI相关技术的火爆,市场上出现了数十款此类应用。因此,我们整理了今年最佳和最实用的语音录入应用。
Wispr Flow
Wispr Flow是一款资金充足的AI语音录入应用,允许用户为语音录入添加自定义词汇和指令。该应用拥有MacOS、Windows和iOS的原生应用,Android版本正在开发中。
该应用允许你通过选择"正式"、"随意"和"非常随意"的风格来定制系统转录笔记的方式,适用于个人消息、工作和邮件等不同类型的写作。如果你将其与Cursor等编程工具配合使用,可以开启功能来自动识别变量或在聊天中标记文件。
在任何桌面版本上,该应用每月免费提供2000字的转录,iOS版本每月免费1000字。订阅计划提供无限制转录,起价15美元/月。
Willow
Willow将自己宣传为不喜欢打字者的重大时间节省工具。除了自动编辑和格式化等常见功能外,该应用还有一个功能,利用大语言模型仅从几个语音词汇就生成完整的文本段落。
Willow还采用更注重隐私的AI辅助笔记方法,将所有转录本存储在设备本地,并允许用户选择不参与模型训练。它还允许用户向应用添加自定义词汇,帮助其适应行业术语或当地方言。
Willow在其桌面应用上每月免费提供2000字语音录入。个人订阅计划起价15美元/月,提供无限制语音录入并能让应用记住你的写作风格。
Monologue
如果你专注于隐私保护,Monologue允许你下载其模型,这样就可以在设备上运行转录功能,避免将数据发送到云端。此外,该应用还允许你根据所使用的应用自定义语调。
Monologue每月免费提供1000字记录,订阅费用为10美元/月或100美元/年。如果你成为该应用的顶级用户,公司还会向你发送一个有趣的Monokey来配合应用使用。
Superwhisper
Superwhisper主要是一款语音录入应用,但也可以从音频或视频文件进行转录。该应用让你自由选择和下载AI模型,包括其自有的具有不同速度和准确性的模型,以及NVIDIA的Parakeet语音识别模型。
该应用还允许你编写自定义提示来指导输出。你可以轻松查看与系统键盘集成的已处理和未处理转录本。
基本语音转文本功能免费使用,你可以获得15分钟时间来测试翻译和转录等专业功能。付费层级让你使用自己的AI API密钥,并可以无限制地插入云端和本地模型。
月度计划费用为8.49美元/月,年度计划费用为84.99美元/年,或者你可以支付249.99美元购买终身订阅。
VoiceTypr
这款应用采用离线优先、无订阅的方式,让你使用本地模型进行转录。对于想要自己托管和运行开源版本的用户,还有一个GitHub代码库。VoiceTypr支持99种以上语言,适用于Mac和Windows。
VoiceTypr提供三天免费试用,之后你可以购买终身许可证。该应用单设备费用为35美元,两台设备56美元,四台设备98美元。
Aqua
Aqua是另一款由Y Combinator支持的Windows和MacOS语音输入客户端,声称在延迟方面是该类别中最快的工具之一。
除了处理语法和标点符号外,Aqua还允许你通过说短语来自动填充文本——例如,你可以说"我的地址",让Aqua输入你的地址。
该应用还为其他应用提供自己的语音转文本API。
免费层级每月提供1000字。付费计划起价8美元/月(年度计费),解锁无限制字数和800个自定义词典值。
Handy
Handy是一款开源免费的转录工具,可以在Mac、Windows和Linux上运行。该应用功能相当基础,不提供太多定制选项,但如果你想开始更多使用语音而不想付费,这是一个不错的选择。
该应用有一个基本设置菜单,允许你切换按键说话模式,并更改激活转录的热键。
Typeless
Typeless是这个类别中另一款具有高免费字数的应用。该公司声称不会保留任何数据或用于训练模型。如果你可能说错了一句话,Typeless还会建议更好的句子版本。
该应用在免费层级每周允许语音录入4000字(大约每月16000字)。你可以支付12美元/月(年度计费)来解锁无限制字数并获得新功能。Typeless仅适用于Windows和MacOS。
Q&A
Q1:Wispr Flow有什么特色功能?
A:Wispr Flow允许用户添加自定义词汇和指令,提供"正式"、"随意"和"非常随意"三种转录风格,适用于不同写作场景。还可以与编程工具Cursor配合使用,自动识别变量或标记文件。
Q2:哪些AI语音录入应用更注重隐私保护?
A:Willow将转录本存储在设备本地,允许用户选择不参与模型训练。Monologue可下载模型在设备上运行,避免数据上传云端。VoiceTypr采用离线优先方式使用本地模型。
Q3:免费用户可以获得多少语音录入额度?
A:各应用的免费额度不同:Wispr Flow桌面版2000字/月、iOS版1000字/月;Willow桌面版2000字/月;Monologue 1000字/月;Typeless每周4000字(约16000字/月);Aqua 1000字/月。
好文章,需要你的鼓励
总部位于休斯顿的GridFree AI公司宣布推出首个独立电网站点South Dallas One,专为高密度AI工作负载设计。该站点位于希尔县,是计划中South Dallas集群的一部分,三个站点总发电容量近5GW。公司采用天然气驱动基础设施,独立于本地电网运营,可在24个月内完成部署,为超大规模云服务商提供快速、可靠的AI就绪基础设施解决方案。
MBZUAI和法国综合理工学院联合开发的SchED算法能让AI写作速度提升3-4倍。该算法通过监测AI生成文本的置信度,采用进度感知的动态阈值策略,在保持99.8%-100%原始质量的同时显著减少计算时间。实验覆盖多种任务类型,证明了算法的有效性和鲁棒性。
国际数据公司IDC发布报告警告,由于AI基础设施建设对内存需求激增,2026年PC出货量可能下降8.9%。主要内存制造商已将生产重心从传统DRAM和NAND转向AI数据中心所需的高带宽内存,导致PC用内存价格上涨。这种内存紧缺对"AI PC"市场形成讽刺,原本用于提振PC行业的AI电脑反而受到AI产业自身影响。
西安交通大学研究团队发现,AI视觉语言模型容易受到功能词(如"是"、"的"等)的干扰而遭受攻击。他们开发了功能词去注意力(FDA)机制,让AI减少对这些词汇的关注。测试显示,该方法可将攻击成功率降低18%-90%,而正常性能仅下降0.2%-0.6%。FDA无需额外训练即可集成到现有模型中,为AI安全防护提供了简单有效的解决方案。