谷歌新推出的AI语音转写应用Google AI Edge Eloquent已于周一正式发布,这是一款可离线工作的AI听写应用。该应用提供了多项先进功能,能够将用户的断续话语转换为几乎无需编辑的可用文本。
谷歌正致力于解决一个长期存在的问题——语音转文本听写的不准确或表达不清晰。近年来这一问题虽有改善但仍然存在。有时是因为应用未能正确翻译所说内容,有时则是因为说话者的犹豫和漫谈,使文本中充斥着停顿和填充词,如"嗯"和"呃"。
使用这款新应用时,用户只需点击按钮,对着麦克风说话,文本就会出现在屏幕上。完成后,谷歌的设备端Gemma模型将自动优化文本。
App Store的描述显示,所有的"嗯"、"呃"和句中自我纠正都会被编辑删除,留下干净的文本供用户进一步自定义。
AI Edge Eloquent可完全离线工作,所有内容都保存在设备上。用户可以将应用连接到谷歌账户,这样它就能根据Gmail数据构建词典,或者连接到云端,通过Gemini获得更强的文本优化能力。
该应用界面简洁,底部有一排图标菜单,分别是录音、历史记录、词典和设置。用户可以手动向词典添加词汇,如果存在拼写错误,应用会自动添加用户已编辑的词汇,例如当应用拼错姓名时。
这款应用无需订阅付费。
虽然谷歌在其许多产品中已经具备语音转文本功能,但对于那些寻求免费独立选项并希望获得文本优化功能的用户来说,这可能是一个不错的选择。
该应用目前尚未面向Android用户推出,但Apple App Store的描述承诺提供"无缝Android集成"。
谷歌代表暂未就此立即回复置评请求。
Q&A
Q1:Google AI Edge Eloquent是什么?
A:Google AI Edge Eloquent是谷歌新推出的AI语音转写应用,可以离线工作,能将用户的断续话语转换为几乎无需编辑的可用文本,并自动去除"嗯"、"呃"等填充词和停顿。
Q2:这款应用需要付费吗?支持哪些平台?
A:该应用完全免费,无需订阅付费。目前只支持iOS平台,Android版本尚未发布,但App Store描述承诺将提供"无缝Android集成"。
Q3:Google AI Edge Eloquent如何保护隐私?
A:该应用可完全离线工作,所有数据都保存在设备上。用户可选择连接谷歌账户构建个人词典,或连接云端获得更强的文本优化功能,但这些都是可选的。
好文章,需要你的鼓励
这篇来自爱丁堡大学与谷歌DeepMind的研究发现,给AI的上下文优化器加装搜索工具,需配合束搜索训练机制才有效,否则反而损害性能。
5月18日,Dell在拉斯维加斯举办了一年一度的Dell Technologies World大会。Michael Dell做了一小时的主旨演讲,中间穿插了礼来、三星、Honeywell等客户对话,黄仁勋也上台做了一段联合展示。
印第安纳大学研究者提出WriteSAE,首次实现对循环状态语言模型矩阵缓存写入的分解与精准编辑,可将目标词出现率从33.3%提升至100%。