谷歌新推出的AI语音转写应用Google AI Edge Eloquent已于周一正式发布,这是一款可离线工作的AI听写应用。该应用提供了多项先进功能,能够将用户的断续话语转换为几乎无需编辑的可用文本。
谷歌正致力于解决一个长期存在的问题——语音转文本听写的不准确或表达不清晰。近年来这一问题虽有改善但仍然存在。有时是因为应用未能正确翻译所说内容,有时则是因为说话者的犹豫和漫谈,使文本中充斥着停顿和填充词,如"嗯"和"呃"。
使用这款新应用时,用户只需点击按钮,对着麦克风说话,文本就会出现在屏幕上。完成后,谷歌的设备端Gemma模型将自动优化文本。
App Store的描述显示,所有的"嗯"、"呃"和句中自我纠正都会被编辑删除,留下干净的文本供用户进一步自定义。
AI Edge Eloquent可完全离线工作,所有内容都保存在设备上。用户可以将应用连接到谷歌账户,这样它就能根据Gmail数据构建词典,或者连接到云端,通过Gemini获得更强的文本优化能力。
该应用界面简洁,底部有一排图标菜单,分别是录音、历史记录、词典和设置。用户可以手动向词典添加词汇,如果存在拼写错误,应用会自动添加用户已编辑的词汇,例如当应用拼错姓名时。
这款应用无需订阅付费。
虽然谷歌在其许多产品中已经具备语音转文本功能,但对于那些寻求免费独立选项并希望获得文本优化功能的用户来说,这可能是一个不错的选择。
该应用目前尚未面向Android用户推出,但Apple App Store的描述承诺提供"无缝Android集成"。
谷歌代表暂未就此立即回复置评请求。
Q&A
Q1:Google AI Edge Eloquent是什么?
A:Google AI Edge Eloquent是谷歌新推出的AI语音转写应用,可以离线工作,能将用户的断续话语转换为几乎无需编辑的可用文本,并自动去除"嗯"、"呃"等填充词和停顿。
Q2:这款应用需要付费吗?支持哪些平台?
A:该应用完全免费,无需订阅付费。目前只支持iOS平台,Android版本尚未发布,但App Store描述承诺将提供"无缝Android集成"。
Q3:Google AI Edge Eloquent如何保护隐私?
A:该应用可完全离线工作,所有数据都保存在设备上。用户可选择连接谷歌账户构建个人词典,或连接云端获得更强的文本优化功能,但这些都是可选的。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。