据Android Police周一报道,谷歌翻译即将获得重大AI功能升级,包括选择不同AI模型的能力以及类似Duolingo的游戏化练习模式。
Android分析师AssembleDebug对谷歌翻译应用的最新版本9.15.114进行了分析,发现了用户界面的新变化。在顶部出现了新的模型选择器,提供"快速"和"高级"两个选项。快速模式推测用于快速翻译任务,比如破译菜单项目。高级模式可能会使用Gemini来更准确地理解文本或对话的上下文。
根据报道,此次更新还将包含练习模式,以游戏化方式帮助语言学习,类似于热门语言学习应用Duolingo的做法。
谷歌代表没有立即回应置评请求。
在过去两年中,谷歌一直在展示各种演示并发布功能,使语言翻译变得更加容易。在今年早些时候的Google I/O大会上,这家科技巨头展示了佩戴Android XR智能眼镜进行实时翻译的演示。
随着2023年Pixel Fold的发布,该公司还推出了实时翻译模式,利用设备的内外屏幕。
理解不同语言是AI的一项关键创新。使用大语言模型技术在两种不同语言之间进行翻译,扩展了人类之间可以进行的内容和对话。
谷歌已经在YouTube上发布了自动配音技术,例如允许英语观众观看日语YouTuber的视频。
Q&A
Q1:谷歌翻译的新AI功能有哪些?
A:谷歌翻译将新增模型选择器,提供"快速"和"高级"两个AI模型选项。快速模式用于快速翻译任务,高级模式使用Gemini技术更准确地理解文本上下文。还将增加类似Duolingo的游戏化练习模式来帮助语言学习。
Q2:谷歌在语言翻译方面还有哪些技术创新?
A:谷歌在过去两年推出了多项语言翻译创新,包括Android XR智能眼镜的实时翻译演示、Pixel Fold的实时翻译模式,以及YouTube上的自动配音技术,让不同语言的观众能够观看其他语言的视频内容。
Q3:大语言模型技术在语言翻译中有什么重要作用?
A:大语言模型技术能够在两种不同语言之间进行智能翻译,这是AI的关键创新之一。它扩展了人类之间可以进行的内容和对话范围,让不同语言背景的人能够更好地沟通交流。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。