据Android Police周一报道,谷歌翻译即将获得重大AI功能升级,包括选择不同AI模型的能力以及类似Duolingo的游戏化练习模式。
Android分析师AssembleDebug对谷歌翻译应用的最新版本9.15.114进行了分析,发现了用户界面的新变化。在顶部出现了新的模型选择器,提供"快速"和"高级"两个选项。快速模式推测用于快速翻译任务,比如破译菜单项目。高级模式可能会使用Gemini来更准确地理解文本或对话的上下文。
根据报道,此次更新还将包含练习模式,以游戏化方式帮助语言学习,类似于热门语言学习应用Duolingo的做法。
谷歌代表没有立即回应置评请求。
在过去两年中,谷歌一直在展示各种演示并发布功能,使语言翻译变得更加容易。在今年早些时候的Google I/O大会上,这家科技巨头展示了佩戴Android XR智能眼镜进行实时翻译的演示。
随着2023年Pixel Fold的发布,该公司还推出了实时翻译模式,利用设备的内外屏幕。
理解不同语言是AI的一项关键创新。使用大语言模型技术在两种不同语言之间进行翻译,扩展了人类之间可以进行的内容和对话。
谷歌已经在YouTube上发布了自动配音技术,例如允许英语观众观看日语YouTuber的视频。
Q&A
Q1:谷歌翻译的新AI功能有哪些?
A:谷歌翻译将新增模型选择器,提供"快速"和"高级"两个AI模型选项。快速模式用于快速翻译任务,高级模式使用Gemini技术更准确地理解文本上下文。还将增加类似Duolingo的游戏化练习模式来帮助语言学习。
Q2:谷歌在语言翻译方面还有哪些技术创新?
A:谷歌在过去两年推出了多项语言翻译创新,包括Android XR智能眼镜的实时翻译演示、Pixel Fold的实时翻译模式,以及YouTube上的自动配音技术,让不同语言的观众能够观看其他语言的视频内容。
Q3:大语言模型技术在语言翻译中有什么重要作用?
A:大语言模型技术能够在两种不同语言之间进行智能翻译,这是AI的关键创新之一。它扩展了人类之间可以进行的内容和对话范围,让不同语言背景的人能够更好地沟通交流。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。