Google 本周二发布了三项全新的 AI 实验项目,旨在帮助用户以更加个性化的方式学习口语。虽然这些实验项目仍处于早期阶段,但公司可能借助 Gemini —— Google 的多模态大语言模型,向 Duolingo 发起挑战。
第一个实验项目帮助你迅速掌握当下所需的特定短语,而第二个实验则旨在让你的口语听起来不那么正式,更贴近当地人的风格。
第三个实验允许你利用相机根据周围环境学习新单词。
Google 指出,学习新语言最令人沮丧的部分之一,便是当你遇到需要某个尚未掌握的特定短语的情境时。
借助全新的 "Tiny Lesson" 实验项目,你可以描述一个情境,例如 "发现护照丢失",以此获得针对该上下文量身定制的词汇和语法建议。你还可以获得如 "我不知道我在哪里丢的" 或 "我想向警方报案" 的应答建议。
下一个实验项目 "Slang Hang" 旨在帮助用户在使用新语言时不再显得像教科书那么刻板。Google 表示,学习新语言时,通常会学到相对正式的说法,因此公司正尝试一种方法,教人们用更口语化、具地方特色的俚语交流。
借助这一功能,你可以生成一段本土语者之间的真实对话,并逐条消息观察对话的展开。例如,你可以通过描绘街头小贩与顾客交谈的情景,或是两位久别重逢的老友在地铁上的见面对话来学习。你可以将鼠标悬停在不熟悉的词汇上,了解它们的含义及用法。
Google 表示,该实验项目有时会误用某些俚语,甚至会虚构词汇,因此用户需要与可信的资料进行核对。
第三个实验项目 "Word Cam" 允许你拍摄周围环境的照片,随后 Gemini 将检测图像中的物体并用你正在学习的语言为其贴上标签。此功能还会提供额外的词汇,供你用来描述这些物体。
Google 表示,有时你只需要掌握面前事物的词汇,因为这能显示出你尚未知晓的部分。例如,你可能知道 "window"(窗户)这个词,但却不知道 "blinds"(百叶窗)的说法。
公司指出,这些实验项目的初衷在于探索如何利用 AI 使自主学习变得更加生动和个性化。
这些新实验项目支持以下语言:Arabic(阿拉伯语)、Chinese(中国大陆、香港、台湾)、English(澳大利亚、英国、美国)、French(加拿大、法国)、German(德语)、Greek(希腊语)、Hebrew(希伯来语)、Hindi(印地语)、Italian(意大利语)、Japanese(日语)、Korean(韩语)、Portuguese(巴西、葡萄牙)、Russian(俄语)、Spanish(拉丁美洲、西班牙)以及 Turkish(土耳其语)。用户可以通过 Google Labs 访问这些工具。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。