Google 本周二发布了三项全新的 AI 实验项目,旨在帮助用户以更加个性化的方式学习口语。虽然这些实验项目仍处于早期阶段,但公司可能借助 Gemini —— Google 的多模态大语言模型,向 Duolingo 发起挑战。
第一个实验项目帮助你迅速掌握当下所需的特定短语,而第二个实验则旨在让你的口语听起来不那么正式,更贴近当地人的风格。
第三个实验允许你利用相机根据周围环境学习新单词。
Google 指出,学习新语言最令人沮丧的部分之一,便是当你遇到需要某个尚未掌握的特定短语的情境时。
借助全新的 "Tiny Lesson" 实验项目,你可以描述一个情境,例如 "发现护照丢失",以此获得针对该上下文量身定制的词汇和语法建议。你还可以获得如 "我不知道我在哪里丢的" 或 "我想向警方报案" 的应答建议。
下一个实验项目 "Slang Hang" 旨在帮助用户在使用新语言时不再显得像教科书那么刻板。Google 表示,学习新语言时,通常会学到相对正式的说法,因此公司正尝试一种方法,教人们用更口语化、具地方特色的俚语交流。
借助这一功能,你可以生成一段本土语者之间的真实对话,并逐条消息观察对话的展开。例如,你可以通过描绘街头小贩与顾客交谈的情景,或是两位久别重逢的老友在地铁上的见面对话来学习。你可以将鼠标悬停在不熟悉的词汇上,了解它们的含义及用法。
Google 表示,该实验项目有时会误用某些俚语,甚至会虚构词汇,因此用户需要与可信的资料进行核对。
第三个实验项目 "Word Cam" 允许你拍摄周围环境的照片,随后 Gemini 将检测图像中的物体并用你正在学习的语言为其贴上标签。此功能还会提供额外的词汇,供你用来描述这些物体。
Google 表示,有时你只需要掌握面前事物的词汇,因为这能显示出你尚未知晓的部分。例如,你可能知道 "window"(窗户)这个词,但却不知道 "blinds"(百叶窗)的说法。
公司指出,这些实验项目的初衷在于探索如何利用 AI 使自主学习变得更加生动和个性化。
这些新实验项目支持以下语言:Arabic(阿拉伯语)、Chinese(中国大陆、香港、台湾)、English(澳大利亚、英国、美国)、French(加拿大、法国)、German(德语)、Greek(希腊语)、Hebrew(希伯来语)、Hindi(印地语)、Italian(意大利语)、Japanese(日语)、Korean(韩语)、Portuguese(巴西、葡萄牙)、Russian(俄语)、Spanish(拉丁美洲、西班牙)以及 Turkish(土耳其语)。用户可以通过 Google Labs 访问这些工具。
好文章,需要你的鼓励
微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。
苹果与清华合作提出EpiCache技术,解决AI长期对话中的记忆管理难题。该方法将对话自动分割成话题片段,为每个话题建立专门记忆库,实现智能匹配和高效检索。实验显示,EpiCache比传统方法准确率提高40%,内存使用减少4-6倍,响应速度提升2.4倍,为资源受限环境下的AI对话系统提供了实用解决方案。
OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。
清华大学与英伟达合作提出DiffusionNFT,一种革命性的AI图像生成训练方法。该方法通过对比正负样本进行学习,避免了复杂的概率计算,训练效率比传统方法提升25倍。研究团队在多项测试中验证了其优越性,不仅大幅提升了图像质量和文字渲染能力,还实现了无需分类器引导的高效训练,为AI图像生成技术的普及和应用奠定了重要基础。