在众多 AI 公司纷纷推出聊天机器人的背景下,Google 正在利用其最大的竞争优势 —— 搜索引擎,来让 Gemini 脱颖而出。启用个性化功能后,Gemini 现在可以自动分析用户的查询,判断是否可以通过参考搜索历史来"增强"其回答质量。
该功能由 Gemini 2.0 Flash Thinking Experimental 模型提供支持,只有当 AI 模型认为"有帮助"时才会引用你的搜索结果。例如,当你向 Gemini 询问餐厅或旅行建议时,聊天机器人会参考你最近与美食相关的搜索记录来提供建议。
将搜索历史与 Gemini 关联是可选的。
这是 Google 正在推出的更广泛个性化功能的一部分。该功能最终将把 Gemini 与 YouTube 和 Google Photos 等其他应用程序连接起来,使聊天机器人能够"通过更全面地了解你的活动和偏好,提供更个性化的见解"。
Google 指出,你可以随时断开 Gemini 与搜索历史的连接。当你收到回答时,你会看到 Gemini 如何得出答案的概述,以及它是否参考了你的保存信息、过往对话或搜索历史。系统还会显示一个"清晰的横幅",提供断开搜索历史连接的链接。
Gemini 在提供旅行建议时可能会使用你的搜索历史。
Web 端的 Gemini 和 Gemini Advanced 用户可以通过在模型下拉菜单中选择"个性化 (实验性)"来启用该功能。该功能正在逐步在移动端推出,并在"大多数"国家以超过 40 种语言提供服务。
Google 还发布了其他更新,包括允许所有 Gemini 用户免费创建自己的个人 AI 助手 —— 称为 Gems。公司还宣布将其 Gemini 2.0 Flash Thinking Experimental 模型引入 Deep Research 功能,据称这将提升聊天机器人"在所有研究阶段"的能力。
Gemini 与日历、记事本、任务和照片的集成也升级到了 Gemini 2.0 Flash Thinking Experimental 模型,加入了 YouTube、搜索和 Google Maps 的行列。
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。