在众多 AI 公司纷纷推出聊天机器人的背景下,Google 正在利用其最大的竞争优势 —— 搜索引擎,来让 Gemini 脱颖而出。启用个性化功能后,Gemini 现在可以自动分析用户的查询,判断是否可以通过参考搜索历史来"增强"其回答质量。
该功能由 Gemini 2.0 Flash Thinking Experimental 模型提供支持,只有当 AI 模型认为"有帮助"时才会引用你的搜索结果。例如,当你向 Gemini 询问餐厅或旅行建议时,聊天机器人会参考你最近与美食相关的搜索记录来提供建议。
将搜索历史与 Gemini 关联是可选的。
这是 Google 正在推出的更广泛个性化功能的一部分。该功能最终将把 Gemini 与 YouTube 和 Google Photos 等其他应用程序连接起来,使聊天机器人能够"通过更全面地了解你的活动和偏好,提供更个性化的见解"。
Google 指出,你可以随时断开 Gemini 与搜索历史的连接。当你收到回答时,你会看到 Gemini 如何得出答案的概述,以及它是否参考了你的保存信息、过往对话或搜索历史。系统还会显示一个"清晰的横幅",提供断开搜索历史连接的链接。
Gemini 在提供旅行建议时可能会使用你的搜索历史。
Web 端的 Gemini 和 Gemini Advanced 用户可以通过在模型下拉菜单中选择"个性化 (实验性)"来启用该功能。该功能正在逐步在移动端推出,并在"大多数"国家以超过 40 种语言提供服务。
Google 还发布了其他更新,包括允许所有 Gemini 用户免费创建自己的个人 AI 助手 —— 称为 Gems。公司还宣布将其 Gemini 2.0 Flash Thinking Experimental 模型引入 Deep Research 功能,据称这将提升聊天机器人"在所有研究阶段"的能力。
Gemini 与日历、记事本、任务和照片的集成也升级到了 Gemini 2.0 Flash Thinking Experimental 模型,加入了 YouTube、搜索和 Google Maps 的行列。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。