Google 正在继续努力让更多人使用 Gemini,为此它提供了更多的 AI 计算资源。今天,Google 发布了一系列 Gemini 2.0 模型的改进,作为升级的一部分,一些 AI 最先进的功能现在对免费用户开放。你可以使用改进后的 Deep Research 获取某个主题的深入信息,而且 Google 最新的推理模型可以浏览你的搜索历史,以提升它对你个人特征的理解。这会带来什么问题呢?
与大多数大型 AI 公司一样,Google 提供了多种不同的模型。Gemini 2.0 Flash Thinking Experimental 是该公司最强大的多步推理模型,能够处理复杂主题并让你了解其"思考"过程。Google 在最新一轮更新中为这个模型增加了许多功能,支持更大的 100 万 Token 上下文窗口、文件上传和更快的输出。它还支持更多 Google 应用的连接,包括日历、笔记、任务和照片。
为了让 Gemini 更加个性化,Google 还将 Flash Thinking Experimental 连接到了一个新的数据源:你的搜索历史。Google 强调这是一个需要用户主动选择加入的功能,并且可以随时禁用。Gemini 甚至会显示一个横幅,提醒你它已连接到你的搜索历史。如果你授予访问权限,AI 据称可以更好地理解你,并提供更相关的推荐。让 Gemini 访问这些个人数据可能会让人感到有些奇怪,但 Google 已经知道你在互联网上搜索什么了。让 AI 看一眼并不会让你失去更多隐私。这显然只是 Google 个性化 AI 努力的开始。
Gemini 2.0 也将应用到 Deep Research,这是 Google 的一款 AI 工具,可以针对特定主题或问题创建详细报告。该工具会代表你浏览网络,花时间组织回答。基于 Gemini 2.0 的新版本将展示更多收集数据的过程,Google 声称最终产品的质量会更高。
你不必完全相信 Google 的说法 —— 即使你没有付费使用高级 AI 功能,也可以亲自尝试。Google 将免费提供 Deep Research,但使用次数是有限的。该公司表示,所有人每月都可以免费使用 Deep Research "几次"。这就是我们得到的所有细节,所以不要一开始就过度使用 Deep Research。
最后,Google 也向免费账户推出了 Gems 功能。Gems 类似于可以针对特定任务设置的自定义聊天机器人。Google 提供了一些默认选项,如学习教练和头脑风暴助手,但你可以发挥创意,制作几乎任何类型的机器人 (在 Google LLC 规定的限制和适用法律范围内)。
一些新推出的免费功能需要大量的推理处理能力,这并不便宜。即使在有限的基础上,将最昂贵的模型免费提供无疑会增加 Google 在 AI 方面的损失。目前还没有人找到如何从生成式 AI 中赚钱的方法,但 Google 似乎愿意花更多钱来确保市场份额。
好文章,需要你的鼓励
Databricks在旧金山Data + AI峰会上推出多项重磅产品,包括支持AI智能体实时访问数据湖的Lake TAP架构、毫秒级查询引擎Reyden,以及具备持续学习能力的Genie One智能平台。CEO Ali Ghodsi表示AGI已经到来,当前核心挑战在于如何将其真正融入企业运营。Databricks还宣布收购AI安全平台Panther Labs,并推出Unity AI Gateway用于企业AI治理与成本管控。
WorldOlympiad是浙大、阿里等机构联合提出的视频世界模型评测基准,从物理规律、三维几何一致性和长程交互控制三个维度评测AI视频模型,首次实现跨游戏、机器人、真实世界场景的统一评测。
谷歌Wear OS 7已开始向Pixel Watch设备推送,此次更新带来最高10%的续航提升、实时通知Live Updates及跨设备音频控制功能。更值得关注的是,谷歌正将智能手表定位为其AI生态系统的核心枢纽,与智能眼镜、耳机等设备深度联动。Gemini AI功能将于年内陆续上线,包括自然语言生成表盘和跨应用多步操作。此外,重塑后的Fitbit应用引入AI健康教练,但用户生物特征与医疗数据的隐私保护问题仍是谷歌面临的重大挑战。
混合大模型做推理训练后长文检索能力暴跌,香港科技大学团队发现根源在查询键矩阵局部漂移,提出零训练成本的QK-Restore修复方法。