Google LLC 今天宣布将扩展其 Gemini 人工智能模型系列,并增加现有模型的可用性。
首先,Google 在 Google AI Studio 和 Vertex AI(该公司的全托管机器学习开发平台)中全面开放了更新版的 Gemini 2.0 Flash。这是继公司在桌面和移动端的 Gemini 应用中向所有用户开放 2.0 Flash 之后的又一举措。
在实验性 Gemini 模型方面,Google 发布了 Gemini 2.0 Pro 的实验版本(该公司在编程和复杂提示方面表现最佳的旗舰模型),并宣布 2.0 Flash Thinking Experimental 正式发布。新的 2.0 Flash Thinking 模型是一个针对逻辑和推理进行优化的小型快速 AI 模型。
Google 还发布了一个全新的模型 Gemini 2.0 Flash-Lite,这是该公司最具成本效益的 AI 模型,目前处于公开预览阶段。
2.0 Pro 实验版 通过与开发者和高级用户分享 Gemini 2.0 的早期实验版本,Google 表示已收到关于其 AI 模型优势的宝贵反馈。随着 Gemini 2.0 Pro 实验版的发布,公司希望继续保持这一趋势。
Gemini 2.0 Pro 实验版具有 200 万个 token 的上下文窗口,可以处理大量文档和视频,或约 150 万个单词。它还可以调用 Google 搜索等工具并执行代码。
Gemini 2.0 Pro 是 Google 去年 2 月推出的前代旗舰模型 Gemini 1.5 Pro 的继任者。
2.0 Flash Thinking 实验版 为了打造一个通过优化推理能力来进行"深度思考"的模型,Google 于去年 12 月发布了 2.0 Flash Thinking Experimental。中国 AI 初创公司 DeepSeek 的开源 R1 推理模型同样具有深度思考能力,但获得了更多媒体关注。
Google 在 2.0 Flash 的速度和性能基础上构建了这个新的实验模型,并训练它将提示分解为一系列步骤,使其本质上能够完成推理过程。
Google Gemini 应用产品管理总监 Patrick Kane 在公告中表示:"2.0 Flash Thinking Experimental 会展示其思考过程,让你能够了解它为什么会以某种方式回应,它的假设是什么,以及追踪模型的推理路线。"
公司还表示,Flash Thinking 将推出一个可以与 YouTube、搜索和 Google Maps 等应用交互的版本。这将使推理模型能够利用其固有的推理能力,充当有用的 AI 助手。
新的 2.0 Flash Thinking Experimental 和 2.0 Pro Experimental 将于今天在 Gemini 网页和移动应用中推出。
2.0 Flash-Lite:小型高效模型 作为 Google Gemini 系列的最新模型,2.0 Flash-Lite 在保持 Flash 1.5 的速度和价格的同时,在大多数质量基准测试中都优于该模型。
与 Flash 2.0 一样,Flash-Lite 提供 100 万个 token 的上下文窗口和多模态输入。举例来说,Google 表示,新模型可以为大约 4 万张独特照片生成单行标题,在 Google AI Studio 的付费层级中花费不到一美元。
这种规模化的速度和效率,以及如此低的成本,特别受到营销和零售机构的青睐。对于营销人员来说,该模型可以帮助以低成本为客户生成定制电子邮件,而在零售领域,它可以为产品照片生成大量文字描述,而不会产生高额成本。
Gemini 2.0 Flash-Lite 今天开始在 Google AI Studio 和 Vertex AI 中进行公开预览。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。