Google LLC 今天宣布将扩展其 Gemini 人工智能模型系列,并增加现有模型的可用性。
首先,Google 在 Google AI Studio 和 Vertex AI(该公司的全托管机器学习开发平台)中全面开放了更新版的 Gemini 2.0 Flash。这是继公司在桌面和移动端的 Gemini 应用中向所有用户开放 2.0 Flash 之后的又一举措。
在实验性 Gemini 模型方面,Google 发布了 Gemini 2.0 Pro 的实验版本(该公司在编程和复杂提示方面表现最佳的旗舰模型),并宣布 2.0 Flash Thinking Experimental 正式发布。新的 2.0 Flash Thinking 模型是一个针对逻辑和推理进行优化的小型快速 AI 模型。
Google 还发布了一个全新的模型 Gemini 2.0 Flash-Lite,这是该公司最具成本效益的 AI 模型,目前处于公开预览阶段。
2.0 Pro 实验版 通过与开发者和高级用户分享 Gemini 2.0 的早期实验版本,Google 表示已收到关于其 AI 模型优势的宝贵反馈。随着 Gemini 2.0 Pro 实验版的发布,公司希望继续保持这一趋势。
Gemini 2.0 Pro 实验版具有 200 万个 token 的上下文窗口,可以处理大量文档和视频,或约 150 万个单词。它还可以调用 Google 搜索等工具并执行代码。
Gemini 2.0 Pro 是 Google 去年 2 月推出的前代旗舰模型 Gemini 1.5 Pro 的继任者。
2.0 Flash Thinking 实验版 为了打造一个通过优化推理能力来进行"深度思考"的模型,Google 于去年 12 月发布了 2.0 Flash Thinking Experimental。中国 AI 初创公司 DeepSeek 的开源 R1 推理模型同样具有深度思考能力,但获得了更多媒体关注。
Google 在 2.0 Flash 的速度和性能基础上构建了这个新的实验模型,并训练它将提示分解为一系列步骤,使其本质上能够完成推理过程。
Google Gemini 应用产品管理总监 Patrick Kane 在公告中表示:"2.0 Flash Thinking Experimental 会展示其思考过程,让你能够了解它为什么会以某种方式回应,它的假设是什么,以及追踪模型的推理路线。"
公司还表示,Flash Thinking 将推出一个可以与 YouTube、搜索和 Google Maps 等应用交互的版本。这将使推理模型能够利用其固有的推理能力,充当有用的 AI 助手。
新的 2.0 Flash Thinking Experimental 和 2.0 Pro Experimental 将于今天在 Gemini 网页和移动应用中推出。
2.0 Flash-Lite:小型高效模型 作为 Google Gemini 系列的最新模型,2.0 Flash-Lite 在保持 Flash 1.5 的速度和价格的同时,在大多数质量基准测试中都优于该模型。
与 Flash 2.0 一样,Flash-Lite 提供 100 万个 token 的上下文窗口和多模态输入。举例来说,Google 表示,新模型可以为大约 4 万张独特照片生成单行标题,在 Google AI Studio 的付费层级中花费不到一美元。
这种规模化的速度和效率,以及如此低的成本,特别受到营销和零售机构的青睐。对于营销人员来说,该模型可以帮助以低成本为客户生成定制电子邮件,而在零售领域,它可以为产品照片生成大量文字描述,而不会产生高额成本。
Gemini 2.0 Flash-Lite 今天开始在 Google AI Studio 和 Vertex AI 中进行公开预览。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。