周二,谷歌发布了其最新、最先进的基础模型Gemini 3,该模型现已通过Gemini应用程序和AI搜索界面立即提供服务。
距离Gemini 2.5发布仅七个月,这一新模型是谷歌迄今为止最强大的大语言模型,也是市场上最具竞争力的AI工具之一。此次发布距离OpenAI发布GPT 5.1不到一周,距离Anthropic发布Sonnet 4.5仅两个月——这提醒我们前沿模型开发的飞速发展。
该模型的更加专注于研究的版本,名为Gemini 3 Deepthink,将在未来几周内向Google AI Ultra订阅用户提供,待通过进一步的安全测试后即可使用。
"通过Gemini 3,我们看到了推理能力的巨大飞跃,"谷歌Gemini模型产品负责人Tulsee Doshi说。"它以前所未有的深度和细致度进行回应。"
这种推理能力已经在独立基准测试中得到体现。该模型在"人类最后考试"基准测试中获得37.4分,创下了该项旨在衡量通用推理和专业知识测试的历史最高纪录。此前的最高分31.64分由GPT-5 Pro保持。Gemini 3还在LMArena这一衡量用户满意度的人工评判基准测试中位居榜首。
据谷歌数据显示,Gemini应用程序目前拥有超过6.5亿月活跃用户,已有1300万软件开发者在工作流程中使用该模型。
除基础模型外,谷歌还发布了一款基于Gemini的编程界面Google Antigravity,提供多窗格智能体编程功能,类似于Warp或Cursor 2.0等智能体集成开发环境。具体而言,Antigravity结合了ChatGPT风格的提示窗口、命令行界面和浏览器窗口,可以显示编程智能体所做更改的影响。
"该智能体可以与您的编辑器、终端和浏览器协同工作,确保以最佳方式帮助您构建应用程序,"DeepMind首席技术官Koray Kavukcuoglu表示。
Q&A
Q1:Gemini 3相比前代模型有什么突破?
A:Gemini 3在推理能力方面实现了巨大飞跃,能够以前所未有的深度和细致度进行回应。在"人类最后考试"基准测试中获得37.4分的历史最高纪录,超越了GPT-5 Pro此前保持的31.64分纪录,并在LMArena用户满意度测试中位居榜首。
Q2:Google Antigravity编程界面有什么特色功能?
A:Google Antigravity是基于Gemini的编程界面,提供多窗格智能体编程功能。它结合了ChatGPT风格的提示窗口、命令行界面和浏览器窗口,智能体可以与编辑器、终端和浏览器协同工作,实时显示代码更改的影响,帮助开发者以最佳方式构建应用程序。
Q3:普通用户如何使用Gemini 3?
A:Gemini 3现已通过Gemini应用程序和AI搜索界面立即提供服务。据谷歌数据,该应用程序目前拥有超过6.5亿月活跃用户。更高级的Gemini 3 Deepthink版本将在未来几周内向Google AI Ultra订阅用户提供。
好文章,需要你的鼓励
ChatGPT发布三年后,物理AI成为行业最新热词。物理AI是指在硬件中实现的AI系统,能够感知周围世界并进行推理以执行操作。与传统机器人不同,物理AI具备推理、行动和与环境交互的能力。智能眼镜是物理AI的典型代表,能够看到和听到用户所体验的内容。高通专家指出,AI可穿戴设备可以为机器人提供基于真实人类体验的高质量数据集,形成良性生态系统。
德国弗劳恩霍夫研究院提出ViTNT-FIQA人脸质量评估新方法,无需训练即可评估图像质量。该方法基于Vision Transformer层间特征稳定性原理,通过测量图像块在相邻层级间的变化幅度判断质量。在八个国际数据集上的实验显示其性能可媲美现有最先进方法,且计算效率更高,为人脸识别系统提供了即插即用的质量控制解决方案,有望广泛应用于安防监控和身份认证等领域。
来自加州大学伯克利分校和康奈尔大学的研究团队,通过分析130万篇学术论文发现,使用ChatGPT等AI工具的科学家论文产出平均提升40-60%,且英语非母语研究者受益最大。
布朗大学联合图宾根大学的研究团队通过系统实验发现,AI医疗助手的角色设定会产生显著的情境依赖效应:医疗专业角色在急诊场景下表现卓越,准确率提升20%,但在普通医疗咨询中反而表现更差。研究揭示了AI角色扮演的"双刃剑"特性,强调需要根据具体应用场景精心设计AI身份,而非简单假设"更专业等于更安全",为AI医疗系统的安全部署提供了重要指导。