Mozilla近日再次表明对谷歌将AI功能内置于Chrome浏览器这一决定的反对立场。尽管时机略显滞后——这项名为Prompt API的技术已经在Chrome和微软Edge中进入测试阶段——Mozilla仍公开表达了其核心关切。
Mozilla Web开发者关系负责人Jake Archibald在GitHub的相关API讨论帖中阐述了该组织的立场。Prompt API提供了一种标准化方式,用于向本地机器学习模型发送提示词并接收响应。
"我们持续反对这一API,认为它将对Web平台的互操作性、可更新性和中立性产生严重负面影响,"Archibald表示。
谷歌对Prompt API的描述是:为网页提供直接向浏览器内置语言模型发送提示词的能力。该API可向谷歌的Gemini Nano模型发送自然语言指令,该模型体量足够小,可通过Chrome下载并在本地运行推理任务。
不过,所谓"足够小"也是相对的——谷歌建议为此预留22 GB的存储空间,而桌面端使用的Nano(v3Nano)模型本身约为4.27 GB。
目前,Web开发者已有多种与AI模型交互的方式:可以通过云服务API与托管模型通信,也可以借助JavaScript运行时框架、WASM或WebGPU等技术访问本地模型。OpenAI、Perplexity等厂商已推出内置远程AI模型访问能力的浏览器。Mozilla自身也在Firefox中测试基于AI的智能窗口功能,并正在开发AI模型脚手架工具。
Prompt API的目标是简化本地推理的运行方式,使其能够充分利用浏览器安全机制、实现更快的响应速度、支持离线使用,并提供更具成本效益的AI服务集成方案(例如,在用户没有付费AI API密钥时提供免费AI备用选项)。
Mozilla的核心关切,正如Archibald所阐述的,不仅关乎Prompt API对Web生态的影响,也涉及谷歌对该API推出理由的诠释。
首先,Archibald担忧谷歌自家的Nano模型将成为默认选项,开发者为了让AI模型的非确定性输出更具可预测性,会逐渐向其靠拢并形成依赖。他认为,这种趋势将给苹果和Mozilla带来压力,迫使它们为了统一用户体验而授权使用Nano模型。
更值得关注的是,Archibald指出,使用Prompt API需要同意谷歌的生成式AI禁止使用政策,该政策明确禁止某些并非违法的行为,例如生成"令人不安"的内容。
"对于Web平台上的API来说,这是一个不良先例,同时也为更多包含浏览器特定使用规则的API开了一个令人担忧的口子,"他说道。
此外,Archibald还指出,谷歌通过筛选少数社交媒体帖子,将其包装成开发者的广泛支持,夸大了市场对该API的实际需求。
"意向公告中将Web开发者描述为'强烈支持',并以说明文档作为佐证,但所提供的证据与该说法明显不符,"他写道。
Archibald在接受媒体采访时进一步阐明,问题的核心在于Prompt API是否真正有利于Web生态,而Mozilla的答案是否定的。
"核心问题是互操作性,"他说,"提示词与模型高度耦合;开发者在开发过程中不可避免地会针对所使用模型的特性和策略进行调优。这最终会导致针对特定模型的代码分支,也就是浏览器兼容性问题的又一次轮回。服务条款问题也是其中一环:如果使用某个Web API意味着必须接受特定厂商的内容政策(尤其是超出法律范畴的部分),那实际上已经不是在为开放平台构建应用了。"
关于谷歌夸大开发者热情一事,Archibald表示,确实有开发者对AI能力感兴趣,但谷歌未能提供充分证据。
"反馈是两极分化的,并非'强烈支持',"他解释道,"无论如何,仅凭开发者需求本身并不足以达到标准。真正的问题在于:该API能否在不将平台绑定于某一厂商模型的前提下,实现跨实现的互操作。"
谷歌方面未对此立即作出回应。
然而,负责推进Prompt API发布的谷歌Chrome工程师Rick Byers随后在GitHub讨论中作出回应,表示认可Archibald所提出的部分关切。
"作为在Chromium中推动该功能发布的blink API负责人之一,我承认自己对Mozilla的立场所提及的问题同样存有顾虑,"他写道,"我的分歧在于,相较于因担忧潜在风险而选择保守观望、阻碍创新,我更倾向于通过鼓励实验、从错误中学习、促进竞争来推动发展。"
Byers呼吁Web社区积累更多实证数据,以推动讨论深入。他以加密媒体扩展(EME)等曾饱受争议的Web技术为例,指出实际结果并未如当时所预测的那般糟糕。
然而,数据层面的表现目前对谷歌并无助益。一份发布于今年2月的报告,通过Prompt API对比了Chrome(Gemini Nano)与Edge(Phi-4 mini-instruct)的性能表现,结果显示两款模型的实际效果均不理想。
"在生成类任务(如文本创作、标签生成等)中,Edge有24.29%的响应未能完成任务,Chrome为15.17%——评分标准将5分制中得分不超过2分的响应判定为失败,"报告写道。"在分类任务中,Edge有29.58%、Chrome有23.93%的响应未能正确标注或归类输入内容。"
在准确性与可靠性方面,Edge的幻觉率为17%,Chrome为6%。
这样的表现,究竟对Web生态是福是祸?或许你可以去问问Chrome——只是未必能得到一个可靠的答案。
Q&A
Q1:谷歌Prompt API是什么,它能做什么?
A:Prompt API是谷歌内置于Chrome浏览器的一项AI接口,允许网页直接向浏览器内置的语言模型(即Gemini Nano)发送自然语言提示词并获取响应。它的目标是简化本地AI推理流程,支持离线使用、提升响应速度,并为没有付费API密钥的用户提供免费AI备用方案。运行该模型需要约22 GB存储空间,模型本身大小约为4.27 GB。
Q2:Mozilla为什么反对谷歌将Prompt API内置到浏览器?
A:Mozilla的核心反对理由有三点:一是互操作性问题,开发者会针对Gemini Nano的特性调优代码,形成对单一厂商模型的依赖;二是使用Prompt API需同意谷歌的生成式AI禁止使用政策,该政策限制范围超出法律边界,不适合作为开放Web平台的标准;三是谷歌夸大了开发者对该API的支持程度,实际反馈呈两极分化,并非谷歌所称的"强烈支持"。
Q3:Prompt API在实际测试中表现如何?
A:根据今年2月发布的测试报告,Prompt API在Chrome和Edge上的实际表现均不理想。在生成类任务中,Chrome的失败率为15.17%,Edge为24.29%;在分类任务中,Chrome失败率为23.93%,Edge为29.58%。在准确性方面,Edge的幻觉率为17%,Chrome相对较低为6%,但整体而言两款模型的可靠性仍有较大提升空间。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。