OpenAI在周二的直播活动中发布了AI浏览器ChatGPT Atlas。虽然市场上已有The Browser Company的Dia、Opera的Neon、Perplexity的Comet以及General Catalyst支持的Strawberry等AI浏览器,但OpenAI的发布格外引人注目,因为它有望触达8亿周活跃的ChatGPT用户。对OpenAI来说,这款浏览器的意义更多在于保持ChatGPT的中心地位,而非改进网页浏览体验。
Atlas的核心定位与分发策略
目前Atlas仅支持Mac平台,但OpenAI已在开发Windows、iOS和Android版本,覆盖ChatGPT现有的所有平台。与竞争对手采用邀请制不同,OpenAI选择向所有用户开放Atlas。该浏览器的核心理念是让用户将ChatGPT视为搜索和获取答案的首选界面,而非Google。
所有AI浏览器都有相似的搜索和问答理念:用户无需执行搜索查询,只需在地址栏输入问题,就能从AI聊天机器人获得答案,而不用浏览大量链接页面。
正如Sam Altman在发布会上明确表示的,OpenAI与其他浏览器厂商一样,认为Atlas将改变网页浏览方式。"我们认为AI代表了十年一遇的机会,让我们重新思考浏览器的本质、使用方式,以及如何最高效地利用网络。标签页很棒,但此后就没有太多创新了。"Altman在开幕演讲中说道。
虽然包括Sundar Pichai和Satya Nadella在内的科技领袖都将AI视为平台转变,但对消费者而言,手机和桌面操作系统仍是获取AI工具的主要途径。OpenAI希望尽可能掌控ChatGPT的分发渠道。上周,Meta关闭了第三方聊天机器人在WhatsApp上的访问权限,包括ChatGPT和Perplexity,而WhatsApp拥有超过30亿月活用户。这意味着平台方可以随时限制分发。
深度集成与数据收集优势
对OpenAI而言,Atlas还提供了深度集成ChatGPT和其他产品的机会,超越其他平台的能力。用户可以直接引用多个网站,而无需向ChatGPT发送链接。该公司已为其智能体使用无头浏览器技术。通过Atlas,它可能对该功能拥有更多控制权。它还集成了悬浮写作助手,会在文本框中显示。
此外,该公司正在集成其App SDK,允许在ChatGPT内调用其他应用,以提升可发现性。
记忆功能对ChatGPT的高级用户也至关重要。该功能结合浏览历史和ChatGPT聊天记录,提供具有相关背景的答案。你可以询问"我制作演示计划的工作文档在哪里?"ChatGPT会为你找到相应链接。这也意味着随着你在浏览器中使用时间增长,ChatGPT会获得更多关于你的背景信息。当OpenAI广泛推出"ChatGPT登录"功能时,可以将这些背景信息提供给其他应用。
将ChatGPT设为默认搜索选项和启用记忆功能,这两项功能都旨在收集更多用户数据,让OpenAI更深入了解用户行为,实现更好的产品开发。该浏览器没有广告拦截器、VPN、阅读模式或翻译功能来改善网站浏览体验。相反,用户必须要求ChatGPT总结内容或在页面上查找信息——仿佛打开页面是为了给ChatGPT提供更多背景,而非帮助用户消费页面内容。
相比之下,The Browser Company的Arc在改进浏览器体验方面有一些有用的想法,比如使用AI重命名下载文件或通过删除元素来自定义网页。
超越浏览器的更大野心
结果是Atlas不仅仅是一个浏览器,更是ChatGPT的更广阔画布。OpenAI应用CEO Fidji Simo在概述Atlas发布的博客中阐述了这一理念。
"当我们首次发布ChatGPT时,并不确定人们会如何使用它。现在我们从全球数亿人那里获得了反馈和信号,显然ChatGPT需要发展成比最初简单聊天机器人更强大的工具。随着时间推移,我们看到ChatGPT将演变为你生活的操作系统:一个完全连接的中枢,帮助你管理日常并实现长期目标。"Simo说道。
OpenAI面临的一大问题是如何让默认使用Chrome、Safari或Edge的用户转向其浏览器,从Google、Apple和Microsoft手中夺取一些市场份额。虽然使用ChatGPT的人数稳步增长,但普通用户是否愿意将浏览器和聊天机器人体验结合起来,目前还不明确。Chrome之所以成功,是因为它速度快,人们希望将Google查询作为互联网的默认起始体验。ChatGPT Atlas对于已经用ChatGPT替代Google的用户来说是完美的,但要替代Chrome,OpenAI需要确保数十亿用户养成这种习惯。
Q&A
Q1:ChatGPT Atlas浏览器有什么特色功能?
A:ChatGPT Atlas的核心特色是将ChatGPT作为搜索和问答的首选界面,用户可以直接在地址栏输入问题获得AI答案,还具备记忆功能,能结合浏览历史和聊天记录提供个性化回答,并集成了悬浮写作助手。
Q2:为什么OpenAI要开发自己的浏览器?
A:主要是为了掌控ChatGPT的分发渠道,避免被其他平台方限制。通过自有浏览器,OpenAI可以更深度集成ChatGPT功能,收集更多用户数据,并将ChatGPT发展为"生活操作系统"的中枢平台。
Q3:ChatGPT Atlas能否挑战Chrome等主流浏览器?
A:目前面临挑战。虽然Atlas对已经用ChatGPT替代Google搜索的用户很有吸引力,但要让数十亿习惯使用Chrome、Safari的普通用户转换,OpenAI还需要让更多用户养成优先使用ChatGPT而非传统搜索引擎的习惯。
好文章,需要你的鼓励
美国多州和部分国家要求特定应用进行年龄验证,澳大利亚已禁止16岁以下用户使用社交媒体。新提案《应用商店问责法案》建议由苹果和谷歌负责统一验证用户年龄,而非各开发者单独验证。这将提升用户体验,用户只需向苹果或谷歌验证一次身份。凭借苹果在隐私保护方面的优势,该方案可扩展至Safari浏览器,为需要年龄验证的网站提供确认信息,而无需透露用户个人数据。
Meta AI首次发布多模态奖励评估基准MMRB2,专门评价AI同时处理文字和图像的能力。该基准包含四大任务类型共4000个专家标注样本,测试23个先进模型。结果显示最佳模型Gemini 3 Pro达75-80%准确率,仍低于人类90%水平。研究揭示AI评价存在视觉偏见等问题,为多模态AI发展提供重要参考标准。
AI编程助手Cursor背后的公司Anysphere宣布收购AI代码审查工具初创公司Graphite。据报道收购价远超Graphite今年早些时候B轮融资时2.9亿美元的估值。此次收购具有战略意义,将AI代码生成与AI代码审查工具相结合,可大幅提升从编写到交付的整体效率。Anysphere估值已达290亿美元,近期频繁收购,上月收购技术招聘公司,今年7月还收购AI客户关系管理初创公司Koala的团队。
快手推出的Kling-Omni是首个真正统一的AI视频制作系统,能够理解文字、图像、视频等多种输入方式,不仅可以生成视频,还能进行复杂编辑和推理。该系统通过三个核心模块的协作,实现了从创意理解到最终输出的全流程自动化,让普通用户也能制作专业水准的视频内容,代表了AI视频技术的重要突破。