AI驱动的对话式搜索引擎Perplexity因提出以345亿美元收购谷歌Chrome浏览器而成为新闻焦点。但在2024年12月,Perplexity曾考虑收购The Browser Co.公司。就在几个月前,据报道Perplexity还曾提出以约10亿美元收购注重隐私的浏览器Brave。
为什么Perplexity如此渴望拥有一个网络浏览器?可能是因为浏览器很可能是我们智能体AI未来的关键所在。
我最近在TechFirst播客上采访了Opera高级产品负责人Henrik Lexow。Opera是一家有着30年历史的浏览器公司,率先推出了标签页浏览、弹窗拦截和广告拦截功能,在全球拥有约3亿活跃用户。今年,Opera率先在Opera Neon项目中将AI智能体直接引入了我们的浏览器。
"智能体浏览器……是否算是新的操作系统?"Lexow在播客中问道。"这是一个重大问题。"
无论浏览器走向何方,Opera对互联网本身的未来都相当确定。
"互联网的下一次迭代将是智能体驱动的,"Lexow说。"这一点现在已经很明显了。"
顺便说一下,这是一个巨大的转变。智能体互联网将是从用户驱动互联网到智能体驱动版本的巨大而根本性的变化。在用户驱动的互联网中,你搜索、查看结果、做出选择、点击链接、填写表单、预订航班和购买产品。
从某种意义上说,你就是智能体。
在智能体互联网中,你告诉某个东西——也许是你的智能体浏览器——为你做这些事情。只不过你不会说搜索、查看、选择和购买;你会说给我买更多六个月前买的内衣。然后智能体会查询它的记忆,制定计划,采取多个步骤,处理一切:从你买了什么内衣、在哪里买的,到在线找到相同的产品(也许还会四处查看更好的价格),到添加到购物车,到结账……然后向你报告结果。
因此,智能体——在这种情况下可能是智能体浏览器——本质上是个人助手,是一个力量倍增器。
但智能体浏览器会是我们与智能体交互的主要方式吗?
考虑到Perplexity公司持续反复但迄今为止未能成功的收购浏览器尝试,Perplexity似乎认为这非常重要。Opera当然这样认为,哪怕只是因为Opera拥有一个浏览器,而且是一个非常创新的浏览器。
Opera早在2023年就在ARIA项目中在浏览器中推出了AI。ARIA在基于GPT的聊天界面中实现了网页内的上下文交互。随着时间的推移,这已经发展为Opera Neon品牌下的三部分策略:
**Neon Chat** 是浏览器内的上下文AI聊天层,类似于ChatGPT但集成到你的浏览中。
**Neon Do** 是一个主动智能体,代表你执行操作,比如在你的本地浏览器环境中搜索并将袜子添加到亚马逊购物车。
**Neon Make** 是一个生成式空间,用户可以使用在云端运行的AI驱动智能体创建网络应用、游戏或比较工具。
现实是,对我们许多人来说,大部分工作都在浏览器中进行。我在浏览器中写这个故事。我在浏览器中录制了采访。我在浏览器中研究了Opera和Perplexity。我在浏览器中为播客制作了节目封面(感谢Canva)。
Opera的观点是,将智能体嵌入到你工作的地方会让它们变得更加有用:它们可以访问你的历史记录、你的工作、你的网站和应用程序。
"你已经登录服务,标签页已打开,历史记录可用。所有这些都成为上下文,"Lexow说。"这是你的智能体代表你行动的起点。"
重要提示:Neon智能体浏览器的AI在你的硬件上本地运行,使其成为你的智能体,而不是Opera的,也不是你雇主的。如果你要给智能体访问包括你的信用卡在内的非常个人信息,这应该会增强你的隐私保护,这一点至关重要。
"AI记忆加上浏览器上下文变得非常强大,"Lexow说。"它让智能体不仅理解你想要什么,还理解你希望如何完成。"
当然,这只是对未来的一种愿景。
苹果的Siri,尽管备受诟病,会有另一种愿景。谷歌,凭借Gemini和其庞大的Android手机群,会有另一种愿景。微软的Copilot是另一种。而OpenAI,拥有移动设备和完整计算机的ChatGPT应用,可能对我们如何将AI整合到生活和工作中有另一种愿景。
因此,浏览器是否会成为我们智能体AI未来的焦点还有待确定。记住那句古老的谚语:对于只有锤子的人来说,每个问题看起来都像钉子。
但在我看来,这似乎是一个相当不错的赌注。
Q&A
Q1:Opera Neon项目包含哪些功能?
A:Opera Neon项目包含三个主要功能:Neon Chat是浏览器内的上下文AI聊天层,类似ChatGPT但集成在浏览中;Neon Do是主动智能体,可代表用户执行操作;Neon Make是生成式空间,用户可用AI驱动智能体创建网络应用、游戏或比较工具。
Q2:为什么Perplexity想要收购浏览器?
A:因为浏览器可能是智能体AI未来的关键。在智能体互联网中,浏览器可以作为个人助手和力量倍增器,用户只需告诉智能体浏览器做什么,它就能自动完成搜索、选择、购买等复杂任务,而不需要用户逐步操作。
Q3:智能体浏览器相比传统浏览器有什么优势?
A:智能体浏览器的AI在用户硬件上本地运行,能访问用户的登录服务、打开的标签页和历史记录,这些都成为上下文信息。这使得智能体不仅理解用户想要什么,还理解用户希望如何完成,同时保护用户隐私。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。