AI驱动的对话式搜索引擎Perplexity因提出以345亿美元收购谷歌Chrome浏览器而成为新闻焦点。但在2024年12月,Perplexity曾考虑收购The Browser Co.公司。就在几个月前,据报道Perplexity还曾提出以约10亿美元收购注重隐私的浏览器Brave。
为什么Perplexity如此渴望拥有一个网络浏览器?可能是因为浏览器很可能是我们智能体AI未来的关键所在。
我最近在TechFirst播客上采访了Opera高级产品负责人Henrik Lexow。Opera是一家有着30年历史的浏览器公司,率先推出了标签页浏览、弹窗拦截和广告拦截功能,在全球拥有约3亿活跃用户。今年,Opera率先在Opera Neon项目中将AI智能体直接引入了我们的浏览器。
"智能体浏览器……是否算是新的操作系统?"Lexow在播客中问道。"这是一个重大问题。"
无论浏览器走向何方,Opera对互联网本身的未来都相当确定。
"互联网的下一次迭代将是智能体驱动的,"Lexow说。"这一点现在已经很明显了。"
顺便说一下,这是一个巨大的转变。智能体互联网将是从用户驱动互联网到智能体驱动版本的巨大而根本性的变化。在用户驱动的互联网中,你搜索、查看结果、做出选择、点击链接、填写表单、预订航班和购买产品。
从某种意义上说,你就是智能体。
在智能体互联网中,你告诉某个东西——也许是你的智能体浏览器——为你做这些事情。只不过你不会说搜索、查看、选择和购买;你会说给我买更多六个月前买的内衣。然后智能体会查询它的记忆,制定计划,采取多个步骤,处理一切:从你买了什么内衣、在哪里买的,到在线找到相同的产品(也许还会四处查看更好的价格),到添加到购物车,到结账……然后向你报告结果。
因此,智能体——在这种情况下可能是智能体浏览器——本质上是个人助手,是一个力量倍增器。
但智能体浏览器会是我们与智能体交互的主要方式吗?
考虑到Perplexity公司持续反复但迄今为止未能成功的收购浏览器尝试,Perplexity似乎认为这非常重要。Opera当然这样认为,哪怕只是因为Opera拥有一个浏览器,而且是一个非常创新的浏览器。
Opera早在2023年就在ARIA项目中在浏览器中推出了AI。ARIA在基于GPT的聊天界面中实现了网页内的上下文交互。随着时间的推移,这已经发展为Opera Neon品牌下的三部分策略:
**Neon Chat** 是浏览器内的上下文AI聊天层,类似于ChatGPT但集成到你的浏览中。
**Neon Do** 是一个主动智能体,代表你执行操作,比如在你的本地浏览器环境中搜索并将袜子添加到亚马逊购物车。
**Neon Make** 是一个生成式空间,用户可以使用在云端运行的AI驱动智能体创建网络应用、游戏或比较工具。
现实是,对我们许多人来说,大部分工作都在浏览器中进行。我在浏览器中写这个故事。我在浏览器中录制了采访。我在浏览器中研究了Opera和Perplexity。我在浏览器中为播客制作了节目封面(感谢Canva)。
Opera的观点是,将智能体嵌入到你工作的地方会让它们变得更加有用:它们可以访问你的历史记录、你的工作、你的网站和应用程序。
"你已经登录服务,标签页已打开,历史记录可用。所有这些都成为上下文,"Lexow说。"这是你的智能体代表你行动的起点。"
重要提示:Neon智能体浏览器的AI在你的硬件上本地运行,使其成为你的智能体,而不是Opera的,也不是你雇主的。如果你要给智能体访问包括你的信用卡在内的非常个人信息,这应该会增强你的隐私保护,这一点至关重要。
"AI记忆加上浏览器上下文变得非常强大,"Lexow说。"它让智能体不仅理解你想要什么,还理解你希望如何完成。"
当然,这只是对未来的一种愿景。
苹果的Siri,尽管备受诟病,会有另一种愿景。谷歌,凭借Gemini和其庞大的Android手机群,会有另一种愿景。微软的Copilot是另一种。而OpenAI,拥有移动设备和完整计算机的ChatGPT应用,可能对我们如何将AI整合到生活和工作中有另一种愿景。
因此,浏览器是否会成为我们智能体AI未来的焦点还有待确定。记住那句古老的谚语:对于只有锤子的人来说,每个问题看起来都像钉子。
但在我看来,这似乎是一个相当不错的赌注。
Q&A
Q1:Opera Neon项目包含哪些功能?
A:Opera Neon项目包含三个主要功能:Neon Chat是浏览器内的上下文AI聊天层,类似ChatGPT但集成在浏览中;Neon Do是主动智能体,可代表用户执行操作;Neon Make是生成式空间,用户可用AI驱动智能体创建网络应用、游戏或比较工具。
Q2:为什么Perplexity想要收购浏览器?
A:因为浏览器可能是智能体AI未来的关键。在智能体互联网中,浏览器可以作为个人助手和力量倍增器,用户只需告诉智能体浏览器做什么,它就能自动完成搜索、选择、购买等复杂任务,而不需要用户逐步操作。
Q3:智能体浏览器相比传统浏览器有什么优势?
A:智能体浏览器的AI在用户硬件上本地运行,能访问用户的登录服务、打开的标签页和历史记录,这些都成为上下文信息。这使得智能体不仅理解用户想要什么,还理解用户希望如何完成,同时保护用户隐私。
好文章,需要你的鼓励
Gartner预测,到2029年,超过50%的企业将采用数字主权策略,以确保对数据和关键系统的国家控制。主权云将在这些策略中发挥关键作用,使企业能够在确保合规性的同时实现系统"云化"。企业正在采用私有云、主权云和本地数据中心等多种云私有化模式,主要驱动因素包括业务一致性、IT资源、成本和性能考量。
印度学者在卫星图像识别领域取得突破,设计出无需预训练的神经网络架构,在EuroSAT数据集上达到97.23%准确率。通过三轮迭代优化,研究者发现卫星图像需要平衡空间和光谱两种特征,创新性地开发了可学习融合参数的双路径注意力机制。该方法证明了专用架构设计在特定领域的巨大潜力,为无法获得大规模预训练数据的应用场景提供了有效解决方案。
这款16英寸便携显示器采用分离式设计,包含显示屏和磁吸式支架,均由阳极氧化铝制成。支架采用双铰链设计,支持360度旋转调节,收纳时厚度仅约1.3厘米。FlipAction Pro Gen 1配备2560×1600分辨率、60Hz刷新率、350尼特亮度和100% DCI-P3色域。无需外接电源,可直接从设备取电。适合与iPad配合提升多任务处理效率,或作为Mac的垂直副屏使用。
UC伯克利研究团队开发了ECHO框架,通过分析社交媒体上真实用户对GPT-4o图像生成的使用反馈,构建了更贴近实际需求的AI评测体系。该框架收集了超过31000个用户提示词,发现传统评测无法覆盖的复杂任务需求,并识别出用户关心的色彩偏移、身份保持等具体问题,为AI模型评估提供了全新的用户导向思路。