AI驱动的对话式搜索引擎Perplexity因提出以345亿美元收购谷歌Chrome浏览器而成为新闻焦点。但在2024年12月,Perplexity曾考虑收购The Browser Co.公司。就在几个月前,据报道Perplexity还曾提出以约10亿美元收购注重隐私的浏览器Brave。
为什么Perplexity如此渴望拥有一个网络浏览器?可能是因为浏览器很可能是我们智能体AI未来的关键所在。
我最近在TechFirst播客上采访了Opera高级产品负责人Henrik Lexow。Opera是一家有着30年历史的浏览器公司,率先推出了标签页浏览、弹窗拦截和广告拦截功能,在全球拥有约3亿活跃用户。今年,Opera率先在Opera Neon项目中将AI智能体直接引入了我们的浏览器。
"智能体浏览器……是否算是新的操作系统?"Lexow在播客中问道。"这是一个重大问题。"
无论浏览器走向何方,Opera对互联网本身的未来都相当确定。
"互联网的下一次迭代将是智能体驱动的,"Lexow说。"这一点现在已经很明显了。"
顺便说一下,这是一个巨大的转变。智能体互联网将是从用户驱动互联网到智能体驱动版本的巨大而根本性的变化。在用户驱动的互联网中,你搜索、查看结果、做出选择、点击链接、填写表单、预订航班和购买产品。
从某种意义上说,你就是智能体。
在智能体互联网中,你告诉某个东西——也许是你的智能体浏览器——为你做这些事情。只不过你不会说搜索、查看、选择和购买;你会说给我买更多六个月前买的内衣。然后智能体会查询它的记忆,制定计划,采取多个步骤,处理一切:从你买了什么内衣、在哪里买的,到在线找到相同的产品(也许还会四处查看更好的价格),到添加到购物车,到结账……然后向你报告结果。
因此,智能体——在这种情况下可能是智能体浏览器——本质上是个人助手,是一个力量倍增器。
但智能体浏览器会是我们与智能体交互的主要方式吗?
考虑到Perplexity公司持续反复但迄今为止未能成功的收购浏览器尝试,Perplexity似乎认为这非常重要。Opera当然这样认为,哪怕只是因为Opera拥有一个浏览器,而且是一个非常创新的浏览器。
Opera早在2023年就在ARIA项目中在浏览器中推出了AI。ARIA在基于GPT的聊天界面中实现了网页内的上下文交互。随着时间的推移,这已经发展为Opera Neon品牌下的三部分策略:
**Neon Chat** 是浏览器内的上下文AI聊天层,类似于ChatGPT但集成到你的浏览中。
**Neon Do** 是一个主动智能体,代表你执行操作,比如在你的本地浏览器环境中搜索并将袜子添加到亚马逊购物车。
**Neon Make** 是一个生成式空间,用户可以使用在云端运行的AI驱动智能体创建网络应用、游戏或比较工具。
现实是,对我们许多人来说,大部分工作都在浏览器中进行。我在浏览器中写这个故事。我在浏览器中录制了采访。我在浏览器中研究了Opera和Perplexity。我在浏览器中为播客制作了节目封面(感谢Canva)。
Opera的观点是,将智能体嵌入到你工作的地方会让它们变得更加有用:它们可以访问你的历史记录、你的工作、你的网站和应用程序。
"你已经登录服务,标签页已打开,历史记录可用。所有这些都成为上下文,"Lexow说。"这是你的智能体代表你行动的起点。"
重要提示:Neon智能体浏览器的AI在你的硬件上本地运行,使其成为你的智能体,而不是Opera的,也不是你雇主的。如果你要给智能体访问包括你的信用卡在内的非常个人信息,这应该会增强你的隐私保护,这一点至关重要。
"AI记忆加上浏览器上下文变得非常强大,"Lexow说。"它让智能体不仅理解你想要什么,还理解你希望如何完成。"
当然,这只是对未来的一种愿景。
苹果的Siri,尽管备受诟病,会有另一种愿景。谷歌,凭借Gemini和其庞大的Android手机群,会有另一种愿景。微软的Copilot是另一种。而OpenAI,拥有移动设备和完整计算机的ChatGPT应用,可能对我们如何将AI整合到生活和工作中有另一种愿景。
因此,浏览器是否会成为我们智能体AI未来的焦点还有待确定。记住那句古老的谚语:对于只有锤子的人来说,每个问题看起来都像钉子。
但在我看来,这似乎是一个相当不错的赌注。
Q&A
Q1:Opera Neon项目包含哪些功能?
A:Opera Neon项目包含三个主要功能:Neon Chat是浏览器内的上下文AI聊天层,类似ChatGPT但集成在浏览中;Neon Do是主动智能体,可代表用户执行操作;Neon Make是生成式空间,用户可用AI驱动智能体创建网络应用、游戏或比较工具。
Q2:为什么Perplexity想要收购浏览器?
A:因为浏览器可能是智能体AI未来的关键。在智能体互联网中,浏览器可以作为个人助手和力量倍增器,用户只需告诉智能体浏览器做什么,它就能自动完成搜索、选择、购买等复杂任务,而不需要用户逐步操作。
Q3:智能体浏览器相比传统浏览器有什么优势?
A:智能体浏览器的AI在用户硬件上本地运行,能访问用户的登录服务、打开的标签页和历史记录,这些都成为上下文信息。这使得智能体不仅理解用户想要什么,还理解用户希望如何完成,同时保护用户隐私。
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。