随着对AI驱动浏览器需求的不断增长,微软在周一为其Edge浏览器推出了一项名为"Copilot模式"的新功能,允许用户在AI助手的帮助下浏览网页。这一功能的核心理念是让AI成为用户的助手,能够理解用户正在研究的内容,预测用户的需求,并代表用户采取行动。
虽然实际效果如何还有待观察,但微软指出Copilot模式目前仍被视为实验性功能。在测试阶段,该功能默认为选择性加入,目前对所有能够访问Copilot的Mac或PC用户免费开放。
Copilot模式在发布时包含几个主要组件,未来还将推出更多功能。
启用后,Edge用户将看到一个全新的标签页面,可以在Copilot的协助下进行搜索、聊天和网页浏览。访问特定网页时,用户还可以向Copilot寻求更多帮助。例如,微软展示了用户如何询问AI助手是否可以将正在查看的食谱改为纯素版本,Copilot会建议相应的替代方案。
这类问题虽然用户今天也可以询问AI聊天机器人,但这省去了复制粘贴相关内容的步骤。
或者,用户可以直接要求AI呈现食谱本身,这样就可以跳过现在许多在线食谱中伴随的"人生故事"部分。
此外,微软声称Copilot能够代表用户处理各种任务,如预约安排、创建购物清单和起草内容。
这种"智能体"式的网页使用方式是AI浏览器竞赛中的下一个重大飞跃,但消费者是否会自然而然地接受还不得而知。当然,目标是让日常任务变得更容易执行,比如在Booking.com上预订房间或通过Kayak预订航班。然而,与AI来回聊天来了解选项和需求,并不一定比自己直接操作更好或更快,这取决于用户对相关网站的熟悉程度。
尽管如此,Copilot确实支持语音输入,这对于在线预订技术不够熟练的人群,或者行动不便的用户来说可能很有帮助。(微软表示,后续用户将能够为Copilot提供所需的额外信息,如凭证或历史记录,以管理更高级的操作,如预订。目前这个过程还比较手动。)
也许更有趣的是,Copilot具备作为研究伙伴的能力。在用户允许的情况下,Copilot可以查看所有打开的标签页,以了解用户正在浏览的内容。如果用户正在进行某种产品比较或在线研究,比如在多个网站上比较航班或酒店价格,这个功能就会很有用。同样,这些也是AI聊天机器人的使用场景,但将其集成到浏览器中可以加快将用户需求传达给数字助手的过程。
微软表示,未来Copilot还将提示用户继续之前的项目或研究内容,通过推荐下一步操作来实现。
公司强调,Copilot只有在用户选择允许的情况下才能访问用户的浏览内容,并且会通过视觉提示向最终用户透明地展示这一点。然而,现在可以开启或关闭一个能够在用户搜索时查看和监听的功能,这个想法可能会让一些人感到不安。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。