随着对AI驱动浏览器需求的不断增长,微软在周一为其Edge浏览器推出了一项名为"Copilot模式"的新功能,允许用户在AI助手的帮助下浏览网页。这一功能的核心理念是让AI成为用户的助手,能够理解用户正在研究的内容,预测用户的需求,并代表用户采取行动。
虽然实际效果如何还有待观察,但微软指出Copilot模式目前仍被视为实验性功能。在测试阶段,该功能默认为选择性加入,目前对所有能够访问Copilot的Mac或PC用户免费开放。
Copilot模式在发布时包含几个主要组件,未来还将推出更多功能。
启用后,Edge用户将看到一个全新的标签页面,可以在Copilot的协助下进行搜索、聊天和网页浏览。访问特定网页时,用户还可以向Copilot寻求更多帮助。例如,微软展示了用户如何询问AI助手是否可以将正在查看的食谱改为纯素版本,Copilot会建议相应的替代方案。
这类问题虽然用户今天也可以询问AI聊天机器人,但这省去了复制粘贴相关内容的步骤。
或者,用户可以直接要求AI呈现食谱本身,这样就可以跳过现在许多在线食谱中伴随的"人生故事"部分。
此外,微软声称Copilot能够代表用户处理各种任务,如预约安排、创建购物清单和起草内容。
这种"智能体"式的网页使用方式是AI浏览器竞赛中的下一个重大飞跃,但消费者是否会自然而然地接受还不得而知。当然,目标是让日常任务变得更容易执行,比如在Booking.com上预订房间或通过Kayak预订航班。然而,与AI来回聊天来了解选项和需求,并不一定比自己直接操作更好或更快,这取决于用户对相关网站的熟悉程度。
尽管如此,Copilot确实支持语音输入,这对于在线预订技术不够熟练的人群,或者行动不便的用户来说可能很有帮助。(微软表示,后续用户将能够为Copilot提供所需的额外信息,如凭证或历史记录,以管理更高级的操作,如预订。目前这个过程还比较手动。)
也许更有趣的是,Copilot具备作为研究伙伴的能力。在用户允许的情况下,Copilot可以查看所有打开的标签页,以了解用户正在浏览的内容。如果用户正在进行某种产品比较或在线研究,比如在多个网站上比较航班或酒店价格,这个功能就会很有用。同样,这些也是AI聊天机器人的使用场景,但将其集成到浏览器中可以加快将用户需求传达给数字助手的过程。
微软表示,未来Copilot还将提示用户继续之前的项目或研究内容,通过推荐下一步操作来实现。
公司强调,Copilot只有在用户选择允许的情况下才能访问用户的浏览内容,并且会通过视觉提示向最终用户透明地展示这一点。然而,现在可以开启或关闭一个能够在用户搜索时查看和监听的功能,这个想法可能会让一些人感到不安。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。