随着对AI驱动浏览器需求的不断增长,微软在周一为其Edge浏览器推出了一项名为"Copilot模式"的新功能,允许用户在AI助手的帮助下浏览网页。这一功能的核心理念是让AI成为用户的助手,能够理解用户正在研究的内容,预测用户的需求,并代表用户采取行动。
虽然实际效果如何还有待观察,但微软指出Copilot模式目前仍被视为实验性功能。在测试阶段,该功能默认为选择性加入,目前对所有能够访问Copilot的Mac或PC用户免费开放。
Copilot模式在发布时包含几个主要组件,未来还将推出更多功能。
启用后,Edge用户将看到一个全新的标签页面,可以在Copilot的协助下进行搜索、聊天和网页浏览。访问特定网页时,用户还可以向Copilot寻求更多帮助。例如,微软展示了用户如何询问AI助手是否可以将正在查看的食谱改为纯素版本,Copilot会建议相应的替代方案。
这类问题虽然用户今天也可以询问AI聊天机器人,但这省去了复制粘贴相关内容的步骤。
或者,用户可以直接要求AI呈现食谱本身,这样就可以跳过现在许多在线食谱中伴随的"人生故事"部分。
此外,微软声称Copilot能够代表用户处理各种任务,如预约安排、创建购物清单和起草内容。
这种"智能体"式的网页使用方式是AI浏览器竞赛中的下一个重大飞跃,但消费者是否会自然而然地接受还不得而知。当然,目标是让日常任务变得更容易执行,比如在Booking.com上预订房间或通过Kayak预订航班。然而,与AI来回聊天来了解选项和需求,并不一定比自己直接操作更好或更快,这取决于用户对相关网站的熟悉程度。
尽管如此,Copilot确实支持语音输入,这对于在线预订技术不够熟练的人群,或者行动不便的用户来说可能很有帮助。(微软表示,后续用户将能够为Copilot提供所需的额外信息,如凭证或历史记录,以管理更高级的操作,如预订。目前这个过程还比较手动。)
也许更有趣的是,Copilot具备作为研究伙伴的能力。在用户允许的情况下,Copilot可以查看所有打开的标签页,以了解用户正在浏览的内容。如果用户正在进行某种产品比较或在线研究,比如在多个网站上比较航班或酒店价格,这个功能就会很有用。同样,这些也是AI聊天机器人的使用场景,但将其集成到浏览器中可以加快将用户需求传达给数字助手的过程。
微软表示,未来Copilot还将提示用户继续之前的项目或研究内容,通过推荐下一步操作来实现。
公司强调,Copilot只有在用户选择允许的情况下才能访问用户的浏览内容,并且会通过视觉提示向最终用户透明地展示这一点。然而,现在可以开启或关闭一个能够在用户搜索时查看和监听的功能,这个想法可能会让一些人感到不安。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。