微软正在将"氛围编程"概念扩展到工作场景,推出了名为"氛围工作"的新功能,为在线Office套件添加AI智能体来帮助用户完成工作任务。
周一,微软宣布为Word和Excel添加基于OpenAI的智能体模式,该模式可以基于现有材料创建文档,从电子表格中提取数据用于报告和财务分析,用户只需输入几句提示语即可完成。
对于Word用户,微软承诺提供"氛围写作"功能,该功能可以利用现有文档来组装报告和提案,检查草稿的清晰度和风格,并在过程中提出改进建议。
Excel智能体专门设计用于处理现有电子表格并分析数据、构建报告和可视化数据。微软表示,它和OpenAI能够"理解Excel"并产生相对准确的结果。
根据微软官方博客文章,微软Excel智能体模式在既定的SpreadsheetBench基准测试中获得了57.2%的准确率,但这明显低于人类在相同测试中平均71.3%的表现。虽然微软声称智能体模式优于其他AI引擎,但仍存在显著差距,这可能导致更多质量不佳的工作内容充斥我们的收件箱。
微软产品副总裁Trevor O'Brien为这一结果辩护:"我们不是为基准测试而优化,而是为Excel中的真实用户工作而优化。这意味着要解决混乱、模糊和复杂的任务,反映人们实际的工作方式。虽然SpreadsheetBench是一个强有力的信号,但它并不能完全体现Excel的强大功能——比如动态数组、数据透视表、图表和格式设置——或者客户对可刷新、可审核和可验证解决方案的需求。"
微软还在Copilot中推出了新的Office智能体,但使用的是Anthropic而非OpenAI引擎。通过基于聊天的格式,用户可以根据网络上公开可用的信息生成Word文档和PowerPoint演示文稿。
微软亚洲AI企业副总裁张琦声称,生成的幻灯片将是"有品味的",这要归功于代码使用了"品味驱动开发(TDD)范式"。他表示,在通用AI助手(GAIA)基准测试中,Office智能体超越了竞争对手Genspark、Manus和OpenAI自己的Deep research工具。
这是微软一周内第二次展现对Anthropic的青睐。上周三,微软在Copilot Studio和Researcher智能体中添加了Claude Opus 4.1和Sonnet 4作为模型选项,微软还暗示将有更多合作。
这种日益密切的关系表明微软正在远离OpenAI——这家它已投入超过100亿美元的公司。虽然微软有自己的AI开发项目,但它表现出越来越愿意尝试其他选择,甚至将Grok添加到Azure中用于编程目的。
微软于周一为Frontier项目Copilot 365客户在网页版提供Excel和Word的智能体模式,并计划未来将其添加到桌面应用程序中。目前,微软仅向拥有Microsoft 365个人或家庭订阅的美国客户提供Copilot中的Office智能体功能。
Q&A
Q1:微软的"氛围工作"模式是什么功能?
A:微软的"氛围工作"模式是为在线Office套件添加的AI智能体功能,包括Word的"氛围写作"和Excel的数据分析功能。Word智能体可以利用现有文档组装报告和提案,检查草稿并提出改进建议;Excel智能体则能处理电子表格、分析数据、构建报告和可视化数据,用户只需输入简单的提示语即可完成这些任务。
Q2:微软Excel智能体的准确率如何?
A:根据微软官方数据,Excel智能体模式在SpreadsheetBench基准测试中的准确率为57.2%,明显低于人类平均71.3%的表现。微软产品副总裁解释称,他们不是为基准测试而优化,而是为解决真实工作中的复杂任务而设计,基准测试无法完全体现Excel的所有强大功能。
Q3:微软为什么开始使用Anthropic而不是OpenAI?
A:微软在新的Office智能体中使用了Anthropic而非OpenAI引擎,这是微软一周内第二次展现对Anthropic的青睐。这种变化表明微软正在远离OpenAI——尽管已向其投入超过100亿美元。微软展现出越来越愿意尝试其他AI选择的态度,甚至将Grok添加到Azure中用于编程目的。
好文章,需要你的鼓励
微软在Build开发者大会上发布了两款新文生图模型——MAI-Image-2.5与Flash版本,同时还推出了首个推理模型MAI-Thinking-1及多款语音、转录和代码模型,共七款新AI模型。根据Arena AI排行榜评测,MAI-Image-2.5在图像编辑能力上已超越谷歌Nano Banana 2,但仍位居OpenAI GPT-Image-2之后。新图像模型现已集成至PowerPoint、Foundry企业市场及OneDrive,主打精准编辑与专业级输出能力。
DRIFT方法通过数学等价关系,将多轮对话强化学习目标转化为带权重的监督学习,效率接近普通SFT,性能媲美在线强化学习。
Alphabet母公司谷歌完成了一笔创历史纪录的850亿美元股票发行。原计划首轮募资400亿美元,但因超额认购最终达450亿美元,伯克希尔·哈撒韦认购了其中100亿美元。所募资金将专项用于AI基础设施建设。此次融资成功对Anthropic等AI公司的IPO计划是积极信号,表明公共市场投资者对AI赛道仍保持强劲热情。未来五年全球AI支出承诺规模近8万亿美元,公共资本市场能否持续承接这一体量,是所有谋求上市的AI企业必须思考的核心问题。
RPT是Megagon Labs提出的提示词自动优化框架,通过诊断失败模式、维护历史记忆、纳入置信度校准,让AI像工程师一样系统地改进自己的"说明书"。