Microsoft 宣布成立了一个新的工程团队,CEO Satya Nadella 认为这个团队对于应对 AI 引发的软件开发流程和应用程序的重大变革至关重要。
在周一公开分享的一封信中,Nadella 向微软员工表示:"很明显,我们正在进入 AI 平台变革的下一个阶段。"
"2025 年将是以模型为核心的应用重塑所有应用类别的一年。与之前的任何平台变革相比,应用程序技术栈的每一层都将受到影响。这就像同时将 GUI、互联网服务器和云原生数据库引入应用程序技术栈。30 年的变革将在 3 年内完成!"
这位 CEO 认为,Microsoft 将"构建具有记忆、权限和行动空间的代理应用,这些应用将继承强大的模型能力。我们还将针对不同角色、业务流程和行业领域调整这些功能,以提升性能和安全性。此外,我们构建、部署和维护这些 AI 应用程序的方式也在发生根本性的变化,变得更具代理性。"
所谓"代理性"软件,指的是一类新兴的 AI 应用,它能够分析与特定业务流程或任务相关的数据,然后自主提出建议或采取行动。
Salesforce 已经开发出代理技术,据称可以"用自然语言自主处理销售咨询,回答问题,处理异议,并为销售人员安排会议"——这些都在 CRM 巨头自己的套件中完成。Salesforce 还表示,2025 年将不再招聘软件工程师。
代理 AI 可以跨不同供应商的应用程序工作。我们已经看到它被用于检测欺诈性金融交易的案例,它可以启动工作流程来拒绝可疑交易,并启动调查。
代理可以驱动工作流程是因为它通过 API 连接到多个应用程序。因此,检测到疑似欺诈会向其他应用程序发送指令,这些应用程序可能也会使用代理来处理传入的信息。
代理之间的通信和由此产生的行动被称为"代理工作流程"。理论上,大量繁琐工作都被推送到应用程序中处理,让人类可以专注于审查代理做出的决定和/或处理代理尚无法很好理解的复杂事务。
Nadella 认为构建人工智能代理应用和工作流程需要"一个全新的 AI 优先应用技术栈——包含新的 UI/UX 模式、用于构建代理的运行时、协调多个代理的能力,以及重新设计的管理和可观察性层。"
为此,Microsoft 成立了一个名为"CoreAI – 平台与工具"的工程组织。该团队由 Microsoft 开发者部门、AI 平台团队以及首席技术官办公室的一些核心团队组成。该团队的使命是"为我们的第一方和第三方客户构建端到端的 Copilot 和 AI 技术栈,以构建和运行 AI 应用程序和代理。"
该团队还将负责 GitHub Copilot,这反映了代理 AI 在分析现有代码库和开发活动时自动创建代码的潜力。
Nadella 表示:"我们内部的组织边界对我们的客户和竞争对手来说都毫无意义。"他最后指出:"在这个新阶段的成功将取决于拥有最好的 AI 平台、工具和基础设施。我们还有很多工作要做,前面有巨大的机遇,让我们一起期待构建下一个时代。"
好文章,需要你的鼓励
腾讯今日开源混元MT系列语言模型,专门针对翻译任务进行优化。该系列包含四个模型,其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练,并采用强化学习进行优化。在WMT25基准测试中,混元MT在31个语言对中的30个表现优于谷歌翻译,某些情况下得分高出65%,同时也超越了GPT-4.1和Claude 4 Sonnet等模型。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
今年是Frontiers Health十周年。在pharmaphorum播客的Frontiers Health限定系列中,网络编辑Nicole Raleigh采访了Startup Health总裁兼联合创始人Unity Stoakes。Stoakes在科技、科学和设计交汇领域深耕30多年,致力于变革全球健康。他认为,Frontiers Health通过精心选择的空间促进有意义的网络建设,利用网络效应推进创新力量,让企业家共同构建并带来改变,从而有益地影响全球人类福祉。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。