工作场所的AI智能体越来越能够检索信息、协调任务,甚至代表用户采取行动。但重要决策仍通常通过人类互动来完成。
随着智能体AI威胁颠覆SaaS市场,Zoom认为其优势在于能够捕获视频、电话和面对面会议中的互动,并将其自己的AI工具应用于这些信息。
"当我们审视AI在Zoom内部能为我们做什么以及如何改变工作时,它是将参与转化为行动,"临时首席产品官Jeff Smith在接受采访时说。
Zoom在2020年代初期因在新冠疫情期间连接远程工作者而声名鹊起。此后,它已扩展到视频和语音通话之外,转变为更广泛的工作场所平台,涵盖生产力、工作场所管理和员工参与工具——后者通过2023年收购Workvivo实现。
Zoom还通过其AI Companion在其产品中嵌入了AI功能;该助手内置于会议、聊天和其他工具中,可以总结对话、记录笔记并建议行动。Zoom表示,AI Companion的月活跃用户在一年内增长了两倍,但没有提供具体数字。
AI助手现在是第三次迭代,3.0版本于12月发布。Zoom还于本月早些时候发布了几项功能更新,在Custom AI Companion的名义下扩大了公司对AI智能体的雄心——这是一个每用户20美元的附加服务——提供新的无代码智能体构建器,让工作者更容易创建自己的智能体工作流程。
定制智能体有助于"个性化AI Companion与我交互和自动化我想要的事物的方式,"Smith说。AI伴侣可以扫描消息、突出趋势主题并标记未完成的工作承诺。
还可以将Zoom的Custom AI Companion智能体连接到第三方应用,包括Salesforce、ServiceNow、Google Drive、OneDrive等。Zoom表示,智能体可以检索信息、自动化任务并协调跨应用工作流程。
办公室工作者今天面临的最大挑战在于"孤立的数据和多个AI副驾驶/虚拟助手,"Metrigy总裁兼首席分析师Irwin Lazar说。Zoom日益增长的"从CRM和文档存储库等第三方来源提取数据的能力增加了AI Companion的实用性,"他说。
为了帮助捕获和保留互动,Zoom推出了My Notes,据Smith介绍,这是一个"通用的跨平台转录服务"。My Notes记录Zoom和其他协作应用以及面对面会议中的对话。该应用然后充当"第二大脑,"他说,"对我的所有互动有完美的记忆。"
另一个新增功能是名为AI Docs、Sheets和Slides的AI"画布"套件。这些旨在自动化将会议对话转换为"结构化文档、数据分析和演示内容"的过程。该工具可以帮助创建包含截止日期和个人职责的项目计划。
在会议之前,AI Companion还可以生成反映已完成任务和未完成工作的议程文档。"结果是我们能进行更丰富的互动——我们做更多的参与,减少孤立的个人工作,"Smith说。
"我可能有一个Microsoft或Google文档作为这些内容的最终状态,但我们的优势将在于至少获得一个可从中操作的过渡格式的信息。"
Zoom长期以来将自己定位为与各种工具集成的开放平台,这种方法现在扩展到AI智能体。公司正在采用Model Context Protocol (MCP)和Agent-to-Agent (A2A)等开放协议来连接外部AI系统。例如,通过A2A,可以直接从Google的Agentspace AI智能体安排Zoom视频会议,它与Zoom的AI Companion交互进行协调。
"我们在思考超越用户必须在孤立应用中交互的情况,而是在他们所在的地方迎接这些用户,并在这些服务中提供Zoom功能,"Smith说。"它在快速发展,我们正在跟上。"
随着AI智能体变得更擅长代表用户自主行动,人类互动可能会从Zoom等应用转向那些智能体。在这种情况下,协作软件应用面临成为底层基础设施而非主要界面的风险,这种转变最近引发了对更广泛的"SaaS末日"的担忧,这是在Anthropic的Claude Cowork等AI智能体工具推出之后出现的。
Zoom的回应是支持两种模式。用户可以通过第三方智能体访问其服务,但公司也旨在保持作为工作的主要界面。"有些功能我们希望用户始终能够访问,"Smith说,认为完全依赖外部智能体可能会限制功能。
另一个担忧是,随着企业采用来自Anthropic、Google、Microsoft和OpenAI等公司的AI助手,最终结果可能是更碎片化的界面环境。"某人可以在会议中或准备会议时使用Zoom AI Companion UI,同时在进行其他工作时使用Claude,"Lazar说。
但智能体和应用之间更大的互操作性可能会加强Zoom的地位。"这应该允许像Zoom这样的公司通过增加可集成到AI Companion中的数据源数量来继续提供价值,同时也允许Zoom将数据共享到其客户的其他模型中,"他说。
Q&A
Q1:Zoom的AI Companion是什么?能做什么?
A:AI Companion是Zoom内置的AI助手,集成在会议、聊天等工具中,可以总结对话、记录笔记、建议行动。最新的3.0版本还增加了Custom AI Companion功能,让用户通过无代码构建器创建个性化的智能体工作流程,月活跃用户在一年内增长了两倍。
Q2:Zoom如何应对AI智能体可能取代传统SaaS应用的威胁?
A:Zoom采取双重策略:既支持用户通过第三方智能体访问服务,也努力保持作为主要工作界面。公司通过开放协议如MCP和A2A连接外部AI系统,同时强调某些核心功能仍需要用户直接访问,避免完全依赖外部智能体带来的功能限制。
Q3:My Notes功能有什么特别之处?
A:My Notes是Zoom推出的通用跨平台转录服务,不仅记录Zoom会议,还能记录其他协作应用和面对面会议的对话。它充当"第二大脑",为用户的所有互动提供完美记忆,帮助捕获和保留重要的工作交流信息。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。