亚马逊云科技(AWS)正在推出专门的GitHub组织,用于开展最具实验性的智能体AI工作。
周一,该公司推出了Strands Labs,亚马逊各团队将在此发布前沿项目,这些项目尚未准备好纳入公司Strands Agents SDK的生产就绪版本中。
首次发布包括两个项目:AI Functions,可以根据自然语言规范在运行时生成代码;以及Strands Robots,通过视觉-语言-动作(VLA)模型将大语言模型连接到物理硬件。
Strands Agents SDK首次在2025年5月开源,据AWS高级首席工程师Clare Liguori表示,该SDK已被下载1400万次。她同时负责Strands和Kiro AI编码助手的工作。该SDK现在支持Python和TypeScript,AWS内部也将其用于生产工作负载。
正是这种广泛应用促使Liguori的团队觉得需要在稳定的SDK发布版本和更实验性的工作之间建立界限。"我们希望确保SDK继续专注于生产就绪的解决方案,"Liguori告诉The New Stack。
Strands Labs为亚马逊内部团队和更广泛的Strands社区提供了一个迭代想法的场所,在这里"接口可能会发生很大变化",她补充说,而不会破坏核心SDK的API表面稳定性。
因此,虽然所有Strands Labs项目都会附带文档、功能代码和基本测试,但用户应该预期会有重大变更。
即使在Strands Labs推出之前,AWS已经在Strands SDK中推进了一些实验,但正如Liguori所承认的,如今这些实验可能会首先进入Strands Labs。其中一个就是关于智能体操控的实验。
AI Functions的创新应用
对开发者来说,这两个当前实验中最有趣的可能是AI Functions。这让开发者可以用自然语言定义Python函数应该做什么,同时设置作为防护栏的前置条件和后置条件。在运行时,编码智能体会生成实现代码。
由于智能体并非总是完美的,内置的确定性防护栏应该确保如果输出不正确,智能体会自我纠正并重新尝试。
Liguori使用收据解析器作为例子。收据格式变化很大,使确定性代码变得脆弱。使用AI Functions,开发者只需指定函数必须返回供应商名称、总价格和行项目,智能体就会处理边缘情况。
这里重要的是,从程序的角度来看,这看起来就像任何其他函数。"这不是一个单独的智能体,"Liguori说。"它是一个正常的函数",嵌入在其他确定性逻辑中。
从长远来看,团队将AI Functions视为一种反馈循环的路径:在生产中运行智能体函数数百万次,观察出现哪些代码路径,最终将结果折叠回不再需要模型调用的确定性代码。
Strands团队一直强调他们相信模型只会变得更好,所以智能体框架应该尽可能少地妨碍。在许多方面,AI Functions也是朝这个方向的推进,专注于模型根据需要编写代码的能力。
Strands Robots的机器人创新
Strands Robots解决了一个非常不同的问题。它将在本地硬件上运行的轻量级、低延迟VLA模型与云端的前沿大语言模型配对。毕竟,前沿模型的计算密集度太高,无法直接在机器人手臂上运行。但为了让机器人高效工作,你需要尽可能降低延迟。
AWS正在与Nvidia和Hugging Face合作这个项目,团队还发布了一个模拟环境,让开发者无需在桌面上放置物理机器人就能进行迭代。
Liguori说团队一直在与AWS客户进行概念验证工作,她指出亚马逊本身显然运营着非常庞大的仓库机器人车队。但她也看到了车载AI等应用场景,以及其他既需要特定领域的本地推理,又需要现代大语言模型能够提供的长期规划的边缘场景。
AWS显然不是唯一大力投资智能体框架的超大规模云提供商。Google在Cloud Next 2025上宣布的开源Agent Development Kit针对多智能体编排。Microsoft的Agent Framework是少数支持.NET的智能体框架之一,最近达到了Release Candidate状态。像CrewAI、LangGraph等初创公司已经是这个领域的主要参与者,个人智能体也因为围绕OpenClaw的炒作而兴起。
Q&A
Q1:Strands Labs是什么?它的作用是什么?
A:Strands Labs是AWS推出的专门GitHub组织,用于发布最具实验性的智能体AI项目。它为亚马逊内部团队和Strands社区提供了一个迭代创新想法的场所,这些项目的接口可能会频繁变化,但不会影响核心SDK的稳定性。
Q2:AI Functions如何工作?它解决了什么问题?
A:AI Functions允许开发者用自然语言定义Python函数的功能,并设置前置和后置条件作为防护栏。在运行时,编码智能体会生成具体实现。它主要解决了处理格式多变数据(如收据解析)时确定性代码过于脆弱的问题。
Q3:Strands Robots项目有什么特点?适用于哪些场景?
A:Strands Robots将本地硬件上的轻量级低延迟VLA模型与云端前沿大语言模型结合,解决了机器人既需要快速响应又需要复杂推理的问题。适用于仓库机器人、车载AI等需要本地推理和长期规划的边缘场景。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。