亚马逊云科技(AWS)作为云市场的先驱,通过提供组织运行基础设施和软件即服务所需的基础能力在市场中占据重要地位。近年来,这一基础能力正在不断扩展,并日益用于支持生成式AI。
在本周举行的2025年AWS纽约峰会上,这家云计算巨头宣布了一系列新的AI服务,旨在帮助组织将智能体AI的前景从概念验证(POC)推向实际应用部署。
这些发布重点关注智能体部署的基础架构需求,包括运行时执行、内存管理、安全控制以及将生产系统与开发原型区分开来的运营监控能力。
AWS纽约峰会关键发布内容
AWS在2025年纽约峰会上发布了以下关键内容:
Amazon Bedrock Agent Core:包含七项服务的基础架构套件,用于生产环境智能体部署,涵盖运行时、内存、身份验证、代码解释器、浏览器工具、网关和可观测性服务。
Amazon S3 Vectors:S3对象存储中的原生向量搜索能力,降低向量存储成本。
Nova Act:浏览器自动化智能体,在企业用例中实现90%以上的任务完成率。
Kiro IDE预览版:智能体驱动的开发环境现已推出预览版。
AWS Transform扩展:面向.NET、VMware和大型机现代化的AI驱动迁移能力。
AWS智能体市场:预构建智能体解决方案和工具的集中目录。
AWS智能体AI副总裁Swami Sivasubramanian在主题演讲中表示:"智能体在多个维度上都是一个重大变革,它们改变了软件构建、部署和运营的方式。"
Amazon Bedrock Agent Core:生产基础设施服务
Amazon Bedrock Agent Core的发布可能是AWS纽约峰会上最重要的产品新闻。该服务解决了将智能体从原型推向生产的根本挑战。这一新产品提供了七个不同的服务来应对生产环境智能体部署的挑战。
Sivasubramanian表示:"尽管有这些开源框架和协议,但让智能体投入生产仍然太困难了。有很多缺失的部分使得从笔记本电脑上的POC转向现实生产用例中的智能体变得非常困难。"
Amazon Bedrock Agent Core包含七个主要服务:
运行时:为动态智能体工作负载提供无服务器执行环境,支持最长8小时的会话,具备完整的会话隔离和内置检查点功能以从中断中恢复。
内存:实现分层内存管理,自动将短期交互整合为长期概念,支持协作智能体间的共享内存存储。
身份验证:提供具有细粒度控制的集中访问管理,与现有身份提供商(包括Cognito、Okta和Microsoft Entra ID)集成。
代码解释器:在沙箱环境中实现安全代码执行,支持多种编程语言、大文件处理和互联网访问。
浏览器工具:提供模型无关的网络交互能力,具备包括VM级隔离在内的企业级安全功能。
网关:将现有API、Lambda函数和服务转换为MCP兼容工具,为Salesforce、Slack和Jira等热门服务提供一键集成。
可观测性:通过CloudWatch仪表板提供工作流可视化和实时性能监控,以OpenTelemetry格式发出遥测数据。
Kiro IDE:重新定义软件开发
部署AI是一回事,使用AI驱动的工具构建软件则是另一回事。这就是Kiro IDE的价值所在。
Sivasubramanian解释说:"Kiro是一个新的智能体IDE,通过简化的开发者体验帮助您从概念到生产。"
该IDE解决了软件开发中的一个基本挑战:维护最新的规范。Kiro将自然语言需求转换为结构化的开发计划,识别依赖关系并将其与原始需求关联。
Kiro的一个关键功能是平台的智能体钩子系统,支持自动化工作流管理。
Sivasubramanian解释说:"钩子是事件驱动的自动化,在您保存、删除或创建文件时触发,或通过手动触发。钩子让您能够将手动、繁琐的任务转变为自动化工作流,比如在您更改代码后自动更新测试,或在您向应用程序添加新API端点时刷新文档。"
Nova Act:生产级浏览器自动化
对于许多IT用户来说,网页浏览器是他们与应用程序和服务交互的主要场所。
AWS的Nova Act解决了让AI智能体可靠地与网页浏览器交互的复杂挑战。
亚马逊AGI高级副总裁兼首席科学家Rohit Prasad在主题演讲中表示:"使用浏览器对我们来说似乎很轻松,但它需要持续的判断,在滚动、点击和填写表单时解释屏幕上的内容。这些操作虽然对你我来说很简单,但对AI来说仍然具有挑战性。"
主题演讲通过食品援助应用程序示例展示了Nova Act,其中智能体自动化了多个州政府网站上的表单填写。Prasad将Nova Act定位为迈向更强大AI系统的重要一步。
他说:"Nova Act让我们更接近通用人工智能,AI能够完成你我每天在电脑上执行的相同任务。"
好文章,需要你的鼓励
谷歌宣布为Chrome iOS版推出新功能,用户可在工作和个人谷歌账户间轻松切换,无需反复登录登出。该功能支持托管账户浏览,实现严格的数据分离,工作账户的标签页、历史记录和密码等本地数据与个人浏览完全隔离。随着企业不再提供公司手机,员工常需在个人设备上访问公司资源,此更新有助企业允许员工使用自选设备。
以色列理工学院和希伯来大学研究团队通过创新的"对调训练"实验,首次系统性地揭示了大语言模型认知偏见的真正来源。研究发现,AI模型的32种认知偏见主要源于预训练阶段而非微调阶段,这一发现颠覆了此前的认知,为开发更公正的AI系统指明了新方向。
OpenAI宣布其最新实验性推理大语言模型在2025年国际数学奥林匹克竞赛中达到金牌水平。尽管机器在数学推理、代码生成等认知任务上表现卓越,但这并不意味着它们具备真正的智能。机器缺乏知识迁移能力、情感理解、自我意识、内在动机等关键特征。它们无法像人类那样灵活适应新环境,也不具备主观体验和意识。真正的智能需要多方面综合能力,而非仅仅在特定任务上的优异表现。
约翰霍普金斯大学团队开发了VLV系统,仅用1000美元成本就能达到GPT-4o级别的AI图像描述效果。该系统巧妙组合现有的视觉编码器、扩散模型和语言模型,通过两阶段训练实现高质量图像描述。测试显示VLV在重建质量和人类评价方面与顶级商业模型相当,同时具备出色的空间理解和创意组合能力,为AI技术普及化提供了新思路。