亚马逊云科技(AWS)作为云市场的先驱,通过提供组织运行基础设施和软件即服务所需的基础能力在市场中占据重要地位。近年来,这一基础能力正在不断扩展,并日益用于支持生成式AI。
在本周举行的2025年AWS纽约峰会上,这家云计算巨头宣布了一系列新的AI服务,旨在帮助组织将智能体AI的前景从概念验证(POC)推向实际应用部署。
这些发布重点关注智能体部署的基础架构需求,包括运行时执行、内存管理、安全控制以及将生产系统与开发原型区分开来的运营监控能力。
AWS纽约峰会关键发布内容
AWS在2025年纽约峰会上发布了以下关键内容:
Amazon Bedrock Agent Core:包含七项服务的基础架构套件,用于生产环境智能体部署,涵盖运行时、内存、身份验证、代码解释器、浏览器工具、网关和可观测性服务。
Amazon S3 Vectors:S3对象存储中的原生向量搜索能力,降低向量存储成本。
Nova Act:浏览器自动化智能体,在企业用例中实现90%以上的任务完成率。
Kiro IDE预览版:智能体驱动的开发环境现已推出预览版。
AWS Transform扩展:面向.NET、VMware和大型机现代化的AI驱动迁移能力。
AWS智能体市场:预构建智能体解决方案和工具的集中目录。
AWS智能体AI副总裁Swami Sivasubramanian在主题演讲中表示:"智能体在多个维度上都是一个重大变革,它们改变了软件构建、部署和运营的方式。"
Amazon Bedrock Agent Core:生产基础设施服务
Amazon Bedrock Agent Core的发布可能是AWS纽约峰会上最重要的产品新闻。该服务解决了将智能体从原型推向生产的根本挑战。这一新产品提供了七个不同的服务来应对生产环境智能体部署的挑战。
Sivasubramanian表示:"尽管有这些开源框架和协议,但让智能体投入生产仍然太困难了。有很多缺失的部分使得从笔记本电脑上的POC转向现实生产用例中的智能体变得非常困难。"
Amazon Bedrock Agent Core包含七个主要服务:
运行时:为动态智能体工作负载提供无服务器执行环境,支持最长8小时的会话,具备完整的会话隔离和内置检查点功能以从中断中恢复。
内存:实现分层内存管理,自动将短期交互整合为长期概念,支持协作智能体间的共享内存存储。
身份验证:提供具有细粒度控制的集中访问管理,与现有身份提供商(包括Cognito、Okta和Microsoft Entra ID)集成。
代码解释器:在沙箱环境中实现安全代码执行,支持多种编程语言、大文件处理和互联网访问。
浏览器工具:提供模型无关的网络交互能力,具备包括VM级隔离在内的企业级安全功能。
网关:将现有API、Lambda函数和服务转换为MCP兼容工具,为Salesforce、Slack和Jira等热门服务提供一键集成。
可观测性:通过CloudWatch仪表板提供工作流可视化和实时性能监控,以OpenTelemetry格式发出遥测数据。
Kiro IDE:重新定义软件开发
部署AI是一回事,使用AI驱动的工具构建软件则是另一回事。这就是Kiro IDE的价值所在。
Sivasubramanian解释说:"Kiro是一个新的智能体IDE,通过简化的开发者体验帮助您从概念到生产。"
该IDE解决了软件开发中的一个基本挑战:维护最新的规范。Kiro将自然语言需求转换为结构化的开发计划,识别依赖关系并将其与原始需求关联。
Kiro的一个关键功能是平台的智能体钩子系统,支持自动化工作流管理。
Sivasubramanian解释说:"钩子是事件驱动的自动化,在您保存、删除或创建文件时触发,或通过手动触发。钩子让您能够将手动、繁琐的任务转变为自动化工作流,比如在您更改代码后自动更新测试,或在您向应用程序添加新API端点时刷新文档。"
Nova Act:生产级浏览器自动化
对于许多IT用户来说,网页浏览器是他们与应用程序和服务交互的主要场所。
AWS的Nova Act解决了让AI智能体可靠地与网页浏览器交互的复杂挑战。
亚马逊AGI高级副总裁兼首席科学家Rohit Prasad在主题演讲中表示:"使用浏览器对我们来说似乎很轻松,但它需要持续的判断,在滚动、点击和填写表单时解释屏幕上的内容。这些操作虽然对你我来说很简单,但对AI来说仍然具有挑战性。"
主题演讲通过食品援助应用程序示例展示了Nova Act,其中智能体自动化了多个州政府网站上的表单填写。Prasad将Nova Act定位为迈向更强大AI系统的重要一步。
他说:"Nova Act让我们更接近通用人工智能,AI能够完成你我每天在电脑上执行的相同任务。"
好文章,需要你的鼓励
Instagram负责人莫塞里在接受采访时透露,平台正考虑引入长视频内容功能,尽管此前一直专注于短视频。他承认为了吸引优质内容,Instagram可能需要支持长视频格式。此外,Meta最近推出了"您的算法"功能,旨在让用户更好地控制信息流内容。莫塞里承诺未来将提供更多工具,让用户主动塑造个性化内容,但完整实现可能需要2-4年时间。
香港大学联合Adobe研究院提出PS-VAE技术,成功解决了AI无法同时具备图像理解和生成能力的难题。通过创新的两阶段训练策略,让AI既能准确理解图片语义,又能生成高质量图像,在图像编辑任务上性能提升近4倍,为统一视觉AI系统开辟新路径,在数字创作、教育、电商等领域具有广阔应用前景。
在信息爆炸的时代,AI实验室的研究员们常常需要面对海量的论文、专利文件、论坛发言等各种渠道的信息。传统的查找方式不仅费时费力,还容易遗漏关键内容。那么,有没有一种方式能让AI真正代替人工,完成从找资料到写出稿的全流程工作?
华中科技大学与马里兰大学研究团队开发出Sage评估框架,首次无需人工标注即可评估AI评判员可靠性。研究发现即使最先进的AI模型在评判任务中也存在严重不一致问题,近四分之一困难情况下无法保持稳定偏好。团队提出明确评判标准和专门微调等改进方法,为构建更可靠AI评估体系提供重要工具。