过去十年间,数据库行业经历了一场静悄悄的革命。
传统数据库需要管理员预置固定容量,包括计算和存储资源。即使在云环境中使用数据库即服务选项,组织本质上仍在为大部分时间处于闲置状态但能处理峰值负载的服务器容量付费。无服务器数据库颠覆了这一模式,它们根据实际需求自动扩展计算资源,并且只按实际使用量收费。
亚马逊云科技(AWS)十多年前通过DynamoDB率先推出了这种方法,并通过Aurora Serverless将其扩展到关系型数据库。现在,AWS正在通过Amazon DocumentDB Serverless的全面可用性,在其数据库产品组合的无服务器转型中迈出下一步。这为MongoDB兼容的文档数据库带来了自动扩展功能。
这一时机反映了应用程序消费数据库资源方式的根本性转变,特别是随着AI智能体的兴起。无服务器模式非常适合不可预测的需求场景,这正是智能体AI工作负载的行为特征。
AWS数据库副总裁Ganapathy Krishnamoorthy在接受VentureBeat采访时表示:"我们看到更多的智能体AI工作负载属于弹性且不太可预测的类型,所以智能体和无服务器模式确实是相辅相成的。"
当我们分析传统预置模式的工作原理时,无服务器数据库的经济优势变得令人信服。组织通常为峰值负载预置数据库容量,然后无论实际使用情况如何都要全天候为该容量付费。这意味着在非高峰时段、周末和季节性低谷期间都要为闲置资源付费。
Krishnamoorthy解释说:"如果您的工作负载需求实际上更具动态性或不太可预测,那么无服务器模式最合适,因为它为您提供容量和扩展空间,而无需始终为峰值付费。"
AWS声称,对于可变工作负载,Amazon DocumentDB Serverless相比传统预置数据库可以降低高达90%的成本。节省的成本来自于自动扩展功能,能够实时将容量与实际需求匹配。
然而,无服务器数据库的一个潜在风险可能是成本确定性。使用数据库即服务选项时,组织通常为"T恤尺寸"式的小型、中型或大型数据库配置支付固定成本。而无服务器模式没有相同的具体成本结构。
Krishnamoorthy指出,AWS已经通过最小和最大阈值为无服务器数据库实施了成本防护概念,防止费用失控。
DocumentDB是AWS的托管文档数据库服务,具有MongoDB API兼容性。与将数据存储在固定表格中的关系型数据库不同,文档数据库将信息存储为JSON文档。这使它们非常适合需要灵活数据结构的应用程序。
该服务处理常见用例,包括存储玩家档案详情的游戏应用程序、管理具有不同属性产品目录的电商平台以及内容管理系统。
MongoDB兼容性为当前运行MongoDB的组织创建了迁移路径。从竞争角度来看,MongoDB可以在任何云上运行,而Amazon DocumentDB只能在AWS上使用。
供应商锁定的风险可能是一个关注点,但AWS正在尝试以不同方式解决这个问题。一种方式是启用联合查询功能。Krishnamoorthy指出,可以使用AWS数据库查询可能在其他云提供商中的数据。
AI智能体为数据库管理员带来了独特挑战,因为它们的资源消耗模式难以预测。与通常具有相对稳定流量模式的传统Web应用程序不同,智能体可能触发管理员无法预测的级联数据库交互。
传统文档数据库要求管理员为峰值容量进行预置,这在安静期间留下闲置资源。对于AI智能体,这些峰值可能是突然且巨大的。无服务器方法通过根据实际需求而非预测容量需求自动扩展计算资源来消除这种猜测。
除了作为文档数据库之外,Krishnamoorthy还指出Amazon DocumentDB Serverless将支持并与广泛用于使AI工具能够处理数据的MCP(模型上下文协议)配合使用。
MCP的核心基础是一组JSON API。作为基于JSON的数据库,这可以使Amazon DocumentDB为开发人员提供更熟悉的使用体验。
虽然成本降低成为头条新闻,但无服务器的运营优势可能对企业采用更为重要。无服务器消除了容量规划的需要,这是数据库管理中最耗时且容易出错的方面之一。
Krishnamoorthy说:"无服务器实际上可以恰好扩展以满足您的需求。第二点是它实际上减少了您的运营负担,因为您实际上不需要进行容量规划。"
随着组织扩展其AI计划,这种运营简化变得更有价值。系统自动处理扩展,而不是数据库管理员根据智能体使用模式不断调整容量。这释放了团队专注于应用程序开发的精力。
对于希望在AI领域领先的企业来说,这一消息意味着AWS中的文档数据库现在可以与不可预测的智能体工作负载无缝扩展,同时降低运营复杂性和基础设施成本。无服务器模式为AI实验提供了可以自动扩展而无需前期容量规划的基础。
对于计划稍后采用AI的企业来说,这意味着无服务器架构正在成为AI就绪数据库基础设施的基准期望。等待采用无服务器文档数据库可能会使组织在最终部署AI智能体和其他受益于自动扩展的动态工作负载时处于竞争劣势。
Q&A
Q1:Amazon DocumentDB Serverless与传统数据库有什么区别?
A:传统数据库需要预置固定容量并全天候付费,即使大部分时间处于闲置状态。Amazon DocumentDB Serverless根据实际需求自动扩展计算资源,只按实际使用量收费,可为可变工作负载降低高达90%的成本。
Q2:为什么无服务器数据库特别适合AI智能体应用?
A:AI智能体的资源消耗模式难以预测,可能触发突然且巨大的级联数据库交互。无服务器模式能够根据实际需求自动扩展,消除了容量规划的猜测,非常适合智能体这种弹性且不可预测的工作负载。
Q3:Amazon DocumentDB有什么技术特点和应用场景?
A:Amazon DocumentDB是AWS的托管文档数据库服务,具有MongoDB API兼容性,将信息存储为JSON文档,适合需要灵活数据结构的应用。常见用例包括游戏应用的玩家档案存储、电商平台的产品目录管理和内容管理系统。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。