随着AI成本攀升,戴尔力推回归本地数据中心

随着企业加速部署智能体AI,云端token消耗量急剧上升,导致云服务账单大幅攀升。戴尔科技在其年度客户大会上推出一系列新硬件与软件产品,涵盖本地AI沙箱环境、第18代PowerEdge服务器、PowerStore Elite存储阵列及PowerProtect One统一网络安全平台,主张企业AI应在本地运行以降低成本、保障数据安全。戴尔称,相较公有云API,本地部署可在两年内节省高达87%的开支。

随着企业加速部署基于智能体的AI系统,Token消耗量正以前所未有的速度增长,导致来自主要公有云服务商的月度账单急剧膨胀。

戴尔科技(Dell Technologies)瞄准这一"账单冲击"带来的市场机遇,在本周举办的客户大会上发布了一系列新硬件与软件产品,押注企业AI的未来将走向本地化部署、强化数据安全,并有效规避公有云的价格波动风险。

戴尔基础设施解决方案集团高级副总裁瓦伦·查布拉(Varun Chhabra)在大会前的媒体简报会上表示:"我们从客户身上观察到一个趋势——Token生成量的增速已经超过了Token单价的下降速度,这意味着客户的整体账单正在大幅上涨。"

为直观说明这一问题,戴尔客户解决方案集团高级副总裁乔恩·西格尔(Jon Siegal)举例指出,戴尔内部一名开发者曾在24小时内消耗了10亿个Token,单日云服务账单高达3400美元。

对此,戴尔推出了"戴尔桌面智能体AI"(Dell Deskside Agentic AI)——一个用于在本地构建、测试和运行AI智能体的本地化沙箱环境。该产品由英伟达NemoClaw提供支持,运行于高性能戴尔工作站之上,可支持300亿至万亿参数规模的模型,确保敏感数据始终留存于企业内部环境。

西格尔指出,与公有云API相比,完全采用本地部署方案并使用开源模型,企业在两年内可节省高达87%的支出,最快三个月即可实现投资回收。

"对于合适的应用场景而言,工作站正在成为真正意义上的'免费Token生成器',"西格尔解释道,"智能体AI最具成本效益的运行方式,就是尽可能贴近数据所在地。"

将前沿模型引入数据中心

长期以来,最强大的前沿模型几乎只能通过公有云访问。但戴尔正借助一系列重磅合作,打破这道壁垒,将先进模型引入本地或混合部署环境,以满足数据主权与性能需求。

戴尔宣布,谷歌Gemini系列模型现可通过谷歌分布式云(Google Distributed Cloud)在戴尔PowerEdge服务器上实现本地化部署。此外,戴尔还与Palantir合作,将其Foundry及AI平台引入本地部署场景;同时与SpaceX AI展开合作,将Grok的高级推理与多模态能力带入客户的本地或混合环境。

"我怎么强调这件事的重要性都不为过,"查布拉说道,"这些是迄今为止只能在云端使用的全球顶尖前沿模型……让客户在模型运行位置上拥有更多选择与灵活性,同时让这些模型更贴近企业自身的数据和业务负载。"

在大会主旨演讲环节,来自工业和制药领域的大型企业高管也相继登台,分享了各自在本地AI基础设施方面的实践经验。

礼来制药(Eli Lilly)执行副总裁兼首席信息与数字官迪奥戈·劳(Diogo Rau)介绍,公司依托一台配备逾1000块英伟达GPU的戴尔超级计算机,用于模拟复杂蛋白质相互作用以支撑药物研发,并以毫秒级速度对生产线进行数字化检测。霍尼韦尔(Honeywell)首席技术官苏雷什·文卡塔雷亚鲁(Suresh Venkatarayalu)则介绍了公司在工业现场直接部署AI服务器的实践——在实时决策至关重要的场景中推动自主化运营。

为支持密集型AI模型与传统业务负载的协同运行,戴尔还宣布对旗舰存储阵列PowerStore进行全面硬件与软件升级,推出PowerStore Elite。

PowerStore Elite的每秒输入输出操作次数(IOPS)、存储密度和吞吐量均达到上一代产品的三倍,采用全新E3驱动器,去除NVRAM缓存以最大化可用容量,并将戴尔的数据缩减保障比例提升至业界领先的6:1。

"问题不只是这个平台今天能做什么,而是这个决策一年后是否依然正确?负载发生变化时该怎么办?成本结构改变时又该如何应对?"查布拉指出,"这正是PowerStore Elite存在的意义。"

在计算层面,戴尔发布了第18代PowerEdge服务器,这也是该公司有史以来推出的产品线最广泛的单路服务器系列。新一代服务器相较上一代性能提升高达70%,服务器整合比例达到13:1,并将全系标配量子安全固件,为应对2027年后量子密码学合规要求提前布局。

针对AI网络架构的物理部署挑战,戴尔还推出了Dell PowerRack——将AI计算、网络与存储作为可扩展单元进行一体化设计;同时发布了Dell PowerCool CDU-C7000,这是一款紧凑型液冷分配单元,可为英伟达Rubin等高密度GPU提供超过220千瓦的液冷能力。

在安全产品方面,戴尔推出了PowerProtect One——一个统一的网络安全韧性平台,将PowerProtect Data Manager与Data Domain的功能整合至单一控制平面,可将部署时间缩短高达75%。

为帮助企业增强网络攻击抵御能力,戴尔还发布了CyberDetect——一款AI驱动的分析工具,可在字节级别对数据进行深度检测,识别勒索软件造成的数据损坏。该工具精确率高达99.99%,使IT团队在遭受攻击后能够明确判断哪些数据是干净的,将勒索软件恢复过程从"不确定"转变为"基于AI驱动的证据化保障"。

随着上述重大更新陆续推向市场,戴尔向企业IT领导者传递的信息十分明确:支撑可扩展、成本可预期的AI基础设施已经准备就绪,过去的财务逻辑已不再适用。

戴尔科技CEO迈克尔·戴尔(Michael Dell)在主旨演讲中表示:"AI不仅正在改变技术本身,更在改变技术的经济逻辑,使其向企业基础设施倾斜。现在正是时候,决定如何以最具成本效益的方式,满足长期所需的Token生成需求。"

Q&A

Q1:戴尔桌面智能体AI是什么?它能帮企业节省多少成本?

A:戴尔桌面智能体AI(Dell Deskside Agentic AI)是戴尔推出的一套本地化沙箱环境,专为在企业内部构建、测试和运行AI智能体而设计。它由英伟达NemoClaw提供支持,运行于高性能戴尔工作站上,可支持300亿至万亿参数规模的模型,确保敏感数据不离开企业内网。与公有云API相比,完全采用本地部署并使用开源模型,企业在两年内最多可节省87%的支出,最快三个月即可收回投资成本。

Q2:PowerStore Elite相比上一代产品有哪些提升?

A:PowerStore Elite是戴尔对旗舰存储阵列的全面升级版本。与上一代相比,其IOPS、存储密度和吞吐量均提升至三倍,采用全新E3驱动器,并移除了NVRAM缓存以最大化可用容量。此外,数据缩减保障比例提升至6:1,达到业界领先水平。该产品旨在同时支持密集型AI模型与传统企业业务负载的并行运行需求。

Q3:CyberDetect是如何帮助企业应对勒索软件攻击的?

A:CyberDetect是戴尔推出的一款AI驱动安全分析工具,可在字节级别对数据进行深度检测,精准识别勒索软件造成的数据损坏。其检测精确率高达99.99%,使IT团队在遭受攻击后能够清晰判断哪些数据是干净的、可以安全恢复的,从而将灾后恢复过程从依赖经验判断转变为基于AI驱动的证据化保障,大幅降低恢复工作的不确定性。

来源:Computer Weekly

0赞

好文章,需要你的鼓励

2026

05/21

15:46

分享

点赞

邮件订阅