随着企业加速部署基于智能体的AI系统,Token消耗量正以前所未有的速度增长,导致来自主要公有云服务商的月度账单急剧膨胀。
戴尔科技(Dell Technologies)瞄准这一"账单冲击"带来的市场机遇,在本周举办的客户大会上发布了一系列新硬件与软件产品,押注企业AI的未来将走向本地化部署、强化数据安全,并有效规避公有云的价格波动风险。
戴尔基础设施解决方案集团高级副总裁瓦伦·查布拉(Varun Chhabra)在大会前的媒体简报会上表示:"我们从客户身上观察到一个趋势——Token生成量的增速已经超过了Token单价的下降速度,这意味着客户的整体账单正在大幅上涨。"
为直观说明这一问题,戴尔客户解决方案集团高级副总裁乔恩·西格尔(Jon Siegal)举例指出,戴尔内部一名开发者曾在24小时内消耗了10亿个Token,单日云服务账单高达3400美元。
对此,戴尔推出了"戴尔桌面智能体AI"(Dell Deskside Agentic AI)——一个用于在本地构建、测试和运行AI智能体的本地化沙箱环境。该产品由英伟达NemoClaw提供支持,运行于高性能戴尔工作站之上,可支持300亿至万亿参数规模的模型,确保敏感数据始终留存于企业内部环境。
西格尔指出,与公有云API相比,完全采用本地部署方案并使用开源模型,企业在两年内可节省高达87%的支出,最快三个月即可实现投资回收。
"对于合适的应用场景而言,工作站正在成为真正意义上的'免费Token生成器',"西格尔解释道,"智能体AI最具成本效益的运行方式,就是尽可能贴近数据所在地。"
将前沿模型引入数据中心
长期以来,最强大的前沿模型几乎只能通过公有云访问。但戴尔正借助一系列重磅合作,打破这道壁垒,将先进模型引入本地或混合部署环境,以满足数据主权与性能需求。
戴尔宣布,谷歌Gemini系列模型现可通过谷歌分布式云(Google Distributed Cloud)在戴尔PowerEdge服务器上实现本地化部署。此外,戴尔还与Palantir合作,将其Foundry及AI平台引入本地部署场景;同时与SpaceX AI展开合作,将Grok的高级推理与多模态能力带入客户的本地或混合环境。
"我怎么强调这件事的重要性都不为过,"查布拉说道,"这些是迄今为止只能在云端使用的全球顶尖前沿模型……让客户在模型运行位置上拥有更多选择与灵活性,同时让这些模型更贴近企业自身的数据和业务负载。"
在大会主旨演讲环节,来自工业和制药领域的大型企业高管也相继登台,分享了各自在本地AI基础设施方面的实践经验。
礼来制药(Eli Lilly)执行副总裁兼首席信息与数字官迪奥戈·劳(Diogo Rau)介绍,公司依托一台配备逾1000块英伟达GPU的戴尔超级计算机,用于模拟复杂蛋白质相互作用以支撑药物研发,并以毫秒级速度对生产线进行数字化检测。霍尼韦尔(Honeywell)首席技术官苏雷什·文卡塔雷亚鲁(Suresh Venkatarayalu)则介绍了公司在工业现场直接部署AI服务器的实践——在实时决策至关重要的场景中推动自主化运营。
为支持密集型AI模型与传统业务负载的协同运行,戴尔还宣布对旗舰存储阵列PowerStore进行全面硬件与软件升级,推出PowerStore Elite。
PowerStore Elite的每秒输入输出操作次数(IOPS)、存储密度和吞吐量均达到上一代产品的三倍,采用全新E3驱动器,去除NVRAM缓存以最大化可用容量,并将戴尔的数据缩减保障比例提升至业界领先的6:1。
"问题不只是这个平台今天能做什么,而是这个决策一年后是否依然正确?负载发生变化时该怎么办?成本结构改变时又该如何应对?"查布拉指出,"这正是PowerStore Elite存在的意义。"
在计算层面,戴尔发布了第18代PowerEdge服务器,这也是该公司有史以来推出的产品线最广泛的单路服务器系列。新一代服务器相较上一代性能提升高达70%,服务器整合比例达到13:1,并将全系标配量子安全固件,为应对2027年后量子密码学合规要求提前布局。
针对AI网络架构的物理部署挑战,戴尔还推出了Dell PowerRack——将AI计算、网络与存储作为可扩展单元进行一体化设计;同时发布了Dell PowerCool CDU-C7000,这是一款紧凑型液冷分配单元,可为英伟达Rubin等高密度GPU提供超过220千瓦的液冷能力。
在安全产品方面,戴尔推出了PowerProtect One——一个统一的网络安全韧性平台,将PowerProtect Data Manager与Data Domain的功能整合至单一控制平面,可将部署时间缩短高达75%。
为帮助企业增强网络攻击抵御能力,戴尔还发布了CyberDetect——一款AI驱动的分析工具,可在字节级别对数据进行深度检测,识别勒索软件造成的数据损坏。该工具精确率高达99.99%,使IT团队在遭受攻击后能够明确判断哪些数据是干净的,将勒索软件恢复过程从"不确定"转变为"基于AI驱动的证据化保障"。
随着上述重大更新陆续推向市场,戴尔向企业IT领导者传递的信息十分明确:支撑可扩展、成本可预期的AI基础设施已经准备就绪,过去的财务逻辑已不再适用。
戴尔科技CEO迈克尔·戴尔(Michael Dell)在主旨演讲中表示:"AI不仅正在改变技术本身,更在改变技术的经济逻辑,使其向企业基础设施倾斜。现在正是时候,决定如何以最具成本效益的方式,满足长期所需的Token生成需求。"
Q&A
Q1:戴尔桌面智能体AI是什么?它能帮企业节省多少成本?
A:戴尔桌面智能体AI(Dell Deskside Agentic AI)是戴尔推出的一套本地化沙箱环境,专为在企业内部构建、测试和运行AI智能体而设计。它由英伟达NemoClaw提供支持,运行于高性能戴尔工作站上,可支持300亿至万亿参数规模的模型,确保敏感数据不离开企业内网。与公有云API相比,完全采用本地部署并使用开源模型,企业在两年内最多可节省87%的支出,最快三个月即可收回投资成本。
Q2:PowerStore Elite相比上一代产品有哪些提升?
A:PowerStore Elite是戴尔对旗舰存储阵列的全面升级版本。与上一代相比,其IOPS、存储密度和吞吐量均提升至三倍,采用全新E3驱动器,并移除了NVRAM缓存以最大化可用容量。此外,数据缩减保障比例提升至6:1,达到业界领先水平。该产品旨在同时支持密集型AI模型与传统企业业务负载的并行运行需求。
Q3:CyberDetect是如何帮助企业应对勒索软件攻击的?
A:CyberDetect是戴尔推出的一款AI驱动安全分析工具,可在字节级别对数据进行深度检测,精准识别勒索软件造成的数据损坏。其检测精确率高达99.99%,使IT团队在遭受攻击后能够清晰判断哪些数据是干净的、可以安全恢复的,从而将灾后恢复过程从依赖经验判断转变为基于AI驱动的证据化保障,大幅降低恢复工作的不确定性。
好文章,需要你的鼓励
当前关于AI究竟是在创造还是消灭就业岗位,各方信号相互矛盾。分析师和行业专家认为,现实情况更为复杂:因AI而消失的岗位很可能在其他地方重新出现,尤其是对具备AI实践经验的人才而言。虽然AI正在重塑劳动力市场,但并未消除对人才的需求。入门级岗位面临压力,但雇主的期望已转向要求候选人具备AI实际操作能力。领英预测,AI已在全球创造了130万个新岗位。
上海AI实验室等机构推出WildClawBench,含60个真实长周期任务,测试AI智能体在真实环境中使用工具完成复杂任务的能力,最强模型仅得62.2%。
初创公司Bolt Graphics推出Zeus GPU,声称路径追踪性能是英伟达RTX 5090的五倍,功耗仅250W,远低于5090的575W。Zeus基于台积电12nm工艺制造,预计2027年第四季度量产。该卡支持384GB内存及原生400GbE/800GbE以太网接口,同时面向高性能计算市场,FP64性能可达20 TFLOPs,电磁波仿真速度据称比英伟达B200快300倍。
武汉大学等机构揭示AI记忆系统的关键盲区:当新信息隐式推翻旧记忆时,当前最强模型总体正确率仅55%,并提出写入时主动裁决旧状态的改进方案。