DDN公司正式加入英伟达AI数据平台实施商行列,推出了Enterprise AI HyperPOD——一款基于Infinia对象存储的即插即用系统。
这套一体化系统的计算硬件采用超微公司的AI优化服务器,搭载英伟达RTX PRO 6000 Blackwell GPU、BlueField-3 DPU以及AI Enterprise技术,包括NIM和NeMo Retriever微服务。HyperPOD将与Oracle云基础设施(OCI)和Google Managed Lustre集成,并支持即将推出的英伟达技术(如BlueField-4)。Infinia提供亚毫秒级延迟,支持每秒超过100,000次AI调用,专为英伟达H100、GB200和BlueField DPU构建。
DDN首席技术官Sven Oehme表示:"借助基于超微版本、由英伟达加速的DDN Enterprise AI HyperPOD,我们提供了一个一体化平台,能让GPU保持95%的繁忙状态,将基础设施转化为成果,并可从边缘部署扩展到主权AI工厂。"
DDN声称HyperPOD在1个机架单元内提供2PB容量,数据摄取速度提升22倍,推理的KV缓存阶段速度提升18倍。该系统提供四种配置规模:
XS版本(4个GPU,0.5+PB):用于推理和边缘AI的即时部署。
小型版本(32个GPU,1+PB):企业工作负载的经济高效AI扩展。
中型版本(64个GPU,3+PB):全规模企业AI工厂。
大型版本(256个GPU,12+PB):面向全球领导者的超大规模、主权级AI。
每个版本都预集成了超微硬件、英伟达AI Enterprise软件(包括用于分层KV缓存的新Dynamo引擎)以及DDN的Infinia v2.3软件。DDN表示,这"维持了近乎完美的GPU利用率"。
主权AI云服务提供商新加坡电信已采用DDN的AI HyperPOD。新加坡电信是新加坡电信集团,也是亚洲最大的通信集团之一。DDN建议其他电信公司、金融服务和制造业企业也可以使用其AI HyperPOD。
AI HyperPOD可通过超微公司立即获得一体化套装。
评论
似乎没有一家真正想要在企业AI市场销售的企业存储系统供应商能够忽视英伟达,因此供应商们纷纷支持英伟达最新的AI数据平台参考设计,如Hammerspace、HPE和DDN。我们预计所有现有的AI数据平台支持者都将加入其中。
这是一个潜在的淘金热,因为像新加坡电信这样的企业旨在提供AI大语言模型和智能体服务,作为主权AI MSP,需要建立GPU+网络+存储+软件基础设施来运行其AI服务。DDN凭借可扩展、一体化、融合基础设施AI服务设备向前迈进,让新加坡电信这样的客户可以即开即用。DDN可能会销售大量这样的设备。
Q&A
Q1:DDN Enterprise AI HyperPOD是什么产品?
A:这是DDN公司推出的一款基于英伟达平台的一体化企业AI系统,采用Infinia对象存储,搭载超微AI优化服务器和英伟达最新GPU技术,是即插即用的解决方案。
Q2:HyperPOD的性能表现如何?
A:HyperPOD能让GPU保持95%的繁忙状态,在1个机架单元内提供2PB容量,数据摄取速度提升22倍,推理的KV缓存阶段速度提升18倍,支持每秒超过100,000次AI调用。
Q3:HyperPOD提供哪些配置选择?
A:提供四种规模:XS版本(4个GPU,0.5+PB)适用于边缘AI,小型版本(32个GPU,1+PB)适用于企业工作负载,中型版本(64个GPU,3+PB)适用于企业AI工厂,大型版本(256个GPU,12+PB)适用于超大规模应用。
 0赞
0赞好文章,需要你的鼓励
 推荐文章
                    推荐文章
                  虽然ChatGPT等AI工具正在快速改变世界,但它们并非无所不知的神谕。ChatGPT擅长"令人信服的错误",经常提供有偏见、过时或完全错误的答案。在健康诊断、心理健康、紧急安全决策、个人财务规划、机密数据处理、违法行为、学术作弊、实时信息监控、赌博预测、法律文件起草和艺术创作等11个关键领域,用户应避免完全依赖ChatGPT,而应寻求专业人士帮助。
这项由哥伦比亚大学研究团队完成的突破性研究首次揭示了AI系统自我改进中的"效用-学习张力"问题:系统追求更好性能时会增加复杂度,但过高复杂度会破坏学习能力。研究建立了学习边界定理,提出双门控制机制,为AI安全自我改进提供了理论基础和实用方案,对确保AI技术长期安全发展具有重要意义。
微软重启三里岛核反应堆的协议确认了AI革命与能源现实主义的融合。亚马逊和谷歌也达成类似协议,共同押注核能为AI未来提供最可行的动力路径。到2030年代,数据中心用电量可能媲美大国水平。国际能源署预测全球电力需求到2050年将增长六倍。核电厂90%的容量因子使其独特适合数据中心需求。世界核协会估计,当前全球398GW核能产能必须在2050年前至少增长两倍。
这项由Reactive AI公司Adam Filipek主导的研究提出了反应式变换器(RxT),通过事件驱动架构和固定大小记忆系统,将传统聊天机器人的对话成本从平方级降为线性级,使长期对话成本降低99%以上,同时实现恒定响应速度。实验证明即使12M参数的RxT也显著优于22M传统模型,为高效对话AI开辟新路径。
 
             
                 
                     
                     
                    