HPE正在使用其分解式Alletra MP X10000存储系统构建分布式边缘到核心数据中心的数据纤维架构。
这是基于Nvidia的AI工厂和智慧城市计划的一部分,包含第二代私有云AI产品。该计划扩展了基于Nvidia GPU的计算产品组合,推出了新的ProLiant XD685和NVL72服务器系统。科罗拉多州韦尔镇已部署HPE智能体智慧城市解决方案,帮助应对季节性游客人口增长,这也是HPE与Nvidia公共部门合作的成果。HPE表示其AI工厂方法提供集中化工作流程、可重复使用的资产、统一环境以及快速可预测的部署、安全治理和控制。数据纤维此前被称为HPE的Ezmeral数据纤维。
HPE现在宣布推出统一的分布式数据纤维,连接核心和边缘数据中心、主机托管站点以及公有云(AWS、Azure、GCP),具备全局命名空间、通用访问、多协议支持、自动分层、缓存和镜像功能。
HPE AI数据存储副总裁Gokul Sathiacama在简报会上表示:"数据不一致,存在孤岛问题,通过统一数据层和数据纤维软件,我们将多个数据源整合到单一联合命名空间下。"
"数据层由两个互补的不同产品组成。一个是Alletra Storage MP X10000,提供数据存储能力,另一个是数据纤维软件,提供数据管理能力。"
据介绍,该软件支持基于RDMA的S3协议,为GPU服务器系统和GPU(HBM)内存提供快速的Alletra Storage MP X10000对象数据传输。Sathiacama表示:"延迟降低高达80%,CPU利用率降低高达99%。这意味着计算基础设施的利用率更高,存储解决方案的处理能力更强。"
HPE实际上在8月份作为X10000 v2版本的一部分宣布了RDMA的S3支持。这是与Nvidia合作的成果,Nvidia正在普及其SDK。HPE现在能够为客户提供端到端系统。
数据纤维支持模型上下文协议(MCP)和智能体AI治理,确保AI智能体受到监管。
Sathiacama说:"一旦将这些数据源整合在一起,现在就能够提供更多关于谁在访问数据、哪些应用程序在使用数据的启发式信息,然后确保合适的人员拥有对数据的合适访问权限,因为数据非常敏感,特别是在AI领域。"
他补充说:"我们宣布通过GreenLake云平台为10000提供的云模型现在可以部署在本地。因此,需要空隙部署的客户能够在自己的数据中心进行部署,而不是通过我们的云平台访问和管理系统。"
私有云AI第二代现在也提供更小型化的版本,配备Nvidia的RTX 6000 Pro。HPE表示,这比上一代产品的性价比提高了三倍。第二代软件还提供数字化身,如果您想尝试不同类型的客户交互。
韦尔智能体智慧城市项目使用HPE的私有云AI和RTX 6000,HPE表示它通过508无障碍功能、安全、住房和数字礼宾服务改善公共服务,同时符合州和市隐私法规。该公司声称这可以在多个市政当局复制。
HPE推出了新的基于Nvidia的服务器硬件:
配备Nvidia B300 DLC的ProLiant XD695,用于AI训练工作负载
由HPE提供的Nvidia机架级GB300 NVL72,配备72个通过NVLink连接的Blackwell Ultra GPU
配备RTX PRO 6000和Azure Local首要版的ProLiant DL380 Gen 12,专为提升中小规模AI图形性能而构建
Nvidia-HPE公共部门合作伙伴关系正在犹他州安装主权AI工厂,构建如ORNL的Discovery和Lux等超级计算机,参与量子计算研究,HPE表示还有多个即将到来的与Nvidia的公共部门合作项目。
HPE混合云AI业务发展副总裁Robin Braun在简报会上表示:"IDC最近评估了私有AI基础设施系统供应商,将HPE在能力方面排名最高,在战略方面排名最靠前。这领先于戴尔、Supermicro以及IBM、思科和甲骨文。"
评论
HPE的数据纤维产品可与NetApp、Pure Storage和Qumulo以及Hammerspace的类似产品进行比较,其中NetApp是先驱。这些产品都更加成熟,支持多个公有云。它们最初是在生成式AI时期之前的混合云时代开发的,当时数据在覆盖本地和公有云环境的全局命名空间中可用。
生成式AI使数据纤维概念变得更加重要,因为AI处理可以在云端进行(通常如此),也可以在本地进行。这使得在IT基础设施中普遍提供数据可用性成为理所当然的事情,而不是设置自己的数据移动流程,这是显而易见的选择。我们预期HPE将积极发展其数据纤维,添加各种AI数据服务,与其他数据纤维供应商竞争。
Q&A
Q1:HPE的数据纤维架构有什么特点?
A:HPE的数据纤维架构是一个统一的分布式系统,连接核心和边缘数据中心、主机托管站点以及AWS、Azure、GCP等公有云,具备全局命名空间、通用访问、多协议支持、自动分层、缓存和镜像功能,能够将多个数据源整合到单一联合命名空间下。
Q2:Alletra MP X10000存储系统有什么性能优势?
A:Alletra MP X10000存储系统支持基于RDMA的S3协议,为GPU服务器系统和GPU内存提供快速的对象数据传输,能够降低延迟高达80%,减少CPU利用率高达99%,从而提高计算基础设施利用率和存储解决方案处理能力。
Q3:韦尔镇智慧城市项目解决了什么问题?
A:韦尔镇部署的HPE智能体智慧城市解决方案主要帮助应对季节性游客人口增长问题,通过508无障碍功能、安全、住房和数字礼宾服务改善公共服务,同时符合州和市隐私法规要求。
好文章,需要你的鼓励
如果美国有一家公司可以称得上是AI落地标杆,那么很多人大概率会提及Palantir。
南京大学LINK团队发布OmniVideoBench,这是首个专门评估AI音视频协同理解能力的测试基准。研究基于628个真实视频设计了1000道测试题,要求AI必须综合音频和视频信息才能回答。测试结果显示,即使最先进的Gemini-2.5-Pro准确率也仅58.90%,未达及格线,特别是在背景音乐理解方面表现最差,揭示了当前AI在复杂多模态推理方面的显著局限。
网络流量保护专家Cloudflare因其Access零信任平台发生故障向客户道歉,该故障导致包括OpenAI的ChatGPT、DownDetector和社交媒体平台X在内的多个面向公众的服务中断。故障始于英国时间上午11点20分左右,最初被描述为"内部服务降级"。Cloudflare后续确认故障根本原因是自动生成的配置文件超出预期大小并触发软件系统崩溃,强调这并非攻击所致。
中科大和上海创新院团队开发出RLFR技术,通过分析AI内部"思维流动"来优化推理训练。该技术不只看答案对错,而是评估整个推理过程质量,就像监控河流流向一样引导AI形成连贯逻辑。在数学推理等测试中显示显著提升,让AI推理过程更稳定可靠。这项开源技术为构建更智能可信的AI系统提供了新路径。