为了加速客户的AI管道和工作负载,戴尔已将其AI数据平台与Elasticsearch进行集成。同时,PowerEdge R7725服务器运行英伟达RTX Pro 6000 Blackwell GPU,并采用了英伟达的AI数据平台参考设计。
戴尔AI数据平台即将配备由戴尔和Elastic联合构建的非结构化数据引擎,该引擎具备向量搜索、语义检索和混合关键词搜索功能。它将利用GPU加速,为推理、分析和智能搜索提供对大规模非结构化数据集的实时、安全访问。这个非结构化数据引擎与其他工具协同工作,包括用于查询分散结构化数据的联邦SQL引擎、处理大规模数据转换的处理引擎,以及为快速AI就绪访问而设计的存储系统。
Elastic首席产品官Ken Exner表示:"通过将Elasticsearch向量数据库作为戴尔AI数据平台非结构化数据引擎的核心,Elastic将为交钥匙架构带来向量搜索和混合检索功能,在海量数据集上实现自然语言搜索、实时推理和智能资产发现。戴尔在企业市场的深厚根基使他们成为我们的天然合作伙伴,我们共同致力于帮助客户部署高性能、精确且可投入生产的AI。"
GPU加速搜索可以使用R7725服务器,戴尔表示该服务器"非常适合加速企业工作负载,涵盖视觉计算、数据分析和虚拟工作站"。通常在这类工作中,服务器将配备SSD存储——从1.6TB到30.72TB的NVMe,以及一系列SATA存储设备。SAS磁盘驱动器也可选配。这些服务器可以连接到戴尔的外部PowerScale(横向扩展NAS)和ObjectScale(S3兼容对象存储),以及它们的大容量结构化、半结构化和非结构化数据存储。
RTX Pro 6000是一款工作站GPU,提供3,753万亿次稀疏FP4计算性能,配备96GB GDDR7内存,内存带宽达1.6TBps。英伟达的AI数据平台参考设计将存储与其硬件和软件集成,使AI智能体能够提供实时响应。英伟达的组件包括Blackwell GPU、BlueField-3 DPU、Spectrum-X网络和英伟达AI Enterprise软件。软件部分包括NeMo Retriever和NIM微服务,以及AI-Q蓝图。
R7725以及戴尔的R770服务器可以运行英伟达AI推理模型,如用于智能体AI的最新Nemotron模型和用于物理AI的Cosmos世界基础模型。
所有这些使戴尔能够声称,此次AI数据平台的更新将"增强非结构化数据的摄取、转换、检索和计算性能,简化AI开发和部署——将海量数据集转化为可靠、高质量的实时智能,服务于生成式AI"。
这两项更新"将帮助支持企业的AI之旅,从数据摄取到推理,简化数据准备,统一跨孤岛的数据访问,并提供端到端的企业级性能"。
戴尔AI数据平台中的非结构化数据引擎将在今年晚些时候推出。配备英伟达RTX Pro 6000 GPU的戴尔PowerEdge R7725和R770服务器将在今年晚些时候在全球上市。
Q&A
Q1:戴尔AI数据平台的非结构化数据引擎有什么功能?
A:戴尔AI数据平台的非结构化数据引擎由戴尔和Elastic联合构建,具备向量搜索、语义检索和混合关键词搜索功能。它利用GPU加速,为推理、分析和智能搜索提供对大规模非结构化数据集的实时、安全访问,能够实现自然语言搜索、实时推理和智能资产发现。
Q2:RTX Pro 6000 GPU的性能参数如何?
A:RTX Pro 6000是一款工作站GPU,提供3,753万亿次稀疏FP4计算性能,配备96GB GDDR7内存,内存带宽达1.6TBps。这款GPU集成在戴尔PowerEdge R7725服务器中,适用于视觉计算、数据分析和虚拟工作站等加速企业工作负载。
Q3:戴尔AI数据平台何时可以使用?
A:戴尔AI数据平台中的非结构化数据引擎将在今年晚些时候推出。配备英伟达RTX Pro 6000 GPU的戴尔PowerEdge R7725和R770服务器也将在今年晚些时候在全球上市,为企业AI应用提供完整的硬件和软件解决方案。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试,专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现,即使是GPT-5和Claude Opus 4.1等最先进模型,在处理看似简单的格式要求时准确率也不超过80%,揭示了AI在实际应用中的重要局限性。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型,仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略,先进行全局布局分析再做局部精细识别,计算效率提升一个数量级。通过重新定义任务标准和构建高质量数据引擎,MinerU2.5能准确处理旋转表格、复杂公式、多语言文档等挑战性内容,为文档数字化提供了高效解决方案。