随着AI应用日益渗透到企业运营的各个层面,从通过先进医学影像增强患者护理,到驱动复杂的欺诈检测模型,甚至协助野生动物保护,一个关键瓶颈经常出现:数据存储。
在VentureBeat的Transform 2025大会上,Solidigm产品和营销负责人Greg Matson和PEAK:AIO首席执行官Roger Cummings与M12管理合伙人Michael Stewart探讨了存储技术创新如何推动医疗保健领域的企业AI用例。
MONAI框架是医学影像领域的突破性进展,使其构建更快、更安全、更稳定。存储技术的进步使研究人员能够在该框架基础上构建,快速迭代和创新。PEAK:AIO与Solidgm合作,整合了高能效、高性能和大容量存储,使MONAI能够在其IT环境的单个节点上存储超过200万个全身CT扫描。
"随着企业AI基础设施的快速发展,存储硬件越来越需要根据具体用例进行定制,这取决于它们在AI数据管道中的位置,"Matson说。"我们与MONAI讨论的用例类型,即边缘用例以及训练集群的数据供给,都很好地适用于超大容量固态存储解决方案,但实际的推理和模型训练需要不同的东西。这需要非常高性能、极高每秒I/O的SSD要求。对我们而言,RAG正在分化我们制造的产品类型以及我们必须与软件进行的集成类型。"
提升边缘AI推理性能
为了在边缘实现峰值性能,关键是将存储缩减到单个节点,以便将推理更接近数据。关键是消除内存瓶颈。这可以通过将内存作为AI基础设施的一部分来实现,以便与数据和元数据一起扩展。数据与计算的接近度显著提高了洞察的时间。
"你看到所有大规模部署,用于AI的大型绿地数据中心,使用非常特定的硬件设计,能够将数据尽可能接近GPU,"Matson说。"他们一直在构建具有超大容量固态存储的数据中心,以极高速度为GPU提供PB级存储的便捷访问。现在,同样的技术正在边缘和企业中的微观环境中发生。"
对于AI系统的购买者来说,确保通过在全固态上运行来获得系统的最大性能变得至关重要。这允许你引入大量数据,并在边缘的小型系统中实现令人难以置信的处理能力。
AI硬件的未来
"我们必须提供开放、可扩展、具有内存速度的解决方案,使用一些最新最好的技术来实现这一点,"Cummings说。"这是我们公司的目标,提供组织所需的开放性、速度和规模。我认为你会看到经济性也会与此匹配。"
对于整个训练和推理数据管道,以及推理本身,硬件需求将持续增长,无论是超高速SSD还是节能的超大容量解决方案。
"我认为它将进一步向超大容量方向发展,无论是几年后的1PB SSD,以极低功耗运行,基本上可以替代四倍数量的硬盘,还是接近内存速度的超高性能产品,"Matson说。"你会看到大型GPU供应商正在研究如何定义下一代存储架构,以便它能够非常紧密地帮助增强系统中的HBM。云计算中的通用SSD现在正在分化为容量和性能两个方向。在未来5到10年中,我们将在这两个方向上继续深化发展。"
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。