d-Matrix推出IO加速器，宣称AI推理延迟将达到全新低点

d-Matrix在AI基础设施峰会上发布JetStream IO加速卡，这款定制PCI卡可提供400Gbps带宽和2微秒延迟。该产品基于FPGA技术，可与去年发布的Corsair推理加速平台配合使用，支持在服务器内部和多节点间扩展。CEO表示，随着行业重点从大模型训练转向商业化推理，该产品旨在解决内存计算瓶颈后的IO瓶颈问题。JetStream采用标准以太网协议，可直接部署到现有数据中心。

d-Matrix公司在AI基础设施峰会上发布了其AI加速战略的新组件——d-Matrix JetStream IO加速器，这是一款定制PCI IO卡，公司声称它能为AI推理提供超低延迟。

该加速器能够提供400Gbps带宽和2微秒延迟，并可在服务器内部和多个节点间进行扩展。这一产品旨在与该公司去年末发布的Corsair推理加速平台配合使用，该平台据称能够支持Llama3 8B模型每秒处理60,000个Token，每个Token处理时间仅需1毫秒。

CEO兼联合创始人Sid Sheth表示，公司成立于2019年，专门针对推理问题，即使当时整个科技和投资界都专注于训练和开发更大规模的大语言模型。他说："到2025年，特别是在Deepseek之后，叙述焦点真正转向了不仅仅是推理，而是商业可行的推理。如何在过去10年大规模资本支出投资上获得投资回报。"

这归结为两个关键问题，首先是"内存和计算瓶颈"，公司试图通过Corsair平台解决这一问题。上个月，该公司又推出了3DIMC技术来堆叠LPDDR5和改良的SRAM，这项技术将应用于即将推出的Raptor平台。

Sheth指出，随着向推理的转变，用户明显需要"与应用程序进行极快的交互"。但仅从超快内存中运行模型存在挑战，他说："我们在单服务器的快速内存容量上受到限制。"

这意味着必须解决IO瓶颈。"既然我们已经解决了内存和计算瓶颈，我们如何将单节点解决方案扩展出去，以便获得更多超快内存的访问权限，同时解决IO瓶颈。"

Sheth表示，他们研究了英伟达和博通等公司的产品，"结论是市场上没有产品具有我们寻找的那种延迟优势。"

这款基于FPGA的四分之三长度卡将与服务器内的Corsair设备并行工作。他展示了一张架构图，显示JetStream与四个Corsair设备并行，整个五件套连接到PCIe交换机，再连接到其他节点。

这一切都将在节点内扩展，他说："然后通过机架顶部交换机，我们可以将其连接到spine交换机，这是以太网交换机的最上层。通过这种方式，我们能够在多个机架间扩展这一解决方案。"

"这不是新芯片。这是FPGA，"他解释道。"我们与外部合作伙伴开发了所有IP，然后这些IP被整合到另一个合作伙伴的FPGA中。"

在计算加速方面，Corsair之后将推出几周前发布的Raptor产品，未来产品将整合堆叠内存技术。

同时，在IO方面，JetStream技术将构建到芯片组中，使用SUE/UA Link，并在时机成熟时整合光学IO，"当协同封装光学技术准备就绪时。"

产品副总裁Sree Ganesan补充说，他们一直打算将Corsair跨节点扩展，这正是潜在通信开销真正开始显现的地方。

"因此，我们必须对跨多节点扩展做些什么，以构建更大的模型，但同时不能损失Corsair带来的延迟优势。"

她表示，JetStream符合当前标准，客户可以即插即用到现有数据中心。"它基本上使用标准以太网进行通信，使用以太网协议的最小子集来实际使用这些交换机，只需标准的机架顶部以太网交换机就能连接多个机架。"

Q&A

Q1：d-Matrix JetStream IO加速器有什么特点？

A：d-Matrix JetStream是一款定制PCI IO卡，能够提供400Gbps带宽和2微秒超低延迟，专为AI推理设计。它可以在服务器内部和多个节点间进行扩展，解决AI推理中的IO瓶颈问题。

Q2：JetStream如何与现有系统集成？

A：JetStream基于FPGA技术，是四分之三长度卡，可与Corsair推理加速平台配合使用。它符合当前标准，支持即插即用，使用标准以太网协议，可直接集成到现有数据中心的标准机架顶部以太网交换机中。

Q3：d-Matrix为什么要开发这款IO加速器？

A：d-Matrix发现在AI推理应用中存在两个关键瓶颈：内存计算瓶颈和IO瓶颈。在通过Corsair平台解决了内存计算瓶颈后，公司需要解决IO瓶颈来实现跨节点扩展，获得更多快速内存访问权限，满足用户对极快交互的需求。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

d-Matrix推出IO加速器，宣称AI推理延迟将达到全新低点

来源：BLOCKS & FILES

2025

09/09

08:00

分享

点赞

数智惠闽企，展车进福州｜华为坤灵中国行2025·福建站成功举办，推动闽企智能化发展新征程

AI时代的影像实验：记录你眼中的“变化”

大象转身，亦或重塑大象：Unity团结引擎的“中国本土”进化

无万卡，不VLA：元戎启行与阿里云的“想法”和“解法”

AI爬虫让“价格战”变成“算法战”，利润正在被看不见的流量吞噬 AI 爬虫程序流量在短短一年内暴增 300%

做好可持续数字化转型的“必答题”

SUSE Linux Enterprise Server (SLES) 16全新发布：AI赋能，智领企业管理

SAP商业AI获乌镇峰会精品案例奖，助推中国企业实现确定性增长

专访｜Cloudera致力于打造AI时代的企业级“数据操作系统”

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

SAP TechEd柏林观察：企业AI如何发挥飞轮效应?

CIO策略观察——软件测试：从传统困局到 AI 无人测试转型

Vidu推出参考图转图功能，用生成式AI重塑摄影创作

SiFive推出面向AI设备的全新处理器核心设计

神经形态计算与边缘AI的未来发展

CIO未来职业发展的五个关键策略

IDC发布乐观AI支出预测：2029年将达1.3万亿美元

宏碁Aspire 14 AI：500美元实现专业级AI性能

博通获得100亿美元AI芯片新订单，股价创历史新高

哥伦比亚大学尝试用AI缓解学生矛盾冲突

AI让秋季公路旅行规划变得轻松简单

IT服务管理选购指南：21款顶级ITSM工具推荐

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: