d-Matrix声称3D堆叠内存将突破AI推理瓶颈

数字内存计算芯片初创公司d-Matrix推出3D堆叠内存技术，声称相比当前行业标准HBM4，该技术可将AI模型运行速度提升10倍，能耗降低90%。该公司成立于2019年，采用LPDDR5内存配合数字内存计算硬件，通过改进的SRAM单元直接在内存阵列中执行计算。首款3DIMC芯片Pavehawk已在实验室投入运行，下一代架构Raptor将整合该技术。

数字内存计算芯片初创公司d-Matrix推出了新的3D堆叠内存技术(3DIMC)，承诺相比当前行业标准HBM4，能够将AI模型运行速度提升10倍，并将能耗降低高达90%。

该公司成立于2019年，由CEO Sid Sheth和CTO Sudeep Bhoja创立，两人此前都是高速互连开发商Inphi Corp的高管，该公司于2020年被Marvell以100亿美元收购。d-Matrix的目标是开发内存计算芯片级技术，以比传统DRAM带宽更低的成本为AI推理提供比高带宽内存(HBM)更多的内存。

Sheth在LinkedIn上发布消息称："我们相信AI推理的未来不仅取决于重新思考计算，更要重新思考内存本身。我们正在为新的内存-计算范式(3DIMC)铺平道路，这使我们的DIMC平台能够继续扩展并突破内存墙，而不会牺牲内存容量和带宽。通过三维堆叠内存并将其与计算更紧密地集成，我们大幅降低了延迟，提高了带宽，并释放了新的效率增益。"

d-Matrix技术使用LPDDR5内存，通过中介层将数字内存计算(DIMC)硬件连接到内存。DIMC引擎使用经过修改的SRAM单元，增加了执行乘法运算的晶体管，直接在内存阵列内执行计算。该技术采用芯片小片架构构建，针对Transformer模型中使用的矩阵-向量乘法运算进行了优化。Apollo计算核心包含8个DIMC单元，可并行执行64×64矩阵乘法，支持多种数值格式(如INT8、INT4和块浮点)。

Bhoja在博客文章中写道："我们正在将最先进的3D堆叠数字内存计算实现——3DIMC引入我们的路线图。我们首个支持3DIMC的硅芯片d-Matrix Pavehawk经过2年多的开发，现已在我们的实验室中投入运行。"

"我们预计3DIMC将使AI推理工作负载的内存带宽和容量提升几个数量级，确保随着新模型和应用的出现，服务提供商和企业能够高效、经济地大规模运行它们。"

"我们的下一代架构Raptor将把3DIMC集成到其设计中——从我们和客户在Pavehawk上的测试中学到的经验中受益。通过垂直堆叠内存并与计算芯片小片紧密集成，Raptor有望突破内存墙，释放全新水平的性能和总体拥有成本。"

"我们的目标是在运行AI推理工作负载时，使用3DIMC相比HBM4实现10倍更好的内存带宽和10倍更好的能效。这些不是渐进式改进——而是重新定义大规模推理可能性的阶跃函数式改进。"

附注：d-Matrix已完成两轮融资。2022年A轮融资筹集了4400万美元，2023年B轮融资筹集了1.1亿美元，总计1.54亿美元。该公司与服务器可组合性供应商GigaIO建立了合作伙伴关系。

Q&A

Q1：d-Matrix的3DIMC技术是什么？有什么优势？

A：3DIMC是d-Matrix开发的3D堆叠数字内存计算技术。该技术通过三维堆叠内存并与计算紧密集成，相比当前行业标准HBM4，能够将AI模型运行速度提升10倍，将能耗降低高达90%，同时大幅降低延迟并提高带宽。

Q2：d-Matrix的DIMC引擎是如何工作的？

A：DIMC引擎使用经过修改的SRAM单元，增加了执行乘法运算的晶体管，能够直接在内存阵列内执行计算。Apollo计算核心包含8个DIMC单元，可并行执行64×64矩阵乘法，支持INT8、INT4和块浮点等多种数值格式，专门针对Transformer模型优化。

Q3：d-Matrix公司的发展现状如何？

A：d-Matrix成立于2019年，已完成两轮融资共1.54亿美元。首个3DIMC芯片Pavehawk已在实验室投入运行，下一代架构Raptor正在开发中。公司与服务器供应商GigaIO建立了合作伙伴关系，目标是为AI推理提供更高效的内存解决方案。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

d-Matrix声称3D堆叠内存将突破AI推理瓶颈

来源：BLOCKS & FILES

2025

09/03

08:07

分享

点赞

AI赋能农业：科技如何改造传统乡村世界

Disrupt创业大赛六大媒体娱乐初创企业盘点

OpenAI计划第一季度推出全新音频生成模型

Fizz社交应用CEO谈论匿名社交为何有效

Apple Health应用的强大功能及使用技巧大揭秘

VSCO Capture新增视频拍摄功能迎接新年到来

Instagram负责人：AI内容泛滥，为真实媒体加指纹比识别虚假内容更实用

大学辍学成为初创企业创始人最抢手标签

微软如何满足客户需求：安排比尔·盖茨接见的巧妙方法

路创Aurora调光器完美解决飞利浦Hue智能灯泡最大痛点

Fizz CEO解析匿名社交如何俘获Z世代用户

教育科技创业者分享社群构建与用户留存策略

高盛警告：AI泡沫可能冲击数据中心繁荣

网络安全专业人员需具备AI技能需求激增

OpenAI承认长时间对话可能绕过AI安全防护措施

谷歌公布90亿美元弗吉尼亚州数据中心投资计划

戴尔AI业务推动营收创历史新高

甲骨文创始人拨款1.18亿英镑资助牛津AI疫苗研发

OpenAI计划在印度建设超1GW级数据中心

智能体已重塑商业领导层决策制定过程

AI能做一些工作任务，但无法完全替代人类工作岗位

Runway为何瞄准机器人行业寻求新增长点

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: