XCENA融资1.35亿美元开发计算内存控制器

AI基础设施初创公司XCENA宣布完成1.35亿美元B轮融资,由韩国Atinum Investment和IMM Investment领投,公司估值达5.7亿美元。XCENA由三星和SK海力士前员工于2022年创立,其旗舰产品MX1是一款计算内存控制器,集成最高2TB DRAM与数千个RISC-V架构CPU核心,可有效解决大语言模型KV缓存溢出导致的性能瓶颈,并支持Apache Spark等分析应用加速。公司计划采用三星4纳米工艺量产,预计2027年开始创收。

XCENA公司是一家专注于加速人工智能集群的内存设备初创企业,今日宣布已完成1.35亿美元融资。

本轮B轮融资由韩国基金Atinum Investment和IMM Investment领投。XCENA表示,此轮融资还获得了其他六家以上机构投资者的参与。公司目前估值为5.7亿美元。

XCENA成立于2022年,由三星电子和SK海力士的前员工创立,这两家公司是全球顶级的显卡内存供应商。该公司的旗舰产品是一款名为MX1的设备,被称为计算内存控制器。它专为加速AI推理工作负载中的数据管理任务而设计。

大语言模型使用一种称为KV缓存的数据结构来解析用户提示词。当KV缓存无法装入显卡的内置内存时,就必须转移到速度较慢的外部DRAM中,这会造成处理延迟。许多大语言模型使用的向量数据库也面临类似问题。

XCENA表示MX1能够解决这一挑战。该设备将最多2TB的DRAM与数千个中央处理器核心相结合。它可以容纳大语言模型的KV缓存和向量数据库,而不会出现传统内存设备所面临的性能问题。结果是推理性能得到提升。

该设备加速AI工作负载的另一种方式是减少重复计算的需求。许多大语言模型在每次用户请求后都会刷新其用于解析提示词的KV缓存。MX1使得在多个请求之间重用同一个KV缓存成为可能,从而降低处理开销。

该公司表示,这款芯片还可以加速Apache Spark等分析应用。此类工作负载会定期在运行它们的CPU和用于存储数据的内存之间移动数据。MX1的内存池和CPU核心之间的距离比标准服务器的组件更近,这减少了数据传输时间。

该设备的CPU核心基于开源的RISC-V架构。它们被组织成四核心集群,每个集群都有专用的L1缓存,这是一种高速内存。这些四核心集群又被组织成更大的集群,同样配备了集成内存池。

XCENA提供应用程序编程接口,使开发人员能够在不进行重大代码更改的情况下将其AI工作负载移植到MX1上。据该公司称,有更高级需求的客户可以使用第二套API进行底层性能优化。它还提供了一个仿真工具来简化软件可靠性测试。

该公司计划使用三星的4纳米芯片制造工艺来生产MX1。据TechCrunch报道,该公司将在今年年底前开始批量生产,并预计在2027年开始产生收入。

该公司将利用本轮融资所得资金开发新的计算内存产品。此外,它还计划加速市场推广工作,并与超大规模云服务商等关键行业参与者建立合作伙伴关系。

Q&A

Q1:XCENA的MX1计算内存控制器是什么?

A:MX1是XCENA公司开发的一款计算内存控制器设备,它将最多2TB的DRAM与数千个CPU核心相结合,专门用于加速AI推理工作负载中的数据管理任务,可以容纳大语言模型的KV缓存和向量数据库,解决传统内存设备的性能瓶颈问题。

Q2:MX1如何提升大语言模型的推理性能?

A:MX1通过两种方式提升性能:一是解决KV缓存和向量数据库无法装入显卡内置内存而转移到慢速外部DRAM造成的延迟问题;二是使得在多个请求之间重用同一个KV缓存成为可能,减少了许多大语言模型在每次用户请求后都要刷新KV缓存的重复计算开销。

Q3:XCENA公司什么时候开始量产MX1芯片?

A:根据报道,XCENA计划在2025年年底前开始批量生产MX1芯片,该芯片将使用三星的4纳米制造工艺生产,公司预计在2027年开始产生收入。

来源:SiliconANGLE

0赞

好文章,需要你的鼓励

2026

06/01

12:59

分享

点赞

邮件订阅