XCENA公司是一家专注于加速人工智能集群的内存设备初创企业,今日宣布已完成1.35亿美元融资。
本轮B轮融资由韩国基金Atinum Investment和IMM Investment领投。XCENA表示,此轮融资还获得了其他六家以上机构投资者的参与。公司目前估值为5.7亿美元。
XCENA成立于2022年,由三星电子和SK海力士的前员工创立,这两家公司是全球顶级的显卡内存供应商。该公司的旗舰产品是一款名为MX1的设备,被称为计算内存控制器。它专为加速AI推理工作负载中的数据管理任务而设计。
大语言模型使用一种称为KV缓存的数据结构来解析用户提示词。当KV缓存无法装入显卡的内置内存时,就必须转移到速度较慢的外部DRAM中,这会造成处理延迟。许多大语言模型使用的向量数据库也面临类似问题。
XCENA表示MX1能够解决这一挑战。该设备将最多2TB的DRAM与数千个中央处理器核心相结合。它可以容纳大语言模型的KV缓存和向量数据库,而不会出现传统内存设备所面临的性能问题。结果是推理性能得到提升。
该设备加速AI工作负载的另一种方式是减少重复计算的需求。许多大语言模型在每次用户请求后都会刷新其用于解析提示词的KV缓存。MX1使得在多个请求之间重用同一个KV缓存成为可能,从而降低处理开销。
该公司表示,这款芯片还可以加速Apache Spark等分析应用。此类工作负载会定期在运行它们的CPU和用于存储数据的内存之间移动数据。MX1的内存池和CPU核心之间的距离比标准服务器的组件更近,这减少了数据传输时间。
该设备的CPU核心基于开源的RISC-V架构。它们被组织成四核心集群,每个集群都有专用的L1缓存,这是一种高速内存。这些四核心集群又被组织成更大的集群,同样配备了集成内存池。
XCENA提供应用程序编程接口,使开发人员能够在不进行重大代码更改的情况下将其AI工作负载移植到MX1上。据该公司称,有更高级需求的客户可以使用第二套API进行底层性能优化。它还提供了一个仿真工具来简化软件可靠性测试。
该公司计划使用三星的4纳米芯片制造工艺来生产MX1。据TechCrunch报道,该公司将在今年年底前开始批量生产,并预计在2027年开始产生收入。
该公司将利用本轮融资所得资金开发新的计算内存产品。此外,它还计划加速市场推广工作,并与超大规模云服务商等关键行业参与者建立合作伙伴关系。
Q&A
Q1:XCENA的MX1计算内存控制器是什么?
A:MX1是XCENA公司开发的一款计算内存控制器设备,它将最多2TB的DRAM与数千个CPU核心相结合,专门用于加速AI推理工作负载中的数据管理任务,可以容纳大语言模型的KV缓存和向量数据库,解决传统内存设备的性能瓶颈问题。
Q2:MX1如何提升大语言模型的推理性能?
A:MX1通过两种方式提升性能:一是解决KV缓存和向量数据库无法装入显卡内置内存而转移到慢速外部DRAM造成的延迟问题;二是使得在多个请求之间重用同一个KV缓存成为可能,减少了许多大语言模型在每次用户请求后都要刷新KV缓存的重复计算开销。
Q3:XCENA公司什么时候开始量产MX1芯片?
A:根据报道,XCENA计划在2025年年底前开始批量生产MX1芯片,该芯片将使用三星的4纳米制造工艺生产,公司预计在2027年开始产生收入。
好文章,需要你的鼓励
本周早些时候,苹果推出了即将发布的26.6更新的首个测试版,现在公司已发布公开测试版本,包括iPadOS 26.6、tvOS 26.6等。距离苹果揭晓iOS 27等重大软件更新不到两周时间。目前26.6更新改动较少,仅发现在达到上限后屏蔽联系人时会出现提醒。苹果将于6月8日WWDC主题演讲中发布iOS 27等新系统。
多伦多大学与Adobe联合提出DLA模块,让多模态大语言模型与扩散模型协同工作,有效解决AI图片生成中的"复印机"问题,同时提升复杂指令的跨模态理解能力。
这款支持Matter认证的Edison智能灯泡目前在亚马逊Prime会员专属折扣活动中以超低价格出售,四只装套装平均每只不足8美元。Matter认证意味着该灯泡可与主流智能家居平台无缝兼容,适合正在构建或扩展智能家居系统的用户。此次折扣为Prime会员专属优惠,有意购买的用户可关注活动时效。
这项由字节跳动Seed与北京大学联合发表的研究(arXiv:2605.26895)揭示:大语言模型归一化层中参数量不足万分之一的缩放向量,对训练效率有显著影响,并提出了系统性的改进策略。