内存价格正在暴跌,内存公司股价崩盘,起因是谷歌研究院发布了一项突破性技术,能够大幅减少AI处理所需的内存。
AI不仅以高计算要求著称,内存需求同样巨大。处理大语言模型和执行推理需要大量内存,这导致市场上可用内存严重短缺,因为AI数据中心吞噬了所有供应。
谷歌研究院推出了TurboQuant,这是一种针对大语言模型和向量搜索引擎的压缩算法,可能大幅降低AI内存需求。据谷歌表示,TurboQuant通过将AI模型的内存使用量减少6倍,缓解了主要的推理内存瓶颈,在相同GPU数量下速度提升8倍,同时保持零精度损失,"重新定义AI效率"。
谷歌在X平台宣布TurboQuant后,社交网络立即炸锅。人们开始下载早期版本代码并进行测试,发现它确实兑现了承诺。
大型内存芯片制造商股价下跌,美光科技股价在两周内暴跌超过100美元,从3月中旬的467美元跌至几天后的366美元,尽管公平地说,整个市场同时都在震荡。
这也对内存定价产生了重大影响。台湾经济日报报道,DDR5内存条价格在过去几周内下跌15%至30%,这是内存价格一段时间以来的首次下降。
市场上一次见证如此震荡还是中国的DeepSeek,但人们很快对其效力产生怀疑。开发者发现DeepSeek的效率提升需要深度架构决策,必须从一开始就内置。TurboQuant不需要重新训练或微调,理论上可以直接投入现有推理管道。
如果它能在生产系统中无需改装就运行,那么数据中心运营商将在现有硬件上获得巨大性能提升。数据中心运营商不必为解决性能问题而增加硬件投入。
然而,分析师呼吁在得出结论前要谨慎。Dell'Oro集团物理基础设施研究总监Alex Cordovil说:"这是一项研究突破,不是发货产品。发表的论文与现实世界推理工作负载之间往往存在有意义的差距。"
此外,Dell'Oro的基本观点仍然是,AI计算的效率提升往往会被更多需求所消耗,这被称为杰文斯悖论。"任何释放的容量可能会被前沿模型扩展能力所吸收,而不是减少硬件占用空间。"
客观分析公司总裁Jim Handy同意第二部分观点。他说:"超大规模云服务商不会削减支出,他们只会花同样的钱获得更多价值。数据中心不是要达到某个性能水平然后停止在AI上的支出。他们要通过超支对手来获得市场主导地位。这不会改变这一点。"
谷歌计划在4月23日至27日在里约热内卢举行的ICLR会议上提交概述TurboQuant的论文。
Q&A
Q1:TurboQuant是什么技术?有什么优势?
A:TurboQuant是谷歌研究院开发的一种针对大语言模型和向量搜索引擎的压缩算法。它能将AI模型的内存使用量减少6倍,在相同GPU数量下速度提升8倍,同时保持零精度损失,不需要重新训练或微调。
Q2:TurboQuant对内存市场产生了什么影响?
A:TurboQuant发布后,内存价格暴跌,DDR5内存条价格在过去几周内下跌15%至30%。大型内存芯片制造商股价也大幅下跌,美光科技股价在两周内暴跌超过100美元。
Q3:TurboQuant能否在实际生产中广泛应用?
A:分析师认为需要谨慎对待。这目前还是研究突破而非发货产品,发表论文与现实应用之间往往存在差距。即使技术成熟,效率提升可能会被更多AI需求消耗,而不是减少硬件投入。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。