总价值5000亿美元的Stargate项目旨在全球范围内建设AI数据中心网络,但目前进展缓慢。不过该项目的主要支持者——日本软银集团并不担心。
软银首席财务官后藤芳光在周四公布第一季度财报时提到了项目延期问题。他个人认为,由于难以找到合适的数据中心建设地点,项目进展"比预期慢"。
"我们有很多选择,但选择合适地点需要时间,"他说。"而且涉及很多利益相关者。为了建立共识,我们需要进行大量讨论,还要考虑技术问题和建设问题。有很多事情需要关注。"
一旦Stargate项目成员——包括甲骨文、英伟达和OpenAI——确定物理设计并就建设资金达成一致,后藤芳光认为项目将快速推进。
"我们希望花时间成功建立第一个模型,"他说。"我们还需要研究如何测试项目以确保成功。最终回头看,你可能会觉得花费的时间比预期长,但我们不必为此担心。"
这位首席财务官表示,他预计Stargate将在五年内实现约5000亿美元数据中心建设支出的目标。
软银拥有英国芯片设计公司Arm,该公司本季度营收10.5亿美元,同比增长12%。芯片设计许可收入增长更快,达到25%。
后藤芳光预测,2025年运往超大规模数据中心的新服务器芯片中,有一半将使用Arm架构。"自2021年以来,使用基于Arm芯片进行云处理的企业数量增长了14倍以上,2025年超过7万家,"他补充道。
软银公布利润29亿美元,这对该公司来说是相当不寻常的事件。营收增长7%,达到124亿美元。
Q&A
Q1:Stargate项目是什么?规模有多大?
A:Stargate是一个总价值5000亿美元的大型AI基础设施项目,旨在全球范围内建设AI数据中心网络。项目成员包括甲骨文、英伟达和OpenAI等知名科技公司,计划在五年内完成约5000亿美元的数据中心建设投资。
Q2:Stargate项目为什么进展缓慢?
A:根据软银首席财务官后藤芳光的说法,项目进展缓慢主要是因为难以找到合适的数据中心建设地点。此外,项目涉及很多利益相关者,需要进行大量讨论来建立共识,还要解决技术问题和建设问题。
Q3:软银对Stargate项目延期担心吗?
A:软银并不担心项目延期。首席财务官表示,他们希望花时间成功建立第一个模型,确保项目测试成功。一旦项目成员确定物理设计并就建设资金达成一致,项目将快速推进。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。