总价值5000亿美元的Stargate项目旨在全球范围内建设AI数据中心网络,但目前进展缓慢。不过该项目的主要支持者——日本软银集团并不担心。
软银首席财务官后藤芳光在周四公布第一季度财报时提到了项目延期问题。他个人认为,由于难以找到合适的数据中心建设地点,项目进展"比预期慢"。
"我们有很多选择,但选择合适地点需要时间,"他说。"而且涉及很多利益相关者。为了建立共识,我们需要进行大量讨论,还要考虑技术问题和建设问题。有很多事情需要关注。"
一旦Stargate项目成员——包括甲骨文、英伟达和OpenAI——确定物理设计并就建设资金达成一致,后藤芳光认为项目将快速推进。
"我们希望花时间成功建立第一个模型,"他说。"我们还需要研究如何测试项目以确保成功。最终回头看,你可能会觉得花费的时间比预期长,但我们不必为此担心。"
这位首席财务官表示,他预计Stargate将在五年内实现约5000亿美元数据中心建设支出的目标。
软银拥有英国芯片设计公司Arm,该公司本季度营收10.5亿美元,同比增长12%。芯片设计许可收入增长更快,达到25%。
后藤芳光预测,2025年运往超大规模数据中心的新服务器芯片中,有一半将使用Arm架构。"自2021年以来,使用基于Arm芯片进行云处理的企业数量增长了14倍以上,2025年超过7万家,"他补充道。
软银公布利润29亿美元,这对该公司来说是相当不寻常的事件。营收增长7%,达到124亿美元。
Q&A
Q1:Stargate项目是什么?规模有多大?
A:Stargate是一个总价值5000亿美元的大型AI基础设施项目,旨在全球范围内建设AI数据中心网络。项目成员包括甲骨文、英伟达和OpenAI等知名科技公司,计划在五年内完成约5000亿美元的数据中心建设投资。
Q2:Stargate项目为什么进展缓慢?
A:根据软银首席财务官后藤芳光的说法,项目进展缓慢主要是因为难以找到合适的数据中心建设地点。此外,项目涉及很多利益相关者,需要进行大量讨论来建立共识,还要解决技术问题和建设问题。
Q3:软银对Stargate项目延期担心吗?
A:软银并不担心项目延期。首席财务官表示,他们希望花时间成功建立第一个模型,确保项目测试成功。一旦项目成员确定物理设计并就建设资金达成一致,项目将快速推进。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。