AWS雷尼尔项目正式投入运行,与Stargate展开竞争
就在山姆·阿尔特曼的Stargate项目刚刚开始向遥远的AI驱动世界开启门户之际,亚马逊的竞争性AI计算力山峰已经投入运营。
亚马逊云服务今天宣布,其与Stargate竞争的AI"超级集群"雷尼尔项目现已正式运行,在多个数据中心部署了"近50万块"Trainium2芯片来为这个庞大的机器提供服务。AWS并未透露雷尼尔项目究竟涵盖多少个数据中心以及实际提供多少计算能力,但AWS在新闻稿中向公众保证,这台机器是"世界上最大的AI计算集群之一",并且在创纪录的时间内上线。
"雷尼尔项目现已全面投入运营,距离首次宣布不到一年时间,"AWS表示——而且它并不止步于这50万块Trainium2芯片。该集群已经被亚马逊的AI合作伙伴Anthropic使用,该公司表示将扩展"到超过100万块Trainium2芯片——用于包括训练和推理在内的工作负载——到年底"。
根据我们夏季从AWS员工那里了解到的雷尼尔项目预览信息,承载该项目的每个数据中心都将非常庞大。AWS发言人在7月告诉我们,印第安纳州的一个站点现在作为雷尼尔集群的一部分已部分上线,最终将跨越30栋数据中心建筑,每栋占地20万平方英尺。
我们联系了AWS以获取更多关于雷尼尔集群的信息,包括目前涵盖多少个数据中心,以及到年底将有多大规模,但没有收到回复。
AWS正与OpenAI及其合作伙伴Oracle和软银之间的Stargate合资项目展开AI容量竞争。截至本月早些时候,OpenAI支持的德克萨斯州阿比林数据中心的Stargate计算力约为200兆瓦,OpenAI合作伙伴的承诺计划到2026年中期将德克萨斯州Stargate数据中心扩展到1.2吉瓦容量。Oracle预计在未来四年内帮助增加5.7吉瓦容量。
亚马逊的物流专长确实帮助它快速建设,但它也拥有硬件优势。
"与大多数其他云提供商不同,AWS构建自己的硬件,因此能够控制技术栈的每个方面,从芯片的最小组件,到运行其上的软件,再到数据中心本身的完整设计,"AWS在新闻稿中表示。
现在,如果这家云计算巨头能够解决最近出现的那些可靠性问题,一切就会很完美了。
Q&A
Q1:AWS雷尼尔项目是什么?有多大规模?
A:雷尼尔项目是AWS的AI"超级集群",目前已部署近50万块Trainium2芯片,跨越多个数据中心。AWS称其为"世界上最大的AI计算集群之一",计划到年底扩展到超过100万块芯片。
Q2:雷尼尔项目与OpenAI的Stargate有什么竞争关系?
A:两者都在争夺AI计算能力的领先地位。Stargate目前在德克萨斯州有200兆瓦计算力,计划到2026年中期扩展到1.2吉瓦。而雷尼尔项目已经投入运营,在建设速度上领先。
Q3:AWS在AI硬件方面有什么优势?
A:AWS构建自己的硬件,能够控制从芯片组件到软件再到数据中心设计的整个技术栈。这种垂直整合让AWS在建设速度和技术控制方面具有优势,不依赖外部硬件供应商。
好文章,需要你的鼓励
AI实验室不再与企业签署昂贵的数据合同,而是通过Mercor平台招募前员工获取行业知识。Mercor为投资银行、咨询公司和律所的前员工与OpenAI、Anthropic等AI实验室搭建桥梁,向行业专家支付高达每小时200美元来训练AI模型。该公司年化经常性收入达5亿美元,估值100亿美元,每天向承包商支付超150万美元。
以色列理工学院和IBM研究院联合开发了FINAL评测基准,用自然语言描述的方式让大语言模型检测文本中的事实错误。研究测试了四个顶级AI模型,发现最好的表现也只有0.67的F1分数。分析显示AI存在两大缺陷:误将遗漏信息判为错误,以及对符合其知识的错误过于宽容。
作为AI热潮的最大受益者,英伟达成为首家市值突破5万亿美元里程碑的上市公司。受特朗普总统表示将与习近平主席讨论该公司Blackwell芯片消息推动,公司股价周三上涨超过5.6%。英伟达CEO黄仁勋预计AI芯片销售额将达5000亿美元,并为美国建设七台新超级计算机。该公司还投资10亿美元于诺基亚,用于AI原生5G和6G网络开发。这一里程碑距离突破4万亿美元仅三个月。
Harmonic团队开发的Aristotle系统在2025年国际数学奥林匹克竞赛中达到金牌水平,成功解决6道题目中的5道。该系统创新性地结合非正式推理与严格的形式化证明,采用蒙特卡洛图搜索和引理分解技术,不仅能解决竞赛问题,还为实际数学研究做出贡献,标志着AI数学推理的重大突破。