AWS雷尼尔项目正式投入运行,与Stargate展开竞争
就在山姆·阿尔特曼的Stargate项目刚刚开始向遥远的AI驱动世界开启门户之际,亚马逊的竞争性AI计算力山峰已经投入运营。
亚马逊云服务今天宣布,其与Stargate竞争的AI"超级集群"雷尼尔项目现已正式运行,在多个数据中心部署了"近50万块"Trainium2芯片来为这个庞大的机器提供服务。AWS并未透露雷尼尔项目究竟涵盖多少个数据中心以及实际提供多少计算能力,但AWS在新闻稿中向公众保证,这台机器是"世界上最大的AI计算集群之一",并且在创纪录的时间内上线。
"雷尼尔项目现已全面投入运营,距离首次宣布不到一年时间,"AWS表示——而且它并不止步于这50万块Trainium2芯片。该集群已经被亚马逊的AI合作伙伴Anthropic使用,该公司表示将扩展"到超过100万块Trainium2芯片——用于包括训练和推理在内的工作负载——到年底"。
根据我们夏季从AWS员工那里了解到的雷尼尔项目预览信息,承载该项目的每个数据中心都将非常庞大。AWS发言人在7月告诉我们,印第安纳州的一个站点现在作为雷尼尔集群的一部分已部分上线,最终将跨越30栋数据中心建筑,每栋占地20万平方英尺。
我们联系了AWS以获取更多关于雷尼尔集群的信息,包括目前涵盖多少个数据中心,以及到年底将有多大规模,但没有收到回复。
AWS正与OpenAI及其合作伙伴Oracle和软银之间的Stargate合资项目展开AI容量竞争。截至本月早些时候,OpenAI支持的德克萨斯州阿比林数据中心的Stargate计算力约为200兆瓦,OpenAI合作伙伴的承诺计划到2026年中期将德克萨斯州Stargate数据中心扩展到1.2吉瓦容量。Oracle预计在未来四年内帮助增加5.7吉瓦容量。
亚马逊的物流专长确实帮助它快速建设,但它也拥有硬件优势。
"与大多数其他云提供商不同,AWS构建自己的硬件,因此能够控制技术栈的每个方面,从芯片的最小组件,到运行其上的软件,再到数据中心本身的完整设计,"AWS在新闻稿中表示。
现在,如果这家云计算巨头能够解决最近出现的那些可靠性问题,一切就会很完美了。
Q&A
Q1:AWS雷尼尔项目是什么?有多大规模?
A:雷尼尔项目是AWS的AI"超级集群",目前已部署近50万块Trainium2芯片,跨越多个数据中心。AWS称其为"世界上最大的AI计算集群之一",计划到年底扩展到超过100万块芯片。
Q2:雷尼尔项目与OpenAI的Stargate有什么竞争关系?
A:两者都在争夺AI计算能力的领先地位。Stargate目前在德克萨斯州有200兆瓦计算力,计划到2026年中期扩展到1.2吉瓦。而雷尼尔项目已经投入运营,在建设速度上领先。
Q3:AWS在AI硬件方面有什么优势?
A:AWS构建自己的硬件,能够控制从芯片组件到软件再到数据中心设计的整个技术栈。这种垂直整合让AWS在建设速度和技术控制方面具有优势,不依赖外部硬件供应商。
好文章,需要你的鼓励
软银集团宣布以40.4亿美元全现金收购私募股权公司DigitalBridge。该公司管理着约1080亿美元资产,投资组合包括数据中心建设商Vantage等科技企业。Vantage正在为OpenAI建设价值150亿美元的威斯康星数据中心园区,并在德州建设投资超250亿美元的Frontier园区。此次收购将加强软银在AI数据中心领域的布局。
新加坡国立大学联合Lovart AI开发的OmniPSD系统,首次实现了AI驱动的双向PSD文件处理能力。该系统能够将扁平图像自动分解为可编辑的图层结构,同时支持从文字描述直接生成分层设计文件。基于扩散变换器架构和创新的RGBA-VAE技术,OmniPSD在20万真实设计样本上训练,实现了专业级的透明度处理和图层分解效果,为设计行业的数字化转型提供了强大工具。
英伟达宣布已通过私募方式完成50亿美元英特尔股份购买,获得4.4%股权。两家公司将在多个工程项目上合作,英特尔将开发与英伟达GPU优化配合的CPU,采用NVLink互连技术实现数据传输速度提升10倍以上。合作还延伸至消费市场,英特尔计划推出集成英伟达芯片组件的片上系统。
ByteDance Seed团队提出UniUGP统一框架,首次将自动驾驶的理解、生成、规划三大能力完美融合。通过混合专家架构和四阶段训练策略,该系统在场景理解、轨迹规划和视频生成等任务上均超越现有先进模型,为自动驾驶技术发展开辟了新路径,预示着更智能可靠的无人驾驶未来。