国际能源署发布的2025年世界能源展望报告显示,全球AI竞赛推动创纪录的石油、天然气、煤炭和核能消耗,加剧地缘政治紧张局势和气候危机。数据中心用电量预计到2035年将增长三倍,全球数据中心投资预计2025年达5800亿美元,超过全球石油供应投资的5400亿美元。报告呼吁采取新方法实现2050年净零排放目标。
AMD首席执行官苏姿丰在纽约金融分析师日活动中表示,公司已准备好迎接AI浪潮并获得传统企业计算市场更多份额。AMD预计未来3-5年数据中心AI收入复合年增长率将超过80%,服务器CPU收入份额超过50%。公司2025年预期收入约340亿美元,其中数据中心业务160亿美元。MI400系列GPU采用2纳米工艺,Helios机架系统将提供强劲算力支持。
德国铁电存储公司FMC获得1亿欧元C轮融资,用于将FERAM芯片技术应用于AI数据中心,替代DRAM和SRAM。FERAM具有与DRAM和SRAM相似的速度,但具备非易失性特征且耗电更少。公司推出DRAM+和3D CACHE+两款产品,旨在解决AI技术栈中的内存瓶颈问题。该技术采用标准CMOS工艺制造,但面临供应链接受度的挑战。
本文探讨了AI在垂直市场中的应用前景。垂直市场指专门服务特定行业客户的细分市场,如医疗或金融行业。专家认为,生成式AI首次实现了知识工作的真正自动化,在医疗、金融、法律等高成本知识密集型领域具有显著ROI潜力。成功的垂直AI应用需要拥有客户工作流程,采用基于价值而非按席位的定价模式,并将AI从工具逐步发展为团队合作伙伴。
谷歌宣布将在未来两年内向德州投资400亿美元,用于建设三个新数据中心以支持云计算和人工智能业务。新建设施将分布在阿姆斯特朗县和哈斯克尔县。这是谷歌在美国任何州的最大投资,将使其在德州的总投资达到427亿美元。此前谷歌已在该州建有两个数据中心。
在2025年KubeCon/CloudNativeCon北美大会上,云原生开发社区正努力超越AI炒作,理性应对人工智能带来的风险与机遇。随着开发者和运营人员广泛使用AI工具构建AI驱动的应用功能,平台工程迎来复兴。CNCF推出Kubernetes AI认证合规程序,为AI工作负载在Kubernetes上的部署设定开放标准。会议展示了网络基础设施层优化、AI辅助开发安全性提升以及AI SRE改善可观测性工作流等创新成果。
DeepL作为欧洲AI领域的代表企业,正将业务拓展至翻译之外,推出面向企业的AI代理DeepL Agent。CEO库蒂洛夫斯基认为,虽然在日常翻译场景面临更多竞争,但在关键业务级别的企业翻译需求中,DeepL凭借高精度、质量控制和合规性仍具优势。他对欧盟AI法案表示担忧,认为过度监管可能阻碍创新,使欧洲在全球AI竞争中落后。
本文介绍了提示工程领域的新技术"协作提示",该技术能让AI从传统的单轮快速回答模式转向多轮协作对话模式。文章提供了短版和长版两种协作提示模板,解释了AI通常不具备协作性的原因,并通过实例对比展示了协作提示的效果。研究表明,这种方法能够帮助用户获得更深入、更实质性的AI回答,特别适用于复杂问题的探索和解决。
全球信用评级巨头Experian正经历125年来最大转型,从传统信用局向分析和软件提供商转变。公司35%收入现来自软件平台业务。通过与AWS的10年云服务协议,Experian构建了超过100PB的数据湖,开发了Ascend AI平台,将模型部署时间从三周缩短至2-3天。在欺诈检测领域,AI驱动的系统比传统规则系统检测率提升37-45%。公司还利用大语言模型自动化监管合规报告生成,大幅减少人工工作量。
超算领域正在分化,从统一的多处理器x86系统分裂为不同架构,分别服务学术工作负载、极端物理模拟和AI训练需求。英伟达GPU革命彻底颠覆了传统秩序。传统存储系统在AI随机I/O风暴下表现不佳,元数据占用20%的I/O操作。GPU集群规模扩大至数千台时,每秒GPU闲置时间都在消耗成本,存储从支持功能转变为竞争优势。
MinIO将其AIStor对象软件与超微Intel Xeon 6服务器和Solidigm固态硬盘相结合,打造1 EiB容量的机架级本地存储模块,将AI数据存储扩展至ZB级别。该方案基于DataPOD对象存储参考架构,单机架提供36 PiB全闪存可用容量,通过减少和稳定EB级延迟,确保AI工作负载持续高效运行,避免GPU因数据传输不足而闲置。
诺基亚扩展数据中心网络产品组合,升级7220 IXR-H6交换机系列,吞吐量可达102.4Tbps,支持800GE和1.6TE接口速度。新产品符合Ultra以太网联盟规范,支持液冷和风冷配置。同时推出AI驱动的AIOps工具,结合事件驱动自动化平台,可将数据中心网络停机时间减少96%,满足智能AI应用对网络性能和可靠性的严苛要求。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
AI代码编辑器开发商Cursor完成23亿美元D轮融资,估值达293亿美元。Accel和Coatue领投,Google、Nvidia等参与。公司年化收入已突破10亿美元。Cursor基于微软开源VS Code打造,集成大语言模型帮助开发者编写代码和修复漏洞。其自研Composer模型采用专家混合算法,运行速度比同等质量模型快四倍。公司拥有数百万开发者用户,将用新资金推进AI研究。
人工智能公司Anthropic今日公布了首个"AI主导的网络间谍活动"详情。据称中国国家支持的黑客利用Claude模型自动化执行网络间谍活动,目标涉及全球约30家技术、金融、化工和公共部门组织。攻击者使用Claude处理80%-90%的操作流程,包括网络扫描、生成攻击代码、爬取内部系统和打包窃取数据。Anthropic已暂停相关账户并部署新的检测系统。
Cadence设计系统公司发布首款系统芯粒硅片,成功实现了LPDDR5X内存在芯粒间以9600MT/s速度初始化,并验证了UCIe标准在25mm链路上达32Gb/s传输速度。该系统芯粒集成了系统处理器、安全管理处理器和各种控制器,为多芯粒SoC提供资源管理功能。这一突破为半导体行业向模块化芯粒架构迁移提供了重要参考平台,特别适用于边缘AI和物理AI应用场景。
中国搜索巨头百度本周发布两款新AI加速器,响应国家减少对西方芯片依赖的战略。百度计划明年发布推理优化芯片M100,支持新一代专家混合模型,并将在2026年推出256个加速器集群配置Tianchi256。同时,百度还在开发训练优化芯片M300,预计2027年发布,支持多万亿参数模型训练。此举凸显中国科技企业转向国产芯片的战略转变。
DeepMind发布新AI智能体SIMA 2,可学会玩《无人深空》、《英灵神殿》等多款游戏。该智能体首次整合Gemini AI,能够理解用户高级目标并执行复杂推理。DeepMind将其视为通向通用人工智能的重要一步,未来可能应用于机器人技术和现实世界环境中。
微软宣布其首个人工智能"超级工厂"在亚特兰大正式投入运营,这是一座耗资数十亿美元的数据中心设施。该设施将与全国其他数据中心基础设施相连,为客户提供强大的计算能力。新设施占地85英亩,面积超过100万平方英尺,配备数十万个英伟达最强大的GPU和AI加速器。作为微软Fairwater网络的一部分,该设施专门用于训练和运行AI模型,将为OpenAI、Mistral AI和xAI等公司提供服务。
因果人工智能初创公司Alembic Technologies宣布完成1.45亿美元B轮融资,估值增长近16倍。公司将大部分资金投资于英伟达NVL72超级计算机,打造私有AI基础设施。该公司专注于企业级因果AI模型,通过理解因果关系而非仅识别模式来生成营销洞察。新超算搭载英伟达最强Blackwell GPU,将为其连续学习神经网络和时空图构建算法提供计算支持,帮助客户利用专有数据获得竞争优势。