AI泡沫?什么AI泡沫?如果你问英伟达CEO黄仁勋,我们正处在一场"新工业革命"中。
黄仁勋的公司生产芯片和计算机硬件,是AI淘金热中的"锄头和铲子",通过抓住AI增长机遇成为了全球最大的企业。在周三的财报电话会议上,他的公司报告了上季度467亿美元的营收,并表示生成式AI行业的惊人增长没有放缓迹象。
"我认为未来几年,肯定会贯穿整个十年,我们看到了非常重大的增长机会,"黄仁勋说道。
这与OpenAI CEO山姆·奥特曼最近的评论形成对比,后者认为投资者现在对AI"过度兴奋"。(奥特曼也承认他仍然相信AI是"很长时间以来发生的最重要的事情"。)
黄仁勋表示,他的公司对运行AI的芯片和计算机需求有"非常、非常重要的预测",表明对更多数据中心的需求不会很快停止。他推测,到本十年末,AI基础设施支出可能达到3万亿到4万亿美元。(美国的国内生产总值约为30万亿美元。)
这意味着需要大量数据中心,它们占用大量土地,消耗大量水和能源。这些AI工厂近年来变得越来越大,对周围社区产生重大影响,并对美国电网造成更大压力。需要更多能源的不同生成式AI工具的增长可能会使这种需求更加巨大。
更强大且要求更高的模型
聊天机器人上的一个提示不再总是意味着只是一个提示。计算能力需求增加的一个原因是,采用"推理"技术的新AI模型在处理一个问题时使用更多电力。"这被称为长思考,思考得越久,通常产生更好的答案,"黄仁勋说。
这种技术允许AI模型在不同网站上进行研究,多次尝试问题以获得更好答案,并将不同信息整合到一个回应中。
一些AI公司将推理作为单独模型提供,或作为标记为"深度思考"之类的选择。OpenAI将其直接整合到GPT-5发布中,通过路由程序决定是由更轻量、直接的模型处理,还是由更密集的推理模型处理。
但黄仁勋表示,推理模型可能需要比传统大语言模型回应多100倍或更多的计算能力。这些模型,连同能够执行任务的智能体系统和能够处理可视化并在物理世界中操作的机器人模型,使得对芯片、能源和数据中心土地的需求持续上升。
"每一代,需求只会增长,"黄仁勋说道。
Q&A
Q1:英伟达CEO黄仁勋对AI行业未来发展有什么看法?
A:黄仁勋认为我们正处在一场"新工业革命"中,预测未来几年乃至整个十年都会有重大增长机会。他推测到本十年末,AI基础设施支出可能达到3万亿到4万亿美元,表明生成式AI行业的增长没有放缓迹象。
Q2:AI推理模型与传统大语言模型在计算需求上有什么区别?
A:AI推理模型采用"长思考"技术,能够在不同网站研究、多次尝试问题并整合信息。但这种推理模型可能需要比传统大语言模型多100倍或更多的计算能力,大大增加了对芯片和数据中心的需求。
Q3:AI数据中心快速增长会带来哪些影响?
A:AI数据中心占用大量土地,消耗大量水和能源,对周围社区产生重大影响,并对美国电网造成更大压力。随着需要更多能源的生成式AI工具增长,这种需求可能会变得更加巨大。
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。