生成式AI工具如DALL-E、Midjourney和Stable Diffusion能够创建逼真的图像,但这些工具消耗大量能源。现在两项研究发现,所谓的热力学计算可能以仅为传统方法百亿分之一的能耗生成图像。
许多AI图像生成器的核心是被称为扩散模型的机器学习算法。程序员向模型输入大量图像集,然后逐渐添加噪声,直到这些图像看起来像老式模拟电视的雪花屏。接着他们训练神经网络来逆转这个过程,使扩散模型能够根据提示生成全新的图像。
然而,添加噪声然后从静态中生成图像的AI数字计算过程非常耗能。加州劳伦斯伯克利国家实验室的工作科学家Stephen Whitelam表示,涉及热力学计算的新技术可能"以比当前数字硬件低得多的能耗"生成图像。
利用自然噪声
热力学计算采用物理电路,这些电路会响应噪声变化,比如环境中随机热波动引起的噪声,从而执行低能耗计算。例如,纽约初创公司Normal Computing的原型芯片由八个谐振器组成,通过特殊耦合器相互连接。程序员使用这些耦合器构建一种为他们想要研究的问题定制的计算器。然后他们激发谐振器,在谐振器耦合网络中引入噪声,执行计算。系统达到平衡后,程序员可以从谐振器的新配置中读取解决方案。
在1月10日发表在《自然通讯》上的文章中,Whitelam和同事揭示了创建神经网络热力学版本的可能性。这为通过热力学计算生成图像奠定了基础。
Whitelam的新策略将向热力学计算机提供一组图像。该技术随后通过让计算机组件之间的自然随机交互运行,直到连接这些组件的耦合自然达到平衡状态,从而使存储的图片降解。接下来,该策略将计算具有给定耦合状态的热力学计算机逆转衰减过程的概率。然后调整这些耦合的值以最大化该概率。
在1月20日发表在《物理评论快报》上的传统计算机模拟研究中,Whitelam发现这种训练过程可以让热力学计算机的设置生成手写数字图像。它可以在不使用耗能的数字神经网络或噪声生成伪随机数生成器的情况下完成这项任务。
"这项研究表明,制造硬件来执行某些类型的机器学习——这里指图像生成——的能耗可能比我们目前的做法低得多,"Whitelam说。
Whitelam提醒说,与数字神经网络相比,热力学计算机目前还很初级。"我们还不知道如何设计一台在图像生成方面能与DALL-E等相媲美的热力学计算机,"他说。"仍然需要解决如何构建硬件来实现这一点。"
尽管他计算出热力学计算机在能效方面可能比常规计算机有巨大优势,但"构建一台能够享受所有这些优势的热力学计算机将是具有挑战性的。近期的设计可能介于理想状态和当前数字功耗水平之间。"
Q&A
Q1:热力学计算是什么?它如何工作?
A:热力学计算采用物理电路,这些电路会响应环境中随机热波动等噪声变化来执行低能耗计算。它通过谐振器和耦合器构成的网络,利用自然噪声进行计算,系统达到平衡后可以读取计算结果。
Q2:热力学计算在AI图像生成方面有什么优势?
A:热力学计算可能以仅为传统方法百亿分之一的能耗生成图像。它能够在不使用耗能的数字神经网络或噪声生成伪随机数生成器的情况下完成图像生成任务,大幅降低能源消耗。
Q3:热力学计算技术目前面临哪些挑战?
A:与数字神经网络相比,热力学计算机目前还很初级,研究人员还不知道如何设计出在图像生成方面能与DALL-E等工具相媲美的热力学计算机。构建能够充分发挥能效优势的硬件仍然具有挑战性。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
JETSPEC是由UC San Diego等机构联合提出的推测解码框架,通过树形因果掩码让草稿头在一次前向传播中生成分支一致的候选树,在MATH-500上实现最高9.64倍端到端加速。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。