新型扩散模型为资源受限系统提供成功之钥

人工智能领域正在通过改进模型工作方式来释放新功能。研究人员开发了一种名为"SVDquant"的4位量化系统，可以使扩散模型运行速度提高3倍，同时提升图像质量和兼容性。这种技术通过压缩参数和激活值来大幅降低内存和处理需求，为资源受限的系统带来新的可能性。

在整个 AI 领域，各个团队正通过改变模型运作方式来释放新的功能。这其中包括输入压缩、改变大语言模型的内存需求、重新定义上下文窗口，以及创建注意力机制来帮助神经网络聚焦于所需之处。

例如，有一种叫做"量化"的过程，通过使用不同的输入类型来帮助模型获得更好的整体效果——这在某种程度上类似于早期主要是监督系统的机器学习程序中的维度概念。

从 MIT 专家的最新研究中我们可以看到，4 位量化过程在生成式 AI 扩散模型中非常有用。具体来说，Muyang Li 及其团队开发了一个用于扩散的 "SVDquant" 4 位量化系统，该系统比传统模型运行速度快三倍，同时还能提供更好的图像质量和兼容性。

扩散模型如何工作

在深入探讨研究团队在量化系统方面的发现之前，让我们先了解扩散模型的一般工作原理。

我在 MIT CSAIL 实验室的同事 Daniela Rus 曾对此做出很好的解释。她指出，扩散模型会获取现有图像，将其分解，然后基于先前的训练输入数据重建出新图像。因此，最终会创建出一张全新的图像，但它包含了用户在输入提示时所期望的所有特征。提示越详细，输出就越精确。如果你使用过这些系统，就会知道你还可以通过后续提示来调整或修改图像，使其更符合你的期望。

你可以将其类比为一位技艺精湛的画家根据要求作画。你告诉画家要画什么，他们就会运用自己的知识库来描绘特定事物的样子。虽然图像是原创和独特的，但它是基于艺术家所学习的知识。同样，扩散模型的结果也是基于它所学习的内容。

提升扩散效率

通过将 16 位模型转换为 4 位模型，研究人员声称可以节省约 3.5 倍的内存，并将延迟减少 8.7 倍。

一些已发表的资源展示了如何在较少资源的情况下实现高保真度和良好的构图。

Li 在系统说明中写道："量化为减小模型大小和加速计算提供了强有力的方法。通过将参数和激活压缩为低位表示，它大大降低了内存和处理需求。随着摩尔定律放缓，硬件供应商正在转向低精度推理。NVIDIA Blackwell 中的 4 位浮点 (FP4) 精度就是这一趋势的典范。"

这是一个很好的例证，因为 Nvidia Blackwell 几乎无所不能。查看一些使用最先进 GPU 和现代硬件的企业程序，你会经常听到 "Blackwell" 这个名字。

因此，正如作者指出的，硬件供应商正在转向低精度推理，这是一个极好的例子。

量化的挑战

为了克服 4 位量化模型的一些限制，专家们建议了一些最佳实践。例如，权重和激活必须匹配，异常值必须重新分配，必须达到某种平衡。

但是一旦实现了这些，你就能获得那些将在未来转化为大规模企业应用的节省。

期待这些创新很快就会在你所在的商业领域中得到应用。

来源：Forbes

0赞

好文章，需要你的鼓励

新型扩散模型为资源受限系统提供成功之钥

来源：Forbes

2025

01/17

16:47

分享

点赞

情感AI的十字路口：从马斯克的虚拟伴侣到腾讯的共情革命

CoDesign 2025国际研讨会在大阪召开 共探高性能计算与AI融合新路径

自写互联网：Dfinity的Caffeine AI是否为应用开发者敲响警钟

Meta利用AI创造低碳混凝土并用于数据中心地板浇筑

Slack宣称其AI能够理解公司的专业术语和行话

Adobe新AI工具将搞怪噪音转换成逼真音效

AI是新的Android恶意软件吗？手机厂商争夺用户注意力的战争

NetBox Labs获得3500万美元融资推动基础设施运营现代化

边缘计算趋势：采用现状、挑战与未来展望

Liqid发布支持CXL 2.0内存池的可组合GPU服务器

Uber携手Lucid和Nuro部署2万辆自动驾驶出租车

Mistral的Le Chat聊天机器人推出"深度研究"模式，生产力大幅提升

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

CoDesign 2025国际研讨会在大阪召开共探高性能计算与AI融合新路径