Microsoft研究人员称开发出可在 CPU 上运行的超高效 AI 模型

微软团队推出名为 BitNet b1.58 2B4T 的 2 亿参数 1 位模型，通过将权重量化为 -1、0、1，实现了内存和运算效率的显著提升，并能在 CPU（如苹果 M2）上运行，但目前仅支持特定硬件。

Microsoft 的研究人员称他们已经开发出了迄今为止最大的 1-bit AI 模型，也被称为 “bitnet”。该模型名为 BitNet b1.58 2B4T，在 MIT 许可证下公开发布，并且可以在包括 Apple M2 在内的 CPU 上运行。

Bitnets 本质上是为轻量级硬件设计的压缩模型。在标准模型中，定义模型内部结构的数值即权重，通常经过量化处理，以便模型在各种设备上均能良好运行。对权重进行量化减少了表示这些权重所需的比特数 —— 比特是计算机能处理的最小单位 —— 这使得模型可以在内存较少、运行速度更快的芯片上运行。

Bitnets 将权重量化为仅三个值：-1、0 和 1。理论上，这使它们在内存和计算效率上远超当今大多数模型。

Microsoft 的研究人员表示，BitNet b1.58 2B4T 是首个拥有 20 亿参数的 bitnet（“参数”在这里基本上与“权重”同义）。据称，该模型在一个包含 4 万亿 Token 的数据集上训练 —— 一项估计相当于约 3300 万本书 —— 使其在性能上优于同类规模的传统模型。

需要明确的是，BitNet b1.58 2B4T 并未彻底超越所有竞品的 20 亿参数模型，但它似乎能够与之抗衡。根据研究人员的测试结果，该模型在 GSM8K（一组小学水平的数学问题）和 PIQA（测试物理常识推理能力）等基准测试中，表现均超过了 Meta 的 Llama 3.2 1B、Google 的 Gemma 3 1B 和 Alibaba 的 Qwen 2.5 1.5B。

更为引人注目的是，BitNet b1.58 2B4T 的运行速度比同等规模的其他模型更快 —— 在某些情况下，其速度是对方的两倍，而所需内存却只有极小的一部分。

然而，这也有一个前提条件。

实现这种性能需要使用 Microsoft 自研的框架 bitnet.cpp，而该框架目前仅支持某些特定硬件。支持芯片列表中并未包括统治 AI 基础设施格局的 GPU。

总的来说，bitnets 可能存在希望，尤其适用于资源受限的设备。但兼容性问题 —— 并且很可能将继续成为一个主要障碍。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Microsoft研究人员称开发出可在 CPU 上运行的超高效 AI 模型

来源：Techcrunch

2025

04/17

16:27

分享

点赞

数智惠闽企，展车进福州｜华为坤灵中国行2025·福建站成功举办，推动闽企智能化发展新征程

AI时代的影像实验：记录你眼中的“变化”

大象转身，亦或重塑大象：Unity团结引擎的“中国本土”进化

无万卡，不VLA：元戎启行与阿里云的“想法”和“解法”

AI爬虫让“价格战”变成“算法战”，利润正在被看不见的流量吞噬 AI 爬虫程序流量在短短一年内暴增 300%

做好可持续数字化转型的“必答题”

SUSE Linux Enterprise Server (SLES) 16全新发布：AI赋能，智领企业管理

SAP商业AI获乌镇峰会精品案例奖，助推中国企业实现确定性增长

专访｜Cloudera致力于打造AI时代的企业级“数据操作系统”

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

SAP TechEd柏林观察：企业AI如何发挥飞轮效应?

CIO策略观察——软件测试：从传统困局到 AI 无人测试转型

谷歌“Ironwood” TPU Pod与其他AI超级计算机的对比

斯坦福大学出新举措：全面深入解析 AI 在心理健康领域的应用

OpenAI 最新 AI 模型引入新的安全保障措施以防范生物风险

404-GEN 整合去中心化 3D 模型生成平台 与 Unity

AI 的人性面：福祉与四重底线

Kraft Group 与 NWN 携手升级 New England Patriots 网络体系

万物皆可AI！“2025年度最值得关注AIGC企业/产品”揭晓

《2025中国AIGC应用全景图谱报告》重磅发布：全面勾勒中国AI创新发展新蓝图

Google 的 Veo 2 视频生成模型加入 Gemini

如果竞争对手推出“高风险” AI，OpenAI可能调整其安全措施

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

404-GEN 整合去中心化 3D 模型生成平台与 Unity