Microsoft研究人员称开发出可在 CPU 上运行的超高效 AI 模型

微软团队推出名为 BitNet b1.58 2B4T 的 2 亿参数 1 位模型，通过将权重量化为 -1、0、1，实现了内存和运算效率的显著提升，并能在 CPU（如苹果 M2）上运行，但目前仅支持特定硬件。

Microsoft 的研究人员称他们已经开发出了迄今为止最大的 1-bit AI 模型，也被称为 “bitnet”。该模型名为 BitNet b1.58 2B4T，在 MIT 许可证下公开发布，并且可以在包括 Apple M2 在内的 CPU 上运行。

Bitnets 本质上是为轻量级硬件设计的压缩模型。在标准模型中，定义模型内部结构的数值即权重，通常经过量化处理，以便模型在各种设备上均能良好运行。对权重进行量化减少了表示这些权重所需的比特数 —— 比特是计算机能处理的最小单位 —— 这使得模型可以在内存较少、运行速度更快的芯片上运行。

Bitnets 将权重量化为仅三个值：-1、0 和 1。理论上，这使它们在内存和计算效率上远超当今大多数模型。

Microsoft 的研究人员表示，BitNet b1.58 2B4T 是首个拥有 20 亿参数的 bitnet（“参数”在这里基本上与“权重”同义）。据称，该模型在一个包含 4 万亿 Token 的数据集上训练 —— 一项估计相当于约 3300 万本书 —— 使其在性能上优于同类规模的传统模型。

需要明确的是，BitNet b1.58 2B4T 并未彻底超越所有竞品的 20 亿参数模型，但它似乎能够与之抗衡。根据研究人员的测试结果，该模型在 GSM8K（一组小学水平的数学问题）和 PIQA（测试物理常识推理能力）等基准测试中，表现均超过了 Meta 的 Llama 3.2 1B、Google 的 Gemma 3 1B 和 Alibaba 的 Qwen 2.5 1.5B。

更为引人注目的是，BitNet b1.58 2B4T 的运行速度比同等规模的其他模型更快 —— 在某些情况下，其速度是对方的两倍，而所需内存却只有极小的一部分。

然而，这也有一个前提条件。

实现这种性能需要使用 Microsoft 自研的框架 bitnet.cpp，而该框架目前仅支持某些特定硬件。支持芯片列表中并未包括统治 AI 基础设施格局的 GPU。

总的来说，bitnets 可能存在希望，尤其适用于资源受限的设备。但兼容性问题 —— 并且很可能将继续成为一个主要障碍。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Microsoft研究人员称开发出可在 CPU 上运行的超高效 AI 模型

来源：Techcrunch

2025

04/17

16:27

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

谷歌“Ironwood” TPU Pod与其他AI超级计算机的对比

斯坦福大学出新举措：全面深入解析 AI 在心理健康领域的应用

OpenAI 最新 AI 模型引入新的安全保障措施以防范生物风险

404-GEN 整合去中心化 3D 模型生成平台 与 Unity

AI 的人性面：福祉与四重底线

Kraft Group 与 NWN 携手升级 New England Patriots 网络体系

万物皆可AI！“2025年度最值得关注AIGC企业/产品”揭晓

《2025中国AIGC应用全景图谱报告》重磅发布：全面勾勒中国AI创新发展新蓝图

Google 的 Veo 2 视频生成模型加入 Gemini

如果竞争对手推出“高风险” AI，OpenAI可能调整其安全措施

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会

404-GEN 整合去中心化 3D 模型生成平台与 Unity