苹果Mac电脑运行本地大语言模型迎来性能飞跃：Ollama新增MLX框架支持

大语言模型本地运行系统Ollama宣布支持苹果开源机器学习框架MLX，同时改进缓存性能并支持英伟达NVFP4模型压缩格式。这些更新将显著提升搭载M1及后续芯片的Mac设备性能。目前该功能处于预览阶段，仅支持阿里巴巴Qwen3.5模型，需要32GB内存。随着开发者对云服务费用和限制的不满，本地模型运行需求激增，虽然性能仍落后于云端模型，但在隐私保护和成本控制方面具有优势。

Ollama是一个专门在本地计算机上运行大语言模型的运行时系统，现已新增对苹果开源机器学习框架MLX的支持。此外，Ollama还改进了缓存性能，并支持英伟达的NVFP4格式进行模型压缩，大幅提升了特定模型的内存使用效率。

这些改进结合在一起，为搭载苹果芯片（M1或更新版本）的Mac电脑带来了显著的性能提升。时机恰到好处，因为本地模型正开始在研究者和爱好者群体之外获得更广泛的关注。

最近OpenClaw的爆红现象——在GitHub上迅速获得超过30万个星标，通过Moltbook等实验引起轰动，并在中国引起特别关注——让许多人开始尝试在自己的机器上运行模型。

随着开发者对Claude Code或ChatGPT Codex等工具的速率限制和高昂订阅费用感到沮丧，本地编程模型的实验热度不断升温。（Ollama最近还扩展了Visual Studio Code集成功能。）

新支持功能目前处于预览阶段（Ollama 0.19版本），目前仅支持一个模型——阿里巴巴Qwen3.5的350亿参数版本。对于普通用户来说，硬件要求相当严格。根据Ollama的公告，用户不仅需要配备苹果芯片的Mac电脑，还需要至少32GB的内存。

此外，Ollama现在能够利用苹果M5系列GPU中的全新神经加速器，因此那些最新款Mac应该在每秒Token数和Token响应时间方面获得额外优势。

虽然本地模型在基准测试中仍落后于前沿模型，但我们正逐渐达到这样一个程度：它们在某些任务上已经足够好，用户可能无需为此付费订阅。当然，与基于云的服务相比，本地运行模型还具有隐私优势，不过我们绝对不推荐像OpenClaw那样让模型深度访问系统的设置。主要障碍仍然是设置难度（Ollama主要是命令行工具，尽管已有其他界面可用）和硬件能力，特别是显存需求。

苹果的MLX框架为苹果芯片的内存提供了优化访问，GPU和CPU共享内存——这与Ollama之前针对的配备独立GPU的台式机采用了不同的方法。这并不意味着对大多数用户来说云端模型和本地模型之间的差距完全消失，但对现代Mac用户来说，这可能是朝着正确方向迈出的一步。

Ollama尚未公布MLX支持何时退出预览阶段并扩展到更多模型的时间表。

Q&A

Q1：Ollama的MLX支持有什么新功能？

A：Ollama新增了对苹果开源机器学习框架MLX的支持，还改进了缓存性能，并支持英伟达的NVFP4格式进行模型压缩，为搭载苹果芯片的Mac电脑带来显著性能提升。

Q2：使用Ollama的MLX支持需要什么硬件配置？

A：需要配备苹果芯片（M1或更新版本）的Mac电脑，并且至少需要32GB内存。搭载M5系列GPU的最新Mac还能获得额外的性能优势。

Q3：本地大语言模型相比云端模型有什么优势？

A：本地模型的主要优势是隐私保护，用户数据不需要上传到云端。此外，对于某些任务，本地模型已经足够好用，可以避免付费订阅云端服务的费用。

来源：Arstechnica

0赞

好文章，需要你的鼓励

苹果Mac电脑运行本地大语言模型迎来性能飞跃：Ollama新增MLX框架支持

来源：Arstechnica

2026

04/01

15:26

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Galaxy S26照片应用可能让你的回忆变得虚假

谷歌暗示将推出新款健康可穿戴设备

丰田Woven Capital任命新CIO和COO，推进"未来出行"探索

Salesforce发布Slack AI重大更新，新增30项智能功能

Anthropic连续泄露敏感信息引发行业关注

OpenAI完成创纪录1220亿美元融资 估值达8520亿美元

Anthropic意外泄露Claude Code源代码引发关注

ChatGPT母公司OpenAI完成1220亿美元融资创纪录

Agoda全面拥抱AI战略，在亚太区设立新技术中心

谷歌加速后量子密码学迁移 凸显当前数据安全风险

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会

OpenAI完成创纪录1220亿美元融资估值达8520亿美元

谷歌加速后量子密码学迁移凸显当前数据安全风险