随着AI模型日益商品化,初创公司纷纷投身于构建模型之上的软件层。Osaurus就是这一领域中颇具特色的新入局者——这是一款开源、仅面向Apple平台的大语言模型服务器,允许用户在不同AI模型之间自由切换,无论是本地运行还是接入云端,同时将文件和工具完整保留在自己的硬件设备中。
Osaurus脱胎于桌面AI伴侣Dinoki的构想。联合创始人Terence Pae将Dinoki形容为一种"AI驱动的Clippy助手"。当时,Dinoki的用户曾向他提出疑问:如果还要为Token付费,为什么要购买这款应用?这促使Pae开始深入思考本地化运行AI的可能性。
Pae此前曾在Tesla和Netflix担任软件工程师。他在接受TechCrunch电话采访时表示:"Osaurus就是这样诞生的。"他解释说,最初的想法是尝试在本地运行AI助手。"在Mac上你几乎可以完全在本地完成所有操作,比如浏览文件、访问浏览器、查看系统配置。我认为把Osaurus定位为个人AI是个绝佳方向。"
Pae选择以开源项目的方式公开构建这款工具,一路添加功能、修复缺陷。
目前,Osaurus可以灵活连接本地部署的AI模型,也可对接OpenAI、Anthropic等云端服务商。用户能够自由选择使用哪个AI模型,并将AI体验的其他环节保留在自有硬件上,例如模型的记忆数据、个人文件以及工具。
由于不同AI模型各有所长,这套系统的优势在于用户可以随时切换到最契合自身需求的模型。
这种架构让Osaurus成为所谓的"harness"——一个通过统一界面连接不同AI模型、工具与工作流的控制层,类似于OpenClaw或Hermes等工具。但区别在于,这类工具通常面向熟悉终端操作的开发者。而在某些情况下,例如OpenClaw,它们还可能存在令人担忧的安全隐患和漏洞。
Osaurus则提供了普通消费者可直接上手的友好界面,并通过在硬件隔离的虚拟沙箱中运行来解决安全顾虑。这能将AI限制在特定范围内,确保电脑和数据的安全。
当然,在本地设备上运行AI模型仍处于早期阶段,因为这对资源消耗大且高度依赖硬件。要运行本地模型,系统至少需要64GB内存。若要运行如DeepSeek v4这样的更大模型,Pae建议配备约128GB内存的系统。
但Pae相信,本地AI的硬件需求会随时间推移而逐步降低。
"我能看到它的潜力,因为单位功耗下的智能水平——这是衡量本地AI的指标——正在显著提升。它有着自己的创新曲线。去年本地AI连一句完整的话都说不利索,而今天它已经可以运行工具、编写代码、访问浏览器,甚至从Amazon上下单购物……能力正变得越来越强。"他表示。
Osaurus目前可运行MiniMax M2.5、Gemma 4、Qwen3.6、GPT-OSS、Llama、DeepSeek V4等多种模型,同时支持Apple的端侧基础模型以及Liquid AI的LFM端侧模型系列。在云端方面,它可连接OpenAI、Anthropic、Gemini、xAI/Grok、Venice AI、OpenRouter、Ollama和LM Studio。
作为完整的MCP(模型上下文协议)服务器,Osaurus允许任何兼容MCP的客户端访问其工具。此外,它还内置了超过20个原生插件,涵盖邮件、日历、视觉、macOS操作、XLSX、PPTX、浏览器、音乐、Git、文件系统、搜索、抓取等功能。
近期,Osaurus还更新了语音能力。
根据官网信息,该项目自近一年前上线以来,下载量已突破11.2万次。
目前,Osaurus的创始人团队(包括联合创始人Sam Yoo)正在参与位于纽约的初创加速器Alliance。他们也在思考下一步发展方向,可能将Osaurus推向企业市场,例如法律或医疗等对隐私要求较高、适合部署本地大语言模型的行业。
随着本地AI模型能力的不断增强,团队相信这将降低对AI数据中心的需求。
"我们看到AI领域呈现爆发式增长,云端AI服务商必须依靠数据中心和基础设施来扩展规模,但我们觉得人们还没有真正认识到本地AI的价值。"Pae说,"与其依赖云端,企业完全可以在本地部署一台Mac Studio,功耗会大幅降低。你依然拥有云端的能力,但不必再依赖数据中心来运行AI。"
Q&A
Q1:Osaurus是什么?它有什么作用?
A:Osaurus是一款开源的、仅面向Apple平台的大语言模型服务器,可以让用户在Mac上灵活切换本地AI模型与云端AI模型,同时将文件、工具和模型记忆等保留在自有硬件中,实现个人化的AI使用体验。
Q2:使用Osaurus运行本地AI模型需要什么硬件配置?
A:运行本地模型至少需要64GB内存的Mac系统。如果要运行更大型的模型,比如DeepSeek v4,建议配备约128GB内存的设备。本地AI目前对硬件要求较高,但单位功耗下的智能水平正在快速提升。
Q3:Osaurus支持哪些AI模型和功能?
A:Osaurus支持MiniMax M2.5、Gemma 4、Qwen3.6、GPT-OSS、Llama、DeepSeek V4等本地模型,也支持Apple端侧模型和Liquid AI的LFM系列。云端可连接OpenAI、Anthropic、Gemini等主流服务,并内置20多个原生插件,近期还新增了语音功能。
好文章,需要你的鼓励
OpenAI宣布将Codex桌面AI编程工具与ChatGPT移动应用整合,用户可通过iOS或Android手机远程控制电脑上的Codex执行任务。该功能支持查看任务线程、审批命令、切换模型等操作,文件与权限仍保留在本地电脑,实时更新推送至手机。此举被视为OpenAI应对Anthropic Claude Code竞争、打造桌面"超级应用"战略的重要一步。该功能目前已向所有ChatGPT套餐用户开放预览,包括免费版。
这项来自MemTensor与HONOR的联合研究提出MemPrivacy框架,通过在边缘设备上用带类型标签的占位符替换隐私信息、云端处理后本地还原,在保护用户隐私的同时将AI记忆服务质量损失控制在1.6%以内。
据韩国媒体报道,三星将于7月22日在伦敦举办年度第二场Unpacked发布会,届时将推出首款智能眼镜Galaxy Glasses,同期亮相的还有Galaxy Z Fold 8、Z Flip 8及Galaxy Watch 9。该眼镜搭载三星与谷歌联合开发的Android XR系统,集成Gemini AI,支持拍照、导航、实时翻译及智能家居控制。设计由潮流眼镜品牌Gentle Monster操刀。全球智能眼镜市场预计将从2025年的25亿美元增长至2033年的144亿美元。
韩国大学团队提出THINC框架,让AI在解数学题时用代码替代文字推理,4B小模型超越百倍体量大模型,代码接地率达99.2%。