埃隆·马斯克再次搬出他的"Macrohard"冷笑话,这次以所谓的"数字Optimus"智能体舰队的形式出现,他声称这些智能体能够"模拟整个公司的功能"。
这位亿万富翁在X平台(原推特)上写道:"Macrohard或数字Optimus是xAI与特斯拉的联合项目,作为特斯拉与xAI投资协议的一部分推出。"
"Grok是主指挥/导航员,对世界有深入理解,用来指导数字Optimus,后者负责处理和执行过去5秒的实时计算机屏幕视频以及键盘/鼠标操作。"
"Grok就像是一个更高级、更复杂的逐向导航软件版本。"
至于Macrohard?"这是对微软的一个有趣引用。"
真是滑稽。
微软的老板此前曾吹嘘说,AI为公司生成了超过30%的代码。微软在最近几个月也遭遇了几个质量问题。如果AI已经在编写微软软件的很大一部分,那么用马斯克的Macrohard来模拟该公司可能并非完全荒谬。
话说回来,特斯拉的完全自动驾驶(FSD)已与几起广为人知的事故有关。把Windows开到墙上可能是逻辑上的下一步。
马斯克从去年开始就一直在为Macrohard摇旗呐喊。2025年8月,他发了一条消息,敦促读者"加入@xAI,帮助建立一个名为Macrohard的纯AI软件公司。"
"这是一个半开玩笑的名字,但项目是非常真实的!"
"原则上,考虑到像微软这样的软件公司本身并不制造任何物理硬件,应该可以完全用AI来模拟它们。"
自马斯克8月的帖子以来,特斯拉授予了他一个价值高达1万亿美元的薪酬包,不过这在一定程度上取决于公司市值的飞跃式增长。今年早些时候,特斯拉报告了收入下降,而马斯克则大谈Optimus的可能性。
关于xAI-特斯拉项目,马斯克说:"这将在超低成本的特斯拉AI4(650美元)上非常有竞争力地运行,同时相对节俭地使用昂贵得多的xAI英伟达硬件。这将是唯一的实时智能AI系统。这是一件大事。"
他补充说:"目前没有其他公司能做到这一点。"
马斯克有着承诺过多、兑现不足的长期记录,从2015年的自动驾驶汽车、每年50万辆Cybertruck,到DOGE承诺的节省,以及2026年将人类送上火星。
Q&A
Q1:Macrohard项目是什么?它的主要功能是什么?
A:Macrohard是xAI与特斯拉的联合项目,旨在开发能够"模拟整个公司功能"的数字Optimus智能体舰队。该项目使用Grok作为主指挥,负责指导数字Optimus处理实时计算机操作。
Q2:为什么马斯克要取名Macrohard?
A:Macrohard这个名字是马斯克对微软(Microsoft)的一个有趣引用和冷笑话。虽然名字是半开玩笑的,但马斯克强调项目本身是非常真实的,旨在用AI完全模拟像微软这样的软件公司。
Q3:这个项目的技术优势在哪里?
A:马斯克声称该项目将在超低成本的特斯拉AI4硬件(650美元)上运行,同时节俭使用昂贵的xAI英伟达硬件,将成为唯一的实时智能AI系统,目前没有其他公司能做到这一点。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。