卫星首次实现自主目标识别，这意味着什么？

今年4月，搭载谷歌DeepMind Gemma 3视觉语言模型的Yam-9卫星，首次在轨道上独立完成图像分析任务，无需地面人员介入。该模型由NASA喷气推进实验室开发的NAVI-Orbital软件包驱动，可响应自然语言指令识别感兴趣区域。此举不仅能有效减少地面数据分析压力，还为在太空部署更大规模AI基础设施提供了可行性验证，未来有望实现对地球任意地点的实时监测。

地球观测卫星首次在无需地面人工分析师参与的情况下，独立完成了目标识别任务。这一里程碑事件发生于今年4月，标志着视觉语言模型首次被证实应用于在轨运行的卫星，同时也预示着AI技术可能从根本上改变天基传感器的能力边界与应用价值。

传统模式与技术突破

通常情况下，卫星会将大量原始数据下载至地面，再由分析师借助机器学习算法或人工目视判读来提取有效信息。而这一次，搭载于Loft Orbital公司所建造的Yam-9飞行器上，NASA喷气推进实验室（JPL）开发的一套软件系统，直接根据自然语言查询指令，在轨道上完成了感兴趣区域的自动识别。

驱动本次演示的视觉语言模型（VLM）正是谷歌DeepMind的Gemma 3。该模型专为边缘计算场景设计，能够在远离数据中心的有限硬件上高效运行。视觉语言模型将大语言模型的语境理解能力与图像分析能力相结合。研究人员向模型提出了具体任务——例如，识别自然环境与人类建设活动的交界区域，或定位铁路枢纽周边的基础设施——模型均成功完成了分类与识别。

双重意义：近期价值与长远影响

此次演示具有两层重要意义。就近期而言，通过在轨完成初步数据筛选，可以大幅减少地面分析师需要处理的原始数据量，显著提升天基传感器的实用价值；从长远来看，这是在太空部署更大规模AI计算基础设施可行性的有力验证。

Loft公司AI负责人Paul Lasserre在接受TechCrunch采访时表示："这为太空中常态化、持续巡查的监测体系打开了大门。有了视觉语言模型，你可以赋予系统逻辑判断能力——比如'帮我监控这段边界，一旦发现可疑情况立即通知我'——并实现与卫星之间的双向交互。"

平台化运营与商业模式

Loft的飞行器被定位为面向第三方客户的开放平台，其商业模式更接近基础设施即服务（IaaS），而非传统的卫星制造。近期，Loft与EarthDaily达成合作协议，负责建造、发射并运营六颗新卫星，由EarthDaily对卫星采集的数据进行分析与商业化运营。Yam-9于2025年秋季发射，是Loft在轨AI项目的先导验证星，搭载了英伟达Jetson Orin AGX GPU——这是目前太空计算领域的主流芯片之一。

NASA JPL AI团队技术负责人Juan Delfa Victoria主导开发了NAVI-Orbital软件包，该软件包实质上是Gemma 3视觉语言模型的运行框架。尽管Gemma 3本身是现成的商用模型，工程师们仍需对软件包进行精简优化，以降低其对运行库资源和内存的占用。

行业跟进与未来方向

尽管Yam-9是目前已知首个在轨使用视觉语言模型的案例，预计其他企业也将陆续跟进。Planet Labs旗下的卫星同样搭载了Jetson Orin处理器，目前主要用于较为简单的目标检测任务，但该公司发言人透露，包括视觉语言模型在内的更多AI应用正处于研究推进之中。

运营着目前太空中最大GPU集群的Kepler Communications，以合作协议保密条款为由，拒绝披露是否已在太空中部署视觉语言模型，但表示自旗下飞行器于1月发射以来，计算环境已有"若干未公开的应用案例"。

Paul Lasserre表示："既然概念已经得到验证，这就是未来的发展方向。"他的目标是扩建卫星星座，实现对全球任意地点的实时覆盖——据估算，这需要50至100颗与Yam-9同级别的卫星（Loft目前在轨运营12颗）。

在轨部署小型模型积累的工程经验，将为未来在太空中部署更大规模计算基础设施提供参考，尤其在功耗管理与内存优化等关键领域。

航天员助手：更远的畅想

这一切还可能为新型科学工具的诞生铺平道路。NAVI-Space项目的构想，最初源于JPL研究员Taran Cyriac John对月球或火星探索中航天员数字助手的思考。

"我们在想，航天员穿着加压航天服，根本无法使用键盘，而他们需要处理的任务又极为复杂，"Delfa Victoria说，"那么，何不为他们提供一个智能助手——就像游戏和电影里那种可以交互的AI形象？"

当然，请别把它叫做HAL 9000。

Q&A

Q1：Yam-9卫星上搭载的视觉语言模型是什么，它具体能做哪些事？

A：Yam-9搭载的是谷歌DeepMind开发的Gemma 3视觉语言模型，该模型专为边缘计算场景设计，能够在算力有限的卫星硬件上运行。它将大语言模型的语言理解能力与图像分析能力结合，可根据自然语言指令完成遥感数据分类，例如识别自然与人类建设活动的交界地带，或定位铁路枢纽周边的基础设施，无需地面分析师介入即可自主完成任务。

Q2：卫星在轨自主识别目标对实际应用有什么意义？

A：意义主要体现在两个层面。短期内，卫星可在轨完成初步数据筛选，大幅减少需要下传至地面的原始数据量，降低分析师的处理负担，提升响应效率。长远来看，这是在太空部署更大规模AI计算基础设施的重要验证，未来有望实现对全球任意地点的实时、持续监测，并支持与卫星之间的双向交互指令传达。

Q3：除Loft Orbital之外，还有哪些公司在推进卫星AI计算能力？

A：目前多家公司正在跟进相关研究。Planet Labs的卫星同样搭载了英伟达Jetson Orin处理器，目前用于目标检测，视觉语言模型的研究也在推进中。Kepler Communications运营着目前太空中最大的GPU集群，已有多个未公开的计算应用案例，但具体是否部署了视觉语言模型，因保密协议暂未披露。

来源：TechCrunch - AI

0赞

好文章，需要你的鼓励

卫星首次实现自主目标识别，这意味着什么？

来源：TechCrunch - AI

2026

06/15

21:51

分享

点赞

首个AI勒索软件攻击事件：幕后仍有人类参与

英国机器人公司Humanoid推出强化学习系统，机器人操控可靠性提升至99.9%

Waabi AI驾驶系统无需重新训练即可迁移至沃尔沃自动驾驶卡车

Apptronik携手谷歌DeepMind开设机器人训练园区，加速人形机器人商用部署

一个自我进化的开源代码模型突然火了，单张显卡实测效果真不错

比亚迪旗舰电动轿车海豹08上市30小时锁单超6.5万辆

特斯拉司机高速公路上熟睡，驾驶员监控系统为何失效？

AI助手争夺战：苹果能成为最终赢家吗？

NHS App将引入AI分诊工具，助力缩短患者等待时间

Station F加速器助力欧洲AI创业公司崛起

橡树岭国家实验室与克利夫兰诊所联合模拟聚变反应堆材料化学

Even Realities完成1.5亿美元融资，估值达10亿美元

NewCore获6600万美元融资，专为AI智能体构建身份认证体系

iOS 27 相册 AI 新功能深度解析：苹果如何在不失真的前提下完善你的照片记忆

iOS 27 Beta 1 新听写功能默认关闭，附开启教程

索尼AI乒乓球机器人如何推动物理AI技术发展

Parallel Systems CEO：我们正在构建全球首个自主货运铁路系统

DJI与Insta360专利大战全面爆发，创作者科技领域迎来史上最激烈竞争

桑达尔·皮查伊斯坦福毕业典礼演讲：加州乐观主义与做有价值的难事

MassRobotics宣布2026年机器人奖章得主：斯坦福大学冈村·艾莉森与首尔国立大学金雅英获此殊荣

更便宜、更快速、更懂本土文化：Avataar AI视频模型专为印度规模化场景而生

Oracle与AWS携手多家厂商共同应对企业AI成本上涨难题

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: