8月20日,在中国图象图形大会的华为昇思MindSpore技术论坛上,中国科学院空天信息创新研究院(以下简称“空天院”)发布了首个面向跨模态遥感数据的生成式预训练大模型“空天.灵眸”(RingMo,Remote Sensing Foundation Model)。

“空天.灵眸”大模型现场发布图
“空天.灵眸”大模型是空天院联合北京昇腾人工智能生态创新中心技术团队,基于成都智算中心的昇腾AI的澎湃算力训练而完成。在昇腾AI基础软硬件平台的支持下,尤其是依托昇思MindSpore AI框架原生支持大模型的能力,“空天.灵眸”大模型的并行训练及下游任务开发得以加速实现,已在8个国际标准数据集上达到领先水平,填补了跨模态生成式预训练模型在遥感领域的空白。

在模型设计、模型训练、推理优化等方向均进行了独特的技术创新,“空天.灵眸”大模型
深入结合光学、SAR(合成孔径雷达)等跨模态遥感数据的成像机理和目标特性,并在场景分类、检测定位、细粒度识别、要素提取及变化检测等典型下游任务中得到有效验证。
总体来看,“空天.灵眸”大模型具备如下四大亮点:
(1)以遥感特性为研发驱动
不同于现有遥感预训练模型大都采用有监督或者对比式学习的模式,基于昇腾AI的“空天.灵眸”大模型依托掩膜自编码结构,是面向复杂场景且更具通用表征能力的遥感生成式自监督预训练模型。
由于采用的是ViT和Swin Transformer等Transformer类骨干网络,该大模型可对遥感数据的局部和全局特征的依赖关系进行有效建模,并结合目标特性引导的自监督学习方法,通过引入几何、电磁、目标结构等多特性约束,让遥感地物通用特征可被自动提取。

(2)拥有跨模态遥感数据集
为提升遥感预训练模型的特征表达能力,“空天.灵眸”大模型的数据集包含了200多万幅分辨率为0.1m到30m的遥感影像,分别来源于中国遥感卫星地面站、航空遥感飞机等平台,以及高分系列卫星、吉林卫星、QuickBird卫星等。
同时,在数据集中包含了1亿多具有任意角度分布的目标实例,覆盖全球150多个典型城市、乡镇以及常用机场、港口等场景。所用样本数据具备遥感专业特色,且整个样本集都无需标注,能大幅节省训练数据标注成本。
(3)具备应用任务泛化能力
“空天.灵眸”大模型具备遥感数据理解、复原能力,可实现对跨模态遥感数据的共性语义空间进行表征。
针对不同的下游任务仅需修改预测头部网络,即可灵活快速迁移到不同领域的下游任务中,进行简单微调后可适应多目标细粒度分类、小目标检测识别、复杂地物提取等任务。

(4)广泛的产业应用方向
从目标检测识别、地物要素分类等任务的实测比较看,相对于业界通用的视觉模型,“空天.灵眸”大模型对遥感数据应用效果的提升是显著的。
可预见,在未来,基于昇腾AI的“空天.灵眸”大模型的应用不止于在三维重建等领域,或将进一步推广至国土资源、交通、水利等更多行业,为天临空地一体化应用提供整套解决方案。
“空天.灵眸”大模型的相关成果已在遥感领域顶刊《IEEE Transactions on Geoscience and Remote Sensing》上公开发表。
相关论文信息:
Xian Sun, Peijin Wang, Wanxuan Lu, Zicong Zhu, Xiaonan Lu, Qibin He, Junxi Li, Xuee Rong, Zhujun Yang, Hao Chang, Qinglin He, Guang Yang, Ruiping Wang, Jiwen Lu, Kun Fu*. "RingMo: A Remote Sensing Foundation Model with Masked Image Modeling," in IEEE Transactions on Geoscience and Remote Sensing, 2022, doi: 10.1109/TGRS.2022.3194732.
好文章,需要你的鼓励
在2025年KubeCon/CloudNativeCon北美大会上,云原生开发社区正努力超越AI炒作,理性应对人工智能带来的风险与机遇。随着开发者和运营人员广泛使用AI工具构建AI驱动的应用功能,平台工程迎来复兴。CNCF推出Kubernetes AI认证合规程序,为AI工作负载在Kubernetes上的部署设定开放标准。会议展示了网络基础设施层优化、AI辅助开发安全性提升以及AI SRE改善可观测性工作流等创新成果。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
DeepL作为欧洲AI领域的代表企业,正将业务拓展至翻译之外,推出面向企业的AI代理DeepL Agent。CEO库蒂洛夫斯基认为,虽然在日常翻译场景面临更多竞争,但在关键业务级别的企业翻译需求中,DeepL凭借高精度、质量控制和合规性仍具优势。他对欧盟AI法案表示担忧,认为过度监管可能阻碍创新,使欧洲在全球AI竞争中落后。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。