MinIO融合对象存储与表格数据为生成式AI工作负载提供统一存储

MinIO正成为AI多模态数据存储平台，为AI提供数据访问和使用工具。该公司意识到自己本质上是键值数据库公司，键值存储可同时容纳非结构化对象数据和结构化表格数据。对于结构化数据，MinIO通过AI生成代码来理解表格数据结构，而非传统的向量化方式。MinIO支持KV缓存卸载，并提供promptObject API，让用户可像与LLM对话一样查询非结构化对象，桥接了对象存储、向量数据库和SQL数据库访问。

MinIO正在成为AI的多模态数据存储方案，为生成式AI提供数据访问和使用工具。这一点在与MinIO联合创始人兼联合CEO AB Periasamy的深度访谈中得到了印证。

在采访的第一部分，我们了解到MinIO为AI提供快速对象数据访问支持，使其意识到自己本质上是一家键值数据库公司，而键值存储可以同时包含非结构化的对象式数据和结构化的表格式Iceberg数据。

从AI角度来看，将Iceberg式数据项进行向量化是没有意义的，因为与文字或图像不同，它们不是具有可向量化维度特征的独立数据。在表格和生成式AI大语言模型及智能体之间需要某种中介逻辑/抽象层，来连接它们的非结构化数据向量焦点和结构化数据搜索。

**结构化数据作为对象存储的上层**

Periasamy解释说："在对象存储早期，我们发现结构化数据是非结构化数据之上的一层。例如，Iceberg实际上就是类似Parquet对象的集合。基本上，如果你有一个10PB的表格，你不会存储一个10TB的对象。它将是较小Parquet对象的集合。每1000万行排序后，分割成一个Parquet对象，然后你就有了大量Parquet对象的集合。"

企业持续从其他数据库转储捕获的数据作为变更数据捕获或机器生成的遥测数据。所有这些都以表格格式呈现，但表格数据作为Parquet对象写入对象存储，只是对象，还有清单文件和元数据描述。所有这些都只是对象存储之上的一层。

**对象和表格成为一等公民**

MinIO目前正在开发的是：既有对象又有表格。结构化数据进入表格，非结构化数据进入对象，两者都成为对象存储内的一等公民。

MinIO已经通过promptObject展示了，如果你有销售收据或任何类型的非结构化数据，你可以像查询结构化数据一样查询非结构化数据资产。但如果你存储的全是结构化数据，就不需要模拟。相反，模型需要发现，比如说你有数百PB的表格数据。

**AI处理结构化数据的独特方式**

与只需要触及数据子集的数据库查询不同，生成式AI需要理解整个数据集。对于结构化数据，向量化并不是正确的方法。

Periasamy说："如果是非结构化数据，你对其进行向量化，但如果是结构化数据，你如何向量化呢？在结构化数据中，我能向量化每一行吗？这根本没有任何意义。正确的处理方式是有一个链接层，AI首先需要发现表格。"

正确的方法是使用一个链接层，该层知道如何按需加载你正在寻找的内容。就像GPU空间中的KV缓存一样。你不能将所有表格加载到内存中。首先要经历一个发现阶段，了解业务分析师从业务角度提出的问题。

MinIO发现向量化在这里并不起作用。相反，使用元数据信息创建一个结构，将其提供给AI，并利用AI生成代码的能力。实际上，智能体是动态创建的。这里的链接是生成式AI编写代码，该代码理解表格数据的结构。

**KV缓存卸载支持**

所有推理引擎都已内置KV缓存。卸载允许KV缓存实际存储和检索、重新hydrate缓存，还处理非常大的内存，它们需要对键值存储的最快访问。MinIO已经支持KV缓存卸载接口，并正与各种推理引擎和客户合作采用它。

**promptObject API**

MinIO的promptObject API是S3 API的扩展，"让用户或应用程序与非结构化对象对话，就像与大语言模型对话一样。这意味着你可以要求对象描述自己，找到与其他对象的相似性和差异。"

例如，对象存储中可能有一张餐厅收据的图像，该收据上有"客人"字样，后面跟着数字4。promptObject API可以用来"询问对象有多少人来吃饭？"用户可以询问收据的几乎任何问题，如平均账单金额、所在城市、顶部图像是什么、最贵的菜是什么等。

总体而言，MinIO不仅仅是对象存储供应商，它是生成式AI大语言模型和智能体的源数据供应商，为非结构化数据支持向量，为结构化数据支持SQL类型查询。其自有的大语言模型为业务分析师输入的每个查询编写所需的SQL代码应用。

Q&A

Q1：MinIO如何处理结构化数据和非结构化数据的融合？

A：MinIO将对象和表格都作为一等公民处理。结构化数据进入表格，非结构化数据进入对象，两者都在对象存储内统一管理。通过promptObject API，非结构化数据可以像结构化数据一样被查询，而结构化数据则通过AI生成的代码进行理解和处理。

Q2：为什么MinIO不对结构化数据进行向量化处理？

A：因为结构化数据与文字或图像不同，它们不是具有可向量化维度特征的独立数据。对结构化数据的每一行进行向量化没有意义。MinIO采用AI生成代码的方式来理解表格数据结构，这比让AI在人类语言层面理解数据更有效。

Q3：promptObject API能实现什么功能？

A：promptObject API是S3 API的扩展，让用户可以像与大语言模型对话一样与非结构化对象对话。比如对餐厅收据图像询问"有多少人来吃饭"、"平均账单金额是多少"、"最贵的菜是什么"等问题，MinIO后端运行多模态大语言模型来处理这些查询。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

MinIO融合对象存储与表格数据 为生成式AI工作负载提供统一存储

来源：BLOCKS & FILES

2025

08/05

08:51

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

AI推动云计算三巨头增长，微软优势最明显

OpenMind要做人形机器人的安卓操作系统

大语言推理模型效果不佳：数十亿投资面临挑战

美光科技成为先进AI领域的关键供应商

Snowflake与Databricks争夺企业AI市场核心地位

锁定9月13日，2025 AI创新者大会暨第二届提示工程峰会即将来袭

OpenAI ChatGPT学习模式定制指令解析揭示提示工程核心技巧

生成式AI如何改变我们的工作方式

未来顶尖开发者不再只是编码，而是策划、协调和指挥AI

AI对齐与控制技术的现状与挑战探析

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

MinIO融合对象存储与表格数据为生成式AI工作负载提供统一存储

打造Token极致性价比新华三震撼亮相2026世界人工智能大会