MinIO融合对象存储与表格数据为生成式AI工作负载提供统一存储

MinIO正成为AI多模态数据存储平台，为AI提供数据访问和使用工具。该公司意识到自己本质上是键值数据库公司，键值存储可同时容纳非结构化对象数据和结构化表格数据。对于结构化数据，MinIO通过AI生成代码来理解表格数据结构，而非传统的向量化方式。MinIO支持KV缓存卸载，并提供promptObject API，让用户可像与LLM对话一样查询非结构化对象，桥接了对象存储、向量数据库和SQL数据库访问。

MinIO正在成为AI的多模态数据存储方案，为生成式AI提供数据访问和使用工具。这一点在与MinIO联合创始人兼联合CEO AB Periasamy的深度访谈中得到了印证。

在采访的第一部分，我们了解到MinIO为AI提供快速对象数据访问支持，使其意识到自己本质上是一家键值数据库公司，而键值存储可以同时包含非结构化的对象式数据和结构化的表格式Iceberg数据。

从AI角度来看，将Iceberg式数据项进行向量化是没有意义的，因为与文字或图像不同，它们不是具有可向量化维度特征的独立数据。在表格和生成式AI大语言模型及智能体之间需要某种中介逻辑/抽象层，来连接它们的非结构化数据向量焦点和结构化数据搜索。

**结构化数据作为对象存储的上层**

Periasamy解释说："在对象存储早期，我们发现结构化数据是非结构化数据之上的一层。例如，Iceberg实际上就是类似Parquet对象的集合。基本上，如果你有一个10PB的表格，你不会存储一个10TB的对象。它将是较小Parquet对象的集合。每1000万行排序后，分割成一个Parquet对象，然后你就有了大量Parquet对象的集合。"

企业持续从其他数据库转储捕获的数据作为变更数据捕获或机器生成的遥测数据。所有这些都以表格格式呈现，但表格数据作为Parquet对象写入对象存储，只是对象，还有清单文件和元数据描述。所有这些都只是对象存储之上的一层。

**对象和表格成为一等公民**

MinIO目前正在开发的是：既有对象又有表格。结构化数据进入表格，非结构化数据进入对象，两者都成为对象存储内的一等公民。

MinIO已经通过promptObject展示了，如果你有销售收据或任何类型的非结构化数据，你可以像查询结构化数据一样查询非结构化数据资产。但如果你存储的全是结构化数据，就不需要模拟。相反，模型需要发现，比如说你有数百PB的表格数据。

**AI处理结构化数据的独特方式**

与只需要触及数据子集的数据库查询不同，生成式AI需要理解整个数据集。对于结构化数据，向量化并不是正确的方法。

Periasamy说："如果是非结构化数据，你对其进行向量化，但如果是结构化数据，你如何向量化呢？在结构化数据中，我能向量化每一行吗？这根本没有任何意义。正确的处理方式是有一个链接层，AI首先需要发现表格。"

正确的方法是使用一个链接层，该层知道如何按需加载你正在寻找的内容。就像GPU空间中的KV缓存一样。你不能将所有表格加载到内存中。首先要经历一个发现阶段，了解业务分析师从业务角度提出的问题。

MinIO发现向量化在这里并不起作用。相反，使用元数据信息创建一个结构，将其提供给AI，并利用AI生成代码的能力。实际上，智能体是动态创建的。这里的链接是生成式AI编写代码，该代码理解表格数据的结构。

**KV缓存卸载支持**

所有推理引擎都已内置KV缓存。卸载允许KV缓存实际存储和检索、重新hydrate缓存，还处理非常大的内存，它们需要对键值存储的最快访问。MinIO已经支持KV缓存卸载接口，并正与各种推理引擎和客户合作采用它。

**promptObject API**

MinIO的promptObject API是S3 API的扩展，"让用户或应用程序与非结构化对象对话，就像与大语言模型对话一样。这意味着你可以要求对象描述自己，找到与其他对象的相似性和差异。"

例如，对象存储中可能有一张餐厅收据的图像，该收据上有"客人"字样，后面跟着数字4。promptObject API可以用来"询问对象有多少人来吃饭？"用户可以询问收据的几乎任何问题，如平均账单金额、所在城市、顶部图像是什么、最贵的菜是什么等。

总体而言，MinIO不仅仅是对象存储供应商，它是生成式AI大语言模型和智能体的源数据供应商，为非结构化数据支持向量，为结构化数据支持SQL类型查询。其自有的大语言模型为业务分析师输入的每个查询编写所需的SQL代码应用。

Q&A

Q1：MinIO如何处理结构化数据和非结构化数据的融合？

A：MinIO将对象和表格都作为一等公民处理。结构化数据进入表格，非结构化数据进入对象，两者都在对象存储内统一管理。通过promptObject API，非结构化数据可以像结构化数据一样被查询，而结构化数据则通过AI生成的代码进行理解和处理。

Q2：为什么MinIO不对结构化数据进行向量化处理？

A：因为结构化数据与文字或图像不同，它们不是具有可向量化维度特征的独立数据。对结构化数据的每一行进行向量化没有意义。MinIO采用AI生成代码的方式来理解表格数据结构，这比让AI在人类语言层面理解数据更有效。

Q3：promptObject API能实现什么功能？

A：promptObject API是S3 API的扩展，让用户可以像与大语言模型对话一样与非结构化对象对话。比如对餐厅收据图像询问"有多少人来吃饭"、"平均账单金额是多少"、"最贵的菜是什么"等问题，MinIO后端运行多模态大语言模型来处理这些查询。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

MinIO融合对象存储与表格数据 为生成式AI工作负载提供统一存储

来源：BLOCKS & FILES

2025

08/05

08:51

分享

点赞

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

OpenAI收购高管教练AI工具Convogo团队

AI推动云计算三巨头增长，微软优势最明显

OpenMind要做人形机器人的安卓操作系统

大语言推理模型效果不佳：数十亿投资面临挑战

美光科技成为先进AI领域的关键供应商

Snowflake与Databricks争夺企业AI市场核心地位

锁定9月13日，2025 AI创新者大会暨第二届提示工程峰会即将来袭

OpenAI ChatGPT学习模式定制指令解析揭示提示工程核心技巧

生成式AI如何改变我们的工作方式

未来顶尖开发者不再只是编码，而是策划、协调和指挥AI

AI对齐与控制技术的现状与挑战探析

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

MinIO融合对象存储与表格数据为生成式AI工作负载提供统一存储