Scality RING对象存储支持RAG工作流

Scality宣布其RING对象存储可与向量数据库和LangChain框架结合，为GPT等AI模型提供RAG工作流支持。通过LangChain工具将RING内容向量化并存储在Milvus向量数据库中，使AI模型能够访问客户专有数据。该方案采用语义搜索和近似最近邻算法，让模型在生成响应时具备更好的上下文理解能力。Scality选择Milvus是因其查询速度、可扩展性和精确性优势。

Scality宣布其RING对象存储系统已准备好支持检索增强生成（RAG）工作流，可与向量数据库和LangChain框架结合，为GPT等AI模型提供数据支持。

LangChain提供了将外部数据、内存和工具集成到AI工作流中的工具。在这种情况下，外部数据就是Scality的RING对象存储。向量数据库存储通过数学计算得出的向量，这些向量代表非结构化数据标记化片段的多个方面和维度。GPT或Llama等生成式AI模型只有在客户专有的非结构化数据被转换为向量并提供给它们时，才能在生成响应时使用这些数据。

如果没有这样的向量化处理，RING存储的数据对模型来说是不可见的。AI模型通常在静态、通用数据上进行训练。RAG（检索增强生成）技术让它们能够访问客户的专有数据，这些数据可以是静态的（历史数据）、当前的（实时数据）或两者兼有。这意味着模型能够更好地理解请求的背景和数据环境，从而提供更有针对性的响应。

Scality可以使用LangChain工具将选定的RING内容进行向量化，将其存储在Milvus向量数据库中，并使其可用于GPT-3.5、GPT-4、Llama等AI模型。

根据Scality的文章解释，向量嵌入以代表其含义的方式表示非结构化源数据。输入请求本身也被向量化，输入向量集提供了输入请求含义的抽象表示。然后，大语言模型或智能体在存储从Scality RING系统生成向量的Milvus数据库中搜索相似的向量。

Scality表示："这使系统能够检索与用户查询在语义上匹配的内容。"例如，询问"如何管理2型糖尿病？"的输入查询可能使模型检测并使用关于"胰岛素敏感性"或"低升糖指数饮食"的文档，因为在语义搜索terms中，它们与输入请求生成的向量集接近。

向量数据库提供基于索引技术的近似最近邻（ANN）等搜索功能。ANN在非常大的搜索空间中寻找与输入模式最接近的近似模式。搜索空间如此之大，以至于逐一检查每个数据点以找到绝对最匹配项是不现实的，会耗费太长时间。

Scality选择Milvus而非其他向量数据库，是因为其查询速度、可扩展性、直接的LangChain集成以及在不同类型数据集上的精度。

公司提供了RING-LangChain-Milvus-GPT 3.5交互的代码示例。

AI推理和训练越来越关注对象存储，而不仅仅是文件存储。Cloudian、DDN、MinIO和VAST Data等供应商都在强调其作为RAG源数据存储和AI管道支持功能的优势。我们可能期待Scality进一步发展这一领域，通过更深入和扩展的功能组件集成来完善其解决方案。

Q&A

Q1：Scality RING如何支持RAG工作流？

A：Scality RING对象存储通过与LangChain框架和向量数据库结合，可以将存储的非结构化数据向量化，然后存储在Milvus向量数据库中，使GPT等AI模型能够访问和使用客户的专有数据进行响应生成。

Q2：为什么需要将数据向量化才能被AI模型使用？

A：因为AI模型通常在静态、通用数据上训练，无法直接理解非结构化数据。通过向量化处理，数据被转换为数学向量形式，代表其含义和维度，这样AI模型就能理解和使用这些专有数据。

Q3：Scality为什么选择Milvus作为向量数据库？

A：Scality选择Milvus是因为其查询速度快、可扩展性强、能直接与LangChain集成，并且在不同类型数据集上具有高精度，这些特性使其成为支持RAG工作流的理想选择。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

Scality RING对象存储支持RAG工作流

来源：BLOCKS & FILES

2025

08/11

07:15

分享

点赞

数智惠闽企，展车进福州｜华为坤灵中国行2025·福建站成功举办，推动闽企智能化发展新征程

AI时代的影像实验：记录你眼中的“变化”

大象转身，亦或重塑大象：Unity团结引擎的“中国本土”进化

无万卡，不VLA：元戎启行与阿里云的“想法”和“解法”

AI爬虫让“价格战”变成“算法战”，利润正在被看不见的流量吞噬 AI 爬虫程序流量在短短一年内暴增 300%

做好可持续数字化转型的“必答题”

SUSE Linux Enterprise Server (SLES) 16全新发布：AI赋能，智领企业管理

SAP商业AI获乌镇峰会精品案例奖，助推中国企业实现确定性增长

专访｜Cloudera致力于打造AI时代的企业级“数据操作系统”

专访｜AI浪潮下的“卖水人”：Cloudera解构企业AI的“源”与“治”

SAP TechEd柏林观察：企业AI如何发挥飞轮效应?

CIO策略观察——软件测试：从传统困局到 AI 无人测试转型

AI颠覆搜索引擎，XR眼镜秋季浪潮来袭

5000亿美元Stargate AI基础设施项目进展缓慢面临建设挑战

Truth Social推出由Perplexity提供的AI搜索功能

酒业巨头CIO引领生成式AI变革之路

Amazon升级版AI助手Alexa+首次体验测试报告

NotebookLM：谷歌最优秀AI工具迎来体验最佳时机

ChatGPT-5震撼发布，教育界准备好了吗？

Microsoft Copilot推出智能模式搭载GPT-5技术

谷歌向高校免费开放AI工具：科技巨头助力社会技能升级

从自动化到自主化：亚太地区智能体AI发展之路

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: