当数据库开始为Agent重写,OceanBase如何再造AI数据库? 原创

当Agent开始成为企业软件和数据系统的新使用者后,数据库应该如何再一次面向AI进化?

过去三年里,AI行业最热闹的叙事几乎都是围绕模型和算力展开。

模型能力以周为单位迭代,企业预算也在流向大模型、GPU、训推平台和各种Agent(智能体)应用,然而,当AI越深入生产环境中,一个朴素的问题越是凸显出来:

模型也买了,算力也堆了,为什么很多AI项目依然难以真正产生实际价值?

这当然不是因为“模型还不够强”,问题其实出在了数据上。

OceanBase CEO杨冰指出:“AI落地企业最后的一公里,应该是一道数据难题。”在他看来,模型再聪明,如果无法理解业务、参与决策、跑通流程,就无法为企业创造价值。

通用大模型和一家企业真正需要的AI之间,隔着的是一条“业务上下文”的鸿沟。

那么,当Agent开始成为企业软件和数据系统的新使用者后,数据库应该如何再一次面向AI进化?

这是所有企业面临的一大难题,也是OceanBase需要回答的问题。

 当数据库开始为Agent重写,OceanBase如何再造AI数据库?

01 AI最后一公里,回到了数据库

在进入Agent时代后,数据库的服务对象,正在悄然发生变化。

过去的数据库,服务的对象是人。

工程师写SQL,业务人员看报表,系统按照预设流程增删改查,数据库记录的则是交易、订单、账户、库存、日志,是一套企业运转之后留下来的事实系统。

然而,这样的流程在进入人工智能时代,尤其是在Agent开始大量进入各个生产环节后,发生了根本性改变。

来自Gartner的预测数据显示,到2028年,预计33%的企业级软件将整合自主型AI Agent,且超过15%的日常工作决策将由AI Agent自主完成。

而Agent调用数据的方式与人类又截然不同,它们可以7×24小时运行,可以高频并发地查询、推理、执行任务,还可以在执行过程中不断生成新的记忆、状态和行动记录。

这意味着数据库第一次迎来了一类非人类用户,也就是Agent。

当数据库开始为Agent重写,OceanBase如何再造AI数据库?

基于过往深度参与到蚂蚁、阿里等大量数据密集型大型客户的Agent项目落地实践经验,杨冰指出,AI正在为数据库带来三个挑战:

第一,Agent规模不断增加。

vibe coding的火爆让几乎一句话就可以构建一个Agent,这让Agent构建成本趋近于0,也使得Agent和应用的数量呈指数级增长。以蚂蚁灵光为例,仅仅是在几个月的时间内,其所承载的应用就超过了3000万个。

第二,Agent开始执行生产任务。

企业落地Agent必然需要处理核心业务数据,这些业务对于准确性和一致性有着很高的要求,在AI时代,随着越来越多非结构化数据进入核心系统,混合搜索成为了以搜索为核心交互方式的Agent的刚需,这就需要在数据库上增加强大的搜索引擎能力。

当数据库开始为Agent重写,OceanBase如何再造AI数据库?

第三,Agent长期运行的正确性和自我进化能力需要得到保障。

Agent进化本质上需要大量可以被毫秒级复制、试验、回滚的评测数据集,传统数据库没有为Agent大量试错和自我进化进行设计,无法支持生产级Agent的Harness工程,而这是AI数据库必备的能力。

传统数据库应对这三大挑战的过程,也将是重新构建面向Agent的AI原生数据库的过程。

更重要的是,Agent需要的数据也不再只是表格,一笔订单、一段客服录音、一张发票照片、一份合同文本、一次用户对话、一条风控规则,它们共同构成了企业业务的上下文。过去被归档、备份、沉睡的非结构化数据,在大模型出现之后,第一次变成了可理解、可计算、可调用的资产。

换句话说,AI时代的数据库不能只回答“数据在哪里”,还要回答“这些数据是什么意思”、“能不能实时给Agent使用”,以及“能不能在使用中反哺模型和业务”。

当数据库开始为Agent重写,OceanBase如何再造AI数据库?

Agent每一次回答,本质上都是上下文+模型调用的体现,模型决定了能力的上限,但数据和上下文决定了业务价值,企业Agent应用之间的差距,越来越不只是“谁的模型更强”,而是“谁能让AI真正读懂业务”。

数据库由此也被再次推到了舞台中央,在Agent不断涌入企业生产系统的这一年,成为了AI落地的最后一公里。

02 只做AI检索不够,湖库一体是AI数据库的必然

今天谈AI数据库,很容易把它理解成传统数据库加一个向量检索插件,或者把搜索引擎、向量库、数据湖、交易库拼在一起。

不过,这不是OceanBase认为AI数据库该有的样子。

OceanBase CTO杨传辉将AI数据库称为“第四代数据库的基建”,在他看来,湖库一体是这代数据库的关键特性。

为什么是湖库一体?

当数据库开始为Agent重写,OceanBase如何再造AI数据库?

因为“湖”和“库”各自解决的问题不同,湖擅长开放、海量、多模态和多样化计算,库擅长事务、一致性、实时性和可靠性,AI真正进入企业核心场景之后,两者缺一不可。

如果结构化数据在交易库里,文档图片在对象存储里,向量在向量库里,搜索在搜索引擎里,离线加工又在另一套大数据系统里,Agent调用数据时就会面对多套系统、多套权限、多份元数据、多条链路,结果就是上下文不完整、数据不一致、权限难治理,延迟和运维复杂度也一起上升。

这在辅助问答里可能只是体验问题,但在风控、安全、金融、医疗等场景里,慢一拍、错一条,就可能变成业务事故。

所以,在AI时代的数据库,湖库一体是OceanBase给出的答案。

杨传辉则用几个更具体的技术指标来解释这样的改变:

第一,多模表。

过去关系表主要承载整数、字符串、时间等结构化字段,到了AI时代,一张表里还要能容纳文本列、向量列、LOB列、AI列等多模数据,虽然用户看到的仍是一张表,但表背后可以同时管理结构化和非结构化数据。

当数据库开始为Agent重写,OceanBase如何再造AI数据库?

第二,AI列。

它把模型能力引入数据库内部,可以对数据做embedding、打标、摘要等处理,并保证这些AI加工和数据本身保持一致性,也就是说,非结构化数据不再只是“存下来的文件”,而是可以被搜索、计算、治理和调用的数据资产。

第三,混合搜索。

今天AI数据库和原有关系型数据库最大的区别,是能够支持混合搜索,在同一张多模表里完成关系过滤、向量搜索、全文搜索、图搜索和AI计算,这比单纯向量检索更接近真实业务需要。因为Agent的搜索很少是单一模态的,它可能先用结构化条件缩小候选集,再用向量召回语义相近内容,再结合全文、图关系和重排获得结果,真正的上下文工程,天然需要混合搜索。

当数据库开始为Agent重写,OceanBase如何再造AI数据库?

这也是OceanBase反复强调“一体化”的原因,AI数据库不是把几个系统粘在一起,而是要把多模态、在线事务、实时分析、开放计算和Agent上下文,放到同一个强一致性底座上。

为此,OceanBase重写了AI时代的数据底座。

03 OceanBase如何再造AI数据库?

6月29日,OceanBase正式对外发布面向AI时代的湖库一体AI数据库,提出以湖库一体为核心架构,将数据湖的开放与海量存储能力、数据库的事务处理与分析能力,以及多模态数据处理能力统一到一套强一致的数据底座上。

当数据库开始为Agent重写,OceanBase如何再造AI数据库?

OceanBase AI数据库以湖库一体的Lakebase为底层引擎,解决AI时代的数据底座问题。

OceanBase Lakebase面向结构化、非结构化、多模态数据,提供统一管理、加工、检索和调用能力,既可以独立部署,服务全新的AI业务场景,也可以作为智能叠加层,与企业已有的数据湖和数据系统并行运行。

在OceanBase Lakebase之上,是OceanBase DataStudio,面向数据生产、治理与服务,覆盖数据集成、数据加工、数据治理、数据发布、资产管理等环节,DataStudio要解决的是企业如何把分散的数据资产变成可管理、可理解、可调用的数据服务。

在OceanBase DataStudio之上是支撑各类数据应用的快速落地,OceanBase DataPilot是其中之一,OceanBase产品部总经理韩富晟将DataPilot定义为更懂业务的数据智能Agent,用来帮助业务人员通过自然语言完成经营指标查询、归因分析、洞察报告生成和监控看板搭建,DataPilot的目标不是让业务人员多一个报表工具,而是让数据从“看得见”走向“用得上、能决策”。

当数据库开始为Agent重写,OceanBase如何再造AI数据库?

这套产品组合的逻辑很清楚,Lakebase作为底层引擎,DataStudio负责数据生产和治理,DataPilot负责业务智能入口,再结合PowerMem记忆智能体和PowerRAG企业知识库,OceanBase试图把AI应用落地所需的数据链路收敛到一套平台里。

据悉,OceanBase AI数据库可降低整体TCO约30%-50%,目前该能力已在蚂蚁阿福、灵光等场景完成验证,其中灵光累计生成数千万个“闪应用”,验证了湖库一体架构在千万级Agent场景下的可行性。

十五年前,双十一这样的极限业务场景倒逼了OceanBase原生分布式数据库的诞生,今天,灵光、阿福,以及国内正在涌入各类生产场景的Agent又在倒逼下一代AI数据库的出现。

作为已服务超400家金融机构,连续两年位居中国分布式数据库本地部署市场第一,也是迄今唯一同时登顶TPC-C和TPC-H两项国际权威测试的数据库,OceanBase业务已经覆盖全球多个国家和地区。

当数据库开始为Agent重写,AI数据库也就不再是数据库行业的一个小分支,而是AI应用能否真正进入企业核心业务的基础设施问题,杨冰指出:“下一个10年,OceanBase的目标就是再造一个AI时代的数据库。”

这一次,OceanBase选择从数据库内核出发,将长期在金融核心系统中验证的事务一致性、高可用与弹性能力,延伸至湖与多模态数据体系之上,使其具备统一支撑AI负载的能力,这是从底层出发的重构,而非在旧架构上的叠加修补。

来源:至顶网人工智能频道

0赞

好文章,需要你的鼓励

2026

06/30

13:24

分享

点赞

邮件订阅