11月18日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)。开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的AI数据基座。
该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容Hugging Face、LangChain等30余种主流AI框架。这一产品实现了数据库从传统“业务支撑系统”迈向“AI原生数据入口”的新功能,也是OceanBase自启动“Data×AI”战略以来的一份答卷。CEO杨冰表示:“希望OceanBase能够探索出一条数据库在AI时代的范式跃迁。”

杨冰认为,AI的真正瓶颈不在模型,而在数据。尤其在金融、政务等高敏场景,AI需在毫秒级完成实时推理,并安全融合私有数据。而传统架构依赖多系统拼接数据链路,不仅复杂低效,还易引发权限混乱与延迟风险。
“seekdb不是传统数据库的功能叠加,而是专为AI时代重构的AI原生数据库。”杨冰表示,“它继承OceanBase的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。我们希望与开发者一起,在混合搜索、多模融合等方向加速迭代、大胆创新。”
据Gartner预测,到2028年,支持生成式AI的数据库支出将达2180亿美元,占市场74%。但MIT研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。seekdb带来三大核心突破:
一是AI原生混合搜索能力。seekdb支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟的同时提升精度。依托成熟的事务引擎,它支持实时写入与ACID 一致性,并兼容MySQL 生态。此外,seekdb支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,兼顾性能与安全。
二是极简部署,开箱即用。seekdb最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能Agent、开发工具链或本地应用,大幅降低AI应用的工程门槛。
三是更开发者友好。seekdb以Apache 2.0协议全球开源,开发者可自由使用、修改和扩展。产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,无缝融入AI生态;并提供SQL及PythonSDK,适配不同开发习惯。同期开源的PowerRAG智能文档解析框架与PowerMem分层记忆架构,后者在LOCOMO Benchmark上以73.70分登顶SOTA,Token消耗降低96%,大幅节省推理成本。
作为 OceanBase“Data×AI”战略的关键一环,seekdb既可独立使用,也可平滑融入新发布的OceanBase 4.4一体化融合版本。该版本首次将TP、AP与AI能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用,帮助企业避免后期架构重构风险。商用LTS版本将于2026年2月2日推出。
目前,OceanBase的混合搜索能力已在多个行业成功落地,充分验证了其技术价值:中国联通基于混合搜索构建统一AI知识库,有效解决了私有文档的权限管理与高效检索难题;蚂蚁百宝箱则基于混合搜索实现智能体的实时在线搜索,显著提升了信息获取的精准性与响应效率。
“这不仅是技术产品,更是开发范式的跃迁。”杨冰表示,“传统数据库只‘存’数据,而seekdb能‘理解’数据语义,混合搜索正是AI原生数据库的关键分水岭。”过去十五年,OceanBase在“双11”等极限场景锤炼出的工程化能力,正转化为AI时代的底层优势,在AI原生混合搜索、多模融合、TP/AP/AI一体化、多云原生等方向持续突破。
自2010年由蚂蚁集团自主研发以来,OceanBase已服务全球4000余家企业,覆盖金融、政企、能源、通信、零售、制造、互联网等关键领域。其云服务OB Cloud是全球唯一同时支持阿里云、华为云、腾讯云、百度智能云、AWS、GCP、Azure七大主流云厂商的数据库产品,业务遍及全球16个国家和地区、60多个地域、240多个可用区。
杨冰强调:“未来数据库必须同时服务‘人’与‘智能体’。在一个数据库中支撑事务、分析与AI混合搜索,在数据源头驱动实时、可信的智能。”seekdb现已在GitHub开源,新域名oceanbase.ai同步启用,全球开发者可免费下载使用。此举是OceanBase践行AI战略的关键一步,旨在推动行业加速迈向“智能原生”架构,为全球智能化转型提供更普惠、更可落地的数据底座。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。