企业客户在数据主权、合规性和监管要求方面面临的挑战日益增加,这使得AI系统的集成变得愈发重要。为满足上述需求,IBM SQL Data Insights Pro(SQL DI Pro)于2026年3月正式上线,为z/OS平台上的Db2数据库引入了语义搜索、相似性发现、异常检测以及结构化与非结构化数据的统一分析能力。SQL DI Pro将AI能力直接内嵌至Db2中,从而有效降低客户在将数据迁移至其他分析框架时所面临的隐私泄露、合规违规及数据不一致等风险。从研究角度而言,SQL DI Pro是AI与数据系统融合方向上的一款开创性产品,为后续更深层次的AI系统集成研究打开了大门。
该技术由IBM研究团队负责构思与原型开发,将传统SQL从基于语法的查询方式扩展为AI驱动的模式发现,使开发者和数据分析师能够从结构化与非结构化数据中挖掘出以往难以乃至无法获取的洞察信息。
IBM Db2 for z/OS是一款关键任务级企业关系型数据库管理系统,深受全球众多大型企业机构的信赖。尽管存储在Db2 for z/OS中的数据内容丰富、体量庞大,但随着数据规模与复杂度的持续增长,从中提取有价值的洞察变得愈发困难。
跨业务实体的相似性检测、企业交易中的异常检测以及数据驱动的决策建议等应用场景,均需要超越传统SQL的能力支撑,而仅凭常规关系型查询难以实现这些目标。
通过将先进的语义分析能力直接嵌入Db2 for z/OS,SQL DI Pro可实现以下优势:
更深入、更直观的数据理解
降低对外部数据处理管道的依赖
减少运营成本与复杂度
更便捷地满足数据主权与治理合规要求
SQL DI Pro的技术基础
SQL DI Pro构建于同样由IBM研究团队开发的SQL Data Insights(SQL DI)所奠定的基础之上。SQL DI引入了将结构化关系型数据嵌入高密度向量表示的理念,支持直接在Db2内部执行基于相似性的操作,如聚类分析和实体比较。通过将数据行转化为潜在空间中的向量,SQL DI使关系型数据的分析超越了精确匹配谓词的局限,从而支持对业务数据实体进行近似推理。
SQL DI Pro在此基础上进行了大幅扩展,以充分捕获非结构化数据中的语义内涵。在企业工作负载中,大量有价值的信息存在于自由格式文本字段中,例如客户备注、交易描述、理赔记录和合规文档。这些字段通常篇幅较长、内容稀疏或语言结构复杂,难以通过传统的基于属性的编码方式进行有效建模。SQL DI Pro集成了IBM的现代编码器模型,能够为包含长篇非结构化文本的列生成高质量的嵌入向量,从而实现超越传统结构化数据分析的语义理解能力。
SQL DI Pro通过以下方式将非结构化列嵌入与结构化列嵌入相融合,构建出统一的语义层:
非结构化数据的列级嵌入:长文本列通过基于Transformer的编码器进行处理,生成密集的语义向量,这些嵌入能够捕获文本字段间的上下文信息、主题相似性及隐性关联关系。
结构化数据嵌入:表格属性继续采用专为关系型数据设计的专用模型进行编码,保留数值关系、类别语义及列间依赖关系。
对齐至共享潜在空间:结构化与非结构化嵌入经过归一化处理后,被映射至统一的向量空间,支持跨模态的直接比较与联合推理。
这种统一方案使用户能够在Db2 for z/OS中对多样化数据类型进行端到端的AI驱动发现,同时针对每种数据模态采用最适合的模型。
内置SQL函数与增量重训练
SQL DI Pro引入了四个内置SQL函数以支持语义分析,这些函数可嵌入SQL语句中实现统一的数据处理。
此外,SQL DI Pro还包含一种增量重训练算法,在新数据引入时无需对数据库嵌入进行代价高昂的全量重训练。该方案支持随着新数据的到来或现有数据的变更实时更新嵌入,与全量重训练相比,显著降低了计算与处理开销。这确保了数据库嵌入始终保持最新状态,使SQL DI Pro的高级语义搜索能够持续反映不断演变的数据集中的最新规律。
硬件加速与未来研究方向
SQL DI Pro借助IBM Z Telum处理器的片上AI能力,结合IBM研究团队开发的IBM Z深度学习编译器(zDLC)——一套专为z架构优化深度学习工作负载的编译器框架——来加速嵌入生成与模型推理过程。
这一加速能力是使语义查询处理在Db2 for z/OS内部得以实际运行的核心所在。嵌入生成、相似性评分、聚类分析及异常检测等操作在面对大型企业数据集时计算量极为密集。通过针对IBM Z AI加速能力对上述工作负载进行优化,SQL DI Pro将AI能力引至关键任务数据侧,同时降低了将敏感信息迁移至外部分析环境的需求。
IBM研究团队还在探索将IBM Z与Spyre加速器配合使用,以进一步提升SQL DI Pro工作负载的加速能力。相关研究包括在多卡配置下使用Spyre,使语义处理任务能够跨多个加速器并行执行,从而提高吞吐量与可扩展性。团队还在探索Telum与Spyre的混合集成方案,使工作负载能够根据延迟、规模、数据局部性及系统利用率等因素,自动选用最合适的加速资源。这一混合加速方向有望帮助SQL DI Pro在最大化性能与资源效率的同时,充分发挥IBM Z在安全性、治理能力、高可用性及数字主权方面的固有优势。
Q&A
Q1:SQL DI Pro和原来的SQL DI有什么区别?
A:SQL DI主要将结构化关系型数据嵌入为密集向量,支持相似性聚类和实体比较。SQL DI Pro在此基础上大幅扩展,加入了对非结构化数据(如客户备注、交易描述等长文本字段)的语义嵌入能力,并通过统一向量空间将结构化与非结构化嵌入对齐,实现跨模态联合推理,语义理解能力显著提升。
Q2:SQL DI Pro的增量重训练算法有什么优势?
A:传统方式在引入新数据时需要对所有嵌入进行全量重训练,计算代价极高。SQL DI Pro的增量重训练算法支持在新数据到来或现有数据变更时仅对相关部分进行更新,大幅降低了计算与处理开销,同时保证嵌入始终反映最新的数据规律,确保语义搜索结果的准确性和时效性。
Q3:SQL DI Pro如何利用IBM Z硬件进行加速?
A:SQL DI Pro借助IBM Z Telum处理器内置的片上AI能力,结合IBM Z深度学习编译器(zDLC)对嵌入生成、相似性评分、聚类和异常检测等计算密集型操作进行优化加速。未来还计划引入Spyre加速器,支持多卡并行处理,并探索Telum与Spyre的混合加速方案,以进一步提升吞吐量、可扩展性和资源利用效率。
好文章,需要你的鼓励
英国政府在AI采纳峰会上宣布设立2亿英镑专项基金,旨在帮助企业提升AI技能并推广AI应用。资金将用于多项举措,包括为中小企业提供AI培训、设立AI采纳成长实验室、扩大Sparck AI奖学金计划等。思科、IBM、BT、劳斯莱斯等30余家企业参与其中。政府还与谷歌、微软、Anthropic及OpenAI签署联合声明,共同推动AI负责任发展,并设立"亲劳工AI采纳奖",表彰在提升生产力和员工技能方面表现突出的企业。
复旦大学与罗切斯特大学研究发现,28个主流大语言模型在风险决策中存在"表面像人、机制不像人"的系统性问题,单靠答案相似无法评估AI真实可靠性。
微软在6月补丁日修复了高危零日漏洞CVE-2026-45586,该漏洞由化名"Nightmare Eclipse"的研究员披露。此前双方因漏洞披露协议破裂而交恶,研究员陆续公开多个未修复漏洞。本次修复的漏洞涉及Windows协作翻译框架,属本地权限提升类型,可被链式利用获取SYSTEM权限。此外,研究员披露的另一漏洞MiniPlasma似乎也已被悄然修复,但微软未提供相关CVE编号。本轮补丁共修复约200个漏洞。
ZipSplat是苏黎世联邦理工学院提出的三维高斯泼溅框架,通过K-means令牌聚类将Gaussian数量减少最高33倍,同时在多个基准上超越现有方法,推理时无需重新训练即可调节质量与效率的平衡。