IBM开发者正在为其watsonx.data和watsonx AI软件平台的其他组件添加新功能,以帮助客户构建和运行AI智能体,实现对数据存储请求的更快响应,并确保治理监控的合规性。
IBM的watsonx.data是一个基于湖仓架构的数据存储平台,运行多个查询引擎,如Presto、Spark和Meta的Velox,专门用于AI和分析工作负载。该平台是2023年5月IBM Think大会上发布的整体watsonx AI和数据平台的重要组成部分。watsonx.data代码可在本地或AWS等公有云环境中运行。其湖仓部分能够存储结构化和非结构化数据,支持Apache Parquet和Avro等开放数据格式,以及Apache Iceberg等表格式。
watsonx.data的架构设计让查询引擎访问元数据存储层,该层位于对象存储之上。这可以是IBM的Storage Scale、Ceph、AWS、Azure或GCP对象存储。计算层和存储层采用分离式架构设计。
今年5月我们了解到,watsonx.data的开发将结合开放数据湖仓与数据结构功能,如数据血缘跟踪和治理,帮助客户跨孤岛、格式和云环境统一、治理和访问数据。
最新的v2.2版本watsonx.data是整体watsonx AI数据平台更新的一部分,该平台包含三个核心组件:
watsonx.ai企业级AI工作室,通过传统机器学习和生成式AI功能及数据来运营化和扩展AI应用程序开发
watsonx.data开放、混合和受治理的数据存储平台
watsonx.governance用于以负责任、透明和可解释的方式指导、管理和监控组织的AI活动
watsonx.ai组件的AutoAI RAG功能得到增强,新增支持:
Elasticsearch向量存储
评估数据资产中每个问题的多个正确答案
多语言模型以匹配实验的输入语言
可视化显示每个设置对创建和排序优化模式的重要性
利用导入的自定义基础模型进行实验
利用混合搜索策略从索引文档中检索内容
此外,用户还可以使用新版本的watsonx.ai文本提取API简化业务文档处理,该API支持Microsoft Word和PowerPoint、HTML以及各种图像格式等额外文档格式。导入的自定义基础模型可以包括属于Tiny Time Mixer (TTM)系列的模型,这些模型可通过时间序列API访问。Tuning Studio中提供了参数高效微调(PEFT)技术,支持低秩适应(LoRA)和量化低秩适应(QLoRA),以及用于创建非结构化文本数据集的合成数据生成方法,用于模型调优和评估。
用户还可以使用新的命令行界面(ibm-watsonx-ai-cli)在本地部署和测试AI服务模板和应用程序。新支持的基础模型包括:granite-3-3-8b-instruct、meta-llama/llama-4-scout-17b-16e-instruct、meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8和mistral-small-3-1-24b-instruct-2503。
v2.2版本的watsonx.data推出了IBM watsonx.data高级版,提供集成用户体验来管理AI生命周期中的非结构化和结构化数据。基于集成开发环境(IDE)概念构建的数据工作台,集中了数据管理器和查询管理器的功能和能力。Gluten组件为当前Spark的原生C++性能提供优化。
Apache Gluten是一个开源项目,旨在通过将计算密集型SQL查询执行从Java虚拟机(JVM)卸载到原生C++引擎来改善Apache Spark性能。
该版本定义了Milvus向量数据库引擎的扩缩容策略和规则。数据产品中心集成使数据生产者能够在watsonx.data存储中创建/存储数据产品资产并与数据消费者共享。
最后,与watsonx商业智能分析智能体的互连可使用自然语言处理(NLP)执行查询。
watsonx.governance组件为智能体AI获得新功能,能够利用工作流程在将智能体纳入组织库存之前对其进行审查和评估。更新的仪表板提供与智能体相关的指标,智能体AI评估的其他功能也首先在SaaS交付选项中提供。
IBM v2.2 watsonx发布说明可在此处找到。
评论
IBM独立于其Storage Scale和Ceph存储产品开发了watsonx.data。这与Cloudian、WEKA和VAST Data的策略不同,后者在其存储产品之上构建AI管道软件堆栈元素,例如Cloudian采用Milvus向量数据库,VAST Data开发全面的AI操作系统。
我们看到IBM这些增量式的watsonx更新项目,对AI智能体堆栈日益增长的复杂性感到惊叹。如果AI智能体真如宣传的那样强大,难道它们不能处理这些复杂的AI智能体开发基础设施吗?
好文章,需要你的鼓励
Xbench是知名投资机构红杉中国推出一款全新的AI基准测试工具,旨在真实地反映AI的客观能力,其在评估和推动AI系统提升能力上限与技术边界的同时,会重点量化AI系统在真实场景的效用价值,并采用长青评估的机制,去捕捉AI产品的关键突破。
这项研究首次将在线强化学习成功应用于流匹配模型,通过巧妙的ODE到SDE转换和去噪减少策略,显著提升了AI图像生成的精确度和可控性。在复合场景生成、文字渲染等任务上取得突破性进展,为AI生成领域开辟了新的技术路径。
Atlassian总裁Anu Bharadwaj在Transform 2025大会上分享了公司AI智能体规模化的实践经验。她强调,成功部署AI智能体需要营造实验文化,而非仅依靠自上而下的指令。Atlassian通过Rovo Studio平台为各团队提供了构建定制化智能体的环境,创造心理安全的工作氛围,鼓励员工大胆尝试和迭代。公司客户通过该平台显著提升了工作效率,建筑行业客户将路线图创建时间缩短75%。
这篇由阿里巴巴集团联合多所知名高校发表的综述论文,系统梳理了统一多模态理解与生成模型的最新发展。研究将现有模型分为扩散、自回归和混合三大类型,详细分析了不同图像编码策略的特点,整理了相关数据集和评估基准,并深入探讨了当前面临的技术挑战。