IBM开发者正在为其watsonx.data和watsonx AI软件平台的其他组件添加新功能,以帮助客户构建和运行AI智能体,实现对数据存储请求的更快响应,并确保治理监控的合规性。
IBM的watsonx.data是一个基于湖仓架构的数据存储平台,运行多个查询引擎,如Presto、Spark和Meta的Velox,专门用于AI和分析工作负载。该平台是2023年5月IBM Think大会上发布的整体watsonx AI和数据平台的重要组成部分。watsonx.data代码可在本地或AWS等公有云环境中运行。其湖仓部分能够存储结构化和非结构化数据,支持Apache Parquet和Avro等开放数据格式,以及Apache Iceberg等表格式。
watsonx.data的架构设计让查询引擎访问元数据存储层,该层位于对象存储之上。这可以是IBM的Storage Scale、Ceph、AWS、Azure或GCP对象存储。计算层和存储层采用分离式架构设计。
今年5月我们了解到,watsonx.data的开发将结合开放数据湖仓与数据结构功能,如数据血缘跟踪和治理,帮助客户跨孤岛、格式和云环境统一、治理和访问数据。
最新的v2.2版本watsonx.data是整体watsonx AI数据平台更新的一部分,该平台包含三个核心组件:
watsonx.ai企业级AI工作室,通过传统机器学习和生成式AI功能及数据来运营化和扩展AI应用程序开发
watsonx.data开放、混合和受治理的数据存储平台
watsonx.governance用于以负责任、透明和可解释的方式指导、管理和监控组织的AI活动
watsonx.ai组件的AutoAI RAG功能得到增强,新增支持:
Elasticsearch向量存储
评估数据资产中每个问题的多个正确答案
多语言模型以匹配实验的输入语言
可视化显示每个设置对创建和排序优化模式的重要性
利用导入的自定义基础模型进行实验
利用混合搜索策略从索引文档中检索内容
此外,用户还可以使用新版本的watsonx.ai文本提取API简化业务文档处理,该API支持Microsoft Word和PowerPoint、HTML以及各种图像格式等额外文档格式。导入的自定义基础模型可以包括属于Tiny Time Mixer (TTM)系列的模型,这些模型可通过时间序列API访问。Tuning Studio中提供了参数高效微调(PEFT)技术,支持低秩适应(LoRA)和量化低秩适应(QLoRA),以及用于创建非结构化文本数据集的合成数据生成方法,用于模型调优和评估。
用户还可以使用新的命令行界面(ibm-watsonx-ai-cli)在本地部署和测试AI服务模板和应用程序。新支持的基础模型包括:granite-3-3-8b-instruct、meta-llama/llama-4-scout-17b-16e-instruct、meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8和mistral-small-3-1-24b-instruct-2503。
v2.2版本的watsonx.data推出了IBM watsonx.data高级版,提供集成用户体验来管理AI生命周期中的非结构化和结构化数据。基于集成开发环境(IDE)概念构建的数据工作台,集中了数据管理器和查询管理器的功能和能力。Gluten组件为当前Spark的原生C++性能提供优化。
Apache Gluten是一个开源项目,旨在通过将计算密集型SQL查询执行从Java虚拟机(JVM)卸载到原生C++引擎来改善Apache Spark性能。
该版本定义了Milvus向量数据库引擎的扩缩容策略和规则。数据产品中心集成使数据生产者能够在watsonx.data存储中创建/存储数据产品资产并与数据消费者共享。
最后,与watsonx商业智能分析智能体的互连可使用自然语言处理(NLP)执行查询。
watsonx.governance组件为智能体AI获得新功能,能够利用工作流程在将智能体纳入组织库存之前对其进行审查和评估。更新的仪表板提供与智能体相关的指标,智能体AI评估的其他功能也首先在SaaS交付选项中提供。
IBM v2.2 watsonx发布说明可在此处找到。
评论
IBM独立于其Storage Scale和Ceph存储产品开发了watsonx.data。这与Cloudian、WEKA和VAST Data的策略不同,后者在其存储产品之上构建AI管道软件堆栈元素,例如Cloudian采用Milvus向量数据库,VAST Data开发全面的AI操作系统。
我们看到IBM这些增量式的watsonx更新项目,对AI智能体堆栈日益增长的复杂性感到惊叹。如果AI智能体真如宣传的那样强大,难道它们不能处理这些复杂的AI智能体开发基础设施吗?
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。