IBM旗下子公司Red Hat今日在亚特兰大举办的Red Hat Summit上,发布了一系列产品更新与合作公告,旨在帮助企业将人工智能投入实际运营、推进基础设施现代化,并将开源平台延伸至软件定义汽车、太空计算等全新应用场景。
本次发布的核心是Red Hat AI 3.4,这是该公司企业级AI平台的最新版本,专为支持混合云环境下的大规模推理及智能体AI部署而设计。
Red Hat AI副总裁兼总经理Joe Fernandes表示,公司的AI战略围绕四大核心支柱展开:一是帮助客户实现快速、灵活、高效的推理,在其自有环境中部署模型;二是将企业数据与模型及智能体打通连接;三是加速智能体在混合云环境中的部署与管理;四是通过一体化AI平台将以上能力整合,使客户能够在任意硬件和云环境中运行任意模型与智能体。
本次更新新增了模型即服务能力,管理员可通过集中式网关统一管控AI模型访问权限、追踪使用情况并执行策略。Red Hat还扩展了对分布式推理的支持,并引入推测解码等技术以提升性能、降低运营成本。推测解码是一种大语言模型推理优化技术,可在不降低输出质量的前提下将文本生成速度提升至原来的三倍。
Fernandes指出,推理而非模型训练,将成为企业AI工作负载的主导方向。"推动推理需求指数级增长的关键驱动力,正是AI智能体。"他说,"我们提供的平台,可让客户在混合基础设施环境中部署和管理AI智能体。"
智能体管理
在智能体管理方面,Red Hat新增了可观测性功能,包括推理调用和工具使用的链路追踪,以及对Model Context Protocol网关与目录的支持。此外还引入了提示词管理、自动化评估工具,以及部分由Red Hat近期收购的Chatterbox Labs提供支持的AI安全测试能力。
Fernandes表示,企业客户的关注重心已从构建基础模型转向利用自有数据将现有模型投入实际运营。"从零开始预训练模型,只有极少数大型机构才会做。我们发现,企业客户更关注的是调用这些模型,并将其与自身数据有效连接。"
本次AI公告还进一步深化了Red Hat与英伟达的合作,涵盖对英伟达Blackwell架构及即将推出的Vera Rubin平台的支持,以及参与英伟达面向AI智能体沙箱与安全执行的OpenShell项目。
Linux进军太空
在合作伙伴层面,Red Hat宣布与Voyager Technologies达成合作,将在国际空间站的Voyager Space Edge微型数据中心上部署Red Hat Enterprise Linux 10.1及Universal Base Image,以支持在轨数据处理与AI工作负载,并将地面DevSecOps实践延伸至太空环境。
该平台通过不可变容器原生操作、后量子密码学及可移植容器化工作负载,应对轨道计算环境在电力、连接和硬件资源方面的严苛限制,为在轨边缘处理提供强化安全的运行环境。
此外,Red Hat还披露了与日产汽车的联合工程合作计划,双方将基于Red Hat车载操作系统,共同开发日产下一代软件定义汽车平台,为日产未来的中央车辆计算机架构提供标准化Linux基础,并支持整个车辆生命周期内的软件更新与AI驱动能力。日产高管表示,此次合作体现了公司对软件开发栈掌控权的战略性重视。
本届峰会期间,Red Hat还将围绕Enterprise Linux、OpenShift及Ansible自动化发布更多相关公告。
Q&A
Q1:Red Hat AI 3.4新增了哪些核心功能?
A:Red Hat AI 3.4新增了模型即服务能力,支持通过集中网关管控模型访问权限和使用策略;引入推测解码技术,可将文本生成速度提升至原来的三倍;扩展了分布式推理支持;同时新增了智能体管理与可观测性功能,包括推理链路追踪、Model Context Protocol网关支持,以及由Chatterbox Labs技术支撑的AI安全测试能力。
Q2:Red Hat和日产汽车的合作具体要做什么?
A:Red Hat与日产汽车联合开展工程合作,基于Red Hat车载操作系统共同开发日产下一代软件定义汽车平台。该平台将为日产未来的中央车辆计算机架构提供标准化Linux基础,支持车辆全生命周期内的软件更新与AI驱动功能。日产方面表示,此次合作是公司加强自身软件开发栈掌控权的战略性决策。
Q3:Red Hat为什么要把Linux部署到国际空间站?
A:Red Hat与Voyager Technologies合作,在国际空间站的Space Edge微型数据中心部署Red Hat Enterprise Linux 10.1,目的是支持在轨数据处理和AI工作负载,同时将地面成熟的DevSecOps实践引入太空环境。该方案采用不可变容器操作、后量子密码学等技术,专门应对太空轨道环境中电力有限、网络间歇、硬件资源受限等挑战。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。