IBM 发布新的 Granite 3.2 系列模型，实现按需推理能力

IBM 公司今天推出了新的 Granite AI 模型系列，具备实验性推理、视觉和预测能力，旨在在企业人工智能市场中占据一席之地。所有 Granite 模型均在 Apache 2.0 开源许可证下开放，现已在 Hugging Face 和 IBM watson.ai 等平台上提供。新系列的旗舰产品是 Granite 3.2 Instruct 变体，支持文本处理，能够执行摘要、问题解决和代码生成等任务，并设计为遵循指令。

为了在企业人工智能市场中开拓自己的领地，IBM 公司今天推出了新一代 Granite AI 模型系列，包含实验性推理能力、视觉和预测功能。

与以往每次发布一样，IBM 以开放源代码 Apache 2.0 许可证发布这些模型。所有 Granite 模型现已在 Hugging Face 上线，部分模型也可在 IBM watson.ai 及其他平台上使用。

这个新系列包含旗舰级纯文本大语言模型 Granite 3.2 Instruct，有 8B 和 2B 两个版本。它可以执行总结、问题解决和代码生成等任务，并且设计为可以遵循指令。这些类型的模型最适合构建 AI 助手和代理。两个版本都经过训练，可以使用类似于其他行业标准模型的"思维链"推理，但 IBM 工程师特别设计了更小、性能更高的模型。

每个模型的推理能力都可以通过编程方式开启或关闭。这意味着 IBM 不需要发布单独的"推理模型"，而是创建了一个可以在对话模式和推理模式之间切换的模型。由于推理在部署时需要大量计算资源，在不需要时关闭这一功能可以节省大量能源。

IBM AI 研究副总裁 Sriram Raghavan 表示："AI 的下一个时代关注效率、集成和实际影响 - 企业无需过度投入计算资源就能实现强大的成果。"

推理模型通过"逐步"思考问题，业内通常称之为"思维链"。自 DeepSeek 的 R1 发布以来，这类模型越来越受欢迎。大多数推理模型会扫描整个推理空间以发现最佳逻辑"路径"，然后生成最终答案。然而，一旦确定某条路径不可行，就没有必要继续探索整个路径。

IBM 工程师开发了一种新颖的推理扩展技术，通过使用第二个过程奖励模型添加奖励系统，降低了推理任务的计算成本。这个奖励模型会监控大语言模型，并在推理过程中将其引导至具有更高置信度结果的逻辑路径。结合可以扫描整个逻辑空间的搜索技术，IBM 研究人员表示，与一体化的 R1 相比，他们能够创建一个更小、更高效的推理模型方案。

SiliconANGLE 姐妹市场研究公司 theCUBE Research 的首席分析师 Dave Vellante 表示："DeepSeek 的 R1 发布在某种程度上承认了 IBM 更小、高效率的模型策略。IBM 的简报强化了这一观点，指出 DeepSeek 早在 2024 年 12 月就使用了专家混合和其他效率方法，但直到最近 R1 受到关注才引起市场注意。我们认为这呼应了 IBM 在训练效率和专业架构方面的方法。"

IBM 表示，Granite 3.2 8B 经过调优后，在 AIME2024 和 MATH500 等数学推理基准测试中可以与 Claude 3.5 Sonnet 和 OpenAI GPT-4o 等更大的模型相媲美。

新的多模态视觉模型和更小的护栏模型

IBM 还发布了新的多模态 Granite Vision 3.2 2B，具备计算机视觉能力，专门训练用于帮助企业处理视觉文档理解。

Granite Vision 可以处理各种视觉理解任务，但最适合处理文档。虽然大多数视觉语言模型都是为视觉任务设计的，但很少有模型在光学字符或文本识别方面表现出色。IBM 的工程团队花费了大量时间训练 Vision 3.2，使其能够识别布局、字体、图表和信息图表的独特视觉特征。

Granite Guardian 3.2 是 IBM 最新的护栏 AI 模型，旨在检测和突出显示提示和响应中的风险。公司表示，它提供了与 3.1 相当的性能，但速度更快，成本更低。

Guardian 3.2 的一个优点是在监控输入和输出时提供"口头置信度"指示。它不是简单地表示二元的"是"或"否"，而是表达"高"或"低"的置信水平。这为开发人员提供了更好的指示，帮助他们判断是否可以信任或拒绝输出，给出了一个可以使用的阈值。

除了更新的 8B 版本外，IBM 还发布了两个新的模型规模。第一个是精简的 50 亿参数版本，保持接近原始版本的性能。第二个是 Granite 3.2 3B-A800M，通过微调专家混合基础模型创建。它通过一次只激活其 30 亿参数中的 8 亿参数来运行，以实现低成本高性能。

IBM Granite 系列的最后一个模型包括紧凑型 Granite Timeseries 模型，也称为 Tiny Time Mixers。最新添加的 Granite-Timeseries-TTM-R2.1 扩展了模型功能，可以进行长达两年的日常和每周预测。时间序列模型适用于预测金融、经济、供应链需求预测和零售季节性库存规划等行业的长期趋势。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

IBM 发布新的 Granite 3.2 系列模型，实现按需推理能力

来源：SiliconANGLE

2025

02/27

09:48

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: