Clarifai新推理引擎让AI模型运行速度翻倍成本降低40%

AI平台公司Clarifai发布新推理引擎，声称能让AI模型运行速度提升一倍，成本降低40%。该系统采用多种优化技术，从CUDA内核到高级推测解码，能在相同硬件上获得更强推理性能。第三方测试显示其在吞吐量和延迟方面创下行业最佳记录。该产品专门针对推理过程优化，特别适用于需要多步骤响应的智能体和推理模型。

周四，AI平台Clarifai宣布推出新的推理引擎，该公司声称这将使AI模型运行速度提高一倍，成本降低40%。该系统设计为适应各种模型和云主机，采用多种优化技术从相同硬件中获得更多推理能力。

"这包含各种不同类型的优化，从CUDA内核到高级推测解码技术，"首席执行官Matthew Zeiler说道。"基本上，你可以从相同的显卡中获得更多性能。"

第三方公司Artificial Analysis进行的一系列基准测试验证了这些结果，在吞吐量和延迟方面都创下了行业最佳记录。

该过程专门针对推理进行优化，即运行已训练AI模型的计算需求。随着智能体和推理模型的兴起，这种计算负载变得特别密集，因为这些模型需要多个步骤来响应单个命令。

Clarifai最初作为计算机视觉服务推出，随着AI热潮大幅增加对GPU和容纳它们的数据中心的需求，该公司越来越专注于计算编排。该公司于12月在AWS re:Invent大会上首次宣布其计算平台，但新的推理引擎是首个专门为多步骤智能体模型定制的产品。

该产品推出正值AI基础设施面临巨大压力，这催生了一系列数十亿美元的交易。OpenAI已制定计划，可能投资高达1万亿美元用于新数据中心建设，预测对计算能力的未来需求几乎是无限的。但是，尽管硬件建设非常密集，Clarifai的首席执行官认为在优化现有基础设施方面还有更多工作要做。

"有一些软件技巧可以让像这样的优秀模型走得更远，比如Clarifai推理引擎，"Zeiler说，"但也有算法改进可以帮助减少对千兆瓦数据中心的需求。我认为我们还没有达到算法创新的终点。"

Q&A

Q1：Clarifai推理引擎有什么作用？

A：Clarifai推理引擎是一个新的AI优化系统，能够使AI模型运行速度提高一倍，同时将成本降低40%。它通过多种优化技术，包括CUDA内核和高级推测解码技术，让相同的硬件获得更强的推理能力。

Q2：这个推理引擎主要解决什么问题？

A：该引擎主要针对AI推理过程进行优化，特别是智能体和推理模型的计算需求。这些模型需要多个步骤响应单个命令，计算负载特别密集，推理引擎能够提高这类复杂模型的运行效率。

Q3：Clarifai为什么要开发这个推理引擎？

A：随着AI热潮带来的巨大计算需求和基础设施压力，以及OpenAI等公司计划投资万亿美元建设数据中心，Clarifai认为通过软件优化现有基础设施比单纯扩大硬件建设更有效，可以减少对大型数据中心的依赖。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Clarifai新推理引擎让AI模型运行速度翻倍成本降低40%

来源：Techcrunch

2025

09/26

08:10

分享

点赞

Vibe Bot推出桌面AI智能体设备

Razer推出桌面AI动漫全息投影智能助手

Cloudera：构建符合伦理标准的AI，可信数据是关键

Nvidia发布Vera Rubin AI计算平台，性能大幅提升

7种削弱IT业务价值的致命做法

PTC在NRF 2026大会上发布AI驱动的FlexPLM新功能

如何终结针对IT部门的指责游戏

Windchill + Makersite，让可持续性从“理念”变为“行动”

Linux基金会领导者：我们并未处在AI泡沫中

全新软件与模型优化为 NVIDIA DGX Spark 注入强大动力

NVIDIA DGX Spark 为桌面端最新开源与前沿AI模型提供强大算力支持

AI流量激增为何现在就需要光网络自动化

Harness推出智能体担任DevOps任务管理者

韩国芯片初创公司FuriosaAI推出服务器产品挑战GPU霸主地位

Liquid AI发布超小型高性能基础模型，专为设备端处理设计

Databricks与OpenAI达成1亿美元合作，简化企业AI智能体部署

Solidigm为PS1010 SSD产品线新增E1.S液冷版本

DeepMind推出RoboBallet：让制造机器人实现自主协调的AI系统

2025魔搭社区MCP&Agent挑战赛落幕：20支进入决赛的团队角逐AMD创新赛道，端侧智能体应用百花齐放

阿里云瓴羊发布企业级AI智能体服务平台AgentOne，成就AI时代的“超级公司”

谷歌让AI更易获取真实世界数据

微软为Copilot引入Anthropic AI模型

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: