周四,AI平台Clarifai宣布推出新的推理引擎,该公司声称这将使AI模型运行速度提高一倍,成本降低40%。该系统设计为适应各种模型和云主机,采用多种优化技术从相同硬件中获得更多推理能力。
"这包含各种不同类型的优化,从CUDA内核到高级推测解码技术,"首席执行官Matthew Zeiler说道。"基本上,你可以从相同的显卡中获得更多性能。"
第三方公司Artificial Analysis进行的一系列基准测试验证了这些结果,在吞吐量和延迟方面都创下了行业最佳记录。
该过程专门针对推理进行优化,即运行已训练AI模型的计算需求。随着智能体和推理模型的兴起,这种计算负载变得特别密集,因为这些模型需要多个步骤来响应单个命令。
Clarifai最初作为计算机视觉服务推出,随着AI热潮大幅增加对GPU和容纳它们的数据中心的需求,该公司越来越专注于计算编排。该公司于12月在AWS re:Invent大会上首次宣布其计算平台,但新的推理引擎是首个专门为多步骤智能体模型定制的产品。
该产品推出正值AI基础设施面临巨大压力,这催生了一系列数十亿美元的交易。OpenAI已制定计划,可能投资高达1万亿美元用于新数据中心建设,预测对计算能力的未来需求几乎是无限的。但是,尽管硬件建设非常密集,Clarifai的首席执行官认为在优化现有基础设施方面还有更多工作要做。
"有一些软件技巧可以让像这样的优秀模型走得更远,比如Clarifai推理引擎,"Zeiler说,"但也有算法改进可以帮助减少对千兆瓦数据中心的需求。我认为我们还没有达到算法创新的终点。"
Q&A
Q1:Clarifai推理引擎有什么作用?
A:Clarifai推理引擎是一个新的AI优化系统,能够使AI模型运行速度提高一倍,同时将成本降低40%。它通过多种优化技术,包括CUDA内核和高级推测解码技术,让相同的硬件获得更强的推理能力。
Q2:这个推理引擎主要解决什么问题?
A:该引擎主要针对AI推理过程进行优化,特别是智能体和推理模型的计算需求。这些模型需要多个步骤响应单个命令,计算负载特别密集,推理引擎能够提高这类复杂模型的运行效率。
Q3:Clarifai为什么要开发这个推理引擎?
A:随着AI热潮带来的巨大计算需求和基础设施压力,以及OpenAI等公司计划投资万亿美元建设数据中心,Clarifai认为通过软件优化现有基础设施比单纯扩大硬件建设更有效,可以减少对大型数据中心的依赖。
好文章,需要你的鼓励
英国宠物慈善机构PDSA数据显示,超过半数宠物主担心无法承担兽医费用。科技公司正通过AI和物联网技术解决这一市场需求。在伦敦兽医展上,多家初创公司展示了创新技术:AI for Pet利用视觉AI分析宠物眼部、皮肤等图像提供健康洞察;Sylvester.ai开发AI模型识别猫咪疼痛表情;VEA整合患者数据自动化诊断。此外,智能项圈等物联网设备可追踪宠物健康症状。这些技术有助于宠物主采取预防措施,降低兽医费用。
蚂蚁集团等机构联合提出IGPO方法,解决多轮AI智能体训练中的奖励稀疏问题。该方法通过信息增益为每个交互轮次提供密集反馈,避免传统方法中的"优势坍塌"现象。在七个数据集上的实验表明,IGPO显著超越现有方法,平均提升4.8分,对小型模型改进尤为显著。该研究为多轮推理AI训练提供了新思路。
北欧国家启动统一人工智能产业计划,旨在通过合作在全球舞台上竞争,获得微软和谷歌支持。10月成立的新北欧AI中心获得350万英镑初始预算,但谷歌和微软是唯一提供资金支持的科技公司,具体金额保密。该中心将开发生成式AI系统并建设应用AI服务的系统。北欧教育部长承诺追加资金开发大型北欧语言生成AI模型。尽管资金有限,但北欧国家希望通过联合力量在AI竞赛中提升地位。
ETH苏黎世大学和Google联合开发的VIST3A技术,通过巧妙拼接视频生成模型和3D重建模型,实现了仅用文字描述就能生成高质量3D场景的突破。该技术采用模型拼接和直接奖励微调两大核心创新,在多个基准测试中显著超越现有方法,为3D内容创作的民主化开辟了新路径,有望推动游戏、教育、设计等领域的变革。