周四,AI平台Clarifai宣布推出新的推理引擎,该公司声称这将使AI模型运行速度提高一倍,成本降低40%。该系统设计为适应各种模型和云主机,采用多种优化技术从相同硬件中获得更多推理能力。
"这包含各种不同类型的优化,从CUDA内核到高级推测解码技术,"首席执行官Matthew Zeiler说道。"基本上,你可以从相同的显卡中获得更多性能。"
第三方公司Artificial Analysis进行的一系列基准测试验证了这些结果,在吞吐量和延迟方面都创下了行业最佳记录。
该过程专门针对推理进行优化,即运行已训练AI模型的计算需求。随着智能体和推理模型的兴起,这种计算负载变得特别密集,因为这些模型需要多个步骤来响应单个命令。
Clarifai最初作为计算机视觉服务推出,随着AI热潮大幅增加对GPU和容纳它们的数据中心的需求,该公司越来越专注于计算编排。该公司于12月在AWS re:Invent大会上首次宣布其计算平台,但新的推理引擎是首个专门为多步骤智能体模型定制的产品。
该产品推出正值AI基础设施面临巨大压力,这催生了一系列数十亿美元的交易。OpenAI已制定计划,可能投资高达1万亿美元用于新数据中心建设,预测对计算能力的未来需求几乎是无限的。但是,尽管硬件建设非常密集,Clarifai的首席执行官认为在优化现有基础设施方面还有更多工作要做。
"有一些软件技巧可以让像这样的优秀模型走得更远,比如Clarifai推理引擎,"Zeiler说,"但也有算法改进可以帮助减少对千兆瓦数据中心的需求。我认为我们还没有达到算法创新的终点。"
Q&A
Q1:Clarifai推理引擎有什么作用?
A:Clarifai推理引擎是一个新的AI优化系统,能够使AI模型运行速度提高一倍,同时将成本降低40%。它通过多种优化技术,包括CUDA内核和高级推测解码技术,让相同的硬件获得更强的推理能力。
Q2:这个推理引擎主要解决什么问题?
A:该引擎主要针对AI推理过程进行优化,特别是智能体和推理模型的计算需求。这些模型需要多个步骤响应单个命令,计算负载特别密集,推理引擎能够提高这类复杂模型的运行效率。
Q3:Clarifai为什么要开发这个推理引擎?
A:随着AI热潮带来的巨大计算需求和基础设施压力,以及OpenAI等公司计划投资万亿美元建设数据中心,Clarifai认为通过软件优化现有基础设施比单纯扩大硬件建设更有效,可以减少对大型数据中心的依赖。
好文章,需要你的鼓励
OpenAI发布ChatGPT新功能Pulse,可在用户睡眠期间生成个性化报告,提供5-10条简报帮助用户快速了解当日重要信息。该功能旨在让用户像查看社交媒体一样优先使用ChatGPT。Pulse首先向每月200美元的Pro订阅用户开放,未来计划扩展至所有用户。功能支持连接Gmail、日历等应用,可解析邮件、生成日程安排。报告以卡片形式展示,包含AI生成的图像和文本,涵盖新闻摘要、个性化建议等内容。
这项由谷歌DeepMind研究团队完成的开创性研究首次系统阐述了AI智能体经济的概念框架。研究提出"沙盒经济"模型,从起源性质和边界渗透性两个维度分析AI智能体经济形态,预测未来将出现自然涌现且高度透水的AI经济网络。研究详细探讨了科学加速、机器人协调、个人助手等应用场景,提出基于拍卖机制的公平资源分配方案和使命经济概念,并深入分析了技术基础设施需求、社区货币应用以及相关风险防范措施。
AI平台公司Clarifai发布新推理引擎,声称能让AI模型运行速度提升一倍,成本降低40%。该系统采用多种优化技术,从CUDA内核到高级推测解码,能在相同硬件上获得更强推理性能。第三方测试显示其在吞吐量和延迟方面创下行业最佳记录。该产品专门针对推理过程优化,特别适用于需要多步骤响应的智能体和推理模型。
中国人民大学研究团队提出LoFT方法,通过参数高效微调基础模型解决长尾半监督学习中的数据不平衡问题。该方法利用预训练模型的良好校准特性改进伪标签质量,并扩展出LoFT-OW版本处理开放世界场景。实验显示,仅使用传统方法1%的数据量就能取得更优性能,为AI公平性和实用性提供了新的解决方案。