人工智能基础设施初创公司C-Gen.AI今日正式发布,推出一个全新平台,帮助数据中心运营商自动化部署并最大化利用驱动当今最先进AI模型的昂贵硬件资源。
众所周知,AI模型能够帮助自动化以前由人类执行的业务流程。但直到现在,人类仍然不得不艰难地构建和维护支撑这些模型的昂贵基础设施栈。
现在,借助C-Gen.AI,数据中心团队终于可以获得自己的AI自动化解决方案。其全新的GPU编排平台旨在帮助这些团队快速建立AI基础设施,并以最具成本效益的方式进行扩展,避免任何资源浪费。
这家初创公司表示,希望颠覆AI基础设施栈的构建方式。当今最先进的AI模型,如ChatGPT,运行在庞大的图形处理单元集群上,这些集群由人工操作员全天候配置和维护。传统上,管理这种基础设施一直是一个手动、资源密集且缓慢的过程。企业被迫在云基础设施提供商的迷宫中穿行,并处理计算能力未充分利用和扩展困难等问题。
C-Gen.AI希望消除所有这些阻力,为此它使用AI本身来解决问题。C-Gen.AI平台位于客户现有GPU基础设施之上,将这些资源转化为"AI超级计算机",具备自动化集群部署、实时扩展和GPU重用等功能。
该公司表示,其平台可以在几分钟内自动化部署新的AI集群,然后密切监控它们,确保始终平稳运行并达到最高效率。通过动态重新分配闲置GPU资源用于推理任务,确保没有任何资源浪费。
这家初创公司认为可以帮助各种规模的公司。例如,大多数AI初创公司都在昂贵的云基础设施账单上苦苦挣扎,并在扩展时承受缓慢的配置。通过为他们提供能够在几秒钟内适应和扩展的基础设施平台,AI公司可以随着增长而扩展,而无需花费数千美元重新设计和重建基础设施栈。
对于数据中心运营商,特别是那些试图与亚马逊网络服务和谷歌云等巨头竞争的小型运营商,C-Gen.AI表示可以帮助他们更好地组织GPU资源,确保没有任何浪费。通过即时重新分配闲置GPU来处理推理任务,可以帮助他们最大化AI硬件的收入潜力。
此外,C-Gen.AI表示还可以为需要构建自己的可扩展、资源高效AI栈以保持合规的大型企业提供服务。
C-Gen.AI在AI基础设施方面的专业知识来自其创始人兼首席执行官萨米·卡马,他对数据中心颇有了解。他此前曾帮助英伟达公司、AWS和CERN等公司优化其AI栈的性能。
据卡马介绍,AI基础设施行业充满低效问题,大量GPU投资处于闲置状态,主要是由于管理不善和配置缓慢。他说,这是AI硬件成本飙升的一个重要原因。
"基础设施层是大多数AI项目悄然失败的地方,"卡马解释道。"这不仅仅是获得GPU的问题。而是无法足够快地部署、工作负载之间发生的浪费,以及将团队锁定在他们无法承受扩展的环境中的僵化性。"
卡马表示,他的公司能够为AI硬件团队带来的成本节约和效率提升将是巨大的。他引用了高德纳公司的一项预测,该预测显示全球生成式AI支出将从2023年的1240亿美元增长到年底的6440亿美元。同一份报告警告说,大部分支出是由于复杂性和不断增加的技术债务,并敦促企业投资于能够智能扩展和快速适应的基础设施,以避免成本超支。
"如果我们希望企业AI能够提供真正的结果,我们必须修复它运行的基础,"卡马说。"这就是C-Gen.AI提供的价值主张。这是没有痛苦、没有浪费的大规模AI。"
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。