Cassava Technologies 可能会投资高达 7.2 亿美元,与 Nvidia Corporation 合作建设非洲首个人工智能工厂。
这家由津巴布韦电信大亨 Strive Masiyiwa 创立的泛非洲科技公司计划在南非、埃及、尼日利亚、肯尼亚和摩洛哥部署来自这家美国公司的加速计算和 AI 软件。
Cassava 总裁兼集团首席执行官 Hardy Pemhiwa 在一次采访中表示:"如果我们不迈出第一步投入自己的资金,无论金额多么有限,我们就不能期望别人先行。这关乎确保非洲不会落后。"
南非将成为首个接收 AI 驱动数据中心的国家,到 6 月份将部署 3,000 个来自 Nvidia 的图形处理器 (GPU)。
Pemhiwa 说:"我们计划在未来三到四年内在非洲安装 12,000 个 GPU,从南非的 3,000 个开始。GPU 本身就像铺设光纤一样,这项投资实际上是为了建设整个 AI 生态系统。"
单个 GPU 的成本在 45,000 到 60,000 美元之间。
根据 Pemhiwa 的说法,在全球 GPU 市场占有率达 93% 的 Nvidia 是 Cassava 的自然选择,因为"他们是市场领导者"。另一个吸引力在于 Cassava 可以将多余的算力出售给世界各地的其他 Nvidia 云计算客户。
Pemhiwa 补充道:"除了 GPU 之外,没有人建立过这样的生态系统,而 AI 工厂基本上是 Nvidia 在全球范围内的主要业务。"
Cassava 的非洲 AI 工厂将服务于大学研究人员、初创企业和医疗、金融科技以及政府等各个领域的开发者。
与此同时,据彭博新闻上周报道,Microsoft Corporation 已经在全球范围内收缩数据中心项目,这表明该公司正在更严格地审视其建设支持人工智能和云计算的服务器机房的计划。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。