中国阿里云无法以足够快的速度部署服务器来满足AI需求,因此正在对GPU进行配给,优先为使用其全套服务的客户提供访问权限。
在阿里巴巴集团第二季度财报电话会议上,CEO吴泳铭表示,"AI需求正在加速增长",同时需求也在深化,"涵盖企业运营的各个方面,包括产品开发、整个制造流程,以及支持企业和客户使用其产品的应用。"
"就我们部署新服务器的速度而言,我们甚至无法跟上客户需求的增长步伐,"他补充说。
需求如此强劲,以至于阿里巴巴正在对GPU进行配给,优先满足其最佳客户的需求。
"如果外部客户正在使用我们所有的服务,包括云服务、所有阿里云服务,涵盖存储、大数据以及所有其他服务,那么该客户当然会获得更高级别的优先权,"他说。"如果客户只是租用GPU来满足一些非常简单的推理需求,那么这些客户的需求相应地会被给予稍低级别的优先权。"
吴泳铭还回应并驳斥了AI是投资泡沫的担忧。他给出了两个评估理由,其中之一是阿里巴巴已经在满负荷运行其GPU,包括最新型号和三到五年前的设备,这表明需求已经很强劲。
阿里巴巴高管没有说明其基础设施问题是否与美国禁止向中国销售先进加速器有关。该公司确实透露,在过去12个月中进行了1200亿元人民币(160亿美元)的AI相关资本支出,这少于谷歌、AWS、微软和Meta等公司目前每季度的支出,并怀疑需要将其计划的三年支出修正到超出当前的3800亿元人民币(530亿美元)预算。
第二个原因是他相信AI的最佳时代尚未到来,随着阿里巴巴改进其基础模型,新的用例将会出现,这将使客户花费更多。
阿里巴巴云智能部门本季度营收达56亿美元,同比增长34%。阿里巴巴集团本季度营收达348亿美元,净收入为29.5亿美元。该公司的海外业务首次实现盈利。
Q&A
Q1:阿里云为什么无法满足AI服务需求?
A:阿里云目前面临的主要问题是服务器部署速度跟不上客户对AI服务的需求增长。需求来自企业运营的各个方面,包括产品开发、制造流程等,导致GPU供应紧张,公司不得不对GPU进行配给制管理。
Q2:阿里云如何分配GPU资源给客户?
A:阿里云采用优先级分配机制,使用阿里云全套服务(包括存储、大数据等)的客户会获得更高优先级的GPU访问权。而只是租用GPU进行简单推理任务的客户则会被给予相对较低的优先级。
Q3:阿里云认为AI投资是泡沫吗?
A:阿里云CEO吴泳铭否认了AI投资泡沫的说法。他认为目前GPU已经满负荷运行,包括新旧设备都在使用中,证明需求真实强劲。同时他相信AI最佳时代尚未到来,随着基础模型改进会出现更多用例。
好文章,需要你的鼓励
9to5Mac每日播客探讨苹果健身服务的未来发展方向。节目每个工作日更新,用户可通过苹果播客或其他播放器订阅收听。播客提供付费版本9to5Mac Daily Plus,解锁更多专属内容。听众可通过邮件分享观点,并在苹果播客中评分推荐。
瑞士ETH苏黎世联邦理工学院等机构联合开发的WUSH技术,首次从数学理论层面推导出AI大模型量化压缩的最优解。该技术能根据数据特征自适应调整压缩策略,相比传统方法减少60-70%的压缩损失,实现接近零损失的模型压缩,为大模型在普通设备上的高效部署开辟了新路径。
苹果Fitness+宣布推出多项新功能帮助用户建立运动习惯。1月5日起将上线三个新的多周训练项目,1月12日再增加一个。新功能包括KAROL G音乐训练课程,2月超级碗前还将推出Bad Bunny艺人聚焦系列。Time to Walk也将推出新剧集。该服务支持iPhone、iPad和Apple TV用户使用,月费9.99美元。
弗吉尼亚大学团队创建了Refer360数据集,这是首个大规模记录真实环境中人机多模态交互的数据库,涵盖室内外场景,包含1400万交互样本。同时开发的MuRes智能模块能让机器人像人类一样理解语言、手势和眼神的组合信息,显著提升了现有AI模型的理解准确度,为未来智能机器人的广泛应用奠定了重要基础。