阿里云服务器部署速度跟不上AI需求,GPU配给优先大客户

阿里云CEO吴泳铭在财报电话会议上表示,AI需求增长如此迅猛,以至于服务器部署速度无法跟上客户需求。公司正在对GPU进行配给制,优先满足使用全套阿里云服务的客户需求。过去12个月,阿里巴巴在AI相关基础设施上投入1200亿元人民币,预计三年预算可能超过当前的3800亿元。阿里云智能集团季度营收达56亿美元,同比增长34%。

中国阿里云无法以足够快的速度部署服务器来满足AI需求,因此正在对GPU进行配给,优先为使用其全套服务的客户提供访问权限。

在阿里巴巴集团第二季度财报电话会议上,CEO吴泳铭表示,"AI需求正在加速增长",同时需求也在深化,"涵盖企业运营的各个方面,包括产品开发、整个制造流程,以及支持企业和客户使用其产品的应用。"

"就我们部署新服务器的速度而言,我们甚至无法跟上客户需求的增长步伐,"他补充说。

需求如此强劲,以至于阿里巴巴正在对GPU进行配给,优先满足其最佳客户的需求。

"如果外部客户正在使用我们所有的服务,包括云服务、所有阿里云服务,涵盖存储、大数据以及所有其他服务,那么该客户当然会获得更高级别的优先权,"他说。"如果客户只是租用GPU来满足一些非常简单的推理需求,那么这些客户的需求相应地会被给予稍低级别的优先权。"

吴泳铭还回应并驳斥了AI是投资泡沫的担忧。他给出了两个评估理由,其中之一是阿里巴巴已经在满负荷运行其GPU,包括最新型号和三到五年前的设备,这表明需求已经很强劲。

阿里巴巴高管没有说明其基础设施问题是否与美国禁止向中国销售先进加速器有关。该公司确实透露,在过去12个月中进行了1200亿元人民币(160亿美元)的AI相关资本支出,这少于谷歌、AWS、微软和Meta等公司目前每季度的支出,并怀疑需要将其计划的三年支出修正到超出当前的3800亿元人民币(530亿美元)预算。

第二个原因是他相信AI的最佳时代尚未到来,随着阿里巴巴改进其基础模型,新的用例将会出现,这将使客户花费更多。

阿里巴巴云智能部门本季度营收达56亿美元,同比增长34%。阿里巴巴集团本季度营收达348亿美元,净收入为29.5亿美元。该公司的海外业务首次实现盈利。

Q&A

Q1:阿里云为什么无法满足AI服务需求?

A:阿里云目前面临的主要问题是服务器部署速度跟不上客户对AI服务的需求增长。需求来自企业运营的各个方面,包括产品开发、制造流程等,导致GPU供应紧张,公司不得不对GPU进行配给制管理。

Q2:阿里云如何分配GPU资源给客户?

A:阿里云采用优先级分配机制,使用阿里云全套服务(包括存储、大数据等)的客户会获得更高优先级的GPU访问权。而只是租用GPU进行简单推理任务的客户则会被给予相对较低的优先级。

Q3:阿里云认为AI投资是泡沫吗?

A:阿里云CEO吴泳铭否认了AI投资泡沫的说法。他认为目前GPU已经满负荷运行,包括新旧设备都在使用中,证明需求真实强劲。同时他相信AI最佳时代尚未到来,随着基础模型改进会出现更多用例。

来源:The Register

0赞

好文章,需要你的鼓励

2025

11/26

11:25

分享

点赞

邮件订阅