中国阿里云无法以足够快的速度部署服务器来满足AI需求,因此正在对GPU进行配给,优先为使用其全套服务的客户提供访问权限。
在阿里巴巴集团第二季度财报电话会议上,CEO吴泳铭表示,"AI需求正在加速增长",同时需求也在深化,"涵盖企业运营的各个方面,包括产品开发、整个制造流程,以及支持企业和客户使用其产品的应用。"
"就我们部署新服务器的速度而言,我们甚至无法跟上客户需求的增长步伐,"他补充说。
需求如此强劲,以至于阿里巴巴正在对GPU进行配给,优先满足其最佳客户的需求。
"如果外部客户正在使用我们所有的服务,包括云服务、所有阿里云服务,涵盖存储、大数据以及所有其他服务,那么该客户当然会获得更高级别的优先权,"他说。"如果客户只是租用GPU来满足一些非常简单的推理需求,那么这些客户的需求相应地会被给予稍低级别的优先权。"
吴泳铭还回应并驳斥了AI是投资泡沫的担忧。他给出了两个评估理由,其中之一是阿里巴巴已经在满负荷运行其GPU,包括最新型号和三到五年前的设备,这表明需求已经很强劲。
阿里巴巴高管没有说明其基础设施问题是否与美国禁止向中国销售先进加速器有关。该公司确实透露,在过去12个月中进行了1200亿元人民币(160亿美元)的AI相关资本支出,这少于谷歌、AWS、微软和Meta等公司目前每季度的支出,并怀疑需要将其计划的三年支出修正到超出当前的3800亿元人民币(530亿美元)预算。
第二个原因是他相信AI的最佳时代尚未到来,随着阿里巴巴改进其基础模型,新的用例将会出现,这将使客户花费更多。
阿里巴巴云智能部门本季度营收达56亿美元,同比增长34%。阿里巴巴集团本季度营收达348亿美元,净收入为29.5亿美元。该公司的海外业务首次实现盈利。
Q&A
Q1:阿里云为什么无法满足AI服务需求?
A:阿里云目前面临的主要问题是服务器部署速度跟不上客户对AI服务的需求增长。需求来自企业运营的各个方面,包括产品开发、制造流程等,导致GPU供应紧张,公司不得不对GPU进行配给制管理。
Q2:阿里云如何分配GPU资源给客户?
A:阿里云采用优先级分配机制,使用阿里云全套服务(包括存储、大数据等)的客户会获得更高优先级的GPU访问权。而只是租用GPU进行简单推理任务的客户则会被给予相对较低的优先级。
Q3:阿里云认为AI投资是泡沫吗?
A:阿里云CEO吴泳铭否认了AI投资泡沫的说法。他认为目前GPU已经满负荷运行,包括新旧设备都在使用中,证明需求真实强劲。同时他相信AI最佳时代尚未到来,随着基础模型改进会出现更多用例。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。