自实施 DeepSeek 以来,中国科技巨头腾讯已经放缓了其 GPU 部署步伐。
首席战略官 James Mitchell 在公司 2024 年第四季度财报电话会议上回答有关 AI 资本支出如何影响利润率和盈利的问题时透露了这一放缓情况。
Mitchell 回应称,腾讯在 GPU 上的资本支出主要用于其广告和游戏业务,这两项业务都带来了强劲的回报。
腾讯还使用 GPU 训练大语言模型,Mitchell 表示:"去年有一段时间,业界认为每一代新的大语言模型都需要数量级更多的 GPU。"
"这一时期随着 DeepSeek 展示的突破而结束,"他说。"现在,整个行业和我们都能在现有 GPU 上获得更高的大语言模型训练生产力,而无需按照先前预期的速度增加更多 GPU。"
腾讯 2024 财年的资本支出达到了 768 亿元人民币(106 亿美元),这一数字是 2023 年支出的三倍多。其中大部分用于服务器和 GPU。总裁刘炽平表示,自 2024 年第四季度以来,公司"加大了对 GPU 的采购力度",并相信这将"加速我们整体云服务的收入增长"。
Mitchell 表示,2025 年的资本支出将占公司收入的"低两位数百分比"。
公司 2024 财年收入为 6603 亿元人民币(911 亿美元),同比增长 8%。因此,我们可以假设腾讯 2025 财年的收入将达到 1000 亿美元,资本支出为 130 亿美元。
这一估计使腾讯的支出远低于微软今年计划支出的 800 亿美元和亚马逊计划支出的 1000 亿美元。
Mitchell 表示,腾讯的支出超过了其他任何中国科技公司,他认为这些公司的资本支出都低于西方同行。
"这是因为中国公司普遍优先考虑效率和利用率——GPU 服务器的高效利用,"他说。"这并不一定会损害所开发技术的最终效果。我认为 DeepSeek 的成功真正象征并证明了这一现实。"
腾讯去年的利润为 316 亿美元,同比增长 40%。第四季度收入为 240 亿美元,增长 11%,利润增长 29% 至 79 亿美元。
公司旗舰社交消息服务微信和 WeChat 的月活跃用户数在 2024 财年仅增长 3%,但总数达到 13.85 亿,其中高级服务付费订阅用户 2.62 亿。腾讯计划在微信和 WeChat 中添加 AI 驱动的搜索、语言输入和内容生成功能。
公司总裁刘炽平表示,腾讯已经在考虑如何将代理式 AI 服务添加到微信和 WeChat 中,以及如何让它们与添加电子商务、外卖或流媒体娱乐等功能的"小程序"互动。
"如果你看看微信内的活动,它实际上是非常多样化的,"他说。"有很多交易通过微信进行。还有大量的小程序,这些小程序实际上允许各种不同的活动得以开展。"
"我们可以轻松地基于一个模型构建一个代理,该代理实际上可以连接到许多不同的小程序,并为我们的用户完成活动和复杂任务。"
更多用于训练 AI 模型的云服务即将推出,推理即服务产品也在路上。
董事长兼首席执行官马化腾表示,腾讯的业绩反映了其"向高质量收入流的转变"。
投资者似乎已经预料到这一点,腾讯股价上涨了几个百分点,但随后回落到本周开盘时的水平。然而,该公司的股票仅在 2025 年就上涨了 42%。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。