自实施 DeepSeek 以来,中国科技巨头腾讯已经放缓了其 GPU 部署步伐。
首席战略官 James Mitchell 在公司 2024 年第四季度财报电话会议上回答有关 AI 资本支出如何影响利润率和盈利的问题时透露了这一放缓情况。
Mitchell 回应称,腾讯在 GPU 上的资本支出主要用于其广告和游戏业务,这两项业务都带来了强劲的回报。
腾讯还使用 GPU 训练大语言模型,Mitchell 表示:"去年有一段时间,业界认为每一代新的大语言模型都需要数量级更多的 GPU。"
"这一时期随着 DeepSeek 展示的突破而结束,"他说。"现在,整个行业和我们都能在现有 GPU 上获得更高的大语言模型训练生产力,而无需按照先前预期的速度增加更多 GPU。"
腾讯 2024 财年的资本支出达到了 768 亿元人民币(106 亿美元),这一数字是 2023 年支出的三倍多。其中大部分用于服务器和 GPU。总裁刘炽平表示,自 2024 年第四季度以来,公司"加大了对 GPU 的采购力度",并相信这将"加速我们整体云服务的收入增长"。
Mitchell 表示,2025 年的资本支出将占公司收入的"低两位数百分比"。
公司 2024 财年收入为 6603 亿元人民币(911 亿美元),同比增长 8%。因此,我们可以假设腾讯 2025 财年的收入将达到 1000 亿美元,资本支出为 130 亿美元。
这一估计使腾讯的支出远低于微软今年计划支出的 800 亿美元和亚马逊计划支出的 1000 亿美元。
Mitchell 表示,腾讯的支出超过了其他任何中国科技公司,他认为这些公司的资本支出都低于西方同行。
"这是因为中国公司普遍优先考虑效率和利用率——GPU 服务器的高效利用,"他说。"这并不一定会损害所开发技术的最终效果。我认为 DeepSeek 的成功真正象征并证明了这一现实。"
腾讯去年的利润为 316 亿美元,同比增长 40%。第四季度收入为 240 亿美元,增长 11%,利润增长 29% 至 79 亿美元。
公司旗舰社交消息服务微信和 WeChat 的月活跃用户数在 2024 财年仅增长 3%,但总数达到 13.85 亿,其中高级服务付费订阅用户 2.62 亿。腾讯计划在微信和 WeChat 中添加 AI 驱动的搜索、语言输入和内容生成功能。
公司总裁刘炽平表示,腾讯已经在考虑如何将代理式 AI 服务添加到微信和 WeChat 中,以及如何让它们与添加电子商务、外卖或流媒体娱乐等功能的"小程序"互动。
"如果你看看微信内的活动,它实际上是非常多样化的,"他说。"有很多交易通过微信进行。还有大量的小程序,这些小程序实际上允许各种不同的活动得以开展。"
"我们可以轻松地基于一个模型构建一个代理,该代理实际上可以连接到许多不同的小程序,并为我们的用户完成活动和复杂任务。"
更多用于训练 AI 模型的云服务即将推出,推理即服务产品也在路上。
董事长兼首席执行官马化腾表示,腾讯的业绩反映了其"向高质量收入流的转变"。
投资者似乎已经预料到这一点,腾讯股价上涨了几个百分点,但随后回落到本周开盘时的水平。然而,该公司的股票仅在 2025 年就上涨了 42%。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。