自实施 DeepSeek 以来,中国科技巨头腾讯已经放缓了其 GPU 部署步伐。
首席战略官 James Mitchell 在公司 2024 年第四季度财报电话会议上回答有关 AI 资本支出如何影响利润率和盈利的问题时透露了这一放缓情况。
Mitchell 回应称,腾讯在 GPU 上的资本支出主要用于其广告和游戏业务,这两项业务都带来了强劲的回报。
腾讯还使用 GPU 训练大语言模型,Mitchell 表示:"去年有一段时间,业界认为每一代新的大语言模型都需要数量级更多的 GPU。"
"这一时期随着 DeepSeek 展示的突破而结束,"他说。"现在,整个行业和我们都能在现有 GPU 上获得更高的大语言模型训练生产力,而无需按照先前预期的速度增加更多 GPU。"
腾讯 2024 财年的资本支出达到了 768 亿元人民币(106 亿美元),这一数字是 2023 年支出的三倍多。其中大部分用于服务器和 GPU。总裁刘炽平表示,自 2024 年第四季度以来,公司"加大了对 GPU 的采购力度",并相信这将"加速我们整体云服务的收入增长"。
Mitchell 表示,2025 年的资本支出将占公司收入的"低两位数百分比"。
公司 2024 财年收入为 6603 亿元人民币(911 亿美元),同比增长 8%。因此,我们可以假设腾讯 2025 财年的收入将达到 1000 亿美元,资本支出为 130 亿美元。
这一估计使腾讯的支出远低于微软今年计划支出的 800 亿美元和亚马逊计划支出的 1000 亿美元。
Mitchell 表示,腾讯的支出超过了其他任何中国科技公司,他认为这些公司的资本支出都低于西方同行。
"这是因为中国公司普遍优先考虑效率和利用率——GPU 服务器的高效利用,"他说。"这并不一定会损害所开发技术的最终效果。我认为 DeepSeek 的成功真正象征并证明了这一现实。"
腾讯去年的利润为 316 亿美元,同比增长 40%。第四季度收入为 240 亿美元,增长 11%,利润增长 29% 至 79 亿美元。
公司旗舰社交消息服务微信和 WeChat 的月活跃用户数在 2024 财年仅增长 3%,但总数达到 13.85 亿,其中高级服务付费订阅用户 2.62 亿。腾讯计划在微信和 WeChat 中添加 AI 驱动的搜索、语言输入和内容生成功能。
公司总裁刘炽平表示,腾讯已经在考虑如何将代理式 AI 服务添加到微信和 WeChat 中,以及如何让它们与添加电子商务、外卖或流媒体娱乐等功能的"小程序"互动。
"如果你看看微信内的活动,它实际上是非常多样化的,"他说。"有很多交易通过微信进行。还有大量的小程序,这些小程序实际上允许各种不同的活动得以开展。"
"我们可以轻松地基于一个模型构建一个代理,该代理实际上可以连接到许多不同的小程序,并为我们的用户完成活动和复杂任务。"
更多用于训练 AI 模型的云服务即将推出,推理即服务产品也在路上。
董事长兼首席执行官马化腾表示,腾讯的业绩反映了其"向高质量收入流的转变"。
投资者似乎已经预料到这一点,腾讯股价上涨了几个百分点,但随后回落到本周开盘时的水平。然而,该公司的股票仅在 2025 年就上涨了 42%。
好文章,需要你的鼓励
在2025年KubeCon/CloudNativeCon北美大会上,云原生开发社区正努力超越AI炒作,理性应对人工智能带来的风险与机遇。随着开发者和运营人员广泛使用AI工具构建AI驱动的应用功能,平台工程迎来复兴。CNCF推出Kubernetes AI认证合规程序,为AI工作负载在Kubernetes上的部署设定开放标准。会议展示了网络基础设施层优化、AI辅助开发安全性提升以及AI SRE改善可观测性工作流等创新成果。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
DeepL作为欧洲AI领域的代表企业,正将业务拓展至翻译之外,推出面向企业的AI代理DeepL Agent。CEO库蒂洛夫斯基认为,虽然在日常翻译场景面临更多竞争,但在关键业务级别的企业翻译需求中,DeepL凭借高精度、质量控制和合规性仍具优势。他对欧盟AI法案表示担忧,认为过度监管可能阻碍创新,使欧洲在全球AI竞争中落后。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。