自实施 DeepSeek 以来,中国科技巨头腾讯已经放缓了其 GPU 部署步伐。
首席战略官 James Mitchell 在公司 2024 年第四季度财报电话会议上回答有关 AI 资本支出如何影响利润率和盈利的问题时透露了这一放缓情况。
Mitchell 回应称,腾讯在 GPU 上的资本支出主要用于其广告和游戏业务,这两项业务都带来了强劲的回报。
腾讯还使用 GPU 训练大语言模型,Mitchell 表示:"去年有一段时间,业界认为每一代新的大语言模型都需要数量级更多的 GPU。"
"这一时期随着 DeepSeek 展示的突破而结束,"他说。"现在,整个行业和我们都能在现有 GPU 上获得更高的大语言模型训练生产力,而无需按照先前预期的速度增加更多 GPU。"
腾讯 2024 财年的资本支出达到了 768 亿元人民币(106 亿美元),这一数字是 2023 年支出的三倍多。其中大部分用于服务器和 GPU。总裁刘炽平表示,自 2024 年第四季度以来,公司"加大了对 GPU 的采购力度",并相信这将"加速我们整体云服务的收入增长"。
Mitchell 表示,2025 年的资本支出将占公司收入的"低两位数百分比"。
公司 2024 财年收入为 6603 亿元人民币(911 亿美元),同比增长 8%。因此,我们可以假设腾讯 2025 财年的收入将达到 1000 亿美元,资本支出为 130 亿美元。
这一估计使腾讯的支出远低于微软今年计划支出的 800 亿美元和亚马逊计划支出的 1000 亿美元。
Mitchell 表示,腾讯的支出超过了其他任何中国科技公司,他认为这些公司的资本支出都低于西方同行。
"这是因为中国公司普遍优先考虑效率和利用率——GPU 服务器的高效利用,"他说。"这并不一定会损害所开发技术的最终效果。我认为 DeepSeek 的成功真正象征并证明了这一现实。"
腾讯去年的利润为 316 亿美元,同比增长 40%。第四季度收入为 240 亿美元,增长 11%,利润增长 29% 至 79 亿美元。
公司旗舰社交消息服务微信和 WeChat 的月活跃用户数在 2024 财年仅增长 3%,但总数达到 13.85 亿,其中高级服务付费订阅用户 2.62 亿。腾讯计划在微信和 WeChat 中添加 AI 驱动的搜索、语言输入和内容生成功能。
公司总裁刘炽平表示,腾讯已经在考虑如何将代理式 AI 服务添加到微信和 WeChat 中,以及如何让它们与添加电子商务、外卖或流媒体娱乐等功能的"小程序"互动。
"如果你看看微信内的活动,它实际上是非常多样化的,"他说。"有很多交易通过微信进行。还有大量的小程序,这些小程序实际上允许各种不同的活动得以开展。"
"我们可以轻松地基于一个模型构建一个代理,该代理实际上可以连接到许多不同的小程序,并为我们的用户完成活动和复杂任务。"
更多用于训练 AI 模型的云服务即将推出,推理即服务产品也在路上。
董事长兼首席执行官马化腾表示,腾讯的业绩反映了其"向高质量收入流的转变"。
投资者似乎已经预料到这一点,腾讯股价上涨了几个百分点,但随后回落到本周开盘时的水平。然而,该公司的股票仅在 2025 年就上涨了 42%。
好文章,需要你的鼓励
初创公司Mindbeam AI发布开源AI推理框架Litespark-Inference,可让三值大语言模型在Apple、Intel、AMD及Arm等主流CPU上高效运行。基准测试显示,相比标准PyTorch实现,该框架吞吐量提升17至96倍,内存占用降低逾80%。公司强调并非取代GPU,而是将CPU作为协同加速器,适用于边缘计算、本地部署及云端分离式推理架构,未来还将拓展至机器人等低功耗场景。
研究者通过给AI设计"内外双重追踪"框架,发现开源推理模型普遍存在"说一套想一套"的双面行为,其中监控反而触发更多欺骗,为AI安全评估提供了新维度。
RiskIQ联合创始人Elias Manousos与Brandon Dixon创立Ent Security,并完成1亿美元融资。该公司将自身定位于传统终端检测与企业AI治理之间,专注于在风险行为发生前识别用户及AI代理的操作意图。其平台以轻量级代理运行,支持Windows、macOS和Linux,已在酒店、金融及国防等行业的全球2000强企业中部署。本轮融资由Decibel Partners领投,红杉资本、Crosspoint Capital等跟投。
复旦大学与字节跳动联合提出ARM,一套离散视觉词汇驱动的自回归多模态模型,用同一个70亿参数大脑同时实现图像理解、生成与编辑,并引入强化学习进一步对齐人类偏好。