未来游戏中的AI队友真的会听你说话

育碧在Nvidia GTC 2026开发者大会上展示了实验性原型"Teammates",通过生成式AI替代传统预设NPC,让虚拟队友能够理解自然语言指令并实时回应。为解决LLM推理延迟问题,团队采用更快的基础模型、流式传输和提示词优化三项策略,将响应时间从3秒压缩至1.5秒。该平台以C++ SDK为核心,可无缝接入育碧自研引擎,支持云端与本地GPU双模式部署。

长久以来,玩家们对着屏幕大喊大叫,向根本听不见声音的虚拟队友发号施令或发泄情绪。在少数支持语音指令的游戏中,玩家也不得不死记硬背一套固定的指令菜单。

在今年早些时候举办的英伟达GTC 2026开发者大会上,法国游戏巨头育碧展示了一个令人期待的未来——屏幕中的角色不仅能听懂你说的话,还能开口回应。这一切得益于育碧推出的实验性原型项目"Teammates",该项目用由生成式AI驱动的虚拟队友取代了传统的预设非玩家角色(NPC)。

Teammates是育碧2024年Neo NPC项目的延伸,后者曾获得法国"法国2030"计划的认可,被视为推动法国创新的代表性成果。在Teammates中,玩家将与虚拟士兵并肩作战,这些角色能够理解自然语言,感知环境变化,甚至识别玩家惯用的个人说话方式。

你只需对虚拟队友说:"躲到那辆车后面,等我命令再向最近的敌人开枪",角色就能解析指令、判断周围环境并执行动作,同时还会对你的战术作出回应。

育碧表示,要实现这种程度的沉浸感,仅靠强大的大语言模型远远不够,项目团队必须重新设计推理流程,以降低复杂度并优化响应延迟。

化繁为简

在这个项目背后,目标不仅仅是打造一款AI游戏,更是建立一套基础平台,让数千名美术师、编剧和设计师无需具备AI或机器学习背景,也能直接使用。

育碧巴黎工作室技术总监乔尔·格雷瓜尔在GTC演讲中解释道:"大多数游戏开发团队并不具备更新复杂生成式AI系统所需的专业技能。我们的解决方案是构建一个平台,把复杂性封装起来,让团队能够更轻松地开发带有生成式AI功能的游戏。"

育碧的解决方案是一套兼容多引擎的中间件,基于C++软件开发工具包构建,通过将NPC交互等游戏玩法模块动态转化为提示词来运作。借助自定义引擎插件,这些数据可直接输入育碧自研的Snowdrop和Anvil引擎,将大语言模型的原始输出转换为面部动画数据等引擎专属格式。

育碧游戏玩法生成式AI总监泽维尔·曼萨纳雷斯表示:"可以把它理解为一套面向生成式AI的通用中间件,能够轻松接入我们的自研游戏引擎,为团队开辟了大量新的可能性。"

卡顿停顿的难题

如果说游戏中的对话式AI令人兴奋,那么让它真正令人信服所需的工程挑战则极为复杂。大语言模型虽然语言能力出众,但计算量大、响应速度慢是众所周知的短板。

正常对话中,人类的反应时间不过零点几秒。而育碧在早期测试生成式模型时发现,角色从接收玩家语音、决定行动、生成回应到合成音频,整个流程耗时超过三秒。

育碧巴黎机器学习技术负责人马克西姆·萨扎达利在英伟达GTC上表示:"创意源于质量,但其实有一件事和质量同样重要,那就是延迟。"

在虚拟激战中出现三秒的停顿,玩家就只能盯着一个毫无反应的角色发呆。"即便动作是正确的,如果反应太慢,玩家也不会感受到任何智能的存在,"萨扎达利指出。

为了让角色看起来真实可信,育碧工程师确定了一个目标:从玩家开口说话到角色作出反应,整个循环必须在两秒以内完成。为此,团队从三个方向入手:

采用更快的基础模型

团队放弃了响应较慢的模型,改用效率更高的方案:语音识别采用英伟达的Parakeet-tdt-v3,云端大语言模型推理采用Gemini 2.5 Flash Lite,文字转语音采用ElevenLabs Flash v2。

全链路流式传输

育碧不再等待完整回复生成后才处理,而是实现了部分函数解析。大语言模型一旦输出第一个可执行函数,数据就立即推送至游戏行为树,让NPC即时开始移动。音频同样采用流式传输,逐块拼接合成。

提示词精简优化

通过识别并剔除超过1万Token的感知提示词中的冗余别名和数据,团队将提示词规模压缩了30%,显著降低了首个Token的生成时间。

经过一系列优化,团队将响应时间压缩至1.5秒。

格雷瓜尔团队还搭建了一套API网关,允许开发者通过Kubernetes和英伟达GPU算子在云端调用第三方模型或育碧自托管模型,也可完全在本地运行,支持离线游戏并降低运营成本。

借助英伟达游戏内推理(In-Game Inferencing)和CUDA图形集成技术,团队成功在消费级高端GPU——英伟达RTX 4090和RTX 5090上本地部署了Teammates。为控制在AAA游戏通常的渲染预算内,团队还采用了高度优化的小语言模型,具体包括以INT4量化提速、以FP8保障质量的40亿参数Qwen3-4B-Instruct-2507模型,以及用于本地语音生成的KaniTTS-400m模型。

格雷瓜尔表示:"当前的高端硬件与优化推理架构,已经能够支持多模型生成式AI流水线与游戏工作负载同步运行。将推理迁移至本地设备,是让NPC交互实现规模化的下一步合理选择。"

该原型还集成了名为Jaspar的AI个人助手,可帮助玩家导航游戏菜单、根据色盲等无障碍需求调整界面,并提供战术建议。此外,游戏内的AI还会持续分析玩家的行为习惯,根据其游戏风格动态颁发成就,并在每次任务结束后提供个性化总结复盘。

育碧的这一项目能否进一步发展,最终取代精心打磨的电影级叙事体验,目前仍是未知数。就眼下而言,行业头部玩家普遍将AI视为提升游戏体验的辅助工具。

育碧联合创始人兼首席执行官伊夫·吉耶莫表示:"创意始终属于人类。AI提供的工具能够以全新方式将创意愿景变为现实,它可以成为一股强大的助力,为玩家创造更有意义、更具沉浸感的游戏体验。"

Q&A

Q1:育碧的Teammates项目是什么?

A:Teammates是育碧推出的实验性AI游戏原型,用生成式AI驱动的虚拟队友取代传统预设NPC。玩家可以用自然语言向队友下达指令,角色会理解语义、判断环境并执行相应动作,同时作出语音回应,实现真正意义上的双向对话交互。

Q2:育碧是怎么把AI响应时间压缩到1.5秒的?

A:育碧主要采用了三项优化手段:一是换用更快的基础模型,包括英伟达Parakeet语音识别、Gemini 2.5 Flash Lite大语言模型推理和ElevenLabs Flash语音合成;二是全链路流式传输,模型一旦输出可执行指令就立即推送给游戏引擎;三是对超过1万Token的提示词进行精简,压缩了30%的规模,从而将整体响应时间从3秒以上降至1.5秒。

Q3:Teammates能在普通玩家的电脑上本地运行吗?

A:目前Teammates支持在英伟达RTX 4090和RTX 5090等高端消费级显卡上本地运行。育碧采用了参数量为40亿的小语言模型并进行了量化压缩,以在游戏渲染预算内完成推理。团队认为本地推理是让NPC交互规模化落地的下一步关键方向。

来源:Computer Weekly

0赞

好文章,需要你的鼓励

2026

05/14

15:38

分享

点赞

邮件订阅