未来游戏中的AI队友真的会听你说话

育碧在Nvidia GTC 2026开发者大会上展示了实验性原型"Teammates"，通过生成式AI替代传统预设NPC，让虚拟队友能够理解自然语言指令并实时回应。为解决LLM推理延迟问题，团队采用更快的基础模型、流式传输和提示词优化三项策略，将响应时间从3秒压缩至1.5秒。该平台以C++ SDK为核心，可无缝接入育碧自研引擎，支持云端与本地GPU双模式部署。

长久以来，玩家们对着屏幕大喊大叫，向根本听不见声音的虚拟队友发号施令或发泄情绪。在少数支持语音指令的游戏中，玩家也不得不死记硬背一套固定的指令菜单。

在今年早些时候举办的英伟达GTC 2026开发者大会上，法国游戏巨头育碧展示了一个令人期待的未来——屏幕中的角色不仅能听懂你说的话，还能开口回应。这一切得益于育碧推出的实验性原型项目"Teammates"，该项目用由生成式AI驱动的虚拟队友取代了传统的预设非玩家角色（NPC）。

Teammates是育碧2024年Neo NPC项目的延伸，后者曾获得法国"法国2030"计划的认可，被视为推动法国创新的代表性成果。在Teammates中，玩家将与虚拟士兵并肩作战，这些角色能够理解自然语言，感知环境变化，甚至识别玩家惯用的个人说话方式。

你只需对虚拟队友说："躲到那辆车后面，等我命令再向最近的敌人开枪"，角色就能解析指令、判断周围环境并执行动作，同时还会对你的战术作出回应。

育碧表示，要实现这种程度的沉浸感，仅靠强大的大语言模型远远不够，项目团队必须重新设计推理流程，以降低复杂度并优化响应延迟。

化繁为简

在这个项目背后，目标不仅仅是打造一款AI游戏，更是建立一套基础平台，让数千名美术师、编剧和设计师无需具备AI或机器学习背景，也能直接使用。

育碧巴黎工作室技术总监乔尔·格雷瓜尔在GTC演讲中解释道："大多数游戏开发团队并不具备更新复杂生成式AI系统所需的专业技能。我们的解决方案是构建一个平台，把复杂性封装起来，让团队能够更轻松地开发带有生成式AI功能的游戏。"

育碧的解决方案是一套兼容多引擎的中间件，基于C++软件开发工具包构建，通过将NPC交互等游戏玩法模块动态转化为提示词来运作。借助自定义引擎插件，这些数据可直接输入育碧自研的Snowdrop和Anvil引擎，将大语言模型的原始输出转换为面部动画数据等引擎专属格式。

育碧游戏玩法生成式AI总监泽维尔·曼萨纳雷斯表示："可以把它理解为一套面向生成式AI的通用中间件，能够轻松接入我们的自研游戏引擎，为团队开辟了大量新的可能性。"

卡顿停顿的难题

如果说游戏中的对话式AI令人兴奋，那么让它真正令人信服所需的工程挑战则极为复杂。大语言模型虽然语言能力出众，但计算量大、响应速度慢是众所周知的短板。

正常对话中，人类的反应时间不过零点几秒。而育碧在早期测试生成式模型时发现，角色从接收玩家语音、决定行动、生成回应到合成音频，整个流程耗时超过三秒。

育碧巴黎机器学习技术负责人马克西姆·萨扎达利在英伟达GTC上表示："创意源于质量，但其实有一件事和质量同样重要，那就是延迟。"

在虚拟激战中出现三秒的停顿，玩家就只能盯着一个毫无反应的角色发呆。"即便动作是正确的，如果反应太慢，玩家也不会感受到任何智能的存在，"萨扎达利指出。

为了让角色看起来真实可信，育碧工程师确定了一个目标：从玩家开口说话到角色作出反应，整个循环必须在两秒以内完成。为此，团队从三个方向入手：

采用更快的基础模型

团队放弃了响应较慢的模型，改用效率更高的方案：语音识别采用英伟达的Parakeet-tdt-v3，云端大语言模型推理采用Gemini 2.5 Flash Lite，文字转语音采用ElevenLabs Flash v2。

全链路流式传输

育碧不再等待完整回复生成后才处理，而是实现了部分函数解析。大语言模型一旦输出第一个可执行函数，数据就立即推送至游戏行为树，让NPC即时开始移动。音频同样采用流式传输，逐块拼接合成。

提示词精简优化

通过识别并剔除超过1万Token的感知提示词中的冗余别名和数据，团队将提示词规模压缩了30%，显著降低了首个Token的生成时间。

经过一系列优化，团队将响应时间压缩至1.5秒。

格雷瓜尔团队还搭建了一套API网关，允许开发者通过Kubernetes和英伟达GPU算子在云端调用第三方模型或育碧自托管模型，也可完全在本地运行，支持离线游戏并降低运营成本。

借助英伟达游戏内推理（In-Game Inferencing）和CUDA图形集成技术，团队成功在消费级高端GPU——英伟达RTX 4090和RTX 5090上本地部署了Teammates。为控制在AAA游戏通常的渲染预算内，团队还采用了高度优化的小语言模型，具体包括以INT4量化提速、以FP8保障质量的40亿参数Qwen3-4B-Instruct-2507模型，以及用于本地语音生成的KaniTTS-400m模型。

格雷瓜尔表示："当前的高端硬件与优化推理架构，已经能够支持多模型生成式AI流水线与游戏工作负载同步运行。将推理迁移至本地设备，是让NPC交互实现规模化的下一步合理选择。"

该原型还集成了名为Jaspar的AI个人助手，可帮助玩家导航游戏菜单、根据色盲等无障碍需求调整界面，并提供战术建议。此外，游戏内的AI还会持续分析玩家的行为习惯，根据其游戏风格动态颁发成就，并在每次任务结束后提供个性化总结复盘。

育碧的这一项目能否进一步发展，最终取代精心打磨的电影级叙事体验，目前仍是未知数。就眼下而言，行业头部玩家普遍将AI视为提升游戏体验的辅助工具。

育碧联合创始人兼首席执行官伊夫·吉耶莫表示："创意始终属于人类。AI提供的工具能够以全新方式将创意愿景变为现实，它可以成为一股强大的助力，为玩家创造更有意义、更具沉浸感的游戏体验。"

Q&A

Q1：育碧的Teammates项目是什么？

A：Teammates是育碧推出的实验性AI游戏原型，用生成式AI驱动的虚拟队友取代传统预设NPC。玩家可以用自然语言向队友下达指令，角色会理解语义、判断环境并执行相应动作，同时作出语音回应，实现真正意义上的双向对话交互。

Q2：育碧是怎么把AI响应时间压缩到1.5秒的？

A：育碧主要采用了三项优化手段：一是换用更快的基础模型，包括英伟达Parakeet语音识别、Gemini 2.5 Flash Lite大语言模型推理和ElevenLabs Flash语音合成；二是全链路流式传输，模型一旦输出可执行指令就立即推送给游戏引擎；三是对超过1万Token的提示词进行精简，压缩了30%的规模，从而将整体响应时间从3秒以上降至1.5秒。

Q3：Teammates能在普通玩家的电脑上本地运行吗？

A：目前Teammates支持在英伟达RTX 4090和RTX 5090等高端消费级显卡上本地运行。育碧采用了参数量为40亿的小语言模型并进行了量化压缩，以在游戏渲染预算内完成推理。团队认为本地推理是让NPC交互规模化落地的下一步关键方向。

来源：Computer Weekly

0赞

好文章，需要你的鼓励

未来游戏中的AI队友真的会听你说话

来源：Computer Weekly

2026

05/14

15:38

分享

点赞

Bookshop.org确认今年将推出Kobo电子书阅读器支持

WeWard新增"步行模式"：走够步数才能解锁应用

X将通过私信通知用户其互动帖子被社区笔记纠错

"慢社交"应用Roost：让消息像真鸟一样飞行

Truecaller与印度电信监管机构就反垃圾电话规则展开公开交锋

Block与46州达成4500万美元和解，涉Cash App欺诈纠纷

欧盟威胁对Meta开出罚款，剑指Facebook和Instagram上瘾性设计

Disney+考虑推出免费流媒体内容层级

HyperTexting：将开放网络变成类社交媒体信息流的新应用

TV Time关闭之际，创始人打造新追剧应用Bingers

Telegram短链域名t.me因制裁合规问题短暂下线后已恢复

Apple芯片现不可修复漏洞，或成iPhone越狱突破口

专访沃尔沃汽车软件工程负责人Alwin Bakkenes

Celonis收购MIT关联企业Ikigai，打造企业AI运营"数字孪生"

SAP将Joule重塑为自主企业AI的核心入口

Dessn获600万美元融资，推出面向生产环境的设计工具

SAP收购数据湖仓厂商Dremio，剑指企业AI数据整合

AI推理计算将随电力而动，英伟达布局微型数据中心网络

ServiceNow以AI全面整合体验加速业务转型

曾被机器人攻陷的Digg网站第三度重启，现已开放早期访问

智能测试与数据链的碰撞：挑战与未来

诺基亚推出智能体AI能力，开启宽带网络认知新时代

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: