长久以来,玩家们对着屏幕大喊大叫,向根本听不见声音的虚拟队友发号施令或发泄情绪。在少数支持语音指令的游戏中,玩家也不得不死记硬背一套固定的指令菜单。
在今年早些时候举办的英伟达GTC 2026开发者大会上,法国游戏巨头育碧展示了一个令人期待的未来——屏幕中的角色不仅能听懂你说的话,还能开口回应。这一切得益于育碧推出的实验性原型项目"Teammates",该项目用由生成式AI驱动的虚拟队友取代了传统的预设非玩家角色(NPC)。
Teammates是育碧2024年Neo NPC项目的延伸,后者曾获得法国"法国2030"计划的认可,被视为推动法国创新的代表性成果。在Teammates中,玩家将与虚拟士兵并肩作战,这些角色能够理解自然语言,感知环境变化,甚至识别玩家惯用的个人说话方式。
你只需对虚拟队友说:"躲到那辆车后面,等我命令再向最近的敌人开枪",角色就能解析指令、判断周围环境并执行动作,同时还会对你的战术作出回应。
育碧表示,要实现这种程度的沉浸感,仅靠强大的大语言模型远远不够,项目团队必须重新设计推理流程,以降低复杂度并优化响应延迟。
化繁为简
在这个项目背后,目标不仅仅是打造一款AI游戏,更是建立一套基础平台,让数千名美术师、编剧和设计师无需具备AI或机器学习背景,也能直接使用。
育碧巴黎工作室技术总监乔尔·格雷瓜尔在GTC演讲中解释道:"大多数游戏开发团队并不具备更新复杂生成式AI系统所需的专业技能。我们的解决方案是构建一个平台,把复杂性封装起来,让团队能够更轻松地开发带有生成式AI功能的游戏。"
育碧的解决方案是一套兼容多引擎的中间件,基于C++软件开发工具包构建,通过将NPC交互等游戏玩法模块动态转化为提示词来运作。借助自定义引擎插件,这些数据可直接输入育碧自研的Snowdrop和Anvil引擎,将大语言模型的原始输出转换为面部动画数据等引擎专属格式。
育碧游戏玩法生成式AI总监泽维尔·曼萨纳雷斯表示:"可以把它理解为一套面向生成式AI的通用中间件,能够轻松接入我们的自研游戏引擎,为团队开辟了大量新的可能性。"
卡顿停顿的难题
如果说游戏中的对话式AI令人兴奋,那么让它真正令人信服所需的工程挑战则极为复杂。大语言模型虽然语言能力出众,但计算量大、响应速度慢是众所周知的短板。
正常对话中,人类的反应时间不过零点几秒。而育碧在早期测试生成式模型时发现,角色从接收玩家语音、决定行动、生成回应到合成音频,整个流程耗时超过三秒。
育碧巴黎机器学习技术负责人马克西姆·萨扎达利在英伟达GTC上表示:"创意源于质量,但其实有一件事和质量同样重要,那就是延迟。"
在虚拟激战中出现三秒的停顿,玩家就只能盯着一个毫无反应的角色发呆。"即便动作是正确的,如果反应太慢,玩家也不会感受到任何智能的存在,"萨扎达利指出。
为了让角色看起来真实可信,育碧工程师确定了一个目标:从玩家开口说话到角色作出反应,整个循环必须在两秒以内完成。为此,团队从三个方向入手:
采用更快的基础模型
团队放弃了响应较慢的模型,改用效率更高的方案:语音识别采用英伟达的Parakeet-tdt-v3,云端大语言模型推理采用Gemini 2.5 Flash Lite,文字转语音采用ElevenLabs Flash v2。
全链路流式传输
育碧不再等待完整回复生成后才处理,而是实现了部分函数解析。大语言模型一旦输出第一个可执行函数,数据就立即推送至游戏行为树,让NPC即时开始移动。音频同样采用流式传输,逐块拼接合成。
提示词精简优化
通过识别并剔除超过1万Token的感知提示词中的冗余别名和数据,团队将提示词规模压缩了30%,显著降低了首个Token的生成时间。
经过一系列优化,团队将响应时间压缩至1.5秒。
格雷瓜尔团队还搭建了一套API网关,允许开发者通过Kubernetes和英伟达GPU算子在云端调用第三方模型或育碧自托管模型,也可完全在本地运行,支持离线游戏并降低运营成本。
借助英伟达游戏内推理(In-Game Inferencing)和CUDA图形集成技术,团队成功在消费级高端GPU——英伟达RTX 4090和RTX 5090上本地部署了Teammates。为控制在AAA游戏通常的渲染预算内,团队还采用了高度优化的小语言模型,具体包括以INT4量化提速、以FP8保障质量的40亿参数Qwen3-4B-Instruct-2507模型,以及用于本地语音生成的KaniTTS-400m模型。
格雷瓜尔表示:"当前的高端硬件与优化推理架构,已经能够支持多模型生成式AI流水线与游戏工作负载同步运行。将推理迁移至本地设备,是让NPC交互实现规模化的下一步合理选择。"
该原型还集成了名为Jaspar的AI个人助手,可帮助玩家导航游戏菜单、根据色盲等无障碍需求调整界面,并提供战术建议。此外,游戏内的AI还会持续分析玩家的行为习惯,根据其游戏风格动态颁发成就,并在每次任务结束后提供个性化总结复盘。
育碧的这一项目能否进一步发展,最终取代精心打磨的电影级叙事体验,目前仍是未知数。就眼下而言,行业头部玩家普遍将AI视为提升游戏体验的辅助工具。
育碧联合创始人兼首席执行官伊夫·吉耶莫表示:"创意始终属于人类。AI提供的工具能够以全新方式将创意愿景变为现实,它可以成为一股强大的助力,为玩家创造更有意义、更具沉浸感的游戏体验。"
Q&A
Q1:育碧的Teammates项目是什么?
A:Teammates是育碧推出的实验性AI游戏原型,用生成式AI驱动的虚拟队友取代传统预设NPC。玩家可以用自然语言向队友下达指令,角色会理解语义、判断环境并执行相应动作,同时作出语音回应,实现真正意义上的双向对话交互。
Q2:育碧是怎么把AI响应时间压缩到1.5秒的?
A:育碧主要采用了三项优化手段:一是换用更快的基础模型,包括英伟达Parakeet语音识别、Gemini 2.5 Flash Lite大语言模型推理和ElevenLabs Flash语音合成;二是全链路流式传输,模型一旦输出可执行指令就立即推送给游戏引擎;三是对超过1万Token的提示词进行精简,压缩了30%的规模,从而将整体响应时间从3秒以上降至1.5秒。
Q3:Teammates能在普通玩家的电脑上本地运行吗?
A:目前Teammates支持在英伟达RTX 4090和RTX 5090等高端消费级显卡上本地运行。育碧采用了参数量为40亿的小语言模型并进行了量化压缩,以在游戏渲染预算内完成推理。团队认为本地推理是让NPC交互规模化落地的下一步关键方向。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。