澳大利亚生物技术公司Cortical Labs展示了其CL1"生物计算机",该设备使用约20万个培养在微电极阵列上的活体人类神经元来控制1993年的经典射击游戏《毁灭战士》。软件将游戏中发生的情况转换为神经细胞可以响应的电信号。
神经元位于芯片上,在营养液中保持活性,电极既刺激它们又监听它们的反应。游戏过程被转换为电活动模式。当屏幕左侧出现某物时,电极会刺激神经培养物的相应区域。细胞会发出自己的电脉冲,系统将其解释为移动、转向或发射武器等动作。
虽然听起来很奇怪,但其理念是细胞逐渐调整其活动以响应反馈,这是一种强化学习形式。Cortical Labs表示,神经元最终可以定位敌人、在环境中移动并射击恶魔——尽管"偶尔大量死亡"仍然是游戏循环的重要组成部分。
这项演示建立在该团队早期工作基础上。2022年,他们曾因教授被称为DishBrain的实验室培养神经元集群玩乒乓球游戏而成为头条新闻,通过感知球的位置并相应移动球拍来完成游戏。
当时的研究被认为证明了培养神经元在连接到模拟环境时可以表现出研究人员所描述的目标导向学习。每当细胞"错过"球时,电极会提供结构化反馈信号,促使神经网络重新组织其活动并改善表现。
正如网友指出的,《毁灭战士》是显而易见的下一步。
但这一步比预想的更加困难。乒乓球基本上是一条移动的线和一个弹跳的方块,而《毁灭战士》涉及3D环境、探索和很多试图杀死你的东西。Cortical Labs表示,让神经元应对这种程度的混乱需要在数字游戏世界和神经元的生物语言(电)之间建立更复杂的接口。
Cortical Labs科学家Alon Loeffler在YouTube视频中解释说:"乒乓球要简单得多。有直接关系。球向上,球拍向上。这是直接的输入输出关系。《毁灭战士》要复杂得多。"
没有人声称这些细胞已经发展出对速通或恶魔屠杀荣耀的品味。据Cortical介绍,其表现类似于从未见过键盘、鼠标或计算机的完全初学者——公平地说,这些神经元确实没有见过。
长期目标是了解神经元如何学习和适应,可能有助于药物研究或新的计算理念。就短期而言,这意味着一个盛有人脑细胞的培养皿正在发现《毁灭战士》中的恶魔会反击。
Q&A
Q1:CL1生物计算机是什么,它如何控制游戏?
A:CL1是Cortical Labs开发的"生物计算机",使用约20万个活体人类神经元培养在微电极阵列上。软件将游戏情况转换为电信号刺激神经元,细胞的电反应被解释为游戏动作如移动、转向或射击。
Q2:神经元玩《毁灭战士》比玩乒乓球难在哪里?
A:乒乓球是简单的直接输入输出关系,而《毁灭战士》涉及3D环境、探索和复杂的敌人交互,需要更复杂的接口来处理数字游戏世界和神经元生物语言之间的转换。
Q3:这项研究的实际应用前景是什么?
A:长期目标是了解神经元如何学习和适应,可能帮助药物研究或开发新的计算理念。研究展示了培养神经元在连接模拟环境时的目标导向学习能力。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。