迈克尔·伍尔德里奇就像你希望遇到的那种老师:平易近人,能用简单的语言解释复杂的事物,既不会让人感到高不可攀,也不会刻意追求酷炫,而且对自己的工作充满真诚的热情。"当你看到某个人眼中闪现理解的光芒,当他们明白了之前不理解的东西时,我特别喜欢那种感觉,"他说,"我觉得那种成就感难以言表。"
他给人的感觉就像一个普通人,但作为一位牛津大学教授,拥有500多篇科学论文和10本著作,他显然并不普通。他最喜欢的作品是为瓢虫出版社专家系列丛书撰写的关于人工智能的那本书——这是经典儿童读物系列的更新版。"我为这本书感到非常自豪,"他从书架上拿出一本递给我。我们在牛津大学计算机系的办公室里,这是一个阳光明媚的春日。也许是校园环境的缘故,我们的讨论几乎像一场研讨会。
伍尔德里奇是一位出色的公共传播者,尤其在人工智能领域——他在这个领域工作了30多年,但仍然保持着健康的怀疑态度。在2023年为英国皇家研究所举办的圣诞讲座中,他带来了一只机器狗,并让学生观众投票决定是否用棒球棒敲打它。为了解释强化学习,他重现了80年代经典电影《战争游戏》的场景,片中年轻的马修·布罗德里克让美国军方计算机与自己下井字棋,从而避免了核灾难(直到计算机得出结论:没有真正的获胜方法)。"马修·布罗德里克当时在伦敦。我们试图邀请他参加圣诞讲座,但他没能来,"伍尔德里奇说,"所以我们以他的名字将计算机命名为BrodeRick。"
《战争游戏》实际上与伍尔德里奇的最新著作《博弈论的人生课:在复杂世界中战略思考的艺术》的主题非常接近。他说,他已经向学生教授这门课程超过15年了。现在轮到我们学习了。伍尔德里奇的书中没有数学公式;相反,他将博弈论转化为21个易于理解的场景,涵盖了从大西洋鳕鱼捕捞到百事可乐与可口可乐的竞争,再到上帝存在的问题。
"令人惊讶的是,有多少全球事件可以用相对较少的博弈论模型来解释,"伍尔德里奇说。最简单的模型之一是"懦夫博弈",他在书中用詹姆斯·迪恩电影《无因的反叛》中的一个场景来说明(他承认他的学生都没听说过这部电影)。两个青少年驾驶汽车冲向悬崖;第一个跳车的人是"懦夫",输掉了游戏。如果两人同时跳车,就是平局;如果完全不跳,你就输得很惨(剧透警告:这就是电影中发生的事情)。
这里的理论课程是关于纳什均衡的(我们不会深入细节)——但实际上,我们在现实生活中一直看到这种博弈的上演。古巴导弹危机曾经是经典例子,但另一个例子正在发生:美伊战争。"你有两方不断升级的威胁;总有一方必须在某个时刻退让,"伍尔德里奇说,"危险在于,如果双方都不退让,那么你就越过了不归点,每个人都会得到最坏的结果。"
有没有办法摆脱这种困境?"嗯,改变博弈的一种方法是,如果第三方介入并为其中一方提供某种激励,使其以不同的方式行事。"另一个选择是通过与对手沟通来规避博弈。这就是古巴导弹危机中发生的事情,但在这里似乎不太可能。"不过,我必须说,伊朗似乎玩得更精明,因为美国方面非常非常不可预测。现在,不可预测性也是一种经典的博弈论策略,但这让对方很难知道如何应对。如果你真的在与一个非理性的玩家对弈,那么博弈论告诉你的一件事就是,你只能对最坏的情况进行对冲。"
伍尔德里奇强调,这不仅仅是关于战争,甚至不仅仅是关于游戏。他在书中将博弈论定义为"一种数学理论,旨在理解自利方相互作用的情况"。他认为,这可以适用于各种情况:社会、政治和哲学。
例如,"零和博弈"的概念已经成为主流术语(部分归功于《战争游戏》),即使它被广泛误解。伍尔德里奇解释说,零和博弈不仅仅是一方获得另一方失去的东西;它是一种激励机制,让你的对手尽可能惨败。因此,从技术上讲,国际象棋不是零和博弈,因为你只是想赢,而不是摧毁或羞辱对手。这有一个社会政治维度。"这种零和心态非常有害。这是一种非常男性化的特征,"他说,"证据表明,你不仅最终可能在生活中做得不如你本可以做到的那样好,而且实际上你会成为一个更悲惨的人。你会觉得自己在事务中的主动权更少。博弈论的重要教训之一是,实际上,我们所处的大多数互动都不是零和的。"
这种对抗性世界观是民粹主义政治的引擎——在"移民来抢你的工作"的意义上。你之所以失败,是因为别人在获胜。伍尔德里奇最喜欢的博弈之一鼓励我们反向思考:无知之幕是哲学家约翰·罗尔斯在1971年设计的,前提是你可以以任何方式设计社会,但之后,你将被随机放置在其中。伍尔德里奇将其描述为"一个美丽的思想实验……它激励了一个社会期望的结果,但人们仍然遵循自己的利益。"他补充说,比尔·克林顿和巴拉克·奥巴马都是粉丝。
博弈论如何与AI契合起初并不清楚,但伍尔德里奇解释说,前者如今是后者的重要组成部分,尤其是在他的主要兴趣领域——多智能体系统中,这些程序相互交互并代表你行事。"所以如果我想和你安排一次会议,我为什么要给你打电话?为什么我的Siri不直接和你的Siri对话?"这些类型的交互嵌入在我们的在线生活中。例如,eBay等在线拍卖,你试图在最后一刻提交获胜出价。"如果我的智能体要与你的智能体互动,而我的偏好不一定与你的一致,那么解释你应该如何思考这些互动的理论就是博弈论。"
当伍尔德里奇刚开始时,AI几乎是一个抽象概念。他通过业余爱好进入计算机领域。在赫里福德郡的乡村长大,父亲是当地苹果酒公司的中层管理人员,大约在1980年,当地电子商店有一台家用计算机出售时,这是一件大事。"这听起来很荒谬,因为在我看来,计算机是价值数百万英镑的东西。"店主慷慨地让他试用(那是一台Tandy TRS-80)。"我一周又一周地回去,自学编程。我真的坐在商店橱窗里用电脑。"他继续攻读计算机本科学位,1989年开始攻读AI博士学位,然后在Janet(联合学术网络)实习,这基本上是早期互联网的英国分支。
从那时起,技术已经取得了天文数字般的进步,但伍尔德里奇说,本质上,"推动当前AI革命的核心技术是在80年代中期发明的"。他提到了人工神经网络的先驱杰弗里·辛顿——这种机制现在支撑着机器学习。"在20世纪80年代,阻碍AI革命的唯一障碍实际上是计算机不够强大,我们没有足够的数据。"
归根结底,伍尔德里奇说,GPT-3在2020年的突破性成功主要"基于OpenAI的一个赌注,即如果他们做同样的事情,只是规模扩大10倍,就会产生结果。当时包括我在内的很多人对此非常怀疑。我是一名科学家;我希望看到通过科学发展而不是仅仅通过投入更多计算能力来取得进步。但事实证明,这实际上是一个非常成功的赌注。"这是否表明OpenAI老板山姆·奥特曼和他的同类并不是人们认为的技术天才?"我从未见过山姆·奥特曼;我不知道,"他外交地说,"他显然交付了一些了不起的东西。"
无论是否是天才,这些AI先驱可能正在达到他们的极限。几年前,奥特曼和谷歌DeepMind的德米斯·哈萨比斯等人预计在几年内实现AGI——人类水平的通用人工智能。"我个人认为他们过于乐观,"伍尔德里奇说。他指出,你可以用拉丁语与ChatGPT讨论量子力学,"但与此同时,我们没有AI可以进入你从未见过的房子,找到厨房并清理餐桌"——这是最低工资的人类工人可以做的事情。
"限制是你能够投入的计算能力和数据。而数据现在是一个真正的约束。"他说,整个维基百科只占GPT-3训练数据的3%。"下次你从哪里获得10倍的数据?"因此,数据正在成为一种有价值的资源,一些组织拥有潜在的大量数据。"NHS(英国国家医疗服务体系)拥有大量关于人类的数据。这是可以想象的最有价值的数据。"他说,私营公司会为此付出高昂的代价,"但我怀疑,无论谁签署这样的交易都会后悔。"他想象了一个反乌托邦的未来场景,"你只有在同意连接可穿戴技术定期监测你的情况下才能使用NHS……我认为我们很快就会进入一个世界,下一代在线影响者基本上同意收集他们所有的生活经历、他们说的和做的以及看到的一切,以便为AI提供数据。"
从学术角度来看,伍尔德里奇对硅谷主导AI领域的方式感到不满,无论是在资源方面("GPT-3需要大约20000台AI超级计算机进行训练;整个牛津大学可能有几百台")还是在公共话语方面。"我们看到叙事被硅谷窃取了,它正在推广一种AI版本(利润驱动、取代工作,几乎完全专注于大语言模型),这肯定不是我和我的很多同事有兴趣推广或构建的,"他说,"作为一个花了整个职业生涯试图构建AI以创造更美好世界并改善人们生活的人,这有点令人沮丧。"
他继续说:"如果你从大局来看,那么AI有很多好处,这些好处往往不会被注意到,因为大语言模型吸走了房间里所有的氧气。"他提到牛津的一个团队正在开发一种AI辅助工具,可以分析使用简单超声波完成的心脏扫描,并通过手机发送给你的全科医生。"这是NHS难以提供的昂贵服务,突然之间以可忽略不计的成本提供。"
2025年,伍尔德里奇因其在用通俗语言传播科学思想方面的专业知识而获得了英国皇家学会著名的法拉第奖。他的配套讲座于2月举行,题为"这不是我们承诺的AI"。大约在同一时间,伍尔德里奇推测AI可能会有一个"兴登堡时刻"——兴登堡坠毁事件一夜之间扼杀了飞艇行业。"我们完全有可能看到一些类似的与AI相关的灾难,"他说,"计算机程序以各种方式出错,而我们完全依赖于一个计算网络基础设施,其中AI越来越嵌入其中。"话虽如此,当涉及到存在性风险时,"AI不在我晚上睡不着觉的事情清单上,"他说,"我不担心机器人接管。至少,它不在我的前五名中。"不过,他认为核战争是更大的威胁,这一事实并不令人放心。
不过,如果可以的话,他会放慢AI发展的步伐,"这样我们就有更多时间来理解正在发生的事情"。他指出,这是一个经典的"囚徒困境",博弈论的基础寓言之一。在标准场景中,两名囚犯必须分别决定是否承认他们共同犯下的罪行,还是保持沉默。如果一个人承认而另一个人不承认,只有承认者会被释放。如果两人都承认,他们将各自服刑较短的刑期。如果两人都保持沉默,他们将服刑更短的刑期。所以如果两人都同意保持沉默,他们会做得更好,但两人都不知道另一个囚犯会做什么。也许违反直觉的是,博弈论得出的结论是,最聪明的选择是承认。
根据同样的逻辑,AI公司被锁定在一场竞赛中以取得领先。他们的竞争意味着更多的支出、资源和耗能的数据中心,但对人类没有净增益。但我们就在这里。"我们有少数非常非常富有的公司正在忙于追求AI,同时又说他们担心会出现严重错误。那么他们为什么忙于追求它?因为他们认为,如果我们退缩而不追求它,别人就会追求。"
他自己有没有被硅谷诱惑过?"我怀疑有几个时刻可能发生过,"他说,"但我今年60岁了,现在这是年轻人的游戏。"有些人认为,现在根本没有必要学习,因为AI预计将取代人类活动的很大一部分。伍尔德里奇不这么看。"我进入计算机领域不是因为我认为它会给我一份好工作。我进入它是因为我真的对它感兴趣。"他说,很多家长问他孩子应该在大学学习什么,"答案是:'让他们学习他们真正热衷的东西。'我认为这是迄今为止最重要的事情。"
Q&A
Q1:博弈论如何解释当前的美伊冲突?
A:伍尔德里奇用"懦夫博弈"来解释美伊冲突。这种博弈中,双方不断升级威胁,总有一方必须退让。危险在于,如果双方都不退让,就会越过不归点,导致最坏的结果。伊朗似乎玩得更精明,因为美国方面非常不可预测,而不可预测性本身就是一种经典的博弈论策略。
Q2:为什么AI公司明知风险还要继续开发AI技术?
A:这是一个经典的"囚徒困境"。AI公司被锁定在竞赛中,即使他们担心会出现严重错误,也不敢停下来,因为他们认为如果自己退缩不追求AI,别人就会追求。这种竞争导致更多的支出、资源和耗能的数据中心,但对人类没有净增益。
Q3:大语言模型发展面临什么限制?
A:主要限制是计算能力和数据。整个维基百科只占GPT-3训练数据的3%,下次很难找到10倍的数据。数据正在成为稀缺资源,这也是为什么NHS等机构拥有的人类数据变得极其有价值。伍尔德里奇还指出,AI无法完成人类最低工资工人能做的简单任务,比如在陌生房子里找到厨房并清理餐桌。
好文章,需要你的鼓励
今天讲的出海案例是利亚德,这家 1995 年成立、从 LED 显示产品研发生产销售起步,并做到小间距和 Micro LED 的视效科技公司,沙特工厂预计 2026 年 7 月投产。
ATLAS是由香港中文大学与Meta AI联合提出的视觉推理框架,将视觉操作压缩为词典中的五个特殊词汇,让AI无需生成图片或调用外部工具,即可完成复杂的交互式视觉推理。
谷歌在I/O 2026大会上宣布,Android Auto将对媒体应用进行重大界面升级。此次更新基于Car App Library v1.9.0-alpha01,引入扩展标题、聚焦区域、新型进度条、快捷芯片和迷你播放器等全新组件,提升布局灵活性。开发者可申请加入测试计划提前体验,Spotify、YouTube等热门应用将率先采用新设计。
SPIN是由纽约州立大学奥尔巴尼分校与IBM联合提出的工业AI规划框架,通过格式验证修复和前缀渐进执行控制,在减少40%执行步骤的同时提升任务完成率。