告别模拟联合国,乔治华盛顿大学的研究人员创造了历史,成功构建了美联储银行委员会会议的AI模型。
这个名为"FOMC in silico"的项目模拟了央行联邦公开市场委员会的会议,由AI智能体担任董事会成员。研究团队收集了每位成员对财政政策的态度和历史投票记录等信息,并将所有数据输入模型。
"现有方法无法让我们在相同信息集上观察理性和行为决策规则,"项目论文作者Sophia Kazinnik和Tara M. Sinclair解释道。"我们通过双轨模拟框架解决了这一问题,将大语言模型驱动的FOMC会议模拟与博弈论投票模型相结合。在理性(博弈论)轨道中,政策制定者观察宏观数据,通过贝叶斯推理更新信念并投票达成均衡。在行为(大语言模型)轨道中,智能体获得相同数据,用自然语言推理,参与委员会辩论,产生的结果不仅受数据影响,还受个性差异和制度规范塑造。"
其中一个"轨道"没有自然语言对话,只有"贝叶斯推理",另一个轨道中智能体会"交谈"并通过这种方式做出决策。使用"个性差异"等术语,作者试图表达的是,没有对人们像真实会议中那样交谈表达想法的渲染,就无法获得强健的模拟。
这个FOMC数字孪生的主要发现是,在政治压力下,由智能体代表的董事会成员会产生分歧并破坏共识。
构建人物角色
我认为项目论文中较有趣的一个方面是,作者解释了为创建具有背景的数字董事会成员所做的数据工作。
"在框架内,我们首先自动摄取实时宏观经济数据,"他们写道,具体包括州长演讲、地区报告和财经新闻。"然后我们为每位委员会成员构建详细档案,结合他们的历史政策立场、传记、近期演讲、地区状况和当前宏观经济背景。"
在某种程度上,这很像营销团队经常尝试构建"人物画像"来确定如何向受众投放广告。不过在这里,研究团队试图建模人们对金融政策的想法,这就是为什么枚举结果包括初始利率建议,由首选政策利率、置信度分数和摘要组成。
然后是在"并行蒙特卡罗模拟"中呈现的政治压力场景,模型试图复制对杰罗姆·鲍威尔的公开批评。
"政治压力场景(反映总统对主席鲍威尔的公开攻击)会降低主席的议程权重,对其提案施加鸽派偏见,并对任命概率高的成员施加职业驱动的鸽派转变,"Kazinnik和Sinclair写道。
本质上,通过区分"鹰派"和"鸽派"情绪,他们为更细致地调查每位董事会成员的立场以及由此产生的博弈论奠定了基础,最终董事会要决定是提高利率、降低利率还是保持不变。
委员会审议
事实上,为了更好地理解这一切是如何运作的,查看过去真实人类FOMC会议的纪要很有帮助。以下是今年早些时候此类会议纪要的摘录:
"与会者认为该声明在建立政策制定者对国会授权的货币政策目标及其货币政策策略的共同理解方面发挥了重要作用。该声明和其他政策沟通手段在向公众传达这种理解和帮助锚定通胀预期方面也发挥了重要作用,从而支持货币政策的有效传导。与会者表示,他们期待在即将举行的会议上进行讨论,在各种美联储倾听活动以及计划中的研究会议上听取各种观点,并以开放的心态参与审查。"
第一句话有大约31个单词,需要花时间说出来,更不用说阅读和消化了。我让ChatGPT提出一个保持原文细节的简化版本:
"该声明被认为非常重要,因为它帮助政府领导人就美联储的货币目标应该是什么以及如何实现这些目标达成一致。它还向公众解释了这些想法,让人们理解美联储试图做什么,这有助于保持人们对通胀的稳定预期。该小组表示,他们很高兴在未来的会议、美联储倾听活动和研究会议上进行更多讨论,并希望保持开放的心态。"
你可以看到这是如何运作的。
然而,模拟并不关注董事会成员是否对即将到来的活动感到兴奋。它旨在行动,旨在反映董事会成员在各种场景中将采取的立场。
论文中还有这样一段,说明了"想要挑战国王,最好不要半途而废"这一古老格言。
"嵌入声誉驱动的职业关切捕捉了成员如何调整其立场以与当前或预期领导者保持一致。这为政治压力对主席的传播创造了一个新颖的渠道:成员预期领导层变化而重新定位,在变化发生之前就改变了委员会的立场。"
我的理解是,如果模型对作为主席的鲍威尔施加压力,它会看到智能体在支持他的立场方面出现分散,并采取新路径来讨好其他领导者。
底线是,既然研究团队已经用AI智能体模拟了FOMC,用相同方法模拟企业财报会议、家长教师会议、大联盟体育更衣室会议以及各种其他群体活动应该指日可待。让我们拭目以待。
Q&A
Q1:FOMC in silico项目是什么?它能做什么?
A:FOMC in silico是乔治华盛顿大学研究人员开发的AI模拟项目,用于模拟美联储联邦公开市场委员会的会议。该项目使用AI智能体担任董事会成员,基于每位成员的财政政策态度和历史投票记录,通过双轨模拟框架来预测委员会在不同场景下的决策行为。
Q2:AI智能体如何模拟真实的委员会成员?
A:研究团队为每位委员会成员构建了详细档案,结合历史政策立场、传记、近期演讲、地区状况和宏观经济背景。智能体通过两种方式运作:理性轨道使用贝叶斯推理和博弈论,行为轨道则让智能体用自然语言推理和参与辩论,更好地反映真实会议中的人际互动。
Q3:模拟结果显示了什么重要发现?
A:主要发现是在政治压力下,AI智能体代表的董事会成员会产生分歧并破坏共识。特别是当对主席施加政治压力时,其他成员会预期领导层变化而重新调整立场,在实际变化发生之前就改变委员会的整体立场,体现了政治压力的传播效应。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。