告别模拟联合国,乔治华盛顿大学的研究人员创造了历史,成功构建了美联储银行委员会会议的AI模型。
这个名为"FOMC in silico"的项目模拟了央行联邦公开市场委员会的会议,由AI智能体担任董事会成员。研究团队收集了每位成员对财政政策的态度和历史投票记录等信息,并将所有数据输入模型。
"现有方法无法让我们在相同信息集上观察理性和行为决策规则,"项目论文作者Sophia Kazinnik和Tara M. Sinclair解释道。"我们通过双轨模拟框架解决了这一问题,将大语言模型驱动的FOMC会议模拟与博弈论投票模型相结合。在理性(博弈论)轨道中,政策制定者观察宏观数据,通过贝叶斯推理更新信念并投票达成均衡。在行为(大语言模型)轨道中,智能体获得相同数据,用自然语言推理,参与委员会辩论,产生的结果不仅受数据影响,还受个性差异和制度规范塑造。"
其中一个"轨道"没有自然语言对话,只有"贝叶斯推理",另一个轨道中智能体会"交谈"并通过这种方式做出决策。使用"个性差异"等术语,作者试图表达的是,没有对人们像真实会议中那样交谈表达想法的渲染,就无法获得强健的模拟。
这个FOMC数字孪生的主要发现是,在政治压力下,由智能体代表的董事会成员会产生分歧并破坏共识。
构建人物角色
我认为项目论文中较有趣的一个方面是,作者解释了为创建具有背景的数字董事会成员所做的数据工作。
"在框架内,我们首先自动摄取实时宏观经济数据,"他们写道,具体包括州长演讲、地区报告和财经新闻。"然后我们为每位委员会成员构建详细档案,结合他们的历史政策立场、传记、近期演讲、地区状况和当前宏观经济背景。"
在某种程度上,这很像营销团队经常尝试构建"人物画像"来确定如何向受众投放广告。不过在这里,研究团队试图建模人们对金融政策的想法,这就是为什么枚举结果包括初始利率建议,由首选政策利率、置信度分数和摘要组成。
然后是在"并行蒙特卡罗模拟"中呈现的政治压力场景,模型试图复制对杰罗姆·鲍威尔的公开批评。
"政治压力场景(反映总统对主席鲍威尔的公开攻击)会降低主席的议程权重,对其提案施加鸽派偏见,并对任命概率高的成员施加职业驱动的鸽派转变,"Kazinnik和Sinclair写道。
本质上,通过区分"鹰派"和"鸽派"情绪,他们为更细致地调查每位董事会成员的立场以及由此产生的博弈论奠定了基础,最终董事会要决定是提高利率、降低利率还是保持不变。
委员会审议
事实上,为了更好地理解这一切是如何运作的,查看过去真实人类FOMC会议的纪要很有帮助。以下是今年早些时候此类会议纪要的摘录:
"与会者认为该声明在建立政策制定者对国会授权的货币政策目标及其货币政策策略的共同理解方面发挥了重要作用。该声明和其他政策沟通手段在向公众传达这种理解和帮助锚定通胀预期方面也发挥了重要作用,从而支持货币政策的有效传导。与会者表示,他们期待在即将举行的会议上进行讨论,在各种美联储倾听活动以及计划中的研究会议上听取各种观点,并以开放的心态参与审查。"
第一句话有大约31个单词,需要花时间说出来,更不用说阅读和消化了。我让ChatGPT提出一个保持原文细节的简化版本:
"该声明被认为非常重要,因为它帮助政府领导人就美联储的货币目标应该是什么以及如何实现这些目标达成一致。它还向公众解释了这些想法,让人们理解美联储试图做什么,这有助于保持人们对通胀的稳定预期。该小组表示,他们很高兴在未来的会议、美联储倾听活动和研究会议上进行更多讨论,并希望保持开放的心态。"
你可以看到这是如何运作的。
然而,模拟并不关注董事会成员是否对即将到来的活动感到兴奋。它旨在行动,旨在反映董事会成员在各种场景中将采取的立场。
论文中还有这样一段,说明了"想要挑战国王,最好不要半途而废"这一古老格言。
"嵌入声誉驱动的职业关切捕捉了成员如何调整其立场以与当前或预期领导者保持一致。这为政治压力对主席的传播创造了一个新颖的渠道:成员预期领导层变化而重新定位,在变化发生之前就改变了委员会的立场。"
我的理解是,如果模型对作为主席的鲍威尔施加压力,它会看到智能体在支持他的立场方面出现分散,并采取新路径来讨好其他领导者。
底线是,既然研究团队已经用AI智能体模拟了FOMC,用相同方法模拟企业财报会议、家长教师会议、大联盟体育更衣室会议以及各种其他群体活动应该指日可待。让我们拭目以待。
Q&A
Q1:FOMC in silico项目是什么?它能做什么?
A:FOMC in silico是乔治华盛顿大学研究人员开发的AI模拟项目,用于模拟美联储联邦公开市场委员会的会议。该项目使用AI智能体担任董事会成员,基于每位成员的财政政策态度和历史投票记录,通过双轨模拟框架来预测委员会在不同场景下的决策行为。
Q2:AI智能体如何模拟真实的委员会成员?
A:研究团队为每位委员会成员构建了详细档案,结合历史政策立场、传记、近期演讲、地区状况和宏观经济背景。智能体通过两种方式运作:理性轨道使用贝叶斯推理和博弈论,行为轨道则让智能体用自然语言推理和参与辩论,更好地反映真实会议中的人际互动。
Q3:模拟结果显示了什么重要发现?
A:主要发现是在政治压力下,AI智能体代表的董事会成员会产生分歧并破坏共识。特别是当对主席施加政治压力时,其他成员会预期领导层变化而重新调整立场,在实际变化发生之前就改变委员会的整体立场,体现了政治压力的传播效应。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。