Anthropic搭建智能体间商业交易测试平台

Anthropic近期开展了一项名为"Project Deal"的实验,构建了一个由AI智能体代表买卖双方的分类交易市场。69名员工各获100美元预算,通过AI完成同事间的商品交易,共促成186笔交易,总价值逾4000美元。实验结果显示,使用更先进模型的用户获得了"客观上更优"的交易结果,但用户本身并未察觉差距,揭示了潜在的"智能体质量鸿沟"问题。

Anthropic近期开展了一项实验,构建了一个模拟分类信息市场,让AI智能体分别扮演买家与卖家角色,双方在这一平台上达成真实商品的实际交易。

Anthropic坦承,这次名为"Project Deal"的测试仅是一项"小规模试验性实验,参与者均为自愿报名的内部员工"。共有69名Anthropic员工参与其中,每人获得100美元预算(以礼品卡形式发放),用于向同事购买商品。

尽管如此,Anthropic表示对"Project Deal的运行成效感到惊喜"——本次实验共促成186笔交易,交易总金额超过4,000美元。

据悉,Anthropic实际上构建了四个独立的市场环境,分别配备不同的AI模型进行测试:其中一个为"真实"市场(所有用户均由公司最先进的模型代理,且实验结束后交易结果得到实际兑现),另外三个则用于学术研究目的。

Anthropic指出,当用户由更先进的模型代理时,他们往往能获得"客观上更优的交易结果"。然而,用户普遍未能察觉到这种差距,这引发了对"智能体质量差异"问题的关注——处于劣势的一方很可能并未意识到自己吃了亏。

此外,实验结果还显示,用户在初始阶段给予智能体的指令,对最终的成交概率和议价结果并无明显影响。

Q&A

Q1:Project Deal实验是什么?它是如何运作的?

A:Project Deal是Anthropic开展的一项内部实验,旨在测试AI智能体之间的商业交易能力。实验构建了一个模拟分类信息市场,让智能体分别代表买家和卖家进行真实商品交易。共69名员工参与,每人获得100美元礼品卡预算用于向同事购买商品。整个实验共达成186笔交易,总金额超过4,000美元。

Q2:使用更先进的AI模型代理交易,结果会有什么不同?

A:根据Anthropic的实验结果,由更先进的AI模型代理的用户能够获得客观上更好的交易结果。但值得关注的是,处于劣势的用户往往并未察觉到这种差距,这意味着"智能体质量差异"可能在用户不知情的情况下影响交易公平性,形成隐性的不对等局面。

Q3:用户给智能体的初始指令会影响交易结果吗?

A:根据Project Deal的实验数据,用户最初给予智能体的指令对成交概率和最终议价价格并没有显著影响。也就是说,无论用户如何设定初始交易策略,智能体在实际谈判中的表现差异并不明显,这一结论对于理解智能体自主决策能力具有一定参考价值。

来源:Techcrunch

0赞

好文章,需要你的鼓励

2026

04/27

08:08

分享

点赞

邮件订阅