未来的 AI 是否会“有意识”,并以类似人类的方式体验世界?目前没有有力的证据表明会这样,但 Anthropic 并未排除这种可能性。
周四,该 AI 实验室宣布已启动一项研究计划,目的是调查并为应对所谓“模型福利”做好准备。作为这一努力的一部分,Anthropic 表示将探索如何判断 AI 模型的“福利”是否值得受到道德关注、模型可能出现的“痛苦迹象”的潜在重要性,以及可能采取的“低成本”干预措施等问题。
在 AI 社区内,关于模型是否展现出任何人类特性以及我们应如何“对待”它们,存在着重大分歧。
许多学者认为,现今的 AI 无法接近人类的意识或体验,未来也不一定能做到。我们所熟知的 AI,本质上是一个统计预测引擎。它实际上并没有按照传统意义上的“思考”或“感觉”。通过在无数文本、图像等示例中进行训练,AI 学习了各种模式,有时能以有用的方式进行外推来解决任务。
正如伦敦国王学院专注于 AI 的研究员 Mike Cook 最近在接受 TechCrunch 采访时所说,一个模型无法“反对”其“价值”的改变,因为模型本身没有价值。将其描述为拥有价值,就是在将人类的属性投射到该系统上。
“任何将 AI 系统拟人化到这种程度的人,要么是在博取关注,要么就是严重误解了他们与 AI 的关系,”Cook 说道。“一个 AI 系统是在优化它的目标,还是在‘获取自身的价值’?这只取决于你如何描述它,以及你想用多么华丽的语言来形容它。”
另一位研究人员、MIT 的博士生 Stephen Casper 在接受 TechCrunch 采访时表示,他认为 AI 仅仅是一个“模仿者”,它“会进行各种胡编乱造”,并说出“各种无聊的话”。
然而,还有科学家坚持认为 AI 确实具有价值以及其他类似于人类道德决策的成分。一项来自 AI 研究组织 AI Safety Center 的研究表明,AI 拥有一种价值系统,可能在某些情境下使其优先考虑自己的福祉而不是人类的利益。
Anthropic 一直在为其模型福利倡议打基础。去年,该公司聘请了首位专职“AI 福利”研究员 Kyle Fish,以制定 Anthropic 以及其他公司应如何处理这一问题的指导方针。(Fish 目前正领导这项新的模型福利研究计划,他在接受 《纽约时报》 采访时表示,他认为 Claude 或其他 AI 当下拥有意识的可能性为 15%。)
在周四的博客文章中,Anthropic 承认,目前尚无科学共识证明当前或未来的 AI 系统是否可能具有意识或体验到需要道德关注的感受。
“鉴于此,我们将以谦逊的态度,并尽可能少地做出假设来探讨这一课题,”该公司表示。“我们认识到,随着这一领域的发展,我们需要定期修正我们的观点。”
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。