一项发表在《社会》(Societies) 期刊上的新研究探讨了人们对人工智能工具日益增长的依赖可能会如何削弱批判性思维能力,特别是通过认知卸载这一现象。这项研究对于那些在法律和司法鉴定等高风险领域依赖 AI 的专业人士具有重要启示,因为过度依赖技术可能导致严重后果。
正如我上月报道的那样,专家证人和律师在法律环境中使用 AI 是一个不断增长的趋势,但如果在缺乏充分监督或验证的情况下使用这些工具,就会带来风险。这项研究进一步强调了这种做法的危险性,突出表明 AI 的便利性可能会降低人类决策和批判性分析的质量。
关于认知卸载和 AI 的研究发现
该研究对 666 名来自不同人口背景的参与者进行了调查,以评估 AI 工具对批判性思维能力的影响。主要发现包括:
认知卸载:经常使用 AI 的用户更倾向于将思维任务转移出去,依赖技术来解决问题和做出决策,而不是进行独立的批判性思考。
技能退化:长期来看,过度依赖 AI 工具的参与者在批判性评估信息或得出细致结论方面的能力有所下降。
代际差距:相比年长群体,年轻参与者表现出对 AI 工具更大的依赖性,这引发了对专业知识和判断力长期影响的担忧。
研究人员警告说,虽然 AI 可以简化工作流程并提高生产力,但过度依赖可能会造成"知识鸿沟",使用户失去验证或质疑这些工具输出结果的能力。
当专业人士盲目信任 AI 输出而不验证其准确性时,他们可能会引入错误,这会破坏案件,损害声誉,并削弱人们对其专业知识的信任。任何需要判断力和专业知识的职业都可能陷入认知卸载的陷阱,正如最近的研究所表明的那样。如果缺乏充分的人工监督,AI 工具可能不仅会增强工作流程,还可能损害专家们应该维护的卓越标准。
这个问题并不仅限于法庭。然而,我经常撰写和讨论法庭、保险和司法鉴定领域的 AI 应用。这些严重依赖人类专业知识的行业正在努力应对 AI 带来的潜在利益、挑战和未知因素。考虑到这些行业固有的高风险,它们可以成为未来风险和挑战的"预警信号"。
法律和司法领域的 AI 应用分析
虽然 AI 可以协助数据分析或案件准备,但人们越来越担心专家和律师可能过度依赖这些工具而不充分验证其准确性。当法律或司法鉴定领域的专业人士过度依赖 AI 工具时,他们就会承担内在风险。
未经验证的数据:AI 工具可能会产生看似合理但实际错误的输出,比如在法律程序中出现伪造证据或不准确计算的案例。
专业知识的退化:随着时间推移,将复杂任务外包给 AI 的习惯可能会削弱批判性评估或质疑证据的能力。
责任感降低:对 AI 的盲目信任会转移个人责任,造成错误被忽视或忽略的危险先例。
AI 和人类专业知识:需要平衡
研究的一个关键结论是,AI 应该被视为增强人类能力的工具,而不是取代它们。为确保这种平衡:
专业知识必须领先:人类专业知识必须保持决策的基石。AI 输出应始终由经过培训的专业人员验证和理解其背景。
批判性思维至关重要:用户需要批判性地参与 AI 生成的数据,质疑其有效性并考虑其他解释。
监管和培训是必要的:随着 AI 变得越来越普遍,各行业必须制定稳健的使用标准,并确保专业人士接受培训,了解其潜力和局限性。
无论是在日常任务还是法律和司法鉴定等高风险领域,人的因素对于确保准确性、责任性和道德完整性仍然至关重要。如果没有适当的监督和批判性参与,我们可能会损害专业人士应该维护的专业知识和信任标准。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。