用生成式AI花几分钟解决一道复杂的数学题或草拟一封邮件,看似省时省力。但如果AI替你完成了所有工作,你的批判性思维、创造力和推理能力就会处于休眠状态。这种影响或许比你想象的更为深远。
卡内基梅隆大学、牛津大学、麻省理工学院和加州大学洛杉矶分校的研究人员近期联合发布了一项预印本研究。研究发现,仅仅依靠AI练习某项任务10分钟后,参与者在失去AI辅助时,完成该任务的表现明显不如那些从未借助AI的人。
研究人员指出,AI聊天机器人在学习、头脑风暴等"需要深度推理的任务"上确实能提供帮助,但过度依赖AI完成这类任务,可能会削弱我们独立完成同类任务的能力。让AI直接替你解决问题,与把AI当作获取提示或澄清疑问的工具,两者之间存在本质区别。
这项研究引发了持续关注:使用AI是否会影响我们在没有机器辅助时独立完成任务的能力?让ChatGPT或Claude提供一些引导或回答几个问题,是一回事;让它全权代劳,则是另一回事。
用AI完成作业和用AI管理时间,效果截然不同。AI的过度使用,尤其是在职场和校园中的滥用,可能正在削弱人类本应具备的独立能力。
有AI与没有AI时的问题解决能力对比
该研究共招募了1200名美国参与者,通过研究平台Prolific开展三项实验,内容涵盖分数运算和SAT风格的阅读理解题。部分参与者获得了AI助手的辅助,可自由使用,但10分钟后被收回。结果显示,曾使用AI的参与者更容易在遇到难题时选择放弃,整体表现也不如未曾使用AI的参与者。
值得注意的是,AI使用带来的负面影响,仅出现在那些依赖AI解题的参与者身上,而非所有人。麻省理工学院去年一项聚焦AI辅助写作的研究也得出了类似结论。
卡内基梅隆大学博士生、本研究作者之一Grace Liu在接受CNET采访时表示,目前的研究只测量了短期效果,长期影响尚不明朗。"这种效应在大规模、长时间情境下的显著程度,还需要更多研究来验证。"她也指出,研究并未深入评估AI工具的具体使用方式。
研究人员还发现,当曾经依赖AI的参与者无法使用AI时,他们对自身解题能力的信心也明显下降。
"人们不仅是变得更不擅长某些任务,他们甚至开始放弃尝试,"研究人员写道,"如果这种效应在数月乃至数年的AI使用中持续积累,我们可能会培养出一代在没有技术支持时就失去主动挑战意愿的学习者。"
AI和计算器真的不一样吗?
这项研究让人不禁思考:使用AI是否与使用计算器解数学题等其他借助工具的方式本质相同?一个关键区别在于,生成式AI几乎可以应用于任何场景——个人决策、内容编辑、多轮追问式研究等,无所不能。
"两者确实有相似之处,因为它们都允许人们将认知任务外包出去,"Liu说,"但我们认为,研究认知外包给AI尤为重要,因为AI可以广泛应用于各类推理任务,而以往的工具往往只针对特定任务。"
你该让AI替你工作吗?
研究人员表示,这些发现促使我们重新审视日常使用AI对坚持力和推理能力的长远影响。
"我们提醒大家注意,如果这种效应随着长期使用AI而持续累积,当前仅针对短期效用进行优化的AI系统,可能会逐渐侵蚀它本应支持的人类能力,"研究人员补充道。
Liu建议在使用AI工具时保持审慎。
"我们的研究结果表明,我们应该更有意识地思考何时、以何种方式使用AI辅助,尤其是在学习场景中,"她说,"这不是拒绝AI的理由,而是更用心地设计和使用这些工具的理由。"
Q&A
Q1:这项关于AI依赖的研究是谁做的?研究了什么内容?
A:该研究由卡内基梅隆大学、牛津大学、麻省理工学院和加州大学洛杉矶分校的研究人员联合开展,共招募1200名美国参与者,通过分数运算和SAT阅读理解测试,研究短期依赖AI对独立完成任务能力的影响。结果发现,仅使用AI练习10分钟的参与者,在失去AI辅助后表现明显下滑,且更容易放弃解题。
Q2:用AI解题和用计算器有什么本质区别?
A:两者都属于认知外包,但生成式AI的应用范围远超计算器。计算器只适用于数学运算等特定任务,而生成式AI几乎可用于任何需要推理的场景,包括写作、决策、研究等。正因为AI的适用范围极广,其对人类整体认知能力的潜在影响也更值得深入研究和警惕。
Q3:我们应该完全避免使用AI吗?研究给出了什么建议?
A:研究并不建议完全放弃使用AI。研究人员建议用户在学习和工作中更有意识地规划AI的使用方式,区分"让AI替你解决问题"与"用AI获取提示和引导"的不同。关键在于合理设计AI的使用边界,避免过度依赖,从而保护和培养人类自身的推理与解决问题的能力。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。