麻省理工学院的科学家们发现,使用大语言模型会导致学习能力"可能下降"。
本周《时代》杂志报道了该研究团队的发现。在一篇预印本论文中,科学家们详细介绍了这项为期数月研究的新数据。
麻省理工学院团队邀请了54名来自波士顿地区的参与者在20分钟内写一篇短文。参与者被分为三组:第一组在没有任何外部帮助的情况下写作,第二组可以使用搜索引擎,第三组使用ChatGPT。
研究人员重复进行了四次实验。在第四次实验中,使用ChatGPT的参与者与独立写作的参与者互换角色。第四次测试在第一次测试四个月后进行。
研究人员在论文中写道:"虽然最初的好处很明显,但正如我们在4个月的过程中所证明的,大语言模型组的参与者在各个层面——神经、语言、评分——都比仅使用大脑组的参与者表现更差。"
麻省理工学院团队通过参与者佩戴的脑电图(EEG)头戴设备收集测试数据。这些设备使用电极测量佩戴者的大脑活动。研究人员还向参与者提出了一系列问题,以补充头戴设备收集的数据。
脑电图设备使用一种称为dDTF(动态定向传递函数)连接性的指标来测量佩戴者的认知负荷。该指标描述了不同大脑区域相互作用的强度。据研究人员称,使用大语言模型的参与者在写作时的dDTF连接性比没有使用ChatGPT的参与者低55%。
配备大语言模型的组在写作练习中也表现出较低的额中线θ活动。额中线θ脑电波与涉及集中注意力的认知活动相关。研究人员发现:"在仅使用大脑组中突出的θ连接在大语言模型组中相对较弱或缺失。"
在项目的后续阶段,麻省理工学院团队要求研究参与者引用他们文章中的内容。使用大语言模型的组在这项任务上的表现不如其他两组。此外,该组参与者报告对他们所写文章的"感知所有权"较低。
研究人员写道:"基于我们研究的结果,我们证明了学习能力可能下降这一紧迫问题。这些发现支持一种教育模式,即延迟AI集成,直到学习者进行了充分的自主认知努力。这种方法可能会促进即时工具效率和持久的认知自主性。"
好文章,需要你的鼓励
谷歌DeepMind发布AlphaEarth Foundations AI模型,能处理每日数TB卫星数据追踪地表变化。该模型如"虚拟卫星"般将全球陆地和沿海水域映射为数字表示,帮助科学家监测食品安全、森林砍伐、城市扩张等关键问题。模型整合光学卫星图像、雷达、激光测绘等数据源,以10×10米精度追踪变化,错误率比其他模型低24%。
阿联酋穆罕默德·本·扎耶德人工智能大学研究团队开发出轻量级语音合成系统LLMVoX,仅用3000万参数就能让任何大语言模型获得流式语音输出能力。该系统实现475毫秒超低延迟,词错误率仅3.7%,支持多语言扩展,可与视觉语言模型集成,为AI语音交互提供了"即插即用"的革命性解决方案。
ChatGPT虽然是目前最受欢迎的AI聊天机器人,但它并非万能。文章指出11个不应该使用ChatGPT的场景:诊断健康问题、处理心理健康、紧急安全决策、个人财务税务规划、处理机密数据、违法行为、学术作弊、监控实时信息、赌博预测、起草法律文件以及创作艺术。AI可能产生错误信息、缺乏实时数据更新,在高风险场景下可能造成严重后果。用户应了解其局限性,在关键决策时寻求专业帮助。
清华大学团队开发出革命性人形机器人系统Being-0,具备类人思维能力。该系统采用创新的"三层大脑"架构:顶层基础模型负责理解指令和制定策略,中间层连接器模块负责将计划转化为具体动作,底层技能库负责执行各种操作。机器人能够理解自然语言,自主规划复杂任务如制作咖啡,并在动态环境中灵活调整策略,在长期任务中达到84.4%的成功率。