一项新研究表明,人脑理解口语的过程采用了逐步处理的方式,这与先进的AI语言模型的运行机制极为相似。研究人员通过记录人们聆听口述故事时的大脑活动发现,大脑反应的后期阶段与AI系统的深层层级相匹配,特别是在布罗卡区等著名的语言区域中。这一结果对长期以来基于规则的语言理解理论提出了质疑,并得到了新发布的公共数据集的支持,为研究大脑如何形成意义提供了强大的新途径。
这项发表在《自然通讯》上的研究由希伯来大学的阿里尔·戈德斯坦博士领导,合作者包括谷歌研究院的马里亚诺·夏因博士以及普林斯顿大学的乌里·哈森教授和埃里克·哈姆。研究团队共同发现了人类理解语音与现代AI模型处理文本之间的惊人相似性。
科学家们使用皮层脑电图记录技术,追踪参与者聆听30分钟播客时语言处理过程中大脑活动的时间和位置。他们发现,大脑遵循一个结构化序列,与GPT-2和Llama 2等大语言模型的分层设计高度匹配。
大脑如何随时间构建意义
当我们聆听别人说话时,大脑并非一次性理解全部含义。相反,每个词都会经过一系列神经步骤。戈德斯坦及其同事表明,这些步骤在时间上的展开方式反映了AI模型处理语言的方式。AI的早期层级专注于基本的词汇特征,而深层层级则结合上下文、语调和更广泛的含义。
人脑活动遵循了同样的模式。早期的神经信号与AI处理的早期阶段相匹配,而后期的大脑反应则与模型的深层层级保持一致。这种时间匹配在布罗卡区等高级语言区域中特别强烈,当与AI深层层级关联时,这些区域的反应峰值出现得更晚。
戈德斯坦博士表示:"最令我们惊讶的是,大脑意义的时间展开过程与大语言模型内部的变换序列如此密切匹配。尽管这些系统的构建方式截然不同,但两者似乎都趋向于类似的逐步构建理解的方式。"
这些发现的重要意义
研究表明,人工智能不仅能够生成文本,还可能帮助科学家更好地理解人脑如何创造意义。多年来,人们认为语言主要依赖于固定符号和严格的层次结构。这些结果挑战了这一观点,转而指向了一个更灵活和统计性的过程,其中意义通过上下文逐渐显现。
研究人员还测试了传统的语言学元素,如音素和词素。这些经典特征在解释实时大脑活动方面不如AI模型产生的上下文表示有效。这支持了大脑更多依赖于流动上下文而非严格语言构建块的观点。
语言神经科学的新资源
为了推动该领域的发展,研究团队已将完整的神经记录和语言特征数据集公开。这一开放数据集使世界各地的研究人员能够比较语言理解理论,并开发出更接近人类思维工作方式的计算模型。
Q&A
Q1:这项研究发现了人脑和AI在语言处理上有什么相似性?
A:研究发现人脑理解口语采用逐步处理方式,与大语言模型的运行机制极为相似。大脑早期神经信号对应AI的早期层级处理基本词汇特征,后期大脑反应则与AI深层层级匹配,结合上下文和更广泛含义,特别是在布罗卡区等语言区域中这种匹配更加明显。
Q2:这项发现对传统语言理解理论有什么影响?
A:研究结果挑战了长期以来基于规则的语言理解理论。传统观点认为语言主要依赖固定符号和严格层次结构,但研究发现传统语言学元素如音素和词素在解释实时大脑活动方面不如AI模型的上下文表示有效,支持了大脑更多依赖流动上下文的观点。
Q3:研究团队为科学界提供了什么新资源?
A:研究团队已将完整的神经记录和语言特征数据集公开发布,创建了一个开放数据集。这一资源使世界各地的研究人员能够比较不同的语言理解理论,开发出更接近人类思维工作方式的计算模型,为语言神经科学研究提供了强大的新工具。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。