在推进人工智能与神经科学交叉发展的过程中,研究团队持续关注的核心任务之一是探索自然发育的生物大脑与科学家创造的人工大脑之间的异同。
如今,我们面临着一个全新的对比维度:一边是发展仅约10年的神经网络系统,另一边是在实验室中用生物材料培养的新型生物类器官大脑。
如果你觉得这会让神经学研究变得极其复杂,你并不孤单——即便有了这些完全发育的仿真模型,关于大脑工作原理仍存在大量未解之谜。
**类器官的术语和方法学**
几周前,我撰文介绍了在实验室培养脑组织的过程。不仅仅是培养脑组织,而是培养一个梨形的小型大脑——科学家称之为类器官,它竟然能够自主生长出眼睛。
观察这种奇特现象激发了我们将视觉与智能相联系的本能倾向,促使我们探索眼睛与大脑之间的关系。
人工智能研究和生物科学领域的研究人员都在关注这种关系。在开发当今最有前景的神经网络模型时,研究人员受到了线虫C elegans原始视觉能力的启发,这一发现著名地推动了某些类型的人工智能和医学研究的发展。
回到生物类脑器官的生产,在进一步研究中,我发现科学家使用干细胞和一种叫做"基质胶"的物质——这源于对实验小鼠肿瘤材料长达数十年的分析。这其中有很多值得深入探讨的内容,随着人们意识到这些微型大脑的存在,我们可能会听到更多相关信息。
**探索视觉与智能**
最近一次"行动中的想象力"活动中的一场技术讲座也激发了我对这一领域的兴趣。演讲者Kushagra Tiwary探讨了涉及不同进化类型的"假设"场景。
"我们提出的首要问题是:如果视觉的目标不同会怎样?如果视觉是为了完全不同的目的而进化的呢?第二个问题是:我们的眼睛里都有晶状体,我们的相机也有镜头。如果晶状体没有进化出来会怎样?如果没有晶状体,我们将如何看世界?我们还能探测到食物吗?……也许这些都不会发生。通过提出这些问题,我们可以开始研究为什么我们拥有今天的视觉,更重要的是,为什么我们拥有今天的视觉智能。"
他还提出了更多问题。
"我们的大脑发育速度与眼睛基本同步,可以说我们真正是用大脑而非眼睛在看,对吧?那么如果大脑的计算成本大大降低会怎样?"
他讨论了大脑/眼睛的缩放关系,以及我们视觉处理信息的关键要素。
然后Tiwary提到,这可以指导人工智能研究,因为我们构建智能体的方式与人类自身的构建方式相似。
**计算机视觉、机器人技术和工业应用**
同一活动中的另一场技术讲座涵盖了协作视觉智能。
Annika Thomas回顾了三维工作空间中多智能体系统的一些特征——它们定位和提取对象的能力,以及一种叫做"高斯散射"的技术,这种技术影响着我们对眼睛和大脑之间信息处理的理解。
关键在于,我们拥有所有这些高度复杂的模型——完全数字化的神经网络,以及现在在培养皿中生长的原型大脑。
同时我们还有这些研究成果,向我们展示了人类大脑如何进化、它与人工替代品的差异,以及我们如何继续推动这一领域的进步。
最后但同样重要的是,我最近了解到科学家相信我们将能够在大约100年后,即到2125年时从死者大脑中提取记忆。
为什么需要这么长时间?
我询问了ChatGPT,得到的答案有三个方面——首先,分解过程使工作变得困难;其次,我们没有人类大脑的完整映射;第三,所需信息存储在精细的框架中。
换句话说,我们大脑中的记忆不是以二进制的0和1形式存在,而是以神经结构和突触强度的形式存在,这些对于任何外部研究者来说都难以测量。
不过我想到,如果人工智能本身具有感知细微差别和映射模式的强大能力,这种能力可能并不像我们想象的那么遥远。
这里的关键词是:思考。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。