要了解打造更强大人工智能的方法,一个好途径是与当今各类会议和贸易展会上汇聚的专家交流,集思广益地探讨近期未来的可能发展方向。
本月初举办了消费电子展 (CES),全年还有其他行业展会。此外还有各种研讨会和会议活动,行业内部人士在这些场合讨论可能性、优先事项和解决方案。
通过与这些业内人士的非正式交谈,以及聆听正式演讲,我发现一些共同的主题逐渐浮现。这些主题涉及引入下一代 AI 所需要的条件 - 即比当前更具活力和能力的人工智能系统。
以下是人们谈论的关于 2025 年 AI 现代化进展的一些关键要素。
物理感知系统 为了真正令人印象深刻,AI 系统需要理解周围的世界。这很困难,因为它们没有生物躯体,不能天生就具备各种帮助在三维空间导航的装置和设备。
然而,AI 系统正在学习物理学,其学习方式与学习其他任何东西相同 - 通过海量的训练数据,以及极其复杂的神经网络,通过反向传播和随机分析等过程来锁定正确的结果。
所以我们正在逐步接近通用人工智能 (AGI) 的这一部分。
持久记忆 AI 变得更强大的另一个重要因素是系统能够更好地记住过去的经历。
这体现在各个方面 - 包括与人类之前互动的信息、来自周围世界的感知数据,以及其他类型的经验性数据,或者能为机器的经验提供信息的数据。
例如,当你询问 ChatGPT 时,它将动态记忆定义为"长期信息的存储和检索",将终身学习定义为"在不发生灾难性遗忘的情况下持续获取、保留和完善知识的能力"。
灾难性遗忘?这种说法在某种程度上很有诗意。
物理交互和感觉运动技能 AI 的强大程度取决于其硬件系统和在物理世界中的实体存在。
换句话说,一台桌面计算机能做的事情很有限。它必须能够移动并与物理系统进行交互。这意味着需要复杂的感知系统,同时也需要具有物理感知能力的仿生结构来在三维空间中导航。
当我们谈论机器人灵巧性时,就是在讨论这个类别。
获取训练数据 此外,AI 的好坏取决于其训练数据。它必须有准确的输入才能产生有用的输出。这就是人们关注"幻觉"问题的原因,即 AI 给出完全错误的陈述。
这也涉及到自然偏见和 AI 系统校准不当的问题。
如果只是推荐音乐,这可能不是什么大问题,但如果 AI 负责审批贷款或帮助人们找工作,这就可能是一个很大的问题。
多维 AI 这是我最近从一些讨论 AGI 发展路径的专家那里得到的另一个想法。
他们认为,AI 不是线性的,而是多维的。它不只沿着一条轨迹发展,而是沿着多条轨迹发展,这些轨迹结合形成了我们所看到的人工智能前沿。
这让我想到了 Marvin Minsky 的工作。在他的《心智社会》一书中,Minsky 明确提出了他的理论:人类大脑不是一台计算机,而是一个协作组件的集合,这些组件协同工作,实时执行人类认知。
你也可以称它们为"智能体"。
今年,人们在谈论"主动式 AI"和多智能体协作智能系统。当计算机能够分享工作并委派任务时,它们就能开始构建更像人类大脑的复杂系统。
早期科幻作家的想法是错误的 - 问题不在于线性扫描人类大脑活动并复制它。而是让这些人工系统能够进化到像人类大脑一样工作,并提供许多相同的性能。
这是我在过去几周听到的一些观点,我们正在为 AI 的丰收之年做准备。请持续关注这个领域 - 因为将会有很多进展,不仅是在模型和硬件方面,还包括规划,以及希望能建立监管框架。我们必须认识到 AI 的力量,以正确的方式驾驭它。这需要付出努力。
好文章,需要你的鼓励
来自上海交通大学和浙江大学等机构的研究团队开发出首个AI"记忆操作系统"MemOS,解决了AI系统无法实现人类般持久记忆和学习的根本限制。该系统将记忆视为核心计算资源进行调度、共享和演化,在时间推理任务中相比OpenAI记忆系统性能提升159%。MemOS采用三层架构设计,通过标准化记忆单元实现跨平台记忆迁移,有望改变企业AI部署模式。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。