要了解打造更强大人工智能的方法,一个好途径是与当今各类会议和贸易展会上汇聚的专家交流,集思广益地探讨近期未来的可能发展方向。
本月初举办了消费电子展 (CES),全年还有其他行业展会。此外还有各种研讨会和会议活动,行业内部人士在这些场合讨论可能性、优先事项和解决方案。
通过与这些业内人士的非正式交谈,以及聆听正式演讲,我发现一些共同的主题逐渐浮现。这些主题涉及引入下一代 AI 所需要的条件 - 即比当前更具活力和能力的人工智能系统。
以下是人们谈论的关于 2025 年 AI 现代化进展的一些关键要素。
物理感知系统 为了真正令人印象深刻,AI 系统需要理解周围的世界。这很困难,因为它们没有生物躯体,不能天生就具备各种帮助在三维空间导航的装置和设备。
然而,AI 系统正在学习物理学,其学习方式与学习其他任何东西相同 - 通过海量的训练数据,以及极其复杂的神经网络,通过反向传播和随机分析等过程来锁定正确的结果。
所以我们正在逐步接近通用人工智能 (AGI) 的这一部分。
持久记忆 AI 变得更强大的另一个重要因素是系统能够更好地记住过去的经历。
这体现在各个方面 - 包括与人类之前互动的信息、来自周围世界的感知数据,以及其他类型的经验性数据,或者能为机器的经验提供信息的数据。
例如,当你询问 ChatGPT 时,它将动态记忆定义为"长期信息的存储和检索",将终身学习定义为"在不发生灾难性遗忘的情况下持续获取、保留和完善知识的能力"。
灾难性遗忘?这种说法在某种程度上很有诗意。
物理交互和感觉运动技能 AI 的强大程度取决于其硬件系统和在物理世界中的实体存在。
换句话说,一台桌面计算机能做的事情很有限。它必须能够移动并与物理系统进行交互。这意味着需要复杂的感知系统,同时也需要具有物理感知能力的仿生结构来在三维空间中导航。
当我们谈论机器人灵巧性时,就是在讨论这个类别。
获取训练数据 此外,AI 的好坏取决于其训练数据。它必须有准确的输入才能产生有用的输出。这就是人们关注"幻觉"问题的原因,即 AI 给出完全错误的陈述。
这也涉及到自然偏见和 AI 系统校准不当的问题。
如果只是推荐音乐,这可能不是什么大问题,但如果 AI 负责审批贷款或帮助人们找工作,这就可能是一个很大的问题。
多维 AI 这是我最近从一些讨论 AGI 发展路径的专家那里得到的另一个想法。
他们认为,AI 不是线性的,而是多维的。它不只沿着一条轨迹发展,而是沿着多条轨迹发展,这些轨迹结合形成了我们所看到的人工智能前沿。
这让我想到了 Marvin Minsky 的工作。在他的《心智社会》一书中,Minsky 明确提出了他的理论:人类大脑不是一台计算机,而是一个协作组件的集合,这些组件协同工作,实时执行人类认知。
你也可以称它们为"智能体"。
今年,人们在谈论"主动式 AI"和多智能体协作智能系统。当计算机能够分享工作并委派任务时,它们就能开始构建更像人类大脑的复杂系统。
早期科幻作家的想法是错误的 - 问题不在于线性扫描人类大脑活动并复制它。而是让这些人工系统能够进化到像人类大脑一样工作,并提供许多相同的性能。
这是我在过去几周听到的一些观点,我们正在为 AI 的丰收之年做准备。请持续关注这个领域 - 因为将会有很多进展,不仅是在模型和硬件方面,还包括规划,以及希望能建立监管框架。我们必须认识到 AI 的力量,以正确的方式驾驭它。这需要付出努力。
好文章,需要你的鼓励
短视频营销正成为品牌推广的重要方式,但寻找最佳片段并精准分发始终是一大难题。初创公司Clouted通过整合逾10万名自由创作者网络,结合AI技术自动完成视频剪辑与分发策略。其AI系统持续测试不同格式与渠道组合,让每次营销活动都比上一次更精准高效。该公司近日完成700万美元种子轮融资,由Slow Ventures领投,正朝着企业级营销基础设施市场迈进。
CurveBench是由四所高校联合构建的视觉拓扑推理基准,通过让AI识别嵌套闭合曲线的层次包含关系,揭示了顶尖视觉语言模型在空间结构理解上的系统性缺陷。
本月初,Anthropic宣布购买300兆瓦算力的协议,锁定位于田纳西州孟菲斯附近的Colossus 1数据中心全部产能。据悉,Anthropic将在2029年5月前每月向xAI支付12.5亿美元,协议总价值超400亿美元。该交易细节源自SpaceX向SEC提交的S-1文件。xAI此举实质上是将闲置算力变现——近期Grok用户量下滑,大量服务器空闲,xAI由此转型为"新云服务商",向竞争对手出售计算资源。
圣母大学与亚利桑那州立大学联合构建首个真实骗局对话进展预测基准PRESCAM,揭示当前AI模型识别骗局推进逻辑的核心局限。