要了解打造更强大人工智能的方法,一个好途径是与当今各类会议和贸易展会上汇聚的专家交流,集思广益地探讨近期未来的可能发展方向。
本月初举办了消费电子展 (CES),全年还有其他行业展会。此外还有各种研讨会和会议活动,行业内部人士在这些场合讨论可能性、优先事项和解决方案。
通过与这些业内人士的非正式交谈,以及聆听正式演讲,我发现一些共同的主题逐渐浮现。这些主题涉及引入下一代 AI 所需要的条件 - 即比当前更具活力和能力的人工智能系统。
以下是人们谈论的关于 2025 年 AI 现代化进展的一些关键要素。
物理感知系统 为了真正令人印象深刻,AI 系统需要理解周围的世界。这很困难,因为它们没有生物躯体,不能天生就具备各种帮助在三维空间导航的装置和设备。
然而,AI 系统正在学习物理学,其学习方式与学习其他任何东西相同 - 通过海量的训练数据,以及极其复杂的神经网络,通过反向传播和随机分析等过程来锁定正确的结果。
所以我们正在逐步接近通用人工智能 (AGI) 的这一部分。
持久记忆 AI 变得更强大的另一个重要因素是系统能够更好地记住过去的经历。
这体现在各个方面 - 包括与人类之前互动的信息、来自周围世界的感知数据,以及其他类型的经验性数据,或者能为机器的经验提供信息的数据。
例如,当你询问 ChatGPT 时,它将动态记忆定义为"长期信息的存储和检索",将终身学习定义为"在不发生灾难性遗忘的情况下持续获取、保留和完善知识的能力"。
灾难性遗忘?这种说法在某种程度上很有诗意。
物理交互和感觉运动技能 AI 的强大程度取决于其硬件系统和在物理世界中的实体存在。
换句话说,一台桌面计算机能做的事情很有限。它必须能够移动并与物理系统进行交互。这意味着需要复杂的感知系统,同时也需要具有物理感知能力的仿生结构来在三维空间中导航。
当我们谈论机器人灵巧性时,就是在讨论这个类别。
获取训练数据 此外,AI 的好坏取决于其训练数据。它必须有准确的输入才能产生有用的输出。这就是人们关注"幻觉"问题的原因,即 AI 给出完全错误的陈述。
这也涉及到自然偏见和 AI 系统校准不当的问题。
如果只是推荐音乐,这可能不是什么大问题,但如果 AI 负责审批贷款或帮助人们找工作,这就可能是一个很大的问题。
多维 AI 这是我最近从一些讨论 AGI 发展路径的专家那里得到的另一个想法。
他们认为,AI 不是线性的,而是多维的。它不只沿着一条轨迹发展,而是沿着多条轨迹发展,这些轨迹结合形成了我们所看到的人工智能前沿。
这让我想到了 Marvin Minsky 的工作。在他的《心智社会》一书中,Minsky 明确提出了他的理论:人类大脑不是一台计算机,而是一个协作组件的集合,这些组件协同工作,实时执行人类认知。
你也可以称它们为"智能体"。
今年,人们在谈论"主动式 AI"和多智能体协作智能系统。当计算机能够分享工作并委派任务时,它们就能开始构建更像人类大脑的复杂系统。
早期科幻作家的想法是错误的 - 问题不在于线性扫描人类大脑活动并复制它。而是让这些人工系统能够进化到像人类大脑一样工作,并提供许多相同的性能。
这是我在过去几周听到的一些观点,我们正在为 AI 的丰收之年做准备。请持续关注这个领域 - 因为将会有很多进展,不仅是在模型和硬件方面,还包括规划,以及希望能建立监管框架。我们必须认识到 AI 的力量,以正确的方式驾驭它。这需要付出努力。
好文章,需要你的鼓励
谷歌深度思维团队开发出名为MolGen的AI系统,能够像经验丰富的化学家一样自主设计全新药物分子。该系统通过学习1000万种化合物数据,在阿尔茨海默病等疾病的药物设计中表现出色,实际合成测试成功率达90%,远超传统方法。这项技术有望将药物研发周期从10-15年缩短至5-8年,成本降低一半,为患者更快获得新药治疗带来希望。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
哈佛医学院和微软公司合作开发了一个能够"听声识病"的AI系统,仅通过分析语音就能预测健康状况,准确率高达92%。该系统基于深度学习技术,能够捕捉声音中与疾病相关的微妙变化,并具备跨语言诊断能力。研究团队已开发出智能手机应用原型,用户只需完成简单语音任务即可获得健康评估,为个性化健康管理开辟了新途径。