近年来,人工智能领域风起云涌,而大模型技术的崛起无疑是其中最耀眼的“明星”。它不仅重新定义了人机交互的方式,更在各行各业掀起了一场颠覆性的革命。然而,当下的 AI 应用大多停留在“聊天机器人”的阶段,人们期待着 AI 能够更进一步,从“Chat”走向“Act”,真正成为解决实际问题、提升效率的得力助手。
面对这一需求和挑战,智谱AI率先推出了 AutoGLM,试图打造一款能够理解、规划、执行,并最终实现“无人驾驶”操作系统的 AI Agent。 然而,通往未来的道路并非一帆风顺,AutoGLM 的出现也引发了人们的诸多疑问:它究竟强大到什么程度?能否真正解放人们的双手?又将如何改变我们的生活和工作方式?
从简单操作到复杂任务:AutoGLM 不断进化
起初,AutoGLM 只能完成一些简单的手机操作,例如点外卖、发朋友圈、领红包等。然而,在不断的迭代升级中,它展现出了惊人的学习能力和执行力。如今,AutoGLM 已经能够挑战更加复杂的任务。
可以实现超长任务。能在无需人为干预的情况下自主执行超过 50 步的操作,例如自动完成一份复杂的采购清单。
AutoGLM 实现了跨 App 操作。AutoGLM打破了应用之间的壁垒,能根据用户的指令在不同 App 间自由切换,例如一边浏览商品信息,一边自动打开购物 App 下单。
理解能力不断提升,避免了繁琐的指令,可对用户的短指令进行理解。AutoGLM不再需要冗长的指令描述,只需简单几个字,就能理解用户的意图,例如用户只要说出“点咖啡”,就能自动完成咖啡预订的所有步骤。用户不必记住冗长的咖啡的具体品名,他会根据用户以往的习惯进行自助选择。
还可以采用“随便模式”。即在用户没有明确指示的情况下,根据用户的意图主动做出决策,可以据用户的口味偏好推荐咖啡。按智谱 CEO 张鹏的说法,这就是一个“盲盒模式”能让用户能感受到不一样的“新奇体验”。
这些功能的实现,得益于 AutoGLM 在泛化能力、思维链能力上的突破。它能够将用户的指令拆解成一系列更细化的步骤,并调用不同的应用程序来完成,真正实现了从“被动执行”到“主动思考”的转变。
从手机到电脑:GLM-PC 开启“无人驾驶”新时代
除了手机端的 AutoGLM,智谱AI 还推出了面向 PC 端的 GLM-PC,试图打造一款能够“像人一样操作电脑”的 AI Agent。目前,GLM-PC 已经能够实现:
会议替身: 自动预定会议、发送会议纪要。
文档处理: 下载、发送、理解和总结文档。
网页搜索与总结: 在指定平台搜索关键词,并对搜索结果进行阅读和总结。
远程和定时操作: 通过手机远程控制电脑,或设定定时任务。
隐形屏幕: 在用户工作时,在后台执行任务,不占用屏幕资源。
GLM-PC 的出现意味着 AI Agent 不再局限于移动端,而是开始向更加复杂、应用场景更加丰富的 PC 端拓展。虽然现阶段 GLM-PC 的功能还比较有限,需要用户输入非常精准的指令,但它所展现出的潜力无疑是巨大的。
从 L1 到 L5:AI Agent 发展之路任重道远
Agent将迎来高速发展期。Gartner预测,到2028年,至少15%的日常工作决策将通过人工智能代理自主完成(这一比例在2024年尚为0%)这依赖于强大的大模型能力。为此智谱AI将大模型能力的演进划分为五个阶段:
L1 语言能力: 能够理解和生成自然语言。
L2 逻辑能力: 能够进行逻辑推理和问题求解。
L3 使用工具的能力: 能够使用各种工具完成任务。
L4 自我学习能力: 能够自主学习和改进自身的能力。
L5 探究科学规律: 能够像科学家一样探索未知领域。
张鹏介绍道,目前大模型在 L1 和 L2 阶段已经取得了显著进展,但在 L3 工具使用能力方面还处于早期阶段。AutoGLM 和 GLM-PC 的出现,正是为了推动 AI Agent 在 L3 阶段的快速发展,最终实现 L4 自我学习能力的突破。
AutoGLM 和 GLM-PC 的出现,意味着 AI 不再仅仅是冷冰冰的代码,而开始拥有了“手”和“眼”,能够像人一样与现实世界进行交互。这不仅将彻底改变人机交互的方式,更将催生出全新的应用场景和商业模式。
智谱不仅要让AI的能力局限在手机和电脑,还会将他扩展到不同的领域:手机+AI 会成为人们随时随地的个人智能助理,PC+AI 将会成为企业和个人的全新生产力工具,汽车+AI 将会让汽车变为人们的智能第三生活空间。
而这些不仅仅是智谱的畅想,现在有很多场景都已落地。在AI与手机的结合中,荣耀手机的很多典型应用已结合了智谱GLM大模型。荣耀 AI 技术总监王作建表示,智谱GLM模型已在YoYo助理、荣耀笔记、荣耀文档产品中规模上线,给用户带来了全新体验。
华硕 AIPC 智能生态负责人钟怀圣对华硕与智谱的合作充满了更多期望,他表示,将和智谱共同打造云端一体的AIPC智能助手。在内容提炼、软件控制、AI创作、个人知识库、AI聊天、硬件体验等场景不断发掘AI的创新能力。不仅如此,智谱不断在不断扩大着自己的朋友圈,从小鹏汽车到高通、英特尔、以及众多赋能2B、2G的合作伙伴……
正如张鹏所说:“我们期待着 AI 不再局限于语言交互,而是能够做更多的事情。”
在不久的将来,各种 AI 原生设备将如雨后春笋般涌现,一个由 AI Agent 驱动的智能时代即将到来。 在这个过程中,智谱AI 将继续深耕大模型技术,与合作伙伴携手共进,共同推动 AI Agent 技术的进步和应用落地,为人类创造更加美好的未来。
好文章,需要你的鼓励
Red Hat 子公司推出的全新 RHEL 10 聚焦混合云及 AI 工作负载,通过生成式 AI 助手 Lightspeed 简化 Linux 管理,同时集成量子抗性加密和容器原生 OS 管理,实现 IT 运维一体化。
Panasonic Industry Europe 与 DigiCert 合作,将 DigiCert Device Trust Manager 集成至 PAN-MaX 服务,实现 Matter 设备自动认证,加速智能家居产品安全、合规生产,助力制造商抢占市场先机。
本文探讨了人工智能如何通过重构内在情感、认知和外部社交、社会结构,既可能扩展也可能限制我们的自由,呼吁以人为本、主动掌控AI未来。
戴尔在 Dell Technologies World 会议上宣布更新 PowerScale 和 ObjectScale 存储系统,并推出多项 AI 工厂创新,与 Nvidia 深度协同,加速企业级 AI 部署与数据处理。