近年来,人工智能领域风起云涌,而大模型技术的崛起无疑是其中最耀眼的“明星”。它不仅重新定义了人机交互的方式,更在各行各业掀起了一场颠覆性的革命。然而,当下的 AI 应用大多停留在“聊天机器人”的阶段,人们期待着 AI 能够更进一步,从“Chat”走向“Act”,真正成为解决实际问题、提升效率的得力助手。
面对这一需求和挑战,智谱AI率先推出了 AutoGLM,试图打造一款能够理解、规划、执行,并最终实现“无人驾驶”操作系统的 AI Agent。 然而,通往未来的道路并非一帆风顺,AutoGLM 的出现也引发了人们的诸多疑问:它究竟强大到什么程度?能否真正解放人们的双手?又将如何改变我们的生活和工作方式?
从简单操作到复杂任务:AutoGLM 不断进化
起初,AutoGLM 只能完成一些简单的手机操作,例如点外卖、发朋友圈、领红包等。然而,在不断的迭代升级中,它展现出了惊人的学习能力和执行力。如今,AutoGLM 已经能够挑战更加复杂的任务。
可以实现超长任务。能在无需人为干预的情况下自主执行超过 50 步的操作,例如自动完成一份复杂的采购清单。
AutoGLM 实现了跨 App 操作。AutoGLM打破了应用之间的壁垒,能根据用户的指令在不同 App 间自由切换,例如一边浏览商品信息,一边自动打开购物 App 下单。
理解能力不断提升,避免了繁琐的指令,可对用户的短指令进行理解。AutoGLM不再需要冗长的指令描述,只需简单几个字,就能理解用户的意图,例如用户只要说出“点咖啡”,就能自动完成咖啡预订的所有步骤。用户不必记住冗长的咖啡的具体品名,他会根据用户以往的习惯进行自助选择。
还可以采用“随便模式”。即在用户没有明确指示的情况下,根据用户的意图主动做出决策,可以据用户的口味偏好推荐咖啡。按智谱 CEO 张鹏的说法,这就是一个“盲盒模式”能让用户能感受到不一样的“新奇体验”。
这些功能的实现,得益于 AutoGLM 在泛化能力、思维链能力上的突破。它能够将用户的指令拆解成一系列更细化的步骤,并调用不同的应用程序来完成,真正实现了从“被动执行”到“主动思考”的转变。
从手机到电脑:GLM-PC 开启“无人驾驶”新时代
除了手机端的 AutoGLM,智谱AI 还推出了面向 PC 端的 GLM-PC,试图打造一款能够“像人一样操作电脑”的 AI Agent。目前,GLM-PC 已经能够实现:
会议替身: 自动预定会议、发送会议纪要。
文档处理: 下载、发送、理解和总结文档。
网页搜索与总结: 在指定平台搜索关键词,并对搜索结果进行阅读和总结。
远程和定时操作: 通过手机远程控制电脑,或设定定时任务。
隐形屏幕: 在用户工作时,在后台执行任务,不占用屏幕资源。
GLM-PC 的出现意味着 AI Agent 不再局限于移动端,而是开始向更加复杂、应用场景更加丰富的 PC 端拓展。虽然现阶段 GLM-PC 的功能还比较有限,需要用户输入非常精准的指令,但它所展现出的潜力无疑是巨大的。
从 L1 到 L5:AI Agent 发展之路任重道远
Agent将迎来高速发展期。Gartner预测,到2028年,至少15%的日常工作决策将通过人工智能代理自主完成(这一比例在2024年尚为0%)这依赖于强大的大模型能力。为此智谱AI将大模型能力的演进划分为五个阶段:
L1 语言能力: 能够理解和生成自然语言。
L2 逻辑能力: 能够进行逻辑推理和问题求解。
L3 使用工具的能力: 能够使用各种工具完成任务。
L4 自我学习能力: 能够自主学习和改进自身的能力。
L5 探究科学规律: 能够像科学家一样探索未知领域。
张鹏介绍道,目前大模型在 L1 和 L2 阶段已经取得了显著进展,但在 L3 工具使用能力方面还处于早期阶段。AutoGLM 和 GLM-PC 的出现,正是为了推动 AI Agent 在 L3 阶段的快速发展,最终实现 L4 自我学习能力的突破。
AutoGLM 和 GLM-PC 的出现,意味着 AI 不再仅仅是冷冰冰的代码,而开始拥有了“手”和“眼”,能够像人一样与现实世界进行交互。这不仅将彻底改变人机交互的方式,更将催生出全新的应用场景和商业模式。
智谱不仅要让AI的能力局限在手机和电脑,还会将他扩展到不同的领域:手机+AI 会成为人们随时随地的个人智能助理,PC+AI 将会成为企业和个人的全新生产力工具,汽车+AI 将会让汽车变为人们的智能第三生活空间。
而这些不仅仅是智谱的畅想,现在有很多场景都已落地。在AI与手机的结合中,荣耀手机的很多典型应用已结合了智谱GLM大模型。荣耀 AI 技术总监王作建表示,智谱GLM模型已在YoYo助理、荣耀笔记、荣耀文档产品中规模上线,给用户带来了全新体验。
华硕 AIPC 智能生态负责人钟怀圣对华硕与智谱的合作充满了更多期望,他表示,将和智谱共同打造云端一体的AIPC智能助手。在内容提炼、软件控制、AI创作、个人知识库、AI聊天、硬件体验等场景不断发掘AI的创新能力。不仅如此,智谱不断在不断扩大着自己的朋友圈,从小鹏汽车到高通、英特尔、以及众多赋能2B、2G的合作伙伴……
正如张鹏所说:“我们期待着 AI 不再局限于语言交互,而是能够做更多的事情。”
在不久的将来,各种 AI 原生设备将如雨后春笋般涌现,一个由 AI Agent 驱动的智能时代即将到来。 在这个过程中,智谱AI 将继续深耕大模型技术,与合作伙伴携手共进,共同推动 AI Agent 技术的进步和应用落地,为人类创造更加美好的未来。
好文章,需要你的鼓励
智谱AI率先推出了 AutoGLM,试图打造一款能够理解、规划、执行,并最终实现“无人驾驶”操作系统的 AI Agent。
该处理器采用16nm工艺技术设计,拥有 48 个ARM Cortex-A75内核,六通道DDR4 3200 MHz 内存 - 每插槽高达 768 GB(每通道 128 GB)
谷歌DeepMind研究人员则直接把这项技术集成到AI Agent中开发了Talker-Reasoner框架,让其具备“快”、“慢”两种拟人化思考方式。
数据密集型工作负载的激增,导致计算系统需要处理的数据量大幅增加。这种不断拓展的数据环境,迫切需要具备更大容量和更高带宽的