当地时间10月3日,在Credo AI负责任的 AI 领导力峰会上,李飞飞分享了如何保护社会免受高级AI模型的潜在威胁以及为什么她认为她创办的World Labs将改变一切,在访谈中,当被问及她对“人工智能奇点”的看法时,李飞飞困惑的表示不知道这些词是什么意思,她甚至也不知道“AGI”是什么意思。
“我来自人工智能学术界,接受的是更严谨、更循证的教育,所以我真的不知道这些词是什么意思。"“坦率地说,我甚至不知道 AGI 是什么意思。就像人们说的,当你看到它的时候你就知道它是什么,我想我还没有看到它。事实上,我并没有花太多时间去思考这些词,因为我觉得还有很多更重要的事情要做......”
当“人工智能教母”都不知道“AGI”是什么意思的时候,其他人的话语权可能更低。李飞飞在2006年启动的ImageNet项目,包含超过1500万张经过标注的图片,覆盖22000个不同类别。该项目直接推动了深度学习技术的崛起。
她曾是斯坦福大学的教授,并在谷歌云担任首席科学家。此外,她还是斯坦福大学以人为本人工智能研究院的院长。由她在今年4月份新创立的World Labs公司,在9月中旬最新一轮的融资中获得了2.3亿美元,短短半年的时间估值已达到10亿美元。
OpenAI的首席执行官Sam Altman曾尝试定义AGI,将AGI描述为“相当于你可以雇佣的中等水平的人类同事”。与此同时,OpenAI的章程将AGI定义为“在大多数经济价值工作上超越人类的高自主系统”。为了衡量进展,OpenAI设定了五个内部级别:第一级是聊天机器人(比如ChatGPT),然后是推理者(OpenAI o1),智能体(接下来是这个),创新者(可以帮助发明创新),以及最后一个级别,组织者(可以完成整个组织工作的AI)。
针对此问题,谷歌在2023年11月的一份论文中,专门对AGI进行了定义。这篇论文的名称是“Position: Levels of AGI for Operationalizing Progress on the Path to AGI”(立场:在通往通用人工智能之路上实现进展的AGI层次)。
在论文中,谷歌表示:通用人工智能(AGI)是计算机研究中一个重要且有时具有争议性的概念,用来描述至少在大多数任务上与人类能力相当甚至更强的AI系统。机器学习(ML)模型快速发展,AGI已经从纯粹的哲学讨论转变为一个具有现实意义的议题。一些专家认为,最新一代的大语言模型已经出现了AGI的“火花”;一些人预测AI将在大约十年内广泛超越人类;甚至有人声称当前的LLMs已经是AGI。
为了更好地理解和衡量AGI的进展,谷歌的研究人员提出了一个新的层次化的框架,将AGI的性能、通用性和自主性分为不同的层次。这个框架基于六个原则,包括关注能力而非过程、关注通用性和性能、关注认知和元认知任务、关注潜力而非部署、关注生态效度,以及关注通往AGI的道路本身。
通用人工智能(AGI)的六个层次:从Level 0的无AI状态,到Level 1的新兴AGI,表现出基本的智能任务执行能力。Level 2的胜任AGI能在多种任务上达到人类平均水平。Level 3的专家AGI则能以专家水平执行任务。Level 4的杰出AGI在多数任务上超越专家,而Level 5的超人AGI则在广泛任务上超越人类极限。这个层次结构揭示了AI发展的逐步进步和潜在风险。
在AGI的层次之上,研究者们还提出了ASI(Artificial Superintelligence)的概念,ASI通常指的是在智能方面超越人类的AI,不仅在某个特定领域,而是在广泛的认知任务上超越。ASI能够进行自我改进和自我增强,有可能发展出人类难以理解的复杂思维模式。ASI更多是一个理论概念,目前还未有实际存在的系统。
这些概念和不同的层次让我们了解到人工智能到达的不同阶段,不过,AGI到底是什么样的,可能我们也需要真的“看到它”才能搞清楚。
好文章,需要你的鼓励
OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植入生成场景中,并可与朋友分享形象使用权限。该iOS应用目前在美加地区采用邀请制,ChatGPT Pro用户可直接体验。
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
大语言模型和生成式AI自诞生以来问题频发,从推理模型表现不佳到AI幻觉现象,再到版权诉讼,这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为,仅靠增加数据和算力的扩展模式已显现边际效应递减,无法实现通用人工智能。研究者提出智能应包含统计、结构、推理和目标四个层次的协调,并强调时间因果性的重要性。面对LLM技术局限,业界开始探索神经符号AI等替代方案。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。