当地时间10月3日,在Credo AI负责任的 AI 领导力峰会上,李飞飞分享了如何保护社会免受高级AI模型的潜在威胁以及为什么她认为她创办的World Labs将改变一切,在访谈中,当被问及她对“人工智能奇点”的看法时,李飞飞困惑的表示不知道这些词是什么意思,她甚至也不知道“AGI”是什么意思。

“我来自人工智能学术界,接受的是更严谨、更循证的教育,所以我真的不知道这些词是什么意思。"“坦率地说,我甚至不知道 AGI 是什么意思。就像人们说的,当你看到它的时候你就知道它是什么,我想我还没有看到它。事实上,我并没有花太多时间去思考这些词,因为我觉得还有很多更重要的事情要做......”
当“人工智能教母”都不知道“AGI”是什么意思的时候,其他人的话语权可能更低。李飞飞在2006年启动的ImageNet项目,包含超过1500万张经过标注的图片,覆盖22000个不同类别。该项目直接推动了深度学习技术的崛起。
她曾是斯坦福大学的教授,并在谷歌云担任首席科学家。此外,她还是斯坦福大学以人为本人工智能研究院的院长。由她在今年4月份新创立的World Labs公司,在9月中旬最新一轮的融资中获得了2.3亿美元,短短半年的时间估值已达到10亿美元。
OpenAI的首席执行官Sam Altman曾尝试定义AGI,将AGI描述为“相当于你可以雇佣的中等水平的人类同事”。与此同时,OpenAI的章程将AGI定义为“在大多数经济价值工作上超越人类的高自主系统”。为了衡量进展,OpenAI设定了五个内部级别:第一级是聊天机器人(比如ChatGPT),然后是推理者(OpenAI o1),智能体(接下来是这个),创新者(可以帮助发明创新),以及最后一个级别,组织者(可以完成整个组织工作的AI)。

针对此问题,谷歌在2023年11月的一份论文中,专门对AGI进行了定义。这篇论文的名称是“Position: Levels of AGI for Operationalizing Progress on the Path to AGI”(立场:在通往通用人工智能之路上实现进展的AGI层次)。
在论文中,谷歌表示:通用人工智能(AGI)是计算机研究中一个重要且有时具有争议性的概念,用来描述至少在大多数任务上与人类能力相当甚至更强的AI系统。机器学习(ML)模型快速发展,AGI已经从纯粹的哲学讨论转变为一个具有现实意义的议题。一些专家认为,最新一代的大语言模型已经出现了AGI的“火花”;一些人预测AI将在大约十年内广泛超越人类;甚至有人声称当前的LLMs已经是AGI。
为了更好地理解和衡量AGI的进展,谷歌的研究人员提出了一个新的层次化的框架,将AGI的性能、通用性和自主性分为不同的层次。这个框架基于六个原则,包括关注能力而非过程、关注通用性和性能、关注认知和元认知任务、关注潜力而非部署、关注生态效度,以及关注通往AGI的道路本身。

通用人工智能(AGI)的六个层次:从Level 0的无AI状态,到Level 1的新兴AGI,表现出基本的智能任务执行能力。Level 2的胜任AGI能在多种任务上达到人类平均水平。Level 3的专家AGI则能以专家水平执行任务。Level 4的杰出AGI在多数任务上超越专家,而Level 5的超人AGI则在广泛任务上超越人类极限。这个层次结构揭示了AI发展的逐步进步和潜在风险。
在AGI的层次之上,研究者们还提出了ASI(Artificial Superintelligence)的概念,ASI通常指的是在智能方面超越人类的AI,不仅在某个特定领域,而是在广泛的认知任务上超越。ASI能够进行自我改进和自我增强,有可能发展出人类难以理解的复杂思维模式。ASI更多是一个理论概念,目前还未有实际存在的系统。
这些概念和不同的层次让我们了解到人工智能到达的不同阶段,不过,AGI到底是什么样的,可能我们也需要真的“看到它”才能搞清楚。
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。