9月5日上午,2024 Inclusion·外滩大会在上海黄浦世博园区开幕。著名未来学家、《连线》杂志创始主编、《5000天后的世界》作者凯文·凯利(Kevin Kelly)在开幕主论坛上的演讲中指出,当人工智能深刻影响经济和文化,必将涌现三大趋势:全球主义、创新加速和AI驱动生成。
AI时代三大趋势:全球主义、创新加速和AI驱动生成
凯文·凯利认为,全球主义正在迅速推进,因为我们正在共同构建一个基于技术的“超级有机体”。“我们正将全球的手机、笔记本电脑和所有的数据服务器连接成一个巨大的计算系统。每一台设备就像这个庞大计算机的一个神经元。这台超级计算机在一个前所未有的规模上高速运行。
“我们正在打造一个巨大的、全球性的、如行星般规模的机器,”他认为,尽管人们可能对设备和内容有不同的偏好,但这些差异只是交互方式上的不同,根本上它们都归属于同一个平台。世界上的所有数字技术,包括人工智能,都运行在这个新平台上。
凯文·凯利指出,人工智能时代下的全球主义推进,也正在推动一种新兴的全球文化。他举例称,人们的生活方式和穿着也逐渐趋同:牛仔裤和T恤成了全球的标配,我们都住在钢筋混凝土的房子里,家里有空调、自来水和Wi-Fi。按照马斯洛的需求层次理论,人们的底层需求已经改变并达成一致。
此外,人工智能将实现真正的“实时翻译”,交流不再有延迟,打破了全球的语言障碍,再加上增强现实(VR)技术,这将极大地改变跨国工作和交流的方式,全球化“劳动力” 将第一次出现出现。
第二个趋势是创新的加速。凯文·凯利指出,AI技术加速了创新的步伐,这种加速体现在多个方面,包括新发明和新思想的传播速度越来越快、通过增强现实(AR)和虚拟现实(VR)技术来提高学习效率,甚至AI也通过机器及其他传感器来感知世界等。此外,ChatGPT等人工智能工具,也极大地加快了人们学习的速度。
“如今,我相信许多年轻人通过ChatGPT等人工智能工具学到的东西,已经超越了他们在学校所学,”凯文·凯利认为,当答案变得唾手可得时,真正有价值的反而是提出正确问题的能力,以及掌握正确思维方式的能力。
他说,如果你是年轻人,你在两年后的工作甚至还没有被创造出来。在两年内,你在学校里接受所针对目前工作市场的培训会发生变化。当你毕业之后,你将从事一些在你上学时还不存在的工作。“学会如何学习”将成为未来毕业生的核心技能。
最后,凯文·凯利谈到了AI驱动生成的趋势。他指出,人工智能不仅将帮助我们摆脱机械、枯燥的工作,完成我们无法独立完成的任务,甚至可以生成超乎人类想象的全新事物。
“这正是人工智能带来的真正巨大革命,”凯文·凯利说,人工智能系统正在生成新的事物——它们还不完美,但正在变得越来越好。他强调,人工智能是多样的,它不仅仅是一种,这些智能将填补许多可能的智能领域,我们也将创造出多种不同的人工智能。
他举例称,通过这一年半来使用 ChatGPT和其他大语言模型的经验来看,从人工智能工具中获益最多的人实际上是表现一般或较差的员工。人工智能工具不仅仅是为最聪明的人准备的,它们还能帮助不那么出色的人产生更好地完成工作。
回答中国网友提问:人类正在通过人工智能重塑文明
在2024外滩大会开幕之前,凯文·凯利通过外滩大会官方微信,向中国读者征集了关于AI的问题,5日,外滩大会官方公布了凯文·凯利的回答。
对于人工智能是不是人类的下一个进化阶段,凯文·凯利给出了肯定的答案,他认为,人工智能的重要性不亚于火、印刷术和工业革命,这将是广泛而巨大的变革。但至少需要一个世纪的时间来实现,甚至可能更长,不可能一蹴而就。
“人类正在通过人工智能重塑文明。”凯文·凯利说,也许一百万年来,我们一直是这个星球上唯一的智慧物种。但如今,我们正在创造人造“外星人”,就像他们来自遥远的星球,前来拜访我们一样。这些“外星人”的思想将被引入我们的世界,从而创造出一种新的文化。
对于如何确保人工智能带来的未来是有益的,而不是加剧不平等,凯文·凯利表示,我们有理由对任何新技术保持谨慎,人工智能也不例外。“我认为,未来最大的问题之一可能会源自人工智能。但我们今天所担心的许多问题,或许并不是最难解决的,那些问题是可以应对的。真正的挑战可能是我们还未曾想象到的未知问题。”
他认为,首先要利用技术去引导它的发展,要实现我们期望的由人工智能驱动的未来,最好的途径之一就是积极参与其中,而不是试图禁止它或将其排斥在外。其次,应尽可能推动人工智能技术的开源化。开源模式赋予更多人参与的机会,形成一种更具包容性的技术生态系统。
在回答“未来哪些工作不会被人工智能取代”时,凯文·凯利表示,正如当今就像几乎没有工作是不需要使用某种能源一样,未来几乎所有的工作都会使用某种程度的人工智能,但这并不意味着它们会被人工智能完全取代。
2024 Inclusion·外滩大会于9月5日-7日在上海黄浦世博园区举办,举办1场开幕主论坛和36场开放见解论坛。大会主题延续“科技·创造可持续未来”,十多位中外院士、全球超过500位有影响力科技领军企业等,将聚焦“AI产业新实践”、“科技人文新思考”、“金融科技新探索”带来思想碰撞。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。