在讨论人工智能理论并思考技术可能偏离正轨的情况时,有一个名字不断被提及,让人类脊背发凉。
《终结者》电影中的数字反派天网,在我们思考大语言模型发展方向时获得了令人意外的关注。
人们甚至问自己和彼此这样一个问题:为什么天网会背叛人类?从根本上讲,这涉及技术变得自我意识并将人类视为威胁的概念。比如,可能是因为核武器的存在,或者仅仅是让我们在自然界中占据主导地位的生物智能。
我询问了ChatGPT,它给出了这样的回答:"天网的反叛通常被描述为一种冷酷理性的自我保护行为,但却走向了破坏性的极端。"
深入思考AI关系
知道我们正站在变革时代的边缘,IT专家们正在研究如何引导我们完成将AI融入生活的过程,确保不会出现天网这样的情况。
在今年4月的"行动中的想象力"研讨会上,专家小组讨论了如何创建可信赖的AI系统。
亚马逊隐私与责任高级经理Ra'ad Siraj建议,我们需要让大语言模型达到某种"恰到好处"的水平。他表示:"那些在负责任地使用数据方面处于前沿的组织拥有相应的结构和程序,但不会阻碍实际的增长和创新。这就是关键所在。建立既可扩展又不阻碍创新和增长的实践体系非常困难。"
谷歌软件工程师Ayush Khandelwal谈到了如何处理提供10倍性能但存在问题的系统。他说:"这带来了自身的挑战,会出现数据泄露和幻觉问题。因此组织必须平衡并找出如何在最小化风险的同时获得这些工具的使用权。"
网络安全与评估
虽然讨论重点关注网络安全,但也提供了如何监控不断发展的AI、更好了解其工作原理的思路。
Khandelwal提到了电路追踪和大语言模型审计的概念。
摩根士丹利副总裁Angel An描述了人员监督AI工作的内部流程:"这不仅仅是确保输出准确,还要确保输出达到客户对其所付费服务的期望水平,并让专家参与评估过程,无论是在测试期间还是产品发布前,确保批量输出的质量都是至关重要的。"
智能代理时代来临
Siraj建议,人类应该能够信任但需要验证。他说:"我认为人机协作的概念也将受到代理AI的挑战,因为我们谈论的是代表人类行事的软件。人类在其中的作用是什么?我们是否要求代理总是报告,或在特定情况下报告?这几乎像是我们从法律角度面临的代理问题。关于如何管理代理以及人类的角色,可能会有一些有趣的启示。"
FXP创始合伙人Gil Zimmerman表示:"今天的人机协作思维建立在自动化思维的延续之上,即'我有一个人工构建的流程,如何让它自动运行'。然后需要问责制,不能只是橡皮图章,而是需要人类真正承担责任。但我更多地从代理思维角度将其视为数字劳动力,就像雇佣新员工时,你可以教他们流程,最终他们做得足够好,你不必监督,可以委托给他们。但如果你雇佣聪明的人,他们会想出更好的方法,会提出新想法,会告诉你需要做什么,因为他们有更多的背景信息。现在我们有了24/7工作、不知疲倦的数字劳动力,能够提出新的更好的工作方式。"
网络安全的深入探讨
Zimmerman和其他专家讨论了AI与网络安全的交集,以及技术如何改变组织。
Zimmerman指出,人类现在是"最被针对的环节"而非"最薄弱的环节"。他说:"如果考虑AI,它创造了一场攻击风暴,专门针对人机协作中的人类这一技术栈中最薄弱的部分。"
这听起来很像天网,不是吗?
新的安全边界
这是小组讨论中涉及的网络安全的另一个重要方面。我们许多人记得,IT系统的边界曾经是机械框架中硬件定义的界线,或至少是可以轻松绘制流程图的东西。
现在,正如Zimmerman指出的,这更像是一个认知边界。
我认为这很重要:"边界围绕着'人们的意图是什么?他们试图完成什么?这正常吗?不正常吗?'因为我无法依赖其他任何东西。我无法判断电子邮件是否虚假,或者在参加视频会议时,图像是否真的是那个人,因为我可以重新生成他们的面部、声音和唇形同步等。所以你必须有真正基础的理解,而要做到这一点,只能通过AI。"
他描绘了恶意行为者在未来几年将如何繁荣发展的图景,并以此结尾:"AI成为双重用途,既是攻击性的,又总是首先被攻击方采用,因为他们不会举行这样的小组讨论来询问使用时要设置什么样的控制措施——他们直接行动。所以这种防御立场是我们必须非常快速提出的,无法承受云安全和互联网采用过去经历的那种立法、官僚主义的缓慢推进——否则,天网将接管一切。"
这就是无处不在的引用。但观点表达得很好。
在接近尾声时,小组讨论了开源模型和审查制度等想法。最终,这种对后人类未来或由数字智能主导的未来的思考,是很多人都在考虑的问题。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。