我们将如何应对人工智能?这是一个常见问题,但表述却相当模糊。让我们深入探讨这个话题。
在科技行业日益复杂的发展中,人们面临着诸多疑问。关于我们与AI的宏大实验将如何进行,存在着相当大的不确定性。其中一部分涉及这样一个观点:与以往的技术变革不同,AI的一部分发展将超出我们的控制范围。
这回到了我的朋友Jeremy Werthheimer等人提出的观点:我们并非完全在"工程化"大语言模型,而是在"发现"它们及其能力。
换句话说,如何"使用"一个同样能够模仿认知的工具?是你在使用它,还是它在使用你?
还有一个重要问题是人类情感。人们对AI感受如何?这个问题是否过于宽泛?
学生群体的实践
哈佛大学的一项研究显示,用户对AI有多种不同的看法。以年轻学生群体为例,一项调查发现半数学生在使用生成式AI,最常见的用途是搜索和头脑风暴。
这项涵盖1500名青少年的调查显示,一些人用AI作弊,而另一些人则以更积极的方式使用它。
Ryan Nagelhout写道:"在接受调查的青少年中,许多人承认使用AI在作业、家庭作业或考试中作弊。但尽管学术诚信仍然是成年人和青少年共同关心的问题,许多研究参与者强调了他们在生成式AI方面的积极学术体验。AI被称为'现代学习方法',其他受访青少年指出'不是所有孩子都用它在学校作弊'。"
因此,积极看待这项技术与消极看待之间存在巨大差异。
回到调查和模糊性的话题,我最近看到HubSpot的Dharmesh Shah的一次演讲,他向许多人提出了一个问题:"我们将如何与AI竞争?"
正如他指出的,这有两层含义——与AI对抗竞争,以及利用AI竞争。我必须承认,当我看到这个问题时,我想到的是与AI对抗竞争,因为这项技术有时具有令人困惑的力量,能够比我们做得更好。但Shah透露,在他的调查中,66%的受访者从协作角度理解这个问题,而34%的人像我一样理解。
他引用"ChatGPT诞生前2年"这个时间点,讨论如何回答诸如AI如何工作以及我们将走向何方等问题。
引用Geoff Hinton等人物的观点——Hinton在早期神经网络工作后变得不那么乐观——Shah还提出了一些我认为针对内行人的有趣观点,比如他开玩笑说"代币是极客们用来按音节收费的工具"。我觉得这很有趣。
代际差异的故事
Shah演讲中另一个我想重点关注的部分是他谈到自己在印度村庄的成长经历,那里没有电视,甚至没有冰箱。然后他将此与儿子作为有抱负作家的经历进行对比,这个年轻人已经参与了Shah所称的"世界构建"(类似《星球大战》或《指环王》?),这是一种卓越的编程技能,让他能够以赋权的方式探索AI的使用。
我认为这是一个引人深思的方式,说明新一代可能如何与AI共存。
利弊权衡
另一种思考方式是列举对AI最大的担忧,如就业替代、隐私伦理问题,以及人类智力能力的逐渐削弱。这些担忧需要与AI在医学等领域帮助社会以及提高多个行业生产力的潜力相平衡。
让我引用Shah演讲中的几个相关短语。
他提到了"简单交互,复杂行动",这个短语似乎体现了一种平衡——看似微小的过程与有意义步骤之间的对比。他还鼓励人们"保持好奇心",在我看来这是接触技术的正确方式。不要恐惧,也不要盲目接受——要保持好奇心,不要放弃批判性思维能力。
最后,他要求人们"志存高远,小步迭代"——换句话说,要有宏大愿景,但要谨慎引导,循序渐进,而不是盲目前进。因为在某种程度上,我们必须自己充分理解技术,才能以最佳方式进行协作。
与AI互动
要确定我们的方法,首先必须以有计划和深思熟虑的方式与技术互动。这一切都是全新的。也许几年后,我们将开发出建立这种关系的程序——或者也许孩子们会为我们找到答案。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。