2024年4月4日中午,Microsoft 举办了一场名为 Copilot 50周年的线上直播活动。
需要说明的是,这并不是 Copilot 诞生50周年。这类 AI 能力的发展仅有约5年时间,而且很多展示的功能都是全新的。这个命名确实有些令人困惑。不过由于 Bill Gates 和 Paul Allen 于1975年创立了公司,Microsoft 借此机会举办了这场以"介绍你的 AI 伙伴"为主题的展示活动,即 Copilot。
由于许多人对 Microsoft Copilot 还很陌生,主持活动的 Microsoft AI CEO Mustafa Suleyman 特别邀请了一些普通用户分享他们的使用故事。
邻里、朋友与用户
活动中的一个环节包括了 Chris Suh 和他的纽芬兰犬 Joonie,以及一位名叫 Elvira 的女士。Elvira 学会了使用 Copilot 来帮助她和丈夫维护家居。
Suh 分享了他如何帮助邻居处理狗狗相处问题的故事,他通过学习训犬方法,让 Joonie 和邻居的狗能和睦相处。
他说:"我想确保自己能以最好的方式提供帮助。" 他提到 Copilot 能很好地整理信息,帮助人们找到完成重要任务或项目的最佳方式。他特别指出 Copilot 可以帮助人们在私下学习那些他们可能不会去上课或在公共场合尝试的内容。
他说:"明天永远无法预知,我们只有今天。"
Elvira 则讲述了她如何解决丈夫在家中火车房的电力问题。
通过使用 Copilot,她获得了传统 Google 搜索可能无法提供的知识。
她说:"我之前所有的担忧都消失了。前方的道路充满了超乎想象的奇迹和发现。"
关于 Elvira 的故事 (实际上 Chris 的故事也是如此),一个重要观点是新模型正在重新定义搜索。对于我们这些习惯于点击超链接寻找信息的人来说,ChatGPT 或 Copilot 这样的模型能在几秒钟内检索整个网络并返回权威答案,这是令人震惊的。现在,通过推理能力,他们甚至可以在测试时进行思考,这使它们作为人类用户答案提供者的能力更加强大。
AI 的形态转变
在演示的后半段,Suleyman 与 Copilot 进行了对话,展示了模型的能力 (以及明显的讨好人类的倾向)。
随着屏幕上呈现出不同的形状和图案,包括一只骄傲的孔雀和一些现代风格的设计,模型采用了各种对话语气,包括密谋般的低语。
这让那些可能不熟悉当前 AI 能力的人们得以一窥这些模型如何融入我们的世界,并以令人惊叹的方式与我们互动。
模型的民主化
从这次活动中,我最大的感悟是思考这将如何扩大主动型 AI 的受众群体。
有时候我们需要退一步想想,了解技术的人已经使用这项技术多年了。但对于那些不太接触技术的人来说,他们可能几乎没有与之互动的经验,这一切对他们来说都可能是全新的。就在几周前,我们看到 Google 在终端设备上发布了 Gemini。我们知道很快所有人的口袋里都会有这些模型。Copilot 的演示可能是让更多人认识这项技术的重要一步。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。