有时候,业内人士会发表一些见解,将人们对 AI 发展方向的诸多想法进行提炼总结。
在 AI Daily Brief 最新一期中,Nathaniel Whittemore 分析了 Sam Altman 的一篇名为"三个观察"的新博文。
在开始分析之前,Whittemore 先讨论了超级碗广告,比如 ChatGPT 的广告,以及由 Woody Harrelson 和 Matthew McConaughey 主演的 Salesforce "特工部队"广告。随后他开始解析 Altman 的新文章。
在这篇文章中,Altman 一开始就详细阐述了三个主要观察。第一个是模型的智能程度大致等于用于训练和运行它的资源的对数。这为公司从这类项目获得的投资回报提供了一个粗略的概念,也让我们对规模化有了一些见解。
Altman 的第二个观察是,特定智能水平的成本每年下降 10 倍。其他人也认识到这一点,并看到这些巨大的进步如何推动着指数级的发展曲线。Altman 还补充说,较低的价格会导致使用量大幅增加,这体现了杰文悖论 (我们大多数人现在才开始听说这个概念:简而言之,杰文认为当获得新能力时,人们最终会利用资源效率来做更多事情,而不是保持价值)。
第三个观察是"智能的社会经济价值是超指数级的"。
"世界不会一下子就改变;它从来都不会这样," Altman 写道。"从短期来看,生活将基本保持不变,2025 年的人们大多会像 2024 年一样度过他们的时间。我们仍然会坠入爱河,组建家庭,在网上争吵,在大自然中徒步等。但未来将以一种无法忽视的方式向我们袭来,对我们社会和经济的长期改变将是巨大的。我们会发现新的事物去做,新的方式来互帮互助,以及新的竞争方式,但它们可能与今天的工作大不相同。"
Altman 如此赞扬晶体管这一增强大语言模型能力的先驱:
"从某些方面来说,AI 在经济上可能会像晶体管一样——一个能够良好扩展并渗透到经济几乎每个角落的重大科学发现。我们不会过多考虑晶体管或晶体管公司,收益被广泛分配。但我们确实期望我们的计算机、电视、汽车、玩具等能够创造奇迹。"
他警告说:
"未来将以一种无法忽视的方式向我们袭来。"
Whittemore 对这些观察的见解
在这个转折点上,Whittemore 分享了他自己的五个观察。
第一个与规模化有关:
"这里有一个明确的切入点,关于我们过去几个月一直在进行的规模化辩论……现在有趣的是,他现在把推理也纳入了这些扩展定律中。因此,与其将测试时间计算作为一个根本不同的东西,它只是'更多资源等于更好输出'这个相同方程的不同版本。"
Whittemore 的第二个观察呼应了 Altman 的观点:
"智能成本下降的速度确实令人难以置信,"他说。
作为第三个观察,Whittemore 指出我们可能都需要成为管理者,需要这些技能来处理可能被委派各种任务的 AI 代理。
Whittemore 概述的下一点是一个相对性论点。
"从某种意义上说,AGI 只是人类进步脚手架中的另一个工具,"Whittemore 说。"但你能感觉到这才是他真正的意思:这一次,情况确实不同。"
Whittemore 的最后一点是目前还没有实际的政策。他引用了在这个行业有着令人印象深刻资历的 MIT 教授 Ethan Mollick 的话。
"正如 (Mollick) 指出的那样,对于未来世界的样子没有清晰的愿景,"他说,"而且实验室把决定如何使用他们创造的东西的负担推给了政策制定者。"
当然,随着各方利益相关者齐聚一堂为未来铺路,我们需要解决这类问题。你可以自己看看 Altman 的文章,也许会想用 Whittemore 的笔记作为指南。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。