在AI加速发展的竞赛中,有几个关键的变化因素。其中之一是硬件:芯片会是什么样?这是一个非常有趣的问题。另一个是量子计算:它将发挥什么作用?还有一个是规模化问题。
从CEO、投资者到工程师,每个人都在努力弄清楚未来会是什么样子。最近在"想象力行动"活动的一次专家讨论会上,汇集了该领域的一些顶尖专家,我们从中获得了一些见解。
**WSE芯片:餐盘大小的推理处理器**
不久前,我写过关于Cerebras WSE芯片的文章,这是一块约餐盘大小的巨型硅芯片,正在推动大语言模型工作的集中化。无论以何种标准来看,这都是一件令人印象深刻的硬件,在我们AI硬件发展的前沿发挥着重要作用。
在前述的专家讨论中,来自Cerebras的Julie Choi展示了公司的WSE超级芯片,她提到有人称其为"推理界的鱼子酱"。
"我认为随着技术的发展,我们将在硬件架构层面看到更多创新和新颖的方法,"她说。
Dinesh Maheshwari在讨论架构和计算单元时表示:"优化空间极其庞大,我鼓励大家都去关注这个领域。"
来自MIT的专家小组成员Caleb Sirak谈到了硬件所有权问题:"随着模型本身开始变化,企业如何直接整合这些模型并以合理价格获得它们,同时将AI和相关能耗转化为生产力工具?"
Alexander Keesling在解释其公司的硬件工作时问道:"什么是计算机,计算机能做什么?我们采用物质的基本单位——单个原子,将其转化为信息的基本单位,即量子比特...量子计算机是人类历史上第一次能够利用自然的基本属性来做一些不同且更强大的事情。"
MIT林肯实验室的Jeremy Kepner对计算的奇点有一些思考——不是向AGI冲刺的竞赛,而是对总体"操作"的短视集中化。
"我们在过去几十年中构建的每一台高端计算机都只执行一种操作,"他说。"基于深层的数学和物理原因:这是几十年来我们唯一能够加速的操作。所以我经常告诉用户,是计算机选择了应用。AI恰好能够通过这种操作加速。"
他敦促听众以特定方式前进:"思考你想要做的任何事情,如果你能用这种数学操作加速它,那么你能做的事情就没有上限。你所在领域的某个人会找到解决方案,并将大幅前进。"
**工程挑战与AI机遇**
专家小组还提到了创新者必须应对的一些阻力。另一方面,Jeff Grover注意到了系统近期的进化能力。"我们对此感到非常兴奋,"他说。
**软件端的发展**
专家们讨论了软件的相关性和编程的发展方向。
"编程语言是为人类构建的,"Sirak说。"如何真正改变这一点,构建AI可以使用的语言和工具?"
Choi提到了Llama 4每秒2900个令牌的推理速率等基准测试。"开源模型对开发者来说非常丰富,这正在为最勇敢的开发者之间搭建桥梁。我认为早期采用者往往非常勇敢,他们愿意在从未见过的东西上编程。"
**高性能的比喻**
几位专家谈到了法拉利的特定比喻,Choi提到Cerebras芯片具有"法拉利级别"的速度。
Maheshwari谈到了"异国情调"的芯片,以及从架构范式的设计,将某些构建比作"开法拉利去买菜"。他还提到了保持技术"符合法规"的必要性。
**摩尔定律与进步**
Kepner谈到了对计算机能力的惊讶,以及行业投资的规模。他说,摩尔定律意味着支出的上限。他预测未来十年将有更多效率提升,并引用了Ozaki方案——一种在计算中保持精度的矩阵方法。
**量子计算的作用**
"我认为量子计算影响的第一个领域将是研究,"Keesling说。"这些问题的核心是试图回答当原子和电子相互作用并发展出这些新兴行为时会发生什么...我们如何思考化学、药物相互作用、材料特性,都来自电子和原子的运动。"
这次专家讨论包含了大量信息,包括我们如何在未来几年实现进步的细节。
**Ozaki方案解析**
回到这个矩阵概念,我对这个术语不太熟悉,所以查询了相关资料。这个方案以提出这个想法的人Makoto Ozaki命名。他找到了一种巧妙的方法,使用快速但精度较低的工具(如低精度数字)进行非常精确的数学运算(如大数字网格的乘法)。他的方法将工作分解为小而简单的步骤,然后仔细地将各部分重新组合以获得准确的答案。
这种方法在需要速度和精确性的计算中特别有价值,为AI硬件优化提供了新的思路。
总的来说,这些专家对AI未来的讨论涵盖了从量子计算到信息精度,再到未来几年加速发展的各种见解,为我们描绘了一幅技术发展的全景图。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。