研发领域正在经历一场巨大的变革。去年,数学家们通过与 AI 的协作,成功解决了一个此前难以攻克的数学难题。随后,宾夕法尼亚大学的研究人员利用人工智能发现了近百万种新型抗生素。这些并非孤立事件,而是科学发现方式发生根本性转变的标志。
"超级顿悟"的崛起
Arthur D. Little 发布的一份名为"超级顿悟"的报告准确地描述了这一转变。该公司 BlueShift 部门主管 Albert Meige 博士解释道:"AI 之于大脑就像类固醇之于肌肉。我们认为 AI 不会取代研究人员,但善用 AI 的研究人员必定会比不使用 AI 的研究人员更有效率。"
这种影响已经可以量化。一些公司在特定领域的生产力提升了十倍。以蛋白质折叠为例,这个过程曾经需要耗费整个博士阶段的时间,并投入高达 10 万美元的实验成本,现在使用 AlphaFold 等 AI 工具只需要几小时甚至几分钟就能完成。
AI 革新研发的三种方式
这种转变正在多个维度上发生。据 Meige 介绍,AI 在研发领域的潜力体现在三个方面:"首先,AI 可以帮助研究人员解决更多问题。研究人员和工程师有许多重复性工作,比如文献综述或撰写活动报告。"其次,AI 能够利用专门的模型解决以前无法解决的问题。第三,它正在革新创新战略的决策过程,帮助组织更好地管理研究组合。
实施的挑战
尽管前景光明,但组织在有效实施 AI 时仍面临多个障碍。BlueShift 项目负责人 Zoe Huczok 强调,最大的风险并非人们想象的那样:"首要风险是 AI 的次优使用。有一种风险是把 AI 当作万能工具,但并非所有问题都适合用 AI 解决。"
数据质量和可访问性仍然是关键挑战。组织需要确保数据清晰、结构合理,并且能够在没有过多官僚障碍的情况下轻松获取。当内部数据不足时,公司正在寻找创新解决方案,包括与其他组织(有时甚至是竞争对手)合作以获取必要的数据集。
研究的未来:主动式 AI
展望未来,最令人兴奋的发展之一是主动式 AI 的出现。这些系统能够自主进行研究,从生成想法到撰写科学论文。像 Sakana 的 AI 科学家已经在计算机科学研究中展示了这种潜力。正如 Meige 博士所说:"当它发挥作用时,效果令人震撼。这有点像看着一群研究人员绞尽脑汁,尝试一种解决方案,发现不行后又尝试另一种方式。"
主动式 AI 的真正潜力在于其在未知领域进行批判性思考和自主决策的能力。正如 Huczok 解释的:"最终目标和期望是让 AI 能够生成假设,根据实验结果调整方向,并在没有人为提示的情况下探索特定问题。"尽管这种进步引发了关于人类监督和适当防护措施的重要问题,但技术发展迅速。正如 Meige 指出,我们正在接近"与 AI 相关的最有趣的哲学讨论",特别是关于可能导致技术奇点的自我改进系统。现在的关键问题是,这些在计算机科学中表现出前景的系统是否能够有效地适应其他科学领域——这种转变可能彻底革新研发领域,同时需要我们仔细考虑技术能力和伦理影响。
研发领域 AI 的起步
对于希望在研发中开始 AI 之旅的组织,专家建议从小处着手但要有大局观。Huczok 说:"实验 AI 不一定要花费很多。现在有很多供应商和完整的生态系统,可以让你外包计算资源。"
然而,Meige 提醒要避免一个常见的陷阱:"人们经常问我'应该使用什么工具?'这不是首要问题。真正的首要问题是,你的组织面临什么问题...一切都应该从痛点出发。"
展望未来
AI 在研发领域的潜力远不止于提高效率。正如 Meige 指出,AI 可能在应对气候变化适应和突破性医学发现等人类重大挑战方面发挥关键作用。虽然关于适当防护措施和人类研究人员角色的问题仍然存在,但有一点是明确的:研发领域的 AI 革命不是即将到来——它已经在这里,并正在改变我们创新的方式。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。