FutureHouse,一个由 Eric Schmidt 支持的非营利组织,旨在未来十年内打造一位 “AI 科学家”,现已推出其首个重大产品:一个平台和 API,内置 AI 工具,用以支持科学研究工作。
目前有许多初创企业竞相开发面向科学领域的 AI 研究工具,其中一些背后拥有大量风险投资资金的支持。科技巨头似乎也看好 AI 在科学中的应用。今年早些时候,Google 推出了 “AI co-scientist”,这是一款据称能够帮助科学家提出假设并制定实验研究计划的 AI。
OpenAI 和 Anthropic 的 CEO 均表示,AI 工具可以大幅加速科学发现,尤其在医学领域。然而,由于现阶段 AI 的不可靠性,许多研究人员并不认为它在引导科学进程方面特别有用。
FutureHouse 于周四发布了四款 AI 工具:Crow、Falcon、Owl 和 Phoenix。Crow 能搜索科学文献并回答相关问题;Falcon 可以进行更深入的文献搜索,包括科学数据库;Owl 用于查找某一特定领域内的既有研究;而 Phoenix 则利用工具帮助规划化学实验。
FutureHouse 在博客文章中写道:“与其他 AI 不同,FutureHouse 的 AI 可访问大量高质量的开放获取论文及专门的科学工具,它们具备透明的推理过程,并采用多阶段流程对每个信息源进行更深入的考量……通过将这些 AI 串联起来,实现规模化,科学家们可以大大加速科学发现的步伐。”
然而具有讽刺意味的是,FutureHouse 迄今尚未利用其 AI 工具取得任何科学突破或发现全新的成果。
开发 “AI 科学家” 的一大挑战在于需要预见无数个干扰因素。AI 在需要广泛探索、缩小大量可能性清单的场景中可能会派上用场,但目前尚不明确 AI 是否具备那种跳出常规框架、从而实现真正突破性的解决问题能力。
到目前为止,专为科学设计的 AI 系统的成果大多令人失望。2023 年,Google 曾表示借助其名为 GNoME 的 AI 合成了大约 40 种新材料,但外部分析显示,这些材料中没有一项实际上是全新的。
AI 的技术缺陷和风险(例如其容易出现“幻觉”的倾向)也使科学家们对将其用于严肃研究持谨慎态度。即便是设计良好的研究,也可能因表现不佳的 AI 而受到污染,其难以执行高精度工作。
实际上,FutureHouse 也承认其 AI 工具——特别是 Phoenix——可能会出错。
公司在博客文章中写道:“我们现在发布这些工具是为了快速迭代,请在使用过程中提供反馈。”
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。