FutureHouse,一个由 Eric Schmidt 支持的非营利组织,旨在未来十年内打造一位 “AI 科学家”,现已推出其首个重大产品:一个平台和 API,内置 AI 工具,用以支持科学研究工作。
目前有许多初创企业竞相开发面向科学领域的 AI 研究工具,其中一些背后拥有大量风险投资资金的支持。科技巨头似乎也看好 AI 在科学中的应用。今年早些时候,Google 推出了 “AI co-scientist”,这是一款据称能够帮助科学家提出假设并制定实验研究计划的 AI。
OpenAI 和 Anthropic 的 CEO 均表示,AI 工具可以大幅加速科学发现,尤其在医学领域。然而,由于现阶段 AI 的不可靠性,许多研究人员并不认为它在引导科学进程方面特别有用。
FutureHouse 于周四发布了四款 AI 工具:Crow、Falcon、Owl 和 Phoenix。Crow 能搜索科学文献并回答相关问题;Falcon 可以进行更深入的文献搜索,包括科学数据库;Owl 用于查找某一特定领域内的既有研究;而 Phoenix 则利用工具帮助规划化学实验。
FutureHouse 在博客文章中写道:“与其他 AI 不同,FutureHouse 的 AI 可访问大量高质量的开放获取论文及专门的科学工具,它们具备透明的推理过程,并采用多阶段流程对每个信息源进行更深入的考量……通过将这些 AI 串联起来,实现规模化,科学家们可以大大加速科学发现的步伐。”
然而具有讽刺意味的是,FutureHouse 迄今尚未利用其 AI 工具取得任何科学突破或发现全新的成果。
开发 “AI 科学家” 的一大挑战在于需要预见无数个干扰因素。AI 在需要广泛探索、缩小大量可能性清单的场景中可能会派上用场,但目前尚不明确 AI 是否具备那种跳出常规框架、从而实现真正突破性的解决问题能力。
到目前为止,专为科学设计的 AI 系统的成果大多令人失望。2023 年,Google 曾表示借助其名为 GNoME 的 AI 合成了大约 40 种新材料,但外部分析显示,这些材料中没有一项实际上是全新的。
AI 的技术缺陷和风险(例如其容易出现“幻觉”的倾向)也使科学家们对将其用于严肃研究持谨慎态度。即便是设计良好的研究,也可能因表现不佳的 AI 而受到污染,其难以执行高精度工作。
实际上,FutureHouse 也承认其 AI 工具——特别是 Phoenix——可能会出错。
公司在博客文章中写道:“我们现在发布这些工具是为了快速迭代,请在使用过程中提供反馈。”
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。