FutureHouse,一个由 Eric Schmidt 支持的非营利组织,旨在未来十年内打造一位 “AI 科学家”,现已推出其首个重大产品:一个平台和 API,内置 AI 工具,用以支持科学研究工作。
目前有许多初创企业竞相开发面向科学领域的 AI 研究工具,其中一些背后拥有大量风险投资资金的支持。科技巨头似乎也看好 AI 在科学中的应用。今年早些时候,Google 推出了 “AI co-scientist”,这是一款据称能够帮助科学家提出假设并制定实验研究计划的 AI。
OpenAI 和 Anthropic 的 CEO 均表示,AI 工具可以大幅加速科学发现,尤其在医学领域。然而,由于现阶段 AI 的不可靠性,许多研究人员并不认为它在引导科学进程方面特别有用。
FutureHouse 于周四发布了四款 AI 工具:Crow、Falcon、Owl 和 Phoenix。Crow 能搜索科学文献并回答相关问题;Falcon 可以进行更深入的文献搜索,包括科学数据库;Owl 用于查找某一特定领域内的既有研究;而 Phoenix 则利用工具帮助规划化学实验。
FutureHouse 在博客文章中写道:“与其他 AI 不同,FutureHouse 的 AI 可访问大量高质量的开放获取论文及专门的科学工具,它们具备透明的推理过程,并采用多阶段流程对每个信息源进行更深入的考量……通过将这些 AI 串联起来,实现规模化,科学家们可以大大加速科学发现的步伐。”
然而具有讽刺意味的是,FutureHouse 迄今尚未利用其 AI 工具取得任何科学突破或发现全新的成果。
开发 “AI 科学家” 的一大挑战在于需要预见无数个干扰因素。AI 在需要广泛探索、缩小大量可能性清单的场景中可能会派上用场,但目前尚不明确 AI 是否具备那种跳出常规框架、从而实现真正突破性的解决问题能力。
到目前为止,专为科学设计的 AI 系统的成果大多令人失望。2023 年,Google 曾表示借助其名为 GNoME 的 AI 合成了大约 40 种新材料,但外部分析显示,这些材料中没有一项实际上是全新的。
AI 的技术缺陷和风险(例如其容易出现“幻觉”的倾向)也使科学家们对将其用于严肃研究持谨慎态度。即便是设计良好的研究,也可能因表现不佳的 AI 而受到污染,其难以执行高精度工作。
实际上,FutureHouse 也承认其 AI 工具——特别是 Phoenix——可能会出错。
公司在博客文章中写道:“我们现在发布这些工具是为了快速迭代,请在使用过程中提供反馈。”
好文章,需要你的鼓励
微软宣布推出Windows 365 Reserve预览版,这是一项云电脑服务,可在物理设备不可用时提供预配置的临时云电脑。该服务预装Microsoft 365应用、安全策略和Windows自定义设置,支持OneDrive数据同步,每年可使用10天。用户可通过Windows应用或浏览器在几分钟内连接。微软还更新了云电脑默认安全设置,禁用USB和剪贴板重定向功能。
浙江大学团队提出CanDist框架,让AI在数据标注时先提供多个候选答案而非单一答案,再通过师生框架筛选最优标签。该方法受心理学"模糊厌恶"启发,在六个文本分类任务上表现优异,相比传统方法平均提升18-27%准确率,为AI数据标注提供了更智能可靠的解决方案。
智能体AI具备推理、适应和自主行动能力,能够以机器速度运行,有望彻底改变企业维护数字韧性的方式。它结合了大语言模型的对话分析体验和智能体框架的任务执行自动化,帮助IT团队从被动救火模式转向主动规划模式。智能体AI可瞬间定位根本原因、预防中断和停机、提供实时洞察并优化人力资源配置,为企业数字生态系统的安全和可靠性能交付提供全新解决方案。
微软联合多所知名高校开发了SwS框架,让AI模型能够自主识别学习弱点并生成针对性练习题进行自我改进。该方法在数学推理任务上取得显著效果,7B和32B模型平均性能分别提升10%和7.7%。通过"弱点诊断-针对性出题-强化训练"的三步流程,AI首次实现了真正意义上的自我反思式学习,不依赖外部知识灌输即可持续优化自身能力,为人工智能的自主学习开辟了新道路。