Anthropic 正在启动一项 AI for Science 计划,以支持那些从事“高影响力”科学项目的研究人员,重点关注生物学和生命科学应用。
该计划于周一宣布,将在六个月内为“合格”的研究人员提供最多 20,000 美元的 Anthropic API 信用额度,研究人员的选拔依据是他们对科学的贡献、所提研究的潜在影响以及 AI 在有意义地加速其工作方面的能力。入选者将获得 Anthropic 标准 AI 模型套件的使用权限,其中包括公司所有公开的 Claude 系列模型。
Anthropic 在博客文章中写道:“先进的 AI 推理和语言能力可以帮助研究人员分析复杂的科学数据、生成假设、设计实验并更有效地传达研究成果。我们尤其关注利用 AI 加速诸如理解复杂生物系统、分析基因数据、加速药物研发(特别是针对一些全球最大疾病负担)、提高农业生产力等过程的应用。”
Anthropic 是众多看好 AI 在科学领域应用的科技公司之一。今年早些时候,Google 推出了“AI co-scientist”,该科技巨头表示该工具能够帮助科学家制定假设和研究计划。Anthropic 与其主要竞争对手 OpenAI 以及 FutureHouse 和 Lilia Sciences 等公司均声称,AI 工具可以大幅加速科学发现,尤其在医学领域。
然而,许多研究人员认为,目前的 AI 在指导科学研究过程中并非特别有用,这主要归因于其不可靠性。
开发“AI scientist”面临的部分挑战在于需要预见大量难以预料的干扰因素。AI 或许能在需要广泛探索的领域发挥作用,例如从海量可能性中筛选出候选项,但目前尚不清楚它是否能够进行那种跳出常规的解决问题方式,从而带来真正的突破。迄今为止,为科学设计的 AI 系统的成果大多未达到预期。2023 年,Google 表示在其一款名为 GNoME 的 AI 帮助下,大约合成了 40 种新材料,但外部分析发现,这些材料中实际上没有一种是真正意义上的全新成果。
Anthropic 无疑希望其此次努力能够优于以往的尝试。
该公司表示,其 AI for Science 计划的入选者将于每个月的第一个星期一依据科学价值、潜在影响、技术可行性以及生物安全审查标准 ( i.e. 确保所提研究不会被用于有害应用 ) 进行遴选。研究人员可通过公司网站上的表格进行申请,所有申请材料将由 Anthropic 进行审核,审核团队中包括相关领域的主题专家。
好文章,需要你的鼓励
Nvidia公布2026财年一季度业绩,营收441亿美元,同比增长69%;新AI超算与显卡产品陆续亮相,尽管出口管控对H20业务造成影响,但整体AI市场前景依然乐观。
Cerebras WSE 芯片拥有 40 亿晶体管,推理速度达到 NVIDIA 集群的约 2.5 倍,刷新了全球 AI 推理速度记录,为复杂 AI 代理应用提供高性能计算支持。
这项研究提出了"B-score",一种新指标用于检测大语言模型中的偏见。研究人员发现,当模型能看到自己之前对同一问题的回答时(多轮对话),它能够减少偏见并给出更平衡的答案。B-score计算单轮与多轮对话中答案概率的差异,无需外部标注即可识别有偏见的回答。实验证明,将B-score用于回答验证可显著提高准确率,在标准基准测试上平均提升2.9个百分点。这一发现不仅提供了实用工具,还表明大语言模型具有自我纠正能力。
这篇论文探讨了强化微调(RFT)如何增强多模态大语言模型(MLLMs)的推理能力。研究指出,作为一种后训练算法,RFT已在各种模态(视觉、音频、GUI等)、任务和领域中取得显著成功。论文详细分析了现有工作,总结了RFT在多模态推理中的五大成功:多样化模态应用、广泛的任务与领域支持、算法改进、丰富的评测基准和完善的工程框架。作者还提出五个未来研究方向:提升跨模态泛化能力、结合不同奖励范式、加强安全性研究、探索数据增强技术以及开发更优算法和应用场景。