在一则令人意外的公告中,新任 FDA 专员 Martin Makary 博士宣布,FDA 已完成了一个基于生成式 AI 的药品审评加速系统试点,并计划在 6 月底前在整个机构内部推广此系统。
Makary 博士在声明中表示,“我们的首个人工智能辅助科学审查试点取得的成功令我大为震惊。我们需要珍惜科学家的时间,并减少历来占据审查过程中大量非生产性忙碌工作的环节。全机构推广这些能力对加速新疗法的审查周期具有巨大潜力。”
公告中关于该技术或试点的详细信息非常有限。文中提到,由 Jeremy Walsh 监督此次推广工作,他几天前刚刚以 FDA 首任首席 AI 官员的身份加入该机构。Walsh 曾在政府承包商 Booz Allen Hamilton 工作 14 年担任首席技术专家,其中包括与 FDA 合作签订合约。WIRED 杂志昨天通过一篇独家报道引用匿名消息源披露,近期 OpenAI 的一个小团队曾与 FDA 及政府效率部( DOGE )的两位相关人员会面,Walsh 也参与了讨论。他们将该项目称为 “cderGPT”,这很可能是指 FDA 的药品审评中心。
尽管业内人士无疑会欢迎更快的药品审查速度,但这一公告也引发了关于患者安全的疑问。生成式 AI 众所周知容易出错,而此次推广时间表之快 —— 对于一个历来对来自 AI 工具的药品数据信任度如此谨慎的机构来说,这颇具讽刺意味。
Makary 博士在为缩短时间表进行辩护时强调了支持创新的紧迫性。
他说:“多年来我们不断在各类框架、会议和小组讨论中谈论 AI 能力,但我们不能再只停留在讨论上。现在是采取行动的时候了。将曾经需要数天完成的任务缩短到几分钟完成,这样的机会实在是太重要而不能拖延。”
这种紧迫感很可能也源于 FDA 最近宣布的裁员计划,这引发了对药品审批周期可能延迟的担忧。在本周波士顿举行的 AAPS 全国生物技术会议上,现任 MCRA 的前 FDA 员工 Alex Cadotte 博士讨论了这些裁员对审批周期的影响。
他解释说:“据我所知,至少从公开渠道来看,近期以及计划中的裁员行动基本上都是面向后勤支持人员,而非审查人员。因此,其直接影响可能不会马上显现,但从长远来看可能会有所体现。不过,总的来说,如果你有一个申请在 FDA 那里审查,从事审查的人员很可能不受影响。”
具有讽刺意味的是,Cadotte 指出,FDA 中许多已被裁员的员工曾是 AI 模型和机器学习方面的专家。
他说:“在 2 月 14 日的裁员中,其中 75% 的 AI 专家被永久解雇。许多人受邀返聘但均拒绝。这主要是因为他们进入了工业界,找到了更有利可图且更稳定的职位。我认为,这显然对我们所有人来说都是一个重大损失,因为现在 FDA 在了解这些模型方面的能力明显受到质疑。”
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。