AI公司Anthropic近日发布了新款大语言模型——Claude Fable 5,并宣称其在药物研发和科学研究领域的卓越能力,使其在同类平台中占据显著优势。
这款自主AI是Anthropic旗下顶级Mythos 5模型的首个公开版本。此前,该公司曾表示Mythos 5因风险过高而无法对外发布,原因在于其在部分黑客攻击和网络安全任务上的表现已能超越人类。
然而,新模型上线后迅速遭到AI研究人员的强烈批评。事件起因是有消息透露,当用户在某些领域(包括生物化学研究和网络安全)提出相关问题时,系统会通过"安全过滤机制"将其自动转接至能力较弱的早期Opus级AI模型。
Anthropic表示,这一措施旨在防止AI被滥用,例如被用于研制生物武器或协助网络攻击。但研究人员对此感到愤慨,尤其是因为部分情况下这种降级处理会在用户毫不知情的情况下悄然发生。据《Wired》报道,Anthropic目前已撤回该方案,并将改为在请求被转接时向用户发出明确提示。
Anthropic前首席科学家Behnam Neyshabur在社交媒体上对此举提出了严厉批评,他写道:"想用AI研究癌症?抱歉,我帮不了你。想用AI研究阿尔茨海默症?抱歉,我在AI这块变笨了。"
Anthropic表示,根据其内部测试,在95%的情况下,Claude Fable 5能够直接处理用户请求,而无需转接至Opus 4.8,并补充说"我们正在努力改进安全过滤机制,尽快减少误判率。"
争议之外,Anthropic也在积极推广Claude Fable 5在药物设计领域的潜力。该公司在一篇博客文章中表示,基于Mythos 5的版本"将药物设计流程中的部分环节提速约十倍",并在完全自主运作、无人工介入的条件下,在诸如"选择结合位点、筛选并运行蛋白质设计工具、以及在过程中从失败中恢复"等任务上,达到甚至超越了经验丰富的人类操作员水平。
该公司还表示,这一平台已针对14个蛋白质靶点中的9个生成了具有研究价值的候选药物,目前正在进行进一步评估。
此外,Anthropic还指出,基于Mythos 5的模型在分子生物学和基因组学领域提出创新假设的能力也有所提升。其中一项假设——大肠杆菌中的某种蛋白质可能成为抗菌疗法的全新靶点——已在实验室测试中得到初步验证。
另一项研究则尝试攻克基因治疗中腺相关病毒(AAV)载体设计的技术难关,借助Dyno Therapeutics提供的候选方案,探索AI如何预测基因修改对病毒外壳组装过程的影响。
Anthropic表示,AAV项目"展示了在基因治疗研发中完成简单但关键任务的良好潜力",但同时也警告称,"若落入不法之手,可能被用于设计危险病毒"。
Claude Fable 5目前的定价为每百万输入Token 10美元,每百万输出Token 50美元。
Q&A
Q1:Claude Fable 5是什么?它有哪些主要功能?
A:Claude Fable 5是Anthropic公司基于顶级Mythos 5模型发布的大语言模型,主要面向生命科学领域。它能将药物设计流程提速约十倍,在无人工介入的情况下自主完成蛋白质结合位点选择、蛋白质设计工具运行等任务,并在分子生物学和基因组学领域提出创新研究假设。目前已针对14个蛋白质靶点中的9个生成了具有研究价值的候选药物。
Q2:Claude Fable 5的安全过滤机制为什么引发争议?
A:Claude Fable 5在用户涉及生物化学研究、网络安全等领域提问时,会自动将其转接至能力较弱的Opus 4.8模型,且部分情况下转接过程对用户不可见。研究人员认为此举阻碍了正当的科研工作。Anthropic已撤回该方案,改为在请求被转接时向用户发出明确提示,并表示正在努力减少误判情况。
Q3:Claude Fable 5的使用费用是多少?
A:Claude Fable 5目前的定价为每百万输入Token 10美元,每百万输出Token 50美元。
好文章,需要你的鼓励
前沿AI研究机构Decart发布最新世界模型Oasis 3,旨在弥合虚拟仿真与物理AI之间的鸿沟。该模型将超写实交互图形能力与强大物理引擎相结合,可生成动作驱动的视频流,支持多视角环境模拟,延迟低于200毫秒。开发者能够借助自然语言提示,快速构建多样化极端场景,有效解决机器人和自动驾驶领域长期存在的"仿真到现实"差距问题,大幅降低物理AI训练成本。
OpenSkill是一套让AI代理无需人工监督即可自主成长的框架,通过从互联网获取知识、自建虚拟考题反复练习,实现真正的开放世界自我演化。
Visual Components正式发布5.1版本工厂仿真软件,重点引入高精度物理仿真与可扩展机器人协同调度能力,支持在同一环境中同时模拟数百台自主移动机器人、自动导引车及人员的运行状态。新版本还将仿真性能提升至前代的10倍,新增Allen-Bradley PLC支持及Nachi、Epson机器人虚拟调试插件,并将脚本环境升级至Python 3。该软件旨在帮助制造商在实际部署前完成系统验证,降低调试风险,缩短投产周期。
论文研究了AI评委同时优化多个评判维度时的两大失败原因:梯度稀释与指令干扰,为多目标提示词优化提供了系统性诊断框架。