致力于推动英国在AI驱动药物发现领域占据领先地位的研究联盟OpenBind,近日宣布发布首个实验数据集和预测AI模型,标志着该项目迈出了重要的第一步。
OpenBind于去年正式成立,目标是构建全球规模最大的药物与蛋白质相互作用数据库,其数据量将是近几十年内其他同类项目的20倍。该数据库将用于支持AI模型的训练,帮助研究人员识别具有潜力的新型药物候选物。
此次项目的首批成果包括:699种化合物与EV-A71肠道病毒蛋白结合的高精度X射线图像。EV-A71肠道病毒与儿童中常见的手足口病(HFMD)轻症病例密切相关。
OpenBind团队还对其中601种化合物进行了结合强度测量,表示该数据集已是目前针对单一蛋白质靶点规模最大的公开数据集之一。与此同时,团队还专门为EV-A71 2A蛋白酶靶点开发了一款配套AI模型,并面向研究人员开放使用,以供开发和验证新型计算方法。
"这次首批发布是一个重要里程碑,表明我们已能够规模化生成高质量、标准化的数据,这些数据专门为AI驱动的药物发现而设计。"牛津大学结构生物信息学教授、OpenBind高级研究员夏洛特·迪恩(Charlotte Deane)教授表示。她补充道:"随着数据集持续扩展,将为研究人员提供提升模型性能所需的一致、可靠的信息支撑。"
与此同时,团队计划于本月底前后发布全新通用预测模型OpenBind v1。
OpenBind由牛津大学与英国国家同步辐射光源设施——位于牛津郡哈维尔科学园区的Diamond Light Source——共同创立,联盟成员还包括哥伦比亚大学、纪念斯隆凯特琳癌症中心、开放分子软件基金会、华盛顿大学的科学家,以及伦敦初创企业Isomorphic Labs等行业合作伙伴。
OpenBind指出,即便是当前结构生物学与药物发现领域最先进的AI系统,如谷歌DeepMind的AlphaFold和Recursion的Boltz,也受限于训练数据的质量与范围。这些系统虽然能够对与训练数据相似的生物结构进行建模,但对于与已知结构差异较大的新型靶点,其预测能力仍存在明显局限。
OpenBind项目获得了英国科学、创新与技术部旗下"主权AI基金"800万英镑的投资支持。
牛津大学统计学系副教授、OpenBind计算研究员弗格斯·伊姆里(Fergus Imrie)博士表示:"高质量的实验数据是开发新一代更优秀AI模型的核心基础。随着AI性能的不断提升,反过来又能引导未来实验方向,进一步加速发现进程。早期迭代周期中积累的经验,已帮助我们提升了整个研究流程的速度、一致性与可重复性,而这些对于OpenBind的持续扩展至关重要。"
Q&A
Q1:OpenBind是什么机构?主要做什么?
A:OpenBind是一个由牛津大学和Diamond Light Source共同创立的研究联盟,目标是构建全球最大的药物与蛋白质相互作用数据库,并基于此训练AI模型,用于识别具有潜力的新型药物候选物。其数据规模预计是近几十年同类项目的20倍,目前已获英国政府主权AI基金800万英镑投资支持。
Q2:OpenBind发布的首个AI模型主要针对哪种疾病?
A:首批发布的数据集和AI模型聚焦于EV-A71肠道病毒,该病毒与儿童常见的手足口病轻症病例相关。数据集包含699种化合物与病毒蛋白结合的X射线图像,以及601种化合物的结合强度测量数据,是目前针对单一蛋白靶点规模最大的公开数据集之一。
Q3:OpenBind的数据对现有AI药物发现模型有什么意义?
A:当前最先进的AI药物发现模型(如AlphaFold和Boltz)受限于训练数据的质量和覆盖范围,对与已知结构差异较大的新靶点预测能力有限。OpenBind提供的高质量、标准化实验数据,有助于提升模型性能,弥补现有系统在预测新型靶点方面的不足,从而加速药物发现进程。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。