AWS与约翰斯·霍普金斯大学惠廷工程学院格雷实验室近日宣布,联合推出抗体可开发性基准数据集(Antibody Developability Benchmark),这是一个面向AI/机器学习驱动的抗体设计领域的大规模多样化数据集,旨在为相关模型的评估提供有力支撑。
数据集核心构成
该数据集涵盖50个种子抗体,涉及四种结构格式,针对42种抗原,并对六项关键可开发性特征进行系统评估。这些特征直接关系到抗体从实验室研究走向实际应用的可行性,是衡量抗体设计质量的重要维度。
工程变体与湿实验室验证
数据集中包含经过工程化处理的抗体变体,这些变体同时涵盖可开发性表现优良与表现不佳两类结果,并均经过湿实验室实验的严格验证。这一设计使得数据集不仅具备理论价值,更具备实际应用参考意义,有助于研究人员更真实地评估模型在实际场景中的表现。
支持零样本学习评估
该基准数据集支持零样本学习(Zero-shot Learning)模式,即允许模型在未曾接触该数据集的情况下直接接受评估。这一特性有效避免了数据泄露对评估结果的干扰,显著提升了评估结论的可信度与客观性。
持续扩展与迭代
据悉,该数据集未来将持续扩充,计划纳入更多模型支持与属性维度,以推动AI驱动的抗体设计领域不断向前发展,为制药研究和生物技术创新提供更加坚实的数据基础。
Q&A
Q1:抗体可开发性基准数据集包含哪些内容?
A:该数据集包含50个种子抗体,涵盖四种结构格式,针对42种抗原,并对六项关键可开发性特征进行评估。数据集中还包括经过工程化处理的抗体变体,这些变体涵盖可开发性表现优良与不佳两类结果,所有数据均经过湿实验室实验的严格验证,具有较高的实际参考价值。
Q2:零样本学习在抗体设计评估中有什么优势?
A:零样本学习允许AI模型在未曾接触该基准数据集的前提下直接接受评估,这样可以有效避免模型因提前"见过"数据而产生的结果偏差,从而使评估结论更加客观、可信。对于研究人员来说,这种方式能更真实地反映模型在实际抗体设计任务中的泛化能力。
Q3:抗体可开发性基准数据集未来有哪些扩展计划?
A:根据AWS与约翰斯·霍普金斯大学惠廷工程学院格雷实验室的介绍,该数据集计划在未来持续扩充,将纳入更多AI/机器学习模型的支持,并增加更多抗体属性维度,以推动AI驱动的抗体设计领域持续改进,为制药研究和生物技术创新提供更全面的数据支撑。
好文章,需要你的鼓励
作者测试特斯拉自动驾驶系统十余年,认为FSD v14是迄今最出色的版本,但正因其表现接近完美,反而让驾驶员放松警惕。系统可连续行驶数千英里无需干预,导致驾驶员难以保持专注。更令人担忧的是,特斯拉通过营销宣传鼓励这种松懈,宣称FSD能"给你自由"并推广给视力受损老人使用,而实际上这仍是需要驾驶员随时接管的L2级辅助系统。
来自中国科大的研究团队构建了AsyncTool评测基准,首次系统考察AI模型在工具响应延迟情况下并发处理多任务的能力,发现几乎所有主流模型都存在明显性能退化。
韩国火箭初创公司Unastella完成2400万美元B轮融资,累计融资达4400万美元。该公司于2025年5月在韩国本土成功发射UNA EXPRESS-I火箭,采用煤油液氧推进系统和电动泵技术。公司计划明年发射UNA EXPRESS-II,目标达到100公里高度。韩国政府已承诺在七年内投入2.66亿美元建设发射基础设施,支持私营航天发展。
Parallax是一种基于局部线性注意力理论的参数化注意力机制,通过引入可训练的协方差探针矩阵替代实时方程求解,在理论更优的同时实现了高效的大规模语言模型预训练。