蛋白质是人体内的微观工作者,驱动着从氧气运输到肌肉收缩等各种生理功能。它们复杂的三维结构决定了其功能,理解这些结构形状是揭示生命本质的关键。
由 Google DeepMind 开发的人工智能工具 AlphaFold,能在几分钟内准确预测从氨基酸序列到蛋白质结构的过程,这项任务在过去需要多年的实验才能完成。这一突破性成果使 AlphaFold 的创造者们在 2024 年 10 月获得了著名的诺贝尔化学奖。
AlphaFold 数据库中包含超过 2 亿个预测蛋白质结构,全球有超过 250 万用户在使用,其中亚太地区就有超过 100 万用户,用于推进生物学和医学研究。其中包括由新加坡科技研究局 (A*Star) 领导的一个多学科研究团队,他们正在研究帕金森病。
帕金森病是一种影响全球数百万人的神经退行性疾病,会影响运动能力和生活质量。早期诊断仍然是一个挑战,这阻碍了及时干预和治疗。A*Star 与杜克-新加坡国立大学医学院和国家神经科学研究所合作,正在使用 AlphaFold 研究一种名为 Stip1 (应激诱导磷蛋白 1) 的特定蛋白质在疾病发展和进程中的作用。
Stip1 在大脑和肾脏中大量表达,在确保其他蛋白质正确折叠方面发挥重要作用。在各种疾病中都发现了 Stip1 水平升高,包括帕金森病和阿尔茨海默病。特别是,帕金森病患者的 Stip1 增加与自身抗体的上升相关,这些抗体会错误地攻击身体自身的组织和蛋白质。
在一次媒体简报会上,A*Star 新加坡免疫网络的研究员 Jackwee Lim 解释了 AlphaFold 如何帮助理解 Stip1 的结构和相互作用。
"AlphaFold 使我们能够创建 Stip1 的 3D 模型,显示其不同结构域以及它们如何以线性或非线性方式在空间中相互作用,"Lim 说。该模型被用来绘制与 Stip1 协同工作促进蛋白质折叠的其他蛋白质(如 HSP70 和 HSP90)的结合位点。这将帮助研究人员了解自身抗体如何破坏 Stip1 的正常活动,导致错误折叠的蛋白质聚集,这是神经退行性疾病的特征。
这项正在进行的研究在开发帕金森病的血液诊断方面具有巨大潜力。测量 Stip1 特异性自身抗体可能提供一种早期检测方法,实现及时干预。该团队的工作证明了 AlphaFold 在加快研究进程方面的强大能力,提供了以前无法获得的见解。
除了帕金森病,AlphaFold 在该地区还有多种应用。例如,在菲律宾,国际水稻研究所的研究人员正在使用 AlphaFold 研究水稻的磷酸化作用,这是控制水稻植物如何应对环境压力的关键过程。
通过预测参与这一过程的蛋白质的三维结构,科学家们希望找出使某些水稻品种对干旱和疾病更具抵抗力的分子机制,最终开发出更强壮的水稻品种,为粮食安全作出贡献。
研究人员还使用 AlphaFold 来理解蜜蜂免疫系统中的一种关键蛋白质,将研究时间从数年缩短到数天,为改善这种对授粉和农业至关重要的关键物种的生存奠定了基础。
去年,Google DeepMind 发布了 AlphaFold 的新版本,使科学家能够预测更复杂的生物分子结构,如 DNA、RNA、配体和离子,从而对生物相互作用有更丰富和全面的认识,Google DeepMind 的产品经理 Dhavi Hariharan 说。
然而,像 AlphaFold 这样强大技术的广泛可用性也引发了伦理问题。Hariharan 表示,公司在发布 AlphaFold 之前进行了全面的伦理审查,得出结论认为其好处远远超过潜在风险。她补充说,公司还优先考虑使 AlphaFold 对全球研究人员开放,不论其资源如何,并正在积极提供教育资源和支持,以促进该技术的使用。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。