普通人似乎对生成式 AI 有一定了解。像 Dall-E 这样的图像生成产品在某种程度上已经家喻户晓。但很少有人意识到生成式 AI 在为我们的世界带来新解决方案方面能走多远。
这在生物层面尤其明显。就像生成式 AI 能"破解"模拟文本、图片和视频的能力一样,它也可以转向生物学领域,找到识别生物结构的新方法。
举个例子:Microsoft 团队正在研究如何使用扩散模型来发现能满足高科技项目需求的新材料。
Microsoft 的博客作者写道:"为目标应用找到新材料就像大海捞针。"他们一直在研究一个恰当地被称为 MatterGen 的项目。"历史上,这项工作是通过昂贵且耗时的实验试错完成的。最近,对大型材料数据库的计算筛选让研究人员加快了这个过程。尽管如此,要找到具有所需特性的少数材料仍需要筛选数百万个候选材料。"
从某种程度上说,这让我们想起为什么 AI 是互联网的完美搭档。你可能需要花费数小时、数天甚至数周来搜索互联网上的特定事实或信息,但使用 ChatGPT 这样的模型,几秒钟就能得到答案。互联网是一个横跨全球的庞大信息宝库,而 AI 则是一个能在眨眼间聚合互联网结果的超级高效研究员。
它在搜索互联网方面的效率比人类高出许多个数量级。显然,在寻找新型物质、具有特定化学性质、磁性、导电性等材料方面,它的效率也比人类高出许多个数量级。
扩散架构与生物世界
要理解 MatterGen 在生物科学研究中的工作原理,你需要先了解扩散模型本身。
通常,当生成式 AI 应用于扩散时,你先从一个确定的对象开始,比如一幅图像、一个蛋白质或某种生物项目,然后通过"噪声"过程使其退化。你引入噪声,将原始项目扩散成一个抽象体。然后系统反过来对目标进行"去噪",将其凝聚成一个新的结果,一个具有研究者(人类用户)所需属性或特性的新项目或结构。
Microsoft 研究人员报告称,当系统被输入来自数据库的超过 608,000 种稳定材料时,它能够生成合适的新型材料候选者。
处理成分无序
团队指出,一个挑战是成分无序,即原子可能在特定合成材料中改变其位置。
团队解释说:"在计算机设计材料的背景下,业界一直在探索什么是'新颖'材料,因为广泛使用的算法无法区分那些仅在相似元素位置排列上有差异的结构对。"
听起来很混乱?
正如我之前提到的,你也可以使用 ChatGPT 来更好地理解这些研究人员在讨论什么。当我将上述内容输入 ChatGPT,得到的解释是:
"最近,研究人员一直在研究什么使得计算机设计的材料成为'新'材料。这很重要,因为常用算法通常无法区分那些仅在相似元素位置安排方式上有差异的结构。"
关于成分无序的具体例子,ChatGPT 给出了这样的解释:
"成分无序的一个具体例子可以在金属合金中找到,比如黄铜。黄铜是由铜 (Cu) 和锌 (Zn) 组合而成。在完全有序的结构中,铜和锌原子会按规则排列。但实际上,这些原子可能在晶格中随机交换位置,这意味着原本应该有铜原子的位置可能会有锌原子,反之亦然。这种铜和锌原子排列的随机性就是成分无序的一个例子,它会影响材料的性质,如强度、耐腐蚀性和导电性。"
创新电池技术
在宣布这个新的生成式 AI 解决方案时,Microsoft 团队谈到了锂离子电池的创新,以及 20 世纪 80 年代发现钴酸锂时最初的锂离子电池是如何设计的。他们提到,锂离子电池对现代智能手机和电动/混合动力汽车等设备都至关重要;如果没有它们,我们的世界将倒退很多。
现在,研究人员正在试图找出如何用更好、更现代的电池设计来替代传统的锂离子电池——使用更少的锂,因为锂很难获得,且开采困难。
他们正在成功地使用这项生物技术。回顾大约一年前,可以看到来自太平洋西北国家实验室 (PNNL) 的研究结果,研究人员获得了一种所需锂含量减少 70% 的设计。
通过 AI 过程,我们很可能会继续获得更好的迭代,扩散模型向我们展示了化学工程中的可能性。
我之前曾写过一些关于 AI 在生物学方面的其他解决方案,但这个特别令人兴奋,部分原因是它在锂离子电池进步和其他关键任务方面的潜力,以及我们如何获取企业材料的方式变革。
从简单的物流角度来思考——你想要更好的供应链、更安全的材料、更高质量的项目和更好的客户交付——所有这些都可以帮助我们实现这些目标。
好文章,需要你的鼓励
NVIDIA研究团队开发出名为Lyra的AI系统,能够仅凭单张照片生成完整3D场景,用户可自由切换观察角度。该技术采用创新的"自蒸馏"学习方法,让视频生成模型指导3D重建模块工作。系统还支持动态4D场景生成,在多项测试中表现优异。这项技术将大大降低3D内容创作门槛,为游戏开发、电影制作、VR/AR应用等领域带来重大突破。
生物技术公司SpotitEarly开发了一种独特的居家癌症筛查方法,结合训练有素的比格犬嗅觉能力和AI技术分析人体呼气样本。该公司研究显示,18只训练犬能以94%的准确率检测出早期癌症。用户只需在家收集呼气样本并寄送至实验室,由训练犬识别癌症特异性气味,AI平台验证犬类行为。公司计划明年通过医师网络推出筛查套件,单项癌症检测约250美元。
谷歌DeepMind团队创新性地让Gemini 2.5模型在无需训练的情况下学会理解卫星多光谱图像。他们将复杂的12波段卫星数据转换为6张可理解的伪彩色图像,配以详细文字说明,使通用AI模型能够准确分析遥感数据。在多个基准测试中超越现有模型,为遥感领域AI应用开辟了全新道路。