普通人似乎对生成式 AI 有一定了解。像 Dall-E 这样的图像生成产品在某种程度上已经家喻户晓。但很少有人意识到生成式 AI 在为我们的世界带来新解决方案方面能走多远。
这在生物层面尤其明显。就像生成式 AI 能"破解"模拟文本、图片和视频的能力一样,它也可以转向生物学领域,找到识别生物结构的新方法。
举个例子:Microsoft 团队正在研究如何使用扩散模型来发现能满足高科技项目需求的新材料。
Microsoft 的博客作者写道:"为目标应用找到新材料就像大海捞针。"他们一直在研究一个恰当地被称为 MatterGen 的项目。"历史上,这项工作是通过昂贵且耗时的实验试错完成的。最近,对大型材料数据库的计算筛选让研究人员加快了这个过程。尽管如此,要找到具有所需特性的少数材料仍需要筛选数百万个候选材料。"
从某种程度上说,这让我们想起为什么 AI 是互联网的完美搭档。你可能需要花费数小时、数天甚至数周来搜索互联网上的特定事实或信息,但使用 ChatGPT 这样的模型,几秒钟就能得到答案。互联网是一个横跨全球的庞大信息宝库,而 AI 则是一个能在眨眼间聚合互联网结果的超级高效研究员。
它在搜索互联网方面的效率比人类高出许多个数量级。显然,在寻找新型物质、具有特定化学性质、磁性、导电性等材料方面,它的效率也比人类高出许多个数量级。
扩散架构与生物世界
要理解 MatterGen 在生物科学研究中的工作原理,你需要先了解扩散模型本身。
通常,当生成式 AI 应用于扩散时,你先从一个确定的对象开始,比如一幅图像、一个蛋白质或某种生物项目,然后通过"噪声"过程使其退化。你引入噪声,将原始项目扩散成一个抽象体。然后系统反过来对目标进行"去噪",将其凝聚成一个新的结果,一个具有研究者(人类用户)所需属性或特性的新项目或结构。
Microsoft 研究人员报告称,当系统被输入来自数据库的超过 608,000 种稳定材料时,它能够生成合适的新型材料候选者。
处理成分无序
团队指出,一个挑战是成分无序,即原子可能在特定合成材料中改变其位置。
团队解释说:"在计算机设计材料的背景下,业界一直在探索什么是'新颖'材料,因为广泛使用的算法无法区分那些仅在相似元素位置排列上有差异的结构对。"
听起来很混乱?
正如我之前提到的,你也可以使用 ChatGPT 来更好地理解这些研究人员在讨论什么。当我将上述内容输入 ChatGPT,得到的解释是:
"最近,研究人员一直在研究什么使得计算机设计的材料成为'新'材料。这很重要,因为常用算法通常无法区分那些仅在相似元素位置安排方式上有差异的结构。"
关于成分无序的具体例子,ChatGPT 给出了这样的解释:
"成分无序的一个具体例子可以在金属合金中找到,比如黄铜。黄铜是由铜 (Cu) 和锌 (Zn) 组合而成。在完全有序的结构中,铜和锌原子会按规则排列。但实际上,这些原子可能在晶格中随机交换位置,这意味着原本应该有铜原子的位置可能会有锌原子,反之亦然。这种铜和锌原子排列的随机性就是成分无序的一个例子,它会影响材料的性质,如强度、耐腐蚀性和导电性。"
创新电池技术
在宣布这个新的生成式 AI 解决方案时,Microsoft 团队谈到了锂离子电池的创新,以及 20 世纪 80 年代发现钴酸锂时最初的锂离子电池是如何设计的。他们提到,锂离子电池对现代智能手机和电动/混合动力汽车等设备都至关重要;如果没有它们,我们的世界将倒退很多。
现在,研究人员正在试图找出如何用更好、更现代的电池设计来替代传统的锂离子电池——使用更少的锂,因为锂很难获得,且开采困难。
他们正在成功地使用这项生物技术。回顾大约一年前,可以看到来自太平洋西北国家实验室 (PNNL) 的研究结果,研究人员获得了一种所需锂含量减少 70% 的设计。
通过 AI 过程,我们很可能会继续获得更好的迭代,扩散模型向我们展示了化学工程中的可能性。
我之前曾写过一些关于 AI 在生物学方面的其他解决方案,但这个特别令人兴奋,部分原因是它在锂离子电池进步和其他关键任务方面的潜力,以及我们如何获取企业材料的方式变革。
从简单的物流角度来思考——你想要更好的供应链、更安全的材料、更高质量的项目和更好的客户交付——所有这些都可以帮助我们实现这些目标。
好文章,需要你的鼓励
YouTube开始推出肖像检测工具,帮助创作者识别和举报使用其面部特征的AI生成视频。该系统类似于版权检测机制,目前处于测试阶段,仅向部分创作者开放。用户需要提供政府身份证件照片和面部视频来验证身份。系统会标记疑似包含用户肖像的视频,但无法保证100%准确识别AI内容。YouTube将根据多项因素决定是否移除举报的视频。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。
谷歌宣布在AI Studio平台中引入"氛围编程"体验,让编程和非编程用户都能更轻松地开发应用程序。用户可通过简单提示生成可运行的应用,新功能包括应用画廊、模型选择器、安全变量存储等。平台还添加了模块化"超能力"功能和"手气不错"按钮来激发创意。完成的原型应用可一键部署到谷歌云运行平台。此次更新正值业界期待谷歌即将发布Gemini 3.0大语言模型。
中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。