普通人似乎对生成式 AI 有一定了解。像 Dall-E 这样的图像生成产品在某种程度上已经家喻户晓。但很少有人意识到生成式 AI 在为我们的世界带来新解决方案方面能走多远。
这在生物层面尤其明显。就像生成式 AI 能"破解"模拟文本、图片和视频的能力一样,它也可以转向生物学领域,找到识别生物结构的新方法。
举个例子:Microsoft 团队正在研究如何使用扩散模型来发现能满足高科技项目需求的新材料。
Microsoft 的博客作者写道:"为目标应用找到新材料就像大海捞针。"他们一直在研究一个恰当地被称为 MatterGen 的项目。"历史上,这项工作是通过昂贵且耗时的实验试错完成的。最近,对大型材料数据库的计算筛选让研究人员加快了这个过程。尽管如此,要找到具有所需特性的少数材料仍需要筛选数百万个候选材料。"
从某种程度上说,这让我们想起为什么 AI 是互联网的完美搭档。你可能需要花费数小时、数天甚至数周来搜索互联网上的特定事实或信息,但使用 ChatGPT 这样的模型,几秒钟就能得到答案。互联网是一个横跨全球的庞大信息宝库,而 AI 则是一个能在眨眼间聚合互联网结果的超级高效研究员。
它在搜索互联网方面的效率比人类高出许多个数量级。显然,在寻找新型物质、具有特定化学性质、磁性、导电性等材料方面,它的效率也比人类高出许多个数量级。
扩散架构与生物世界
要理解 MatterGen 在生物科学研究中的工作原理,你需要先了解扩散模型本身。
通常,当生成式 AI 应用于扩散时,你先从一个确定的对象开始,比如一幅图像、一个蛋白质或某种生物项目,然后通过"噪声"过程使其退化。你引入噪声,将原始项目扩散成一个抽象体。然后系统反过来对目标进行"去噪",将其凝聚成一个新的结果,一个具有研究者(人类用户)所需属性或特性的新项目或结构。
Microsoft 研究人员报告称,当系统被输入来自数据库的超过 608,000 种稳定材料时,它能够生成合适的新型材料候选者。
处理成分无序
团队指出,一个挑战是成分无序,即原子可能在特定合成材料中改变其位置。
团队解释说:"在计算机设计材料的背景下,业界一直在探索什么是'新颖'材料,因为广泛使用的算法无法区分那些仅在相似元素位置排列上有差异的结构对。"
听起来很混乱?
正如我之前提到的,你也可以使用 ChatGPT 来更好地理解这些研究人员在讨论什么。当我将上述内容输入 ChatGPT,得到的解释是:
"最近,研究人员一直在研究什么使得计算机设计的材料成为'新'材料。这很重要,因为常用算法通常无法区分那些仅在相似元素位置安排方式上有差异的结构。"
关于成分无序的具体例子,ChatGPT 给出了这样的解释:
"成分无序的一个具体例子可以在金属合金中找到,比如黄铜。黄铜是由铜 (Cu) 和锌 (Zn) 组合而成。在完全有序的结构中,铜和锌原子会按规则排列。但实际上,这些原子可能在晶格中随机交换位置,这意味着原本应该有铜原子的位置可能会有锌原子,反之亦然。这种铜和锌原子排列的随机性就是成分无序的一个例子,它会影响材料的性质,如强度、耐腐蚀性和导电性。"
创新电池技术
在宣布这个新的生成式 AI 解决方案时,Microsoft 团队谈到了锂离子电池的创新,以及 20 世纪 80 年代发现钴酸锂时最初的锂离子电池是如何设计的。他们提到,锂离子电池对现代智能手机和电动/混合动力汽车等设备都至关重要;如果没有它们,我们的世界将倒退很多。
现在,研究人员正在试图找出如何用更好、更现代的电池设计来替代传统的锂离子电池——使用更少的锂,因为锂很难获得,且开采困难。
他们正在成功地使用这项生物技术。回顾大约一年前,可以看到来自太平洋西北国家实验室 (PNNL) 的研究结果,研究人员获得了一种所需锂含量减少 70% 的设计。
通过 AI 过程,我们很可能会继续获得更好的迭代,扩散模型向我们展示了化学工程中的可能性。
我之前曾写过一些关于 AI 在生物学方面的其他解决方案,但这个特别令人兴奋,部分原因是它在锂离子电池进步和其他关键任务方面的潜力,以及我们如何获取企业材料的方式变革。
从简单的物流角度来思考——你想要更好的供应链、更安全的材料、更高质量的项目和更好的客户交付——所有这些都可以帮助我们实现这些目标。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。