近日,华为与中国人民大学高瓴人工智能学院孙浩教授团队合作,基于昇思MindSpore AI框架提出了物理编码递归卷积神经网络(Physics-encoded Recurrent Convolutional Neural Network,PeRCNN),该成果已在《Nature》子刊《Nature Machine Intelligence》上发表,相关代码已在开源社区Gitee的MindSpore Flow代码仓开源[1]。
PeRCN相较于物理信息神经网络、ConvLSTM、PDE-NET等方法,模型泛化性和抗噪性明显提升,长期推理精度提升了10倍以上,在航空航天、船舶制造、气象预报等领域拥有广阔的应用前景。
PDE方程在对物理系统的建模中占据着中心地位,但在流行病学、气象科学、流体力学和生物学等等领域中,很多的底层PDE仍未被完全发掘出来。而对于那些已知的PDE方程,比如Navier-Stokes方程,对这些方程进行精确数值计算需要巨大的算力,阻碍了数值仿真在大规模时空系统上的应用。目前,机器学习的进步提供了一种PDE求解和反演的新思路。
PerCNN的模型架构
已有的数据驱动的模型依赖于大数据[2],这在大多数的科学问题上很难满足,同时还存在解释性的问题。物理约束的神经网络(PINNs)[3]虽然做到了利用先验知识去约束模型的训练从而减少对数据的依赖,但是PINN基于损失函数的软约束限制了最终结果的准确性。如何在缺少有效数据的情形下,得到具有高精度、鲁棒性、可解释性和泛化性的结果,仍是学界努力的方向。
因此,华为与孙浩教授团队合作,利用昇腾AI澎湃算力、依托昇思MindSpore AI框架开发了物理编码递归卷积神经网络[4],实现了对非线性PDE的精确逼近。
PeRCNN在反应扩散方程的应用,长期演化上优于ConvLSTM\PINN等方法
PeRCNN神经网络强制编码物理结构,基于结合部分物理先验设计的π-卷积模块,通过特征图之间的元素乘积实现非线性逼近。该物理编码机制保证模型根据我们的先验知识严格服从给定的物理方程。所提出的方法可以应用于有关PDE系统的各种问题,包括数据驱动建模和PDE的发现,并可以保证准确性和泛用性。
PeRCNN在预测和外推的性能上也优于ConvLSTM/ResNet/PDE-Net/DHPM等方法
PeRCNN的另一个独特优势是其可解释性,这源自π-卷积的乘法形式。通过符号计算,可以从学习到的模型中进一步提取底层的基础物理学表达式。这让PeRCNN能够作为一项有效的工具帮助人们从不完善和高噪声的数据中准确可靠地发现潜在的物理规律。
流体力学、气象、海洋等学科中,存在湍流、激波等强非线性现象,传统数值方法的求解需要大量计算资源,当前AI已经在飞行器流场、中期天气预报等问题中展现出极大的潜力,PeRCNN具备高精度、泛化性强和抗噪性强等特点,将有望在这些领域突破传统计算瓶颈,加速工业仿真和设计,成为AI+科学计算领域的新利器!
[1]https://gitee.com/mindspore/mindscience/tree/master/MindFlow/applications/data_mechanism_fusion/PeRCNN
[2]Yann LeCun, Yoshua Bengio, and Geoffrey Hinton. Deep learning. Nature, 521(7553):436–444, 2015.
[3]Maziar Raissi, Paris Perdikaris, and George E Karniadakis. Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations. Journal of Computational Physics, 378:686–707, 2019.
[4]Chengping Rao, Pu Ren, Qi Wang, Oral Buyukozturk, Hao Sun*, Yang Liu*. Encoding physics to learn reaction-diffusion processes. Nature Machine Intelligence, 2023, DOI: 10.1038/s42256-023-00685-7
好文章,需要你的鼓励
国际能源署发布的2025年世界能源展望报告显示,全球AI竞赛推动创纪录的石油、天然气、煤炭和核能消耗,加剧地缘政治紧张局势和气候危机。数据中心用电量预计到2035年将增长三倍,全球数据中心投资预计2025年达5800亿美元,超过全球石油供应投资的5400亿美元。报告呼吁采取新方法实现2050年净零排放目标。
阿布扎比科技创新研究院团队首次发现大语言模型生成的JavaScript代码具有独特"指纹"特征,开发出能够准确识别代码AI来源的系统。研究创建了包含25万代码样本的大规模数据集,涵盖20个不同AI模型,识别准确率在5类任务中达到95.8%,即使代码经过混淆处理仍保持85%以上准确率,为网络安全、教育评估和软件取证提供重要技术支持。
AMD首席执行官苏姿丰在纽约金融分析师日活动中表示,公司已准备好迎接AI浪潮并获得传统企业计算市场更多份额。AMD预计未来3-5年数据中心AI收入复合年增长率将超过80%,服务器CPU收入份额超过50%。公司2025年预期收入约340亿美元,其中数据中心业务160亿美元。MI400系列GPU采用2纳米工艺,Helios机架系统将提供强劲算力支持。
斯坦福大学研究团队首次系统比较了人类与AI在文本理解任务中的表现。通过HUME评估框架测试16个任务发现:人类平均77.6%,最佳AI为80.1%,排名第4。人类在非英语文化理解任务中显著优于AI,而AI在信息处理任务中更出色。研究揭示了当前AI评估体系的缺陷,指出AI的高分往往出现在任务标准模糊的情况下。