世界视讯！MIT中国研发逆问题深度学习模型-- 迪族网

世界视讯！MIT中国研发逆问题深度学习模型

来源：DeepTech深科技　2023-05-26 19:27:53

日前，中国科学院大学校友、目前在MIT 攻读直博的杨镇泽，通过利用深度学习模型，成功将有限的输入信息，还原为力学行为或物理行为。

(资料图)

图|杨镇泽（来源：杨镇泽）

结合多个深度学习的模型包括卷积神经网络（CNN，Convolutional Neural Networks）、生成对抗网络（GAN，Generative Adversarial Networks）以及基于注意力机制的模型（Transformer），其通过部分的输入来还原完整的应力和应变场，并得以从恢复的应力和应变场中，反向计算得到相应材料的分布。

图| 概念图（来源：MITnews）

在二维和三维的复杂复合材料中，他和所在团队测试了这款模型的表现。

测试中，该模型展现出了优秀的性能：包括其预测性能不受微观结构复杂性的影响；对于拥有混合的应力应变分量的数据集也能实现无标签的预测；以及只从表面应力的应变分布中就能恢复整个三维体积中的力学行为的能力。这些性能表现证实此次方法具有较好的精准度和鲁棒性。

进一步地，课题组还发现本次方法拥有不错的泛化能力，对于简单的弹性力学问题和复杂的塑性力学问题都有较好的预测。

对于不同类型的微观结构，比如棋盘状的离散复合材料以及 Cahn-Hilliard 连续微观结构，该模型都能依据有限的信息，来预测完整的物理图像。

此外，当面对从未见过的、不在训练数据分布内的新数据时，该团队也对模型表现进行了测试。

例如，他们给予模型完全不同于训练集的材料形状和大小，来研究模型相应的预测表现。

测试结果证明：该模型在一定程度上学到了数据背后的力学原理和物理规律，因此可以用来解决一些工程问题和科学问题。

最后，课题组设计了一个训练流程，通过拆分已有训练集来训练多个模型，以解决逆问题中常见的不适定性问题。

不适定性，指的是对于相同的观测结果，可能没有多个因素能够导向这样的结果。通过将相同模型在不同数据子集上进行训练，模型可以探索不同极值区域，以此得到相应的多个可能解。

这在一定程度上为解决不适定的逆问题提供了新方案。总的来说，整个框架提供了有效的分析方法和设计方法，不仅可以处理不完整的信息，并能实现根据性质反向预测材料结构的能力。

图 | 研究意义（来源：杨镇泽）

该工作的意义在于：

其一，为解决复杂的逆问题提供了新思路；

其二，相比一些物理规律启发的神经网络（physics-informed neural network，PINN），无需相应的领域知识或先验规律就可以使用这款模型。对于它来说，所有知识都是直接从数据中学习，对于一些没有已知理论基础的复杂问题，本次方法也具备较大的优势；

其三，基于图片的数据表征方法，其好处在于允许用户更直接地将过程可视化。在便于理解的同时，也更容易处理复杂的物理场问题；

其四，这款模型也能用于材料的反向设计。输入条件甚至可以是复杂的边界条件，因此它不但可被用于设计一个或几个材料，还可以针对特定的材料响应，来设计对应的结构；

其五，该方法不局限于解决固体力学问题，同样也适用于其他科学和工程领域，比如流体力学、电磁学、量子力学等。

日前，相关论文以《填写空白：可转移的深度学习方法来恢复丢失的物理场信息》（）为题发在 Advanced Materials上[1]，杨镇泽（ZhenzeYang）是第一作者，麻省理工学院马库斯·比勒（）教授担任通讯作者[1]。

图 | 相关论文（来源：Advanced Materials）

当下，该工作仍然停留在计算模拟和学术研究的框架内，但是该团队认为这项方法可被用于生产应用和临床应用中。

首先，对于工程上的非破坏性测试（比如通过 X 射线探测材料内部的缺陷），可以利用实验所得数据来训练相应的模型，以此来代替用于材料表征的传统方法，从而实现更快、更高效的测量。

另外，临床上经常有需要对特定的人群做植入（implant），而该模型也可用于植入物的检测和性能评价。借助本次成果，可以避免通过不必要的手术，来监测植入物的状态比如排异反应等。

据了解，在实际测量和工程问题中，学界和业界常常需要通过非直接和不完整的信息来解决复杂问题。

例如，当我们探测一个物体或者材料中是否有缺陷或者孔隙，往往不希望破坏材料的完整性。

因此，人们只能通过间接的测量比如 X 射线探测或者测量物体在边界上的响应，来判断材料内部的结构。

借助这类测量方式，所得到的信息经常是片面的、不完整的，甚至存在多种可能解，而这样的问题又被称为逆问题。

相较于正问题，使用传统手段往往更加难以解决逆问题，常常需要结合求解正问题的算子和特定的优化算法（optimization algorithm）不断迭代来接近对应的解。

这些传统方法往往耗时长，而且容易落入局部的最低点，难以快速找到全局的最优解，同时也难以处理多个解。

而这也是本次课题的研究背景，论文一作杨镇泽表示：“针对课题组之前发表在ScienceAdvances上的使用 PINN 求解逆问题的论文，在组内进行讨论之后，得到了关于本次课题的初步想法。”

然后，杨镇泽使用之前自己建立的数据集，想要试试在没有先验的物理规律、以及面对更为复杂的结构时，能否使用深度学习来做逆问题。

他说：“我在建立和搜索数据集的时候，正好看到一张模型预测的失败图片（一部分是模糊的），所以就萌生了去掉图片中一部分信息，然后让机器学习来帮助还原的想法。”

由于已经有现成的数据集来作为基准，因此他更多需要寻找合适的深度学习模型来兑现设想。

为此，他尝试了不少模型。“整个课题最为头疼的部分是验证模型的泛化性（generality），对于绝大多数模型来说，这都是一个很难实现的点。为此，我们尝试了不同的训练策略，尝试过其他公开的力学数据库，通过开展相关的数据分析，最终得到了这个泛化性还不错的模型。”其表示。

另据悉，现阶段的工作仍然是以计算模拟作为依据，他们希望通过实验的手段进一步验证和拓展本次方法。

具体而言，可以通过 3D 打印来生产所要研究的材料，同时结合测量手段比如数字图像相关法来得到对应的应变场，从而与模拟的数据进行对比来纠正这款模型。如前所述，该模型可被用于材料的反向设计。因此，他们将对该能力予以尝试。

参考资料：

, Z., & Buehler, M. J. (2023). Fill in the Blank: Transferrable Deep Learning Approaches to Recover Missing Physical Field Information.Advanced Materials, 2301449.

关键词：

推荐DIY文章