您现在的位置是:首页 > 精选百科 > 正文

矩阵卸载:图形处理器增强的扩散物理求解器

发布时间:2024-06-26 11:27:21庞昌康来源:

导读 所有复杂的多物理场模拟背后都有更为复杂的数学算法,这些算法用于求解描述物理现象运动的方程,例如聚变反应中固有的辐射扩散和燃烧等离子...

所有复杂的多物理场模拟背后都有更为复杂的数学算法,这些算法用于求解描述物理现象运动的方程,例如聚变反应中固有的辐射扩散和燃烧等离子体过程。这些算法中通常使用预条件求解器来转换问题,以便快速准确地收敛到解决方案。

《SIAM 科学计算杂志》最近发表的一篇论文介绍了专门针对在基于图形处理单元 (GPU) 的超级计算机上运行的模拟而优化的求解器。作者是来自 LLNL 应用科学计算中心的计算数学家 Tzanio Kolev,以及 Will Pazner 和 Panayot Vassilevski,他们都是前利弗莫尔研究员,目前在波特兰州立大学任职。

该团队的算法解决了 MARBL 所依赖的辐射扩散方程,MARBL 是一种任务关键型流体动力学代码,目前正在利弗莫尔即将推出的百亿亿次超级计算机 El Capitan 等 GPU 上运行。

“MARBL 的辐射扩散模型需要一种特定类型的求解器才能实现 GPU 效率。我们的算法针对这种情况进行了优化,”该论文的主要作者 Pazner 表示。

分解数学

为了加快计算速度,这些求解器将物理系统细分为有限元空间,称为 H(div)。这种离散化会增加有限元的数量,同时减小其大小 - 想象一下 3D 网格分解成越来越小的正方形,同时保持恒定的总体积。

H(div) 是一组被称为 de Rham 复合形的微分方程中的四个有限元空间之一,所有这些方程都被纳入了利弗莫尔领导的 MFEM(模块化有限元方法)软件库中。

“在整个研究过程中,我们为其他空间开发了有效的求解器,但还没有找到解决 H(div) 的最佳方法。我们知道我们可以做得更好,”Koley 说。

许多有限元都是用矩阵计算的,矩阵中的数字按行和列排列。但当矩阵太大而无法高效计算时(例如在大规模流体动力学模拟中),无矩阵算法是唯一可行的方法。

“高阶问题在 GPU 上运行的成本过高,这不仅是因为计算量大,还因为内存传输。基于矩阵的算法经常导致 GPU 出现内存瓶颈,因此我们需要提出一种算法,既能得出相同的解决方案,又能避免矩阵的处理和存储,”Pazner 说道。

标签:

上一篇
下一篇

猜你喜欢

最新文章