海洋所实现具有自主知识产权的风暴潮模式的GPU加速
近日,中国科学院海洋研究所近海动力环境研究及其工程应用研究组利用CUDA技术对海洋研究所自主研发的风暴潮数值模式IOCASM(Implicit Ocean Current and Storm Surge Model)进行全面加速,成功构建了新一代GPU-IOCASM。GPU-IOCASM在保证模拟精度与稳定性的同时,相较于原有CPU版本实现了超过312倍的加速效果。相关研究成果已发表在海洋领域国际期刊 Applied Ocean Research。
准确模拟潮汐、潮流和风暴潮对沿海城市的可持续发展和保护居民生命财产安全具有重要意义。传统数值模式的加速主要依靠基于CPU的并行化技术(如OpenMP和MPI),其效率受到CPU计算核心数量限制。随着CUDA技术的快速发展,GPU中数千核心所带来的强大并行能力成为提升数值模式并行效率的理想途径。因此,研究团队提出并探索了将 CUDA 技术应用于风暴潮数值模式的新思路。
图1?CUDA线程到矩阵计算的映射
研究团队通过引入掩码计算减少线程分支、提出自适应迭代次数预测策略、设计异步数据传输机制等方法,大幅提升了计算效率。验证结果显示,GPU-IOCASM的模拟结果与观测数据及国际主流模式的模拟结果高度一致。在保证数值模式稳定性的同时,GPU-IOCASM实现了相较于原模式超过312倍的加速效果。这意味着以往依赖高性能计算集群的风暴潮模拟如今可在小型工作站上高效完成。
图2?不同垂向分层和线程下CPU和GPU每计算步的执行时间对比
中国科学院海洋研究所博士后谢建斌为论文第一作者,冯兴如研究员为论文通讯作者。合作者包括中国科学院海洋研究所尹宝树研究员、高天海博士,南京信息工程大学董昌明教授,中国科学院软件研究所吴长茂副研究员。研究得到了国家重点研发计划、国家自然科学基金等项目的联合资助。
论文信息:
Xie J, Feng X*, Gao T, et al. Accelerating an implicit ocean model using CUDA C. Applied Ocean Research, 2025, 163: 104740. doi:https://doi.org/10.1016/j.apor.2025.104740
附件下载:
古镇口园区地址:青岛市西海岸新区海军路88号 南海路园区地址:青岛市市南区南海路7号 科考船码头基地:青岛市西海岸新区长江东路8号 |
邮编:266000 邮件:iocas@qdio.ac.cn 电话:0532-82898611 传真:0532-82898612 |