{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,26]],"date-time":"2026-03-26T01:14:41Z","timestamp":1774487681258,"version":"3.50.1"},"publisher-location":"New York, NY, USA","reference-count":29,"publisher":"ACM","license":[{"start":{"date-parts":[[2021,1,20]],"date-time":"2021-01-20T00:00:00Z","timestamp":1611100800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.acm.org\/publications\/policies\/copyright_policy#Background"}],"funder":[{"name":"the European Union?s Horizon 2020 research and innovation programme","award":["823844"],"award-info":[{"award-number":["823844"]}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2021,1,20]]},"DOI":"10.1145\/3432261.3436753","type":"proceedings-article","created":{"date-parts":[[2021,1,14]],"date-time":"2021-01-14T03:24:09Z","timestamp":1610594649000},"page":"69-82","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":11,"title":["SeisSol on Distributed Multi-GPU Systems: CUDA Code Generation for the Modal Discontinuous Galerkin Method"],"prefix":"10.1145","author":[{"given":"Ravil","family":"Dorozhinskii","sequence":"first","affiliation":[{"name":"Technical University of Munich, Germany"}]},{"given":"Michael","family":"Bader","sequence":"additional","affiliation":[{"name":"Technical University of Munich, Germany"}]}],"member":"320","published-online":{"date-parts":[[2021,1,20]]},"reference":[{"key":"e_1_3_2_1_1_1","doi-asserted-by":"publisher","DOI":"10.1177\/1094342017694427"},{"key":"e_1_3_2_1_2_1","doi-asserted-by":"publisher","DOI":"10.1109\/IPDPS.2016.109"},{"key":"e_1_3_2_1_3_1","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-58667-0_3"},{"key":"e_1_3_2_1_4_1","doi-asserted-by":"publisher","DOI":"10.1145\/3330345.3330355"},{"key":"e_1_3_2_1_5_1","volume-title":"Tests of 3D elastodynamic codes: Final report for Lifelines Project 1A02","author":"Day M","year":"2003","unstructured":"Steven\u00a0 M Day , J Bielak , D Dreger , R Graves , S Larsen , KB Olsen , and A Pitarka . 2003. Tests of 3D elastodynamic codes: Final report for Lifelines Project 1A02 . Pacific Earthquake Engineering Research Center ( 2003 ). Steven\u00a0M Day, J Bielak, D Dreger, R Graves, S Larsen, KB Olsen, and A Pitarka. 2003. Tests of 3D elastodynamic codes: Final report for Lifelines Project 1A02. Pacific Earthquake Engineering Research Center (2003)."},{"key":"e_1_3_2_1_6_1","doi-asserted-by":"publisher","DOI":"10.1016\/j.amc.2014.02.051"},{"key":"e_1_3_2_1_7_1","doi-asserted-by":"publisher","DOI":"10.1111\/j.1365-246X.2006.03120.x"},{"key":"e_1_3_2_1_8_1","doi-asserted-by":"publisher","DOI":"10.1007\/s10915-005-9025-0"},{"key":"e_1_3_2_1_9_1","volume-title":"Parallel Processing and Applied Mathematics","author":"Ernst Dominik","unstructured":"Dominik Ernst , Georg Hager , Jonas Thies , and Gerhard Wellein . 2020. Performance Engineering for a Tall & Skinny Matrix Multiplication Kernels on GPUs . In Parallel Processing and Applied Mathematics . Springer , 505\u2013515. Dominik Ernst, Georg Hager, Jonas Thies, and Gerhard Wellein. 2020. Performance Engineering for a Tall & Skinny Matrix Multiplication Kernels on GPUs. In Parallel Processing and Applied Mathematics. Springer, 505\u2013515."},{"key":"e_1_3_2_1_10_1","article-title":"A Suite of Exercises for Verifying Dynamic Earthquake Rupture Codes. Seismol.l Res","volume":"89","author":"Harris A.","year":"2018","unstructured":"Ruth\u00a0 A. Harris , Michael Barall , Brad Aagaard , Shuo Ma , Daniel Roten , Kim Olsen , Benchun Duan , Dunyu Liu , Bin Luo , Kangchen Bai , Jean\u2010Paul Ampuero , Yoshihiro Kaneko , Alice\u2010Agnes Gabriel , Kenneth Duru , Thomas Ulrich , Stephanie Wollherr , Zheqiang Shi , Eric Dunham , Sam Bydlon , Zhenguo Zhang , Xiaofei Chen , Surendra\u00a0Nadh Somala , Christian Pelties , Josu\u00e9 Tago , Victor\u00a0Manuel Cruz\u2010Atienza , Jeremy Kozdon , Eric Daub , Khurram Aslam , Yuko Kase , Kyle Withers , and Luis Dalguer . 2018 . A Suite of Exercises for Verifying Dynamic Earthquake Rupture Codes. Seismol.l Res . Lett. 89 , 3 (04 2018), 1146\u20131162. Ruth\u00a0A. Harris, Michael Barall, Brad Aagaard, Shuo Ma, Daniel Roten, Kim Olsen, Benchun Duan, Dunyu Liu, Bin Luo, Kangchen Bai, Jean\u2010Paul Ampuero, Yoshihiro Kaneko, Alice\u2010Agnes Gabriel, Kenneth Duru, Thomas Ulrich, Stephanie Wollherr, Zheqiang Shi, Eric Dunham, Sam Bydlon, Zhenguo Zhang, Xiaofei Chen, Surendra\u00a0Nadh Somala, Christian Pelties, Josu\u00e9 Tago, Victor\u00a0Manuel Cruz\u2010Atienza, Jeremy Kozdon, Eric Daub, Khurram Aslam, Yuko Kase, Kyle Withers, and Luis Dalguer. 2018. A Suite of Exercises for Verifying Dynamic Earthquake Rupture Codes. Seismol.l Res. Lett. 89, 3 (04 2018), 1146\u20131162.","journal-title":"Lett."},{"key":"e_1_3_2_1_11_1","doi-asserted-by":"publisher","DOI":"10.1109\/SC.2014.6"},{"key":"e_1_3_2_1_12_1","volume-title":"SC16: Int. Conf. for HPC, Networking, Storage and Analysis. 981\u2013991","author":"Heinecke A.","unstructured":"A. Heinecke , G. Henry , M. Hutchinson , and H. Pabst . 2016. LIBXSMM: Accelerating Small Matrix Multiplications by Runtime Code Generation . In SC16: Int. Conf. for HPC, Networking, Storage and Analysis. 981\u2013991 . A. Heinecke, G. Henry, M. Hutchinson, and H. Pabst. 2016. LIBXSMM: Accelerating Small Matrix Multiplications by Runtime Code Generation. In SC16: Int. Conf. for HPC, Networking, Storage and Analysis. 981\u2013991."},{"key":"e_1_3_2_1_13_1","volume-title":"Dissecting the NVIDIA Volta GPU Architecture via Microbenchmarking. CoRR abs\/1804.06826","author":"Jia Zhe","year":"2018","unstructured":"Zhe Jia , Marco Maggioni , Benjamin Staiger , and Daniele\u00a0Paolo Scarpazza . 2018. Dissecting the NVIDIA Volta GPU Architecture via Microbenchmarking. CoRR abs\/1804.06826 ( 2018 ). arXiv preprint arXiv:1804.06826(2018). Zhe Jia, Marco Maggioni, Benjamin Staiger, and Daniele\u00a0Paolo Scarpazza. 2018. Dissecting the NVIDIA Volta GPU Architecture via Microbenchmarking. CoRR abs\/1804.06826 (2018). arXiv preprint arXiv:1804.06826(2018)."},{"key":"e_1_3_2_1_14_1","unstructured":"George Karypis and Vipin Kumar. 2009. MeTis: Unstructured Graph Partitioning and Sparse Matrix Ordering System Version 4.0. http:\/\/www.cs.umn.edu\/~metis.  George Karypis and Vipin Kumar. 2009. MeTis: Unstructured Graph Partitioning and Sparse Matrix Ordering System Version 4.0. http:\/\/www.cs.umn.edu\/~metis."},{"key":"e_1_3_2_1_15_1","doi-asserted-by":"publisher","DOI":"10.1111\/j.1365-246X.2006.03193.x"},{"key":"e_1_3_2_1_16_1","doi-asserted-by":"publisher","DOI":"10.1785\/0120060253"},{"key":"e_1_3_2_1_17_1","doi-asserted-by":"publisher","DOI":"10.1109\/IPDPSW.2018.00091"},{"key":"e_1_3_2_1_18_1","doi-asserted-by":"publisher","DOI":"10.1016\/j.cageo.2016.03.008"},{"key":"e_1_3_2_1_19_1","unstructured":"Tesla NVIDIA. 2017. NVIDIA Tesla V100 GPU Architecture.  Tesla NVIDIA. 2017. NVIDIA Tesla V100 GPU Architecture."},{"key":"e_1_3_2_1_20_1","doi-asserted-by":"publisher","DOI":"10.5555\/2388996.2389048"},{"key":"e_1_3_2_1_21_1","doi-asserted-by":"publisher","DOI":"10.1109\/IPDPS.2015.10"},{"key":"e_1_3_2_1_22_1","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1145\/3157733","article-title":"Design of a high-performance gemm-like tensor\u2013tensor multiplication","volume":"44","author":"Springer Paul","year":"2018","unstructured":"Paul Springer and Paolo Bientinesi . 2018 . Design of a high-performance gemm-like tensor\u2013tensor multiplication . ACM Trans. Math. Software 44 , 3 (2018), 1 \u2013 29 . Paul Springer and Paolo Bientinesi. 2018. Design of a high-performance gemm-like tensor\u2013tensor multiplication. ACM Trans. Math. Software 44, 3 (2018), 1\u201329.","journal-title":"ACM Trans. Math. Software"},{"key":"e_1_3_2_1_23_1","doi-asserted-by":"publisher","DOI":"10.1177\/1094342018816368"},{"key":"e_1_3_2_1_24_1","doi-asserted-by":"publisher","DOI":"10.1038\/s41467-019-09125-w"},{"key":"e_1_3_2_1_25_1","doi-asserted-by":"publisher","DOI":"10.1109\/HPCSim.2016.7568431"},{"key":"e_1_3_2_1_26_1","doi-asserted-by":"publisher","DOI":"10.1145\/3406835"},{"key":"e_1_3_2_1_27_1","doi-asserted-by":"publisher","DOI":"10.1145\/3126908.3126948"},{"key":"e_1_3_2_1_28_1","doi-asserted-by":"publisher","DOI":"10.5555\/3014904.3014906"},{"key":"e_1_3_2_1_29_1","doi-asserted-by":"publisher","DOI":"10.1029\/2018JB016355"}],"event":{"name":"HPC Asia 2021: The International Conference on High Performance Computing in Asia-Pacific Region","location":"Virtual Event Republic of Korea","acronym":"HPC Asia 2021"},"container-title":["The International Conference on High Performance Computing in Asia-Pacific Region"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3432261.3436753","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3432261.3436753","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,17]],"date-time":"2025-06-17T20:47:10Z","timestamp":1750193230000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3432261.3436753"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,1,20]]},"references-count":29,"alternative-id":["10.1145\/3432261.3436753","10.1145\/3432261"],"URL":"https:\/\/doi.org\/10.1145\/3432261.3436753","relation":{},"subject":[],"published":{"date-parts":[[2021,1,20]]},"assertion":[{"value":"2021-01-20","order":2,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}