{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,2]],"date-time":"2026-06-02T22:38:54Z","timestamp":1780439934187,"version":"3.54.1"},"publisher-location":"Berlin, Heidelberg","reference-count":21,"publisher":"Springer Berlin Heidelberg","isbn-type":[{"value":"9783642328190","type":"print"},{"value":"9783642328206","type":"electronic"}],"license":[{"start":{"date-parts":[[2012,1,1]],"date-time":"2012-01-01T00:00:00Z","timestamp":1325376000000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2012]]},"DOI":"10.1007\/978-3-642-32820-6_49","type":"book-chapter","created":{"date-parts":[[2012,8,23]],"date-time":"2012-08-23T12:26:25Z","timestamp":1345724785000},"page":"489-501","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":9,"title":["Hierarchical Partitioning Algorithm for Scientific Computing on Highly Heterogeneous CPU + GPU Clusters"],"prefix":"10.1007","author":[{"given":"David","family":"Clarke","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Aleksandar","family":"Ilic","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Alexey","family":"Lastovetsky","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Leonel","family":"Sousa","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","reference":[{"key":"49_CR1","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"863","DOI":"10.1007\/978-3-642-03869-3_80","volume-title":"Euro-Par 2009 Parallel Processing","author":"C. Augonnet","year":"2009","unstructured":"Augonnet, C., Thibault, S., Namyst, R., Wacrenier, P.-A.: StarPU: A Unified Platform for Task Scheduling on Heterogeneous Multicore Architectures. In: Sips, H., Epema, D., Lin, H.-X. (eds.) Euro-Par 2009. LNCS, vol.\u00a05704, pp. 863\u2013874. Springer, Heidelberg (2009)"},{"issue":"10","key":"49_CR2","doi-asserted-by":"publisher","first-page":"1033","DOI":"10.1109\/71.963416","volume":"12","author":"O. Beaumont","year":"2001","unstructured":"Beaumont, O., Boudet, V., Rastello, F., Robert, Y.: Matrix Multiplication on Heterogeneous Platforms. IEEE Trans. Parallel Distrib. Syst.\u00a012(10), 1033\u20131051 (2001)","journal-title":"IEEE Trans. Parallel Distrib. Syst."},{"issue":"5","key":"49_CR3","doi-asserted-by":"publisher","first-page":"720","DOI":"10.1145\/324133.324234","volume":"46","author":"R. Blumofe","year":"1999","unstructured":"Blumofe, R., Leiserson, C.: Scheduling multithreaded computations by work stealing. JACM\u00a046(5), 720\u2013748 (1999)","journal-title":"JACM"},{"issue":"8","key":"49_CR4","doi-asserted-by":"publisher","first-page":"655","DOI":"10.1002\/(SICI)1096-9128(199807)10:8<655::AID-CPE369>3.0.CO;2-O","volume":"10","author":"J. Choi","year":"1998","unstructured":"Choi, J.: A new parallel matrix multiplication algorithm on distributed-memory concurrent computers. Concurrency: Practice and Experience\u00a010(8), 655\u2013670 (1998)","journal-title":"Concurrency: Practice and Experience"},{"key":"49_CR5","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"450","DOI":"10.1007\/978-3-642-29737-3_50","volume-title":"Euro-Par 2011: Parallel Processing Workshops","author":"D. Clarke","year":"2012","unstructured":"Clarke, D., Lastovetsky, A., Rychkov, V.: Column-Based Matrix Partitioning for Parallel Matrix Multiplication on Heterogeneous Processors Based on Functional Performance Models. In: Alexander, M., D\u2019Ambra, P., Belloum, A., Bosilca, G., Cannataro, M., Danelutto, M., Di Martino, B., Gerndt, M., Jeannot, E., Namyst, R., Roman, J., Scott, S.L., Traff, J.L., Vall\u00e9e, G., Weidendorfer, J. (eds.) Euro-Par 2011, Part I. LNCS, vol.\u00a07155, pp. 450\u2013459. Springer, Heidelberg (2012)"},{"key":"49_CR6","first-page":"1110","volume":"arXiv","author":"J. Dongarra","year":"2011","unstructured":"Dongarra, J., Faverge, M., Herault, T., Langou, J., Robert, Y.: Hierarchical qr factorization algorithms for multi-core cluster systems. Arxiv preprint arXiv:1110.1553 (2011)","journal-title":"Arxiv preprint"},{"key":"49_CR7","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"231","DOI":"10.1007\/11549468_28","volume-title":"Euro-Par 2005 Parallel Processing","author":"M. Drozdowski","year":"2005","unstructured":"Drozdowski, M., Lawenda, M.: On Optimum Multi-installment Divisible Load Processing in Heterogeneous Distributed Systems. In: Cunha, J.C., Medeiros, P.D. (eds.) Euro-Par 2005. LNCS, vol.\u00a03648, pp. 231\u2013240. Springer, Heidelberg (2005)"},{"key":"49_CR8","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"64","DOI":"10.1007\/978-3-540-87475-1_14","volume-title":"Recent Advances in Parallel Virtual Machine and Message Passing Interface","author":"I. Galindo","year":"2008","unstructured":"Galindo, I., Almeida, F., Bad\u00eda-Contelles, J.M.: Dynamic Load Balancing on Dedicated Heterogeneous Systems. In: Lastovetsky, A., Kechadi, T., Dongarra, J. (eds.) EuroPVM\/MPI 2008. LNCS, vol.\u00a05205, pp. 64\u201374. Springer, Heidelberg (2008)"},{"key":"49_CR9","doi-asserted-by":"crossref","unstructured":"Horton, M., Tomov, S., Dongarra, J.: A class of hybrid lapack algorithms for multicore and gpu architectures. In: SAAHPC, pp. 150\u2013158 (2011)","DOI":"10.1109\/SAAHPC.2011.18"},{"key":"49_CR10","doi-asserted-by":"crossref","unstructured":"Hummel, S., Schmidt, J., Uma, R.N., Wein, J.: Load-sharing in heterogeneous systems via weighted factoring. In: SPAA 1996, pp. 318\u2013328. ACM (1996)","DOI":"10.1145\/237502.237576"},{"key":"49_CR11","doi-asserted-by":"crossref","unstructured":"Ilic, A., Sousa, L.: Collaborative execution environment for heterogeneous parallel systems. In: IPDPS Workshops and Phd Forum (IPDPSW), pp. 1\u20138 (2010)","DOI":"10.1109\/IPDPSW.2010.5470835"},{"key":"49_CR12","doi-asserted-by":"crossref","unstructured":"Ilic, A., Sousa, L.: On realistic divisible load scheduling in highly heterogeneous distributed systems. In: PDP 2012, Garching, Germany (2012)","DOI":"10.1109\/PDP.2012.56"},{"key":"49_CR13","doi-asserted-by":"crossref","unstructured":"Jacobsen, D.A., Thibault, J.C., Senocak, I.: An MPI-CUDA Implementation for Massively Parallel Incompressible Flow Computations on Multi-GPU Clusters. In: AIAA Aerospace Sciences Meeting Proceedings (2010)","DOI":"10.2514\/6.2010-522"},{"key":"49_CR14","series-title":"Lecture Notes in Computer Science","first-page":"191","volume-title":"High-Performance Computing and Networking","author":"A. Kalinov","year":"1999","unstructured":"Kalinov, A., Lastovetsky, A.: Heterogeneous Distribution of Computations while Solving Linear Algebra Problems on Networks of Heterogeneous Computers. In: Sloot, P.M.A., Hoekstra, A.G., Bubak, M., Hertzberger, B. (eds.) HPCN-Europe 1999. LNCS, vol.\u00a01593, pp. 191\u2013200. Springer, Heidelberg (1999)"},{"key":"49_CR15","doi-asserted-by":"crossref","unstructured":"Kindratenko, V.V., et al.: GPU clusters for high-performance computing. In: CLUSTER, pp. 1\u20138 (2009)","DOI":"10.1109\/CLUSTR.2009.5289128"},{"issue":"1","key":"49_CR16","doi-asserted-by":"publisher","first-page":"76","DOI":"10.1177\/1094342006074864","volume":"21","author":"A. Lastovetsky","year":"2007","unstructured":"Lastovetsky, A., Reddy, R.: Data Partitioning with a Functional Performance Model of Heterogeneous Processors. Int. J. High Perform. Comput. Appl.\u00a021(1), 76\u201390 (2007)","journal-title":"Int. J. High Perform. Comput. Appl."},{"key":"49_CR17","unstructured":"Lastovetsky, A., Reddy, R., Rychkov, V., Clarke, D.: Design and implementation of self-adaptable parallel algorithms for scientific computing on highly heterogeneous HPC platforms. Arxiv preprint arXiv:1109.3074 (2011)"},{"issue":"6","key":"49_CR18","doi-asserted-by":"publisher","first-page":"546","DOI":"10.1109\/TPDS.2004.10","volume":"15","author":"A. Legrand","year":"2004","unstructured":"Legrand, A., Renard, H., Robert, Y., Vivien, F.: Mapping and load-balancing iterative computations. IEEE Transactions on Parallel and Distributed Systems\u00a015(6), 546\u2013558 (2004)","journal-title":"IEEE Transactions on Parallel and Distributed Systems"},{"key":"49_CR19","doi-asserted-by":"crossref","unstructured":"Mart\u00ednez, J., Garz\u00f3n, E., Plaza, A., Garc\u00eda, I.: Automatic tuning of iterative computation on heterogeneous multiprocessors with ADITHE. J. Supercomput. (2009)","DOI":"10.1007\/s11227-009-0350-1"},{"key":"49_CR20","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"217","DOI":"10.1007\/978-3-642-15277-1_21","volume-title":"Euro-Par 2010 - Parallel Processing","author":"J.-N. Quintin","year":"2010","unstructured":"Quintin, J.-N., Wagner, F.: Hierarchical Work-Stealing. In: D\u2019Ambra, P., Guarracino, M., Talia, D. (eds.) Euro-Par 2010, Part I. LNCS, vol.\u00a06271, pp. 217\u2013229. Springer, Heidelberg (2010)"},{"key":"49_CR21","doi-asserted-by":"publisher","first-page":"7","DOI":"10.1023\/A:1020958815308","volume":"6","author":"B. Veeravalli","year":"2003","unstructured":"Veeravalli, B., Ghose, D., Robertazzi, T.G.: Divisible load theory: A new paradigm for load scheduling in distributed systems. Cluster Computing\u00a06, 7\u201317 (2003)","journal-title":"Cluster Computing"}],"container-title":["Lecture Notes in Computer Science","Euro-Par 2012 Parallel Processing"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-642-32820-6_49","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2020,4,20]],"date-time":"2020-04-20T00:55:04Z","timestamp":1587344104000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-642-32820-6_49"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2012]]},"ISBN":["9783642328190","9783642328206"],"references-count":21,"URL":"https:\/\/doi.org\/10.1007\/978-3-642-32820-6_49","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"value":"0302-9743","type":"print"},{"value":"1611-3349","type":"electronic"}],"subject":[],"published":{"date-parts":[[2012]]},"assertion":[{"value":"This content has been made available to all.","name":"free","label":"Free to read"}]}}