{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,3,27]],"date-time":"2025-03-27T16:32:21Z","timestamp":1743093141134,"version":"3.40.3"},"publisher-location":"Cham","reference-count":16,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783319075174"},{"type":"electronic","value":"9783319075181"}],"license":[{"start":{"date-parts":[[2014,1,1]],"date-time":"2014-01-01T00:00:00Z","timestamp":1388534400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2014,1,1]],"date-time":"2014-01-01T00:00:00Z","timestamp":1388534400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2014]]},"DOI":"10.1007\/978-3-319-07518-1_26","type":"book-chapter","created":{"date-parts":[[2014,6,3]],"date-time":"2014-06-03T06:54:08Z","timestamp":1401778448000},"page":"410-419","source":"Crossref","is-referenced-by-count":2,"title":["Exploiting SIMD and Thread-Level Parallelism in Multiblock CFD"],"prefix":"10.1007","author":[{"given":"Ioan","family":"Hadade","sequence":"first","affiliation":[]},{"given":"Luca","family":"di Mare","sequence":"additional","affiliation":[]}],"member":"297","reference":[{"key":"26_CR1","doi-asserted-by":"crossref","unstructured":"Williams, S., Oliker, L., Carter, J., Shalf, J.: Extracting ultra-scale lattice boltzmann performance via hierarchical and distributed auto-tuning. In: Proceedings of 2011 International Conference for High Performance Computing, Networking, Storage and Analysis, SC 2011, pp. 55:1\u201355:12. ACM, New York (2011)","DOI":"10.1145\/2063384.2063458"},{"key":"26_CR2","doi-asserted-by":"crossref","unstructured":"Pennycook, S.J., Hughes, C.J., Smelyanskiy, M., Jarvis, S.: Exploring simd for molecular dynamics, using intel xeon processors and intel xeon phi coprocessors. In: Parallel and Distributed Processing Symposium, International, pp. 1085\u20131097 (2013)","DOI":"10.1109\/IPDPS.2013.44"},{"key":"26_CR3","doi-asserted-by":"crossref","unstructured":"Smith, M.R., Liu, J.Y., Kuo, F.A., Wu, J.S.: Hybrid openmp\/avx acceleration of a higher order quiet direct simulation method for the euler equations. Procedia Engineering\u00a061, 152\u2013157 (2013), 25th International Conference on Parallel Computational Fluid Dynamics","DOI":"10.1016\/j.proeng.2013.07.108"},{"key":"26_CR4","unstructured":"Abel, J., Balasubramanian, K., Bargeron, M., Craver, T., Phlipot, M.: Application tuning for streaming simd extensions. Intel Technology Journal, 1\u201312 (2009)"},{"key":"26_CR5","doi-asserted-by":"crossref","unstructured":"Gepner, P., Gamayunov, V., Fraser, D.L.: Early performance evaluation of avx for hpc. Procedia Computer Science\u00a04, 452\u2013460 (2011), Proceedings of the International Conference on Computational Science, ICCS 2011","DOI":"10.1016\/j.procs.2011.04.047"},{"key":"26_CR6","unstructured":"Piazza, T., Jiang, H., Hammarlund, P., Singhal, R.: Technology insight: Intel(r) next generation microarchitecture code name haswell. Technical report, Intel Corporation (2012)"},{"key":"26_CR7","unstructured":"Zone, I.D.: Intel(r) xeon phi, \n                      http:\/\/software.intel.com\/en-us\/articles\/intel-xeon-phi-coprocessor-vector-microarchitecture\n                     (accessed January 3, 2014)"},{"key":"26_CR8","unstructured":"Zone, I.D.: Avx-512 instructions, \n                      http:\/\/software.intel.com\/en-us\/blogs\/2013\/avx-512-instructions\n                     (accessed April 3, 2014)"},{"key":"26_CR9","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"225","DOI":"10.1007\/978-3-642-19861-8_13","volume-title":"Compiler Construction","author":"T. Henretty","year":"2011","unstructured":"Henretty, T., Stock, K., Pouchet, L.-N., Franchetti, F., Ramanujam, J., Sadayappan, P.: Data layout transformation for stencil computations on short-vector SIMD architectures. In: Knoop, J. (ed.) CC 2011. LNCS, vol.\u00a06601, pp. 225\u2013245. Springer, Heidelberg (2011)"},{"key":"26_CR10","doi-asserted-by":"crossref","unstructured":"Wang, Y., Baboulin, M., Dongarra, J., Falcou, J., Fraigneau, Y., Ma\u00eetre, O.L.: A parallel solver for incompressible fluid flows. Procedia Computer Science\u00a018, 439\u2013448 (2013)","DOI":"10.1016\/j.procs.2013.05.207"},{"key":"26_CR11","volume-title":"Aero-Thermodynamics and Flow in Turbomachines","author":"M. Vavra","year":"1960","unstructured":"Vavra, M.: Aero-Thermodynamics and Flow in Turbomachines. John Wiley, Los Alamitos (1960)"},{"key":"26_CR12","doi-asserted-by":"publisher","first-page":"95","DOI":"10.1007\/978-3-642-60543-7_6","volume-title":"Upwind and High-Resolution Schemes","author":"G. Albada","year":"1997","unstructured":"Albada, G., Leer, B., Roberts Jr., W.W.: A comparative study of computational methods in cosmic gas dynamics. In: Hussaini, M., Leer, B., Rosendale, J. (eds.) Upwind and High-Resolution Schemes, pp. 95\u2013103. Springer, Heidelberg (1997)"},{"issue":"2","key":"26_CR13","doi-asserted-by":"publisher","first-page":"357","DOI":"10.1016\/0021-9991(81)90128-5","volume":"43","author":"P. Roe","year":"1981","unstructured":"Roe, P.: Approximate riemann solvers, parameter vectors, and difference schemes. Journal of Computational Physics\u00a043(2), 357\u2013372 (1981)","journal-title":"Journal of Computational Physics"},{"key":"26_CR14","unstructured":"Grasso, F., Meola, C.: Handbook of Computational Fluid Mechanics. Academic Press, London (1996)"},{"issue":"4","key":"26_CR15","doi-asserted-by":"publisher","first-page":"65","DOI":"10.1145\/1498765.1498785","volume":"52","author":"S. Williams","year":"2009","unstructured":"Williams, S., Waterman, A., Patterson, D.: Roofline: An insightful visual performance model for multicore architectures. Commun. ACM\u00a052(4), 65\u201376 (2009)","journal-title":"Commun. ACM"},{"key":"26_CR16","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"615","DOI":"10.1007\/978-3-642-14390-8_64","volume-title":"Parallel Processing and Applied Mathematics","author":"J. Treibig","year":"2010","unstructured":"Treibig, J., Hager, G.: Introducing a performance model for bandwidth-limited loop kernels. In: Wyrzykowski, R., Dongarra, J., Karczewski, K., Wasniewski, J. (eds.) PPAM 2009, Part I. LNCS, vol.\u00a06067, pp. 615\u2013624. Springer, Heidelberg (2010)"}],"container-title":["Lecture Notes in Computer Science","Supercomputing"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-319-07518-1_26","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2021,12,17]],"date-time":"2021-12-17T09:19:12Z","timestamp":1639732752000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-319-07518-1_26"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2014]]},"ISBN":["9783319075174","9783319075181"],"references-count":16,"URL":"https:\/\/doi.org\/10.1007\/978-3-319-07518-1_26","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2014]]}}}