{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,4,18]],"date-time":"2025-04-18T10:07:50Z","timestamp":1744970870197},"publisher-location":"Berlin, Heidelberg","reference-count":14,"publisher":"Springer Berlin Heidelberg","isbn-type":[{"type":"print","value":"9783642396397"},{"type":"electronic","value":"9783642396403"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2013]]},"DOI":"10.1007\/978-3-642-39640-3_15","type":"book-chapter","created":{"date-parts":[[2013,6,20]],"date-time":"2013-06-20T22:25:58Z","timestamp":1371767158000},"page":"211-223","source":"Crossref","is-referenced-by-count":8,"title":["Optimization of Sparse Matrix-Vector Multiplication for CRS Format on NVIDIA Kepler Architecture GPUs"],"prefix":"10.1007","author":[{"given":"Daichi","family":"Mukunoki","sequence":"first","affiliation":[]},{"given":"Daisuke","family":"Takahashi","sequence":"additional","affiliation":[]}],"member":"297","reference":[{"key":"15_CR1","unstructured":"Baskaran, M.M., Bordawekar, R.: Optimizing Sparse Matrix-Vector Multiplication on GPUs. IBM Research Report RC24704 (2009)"},{"key":"15_CR2","unstructured":"Bell, N., Garland, M.: Efficient Sparse Matrix-Vector Multiplication on CUDA. NVIDIA Technical Report NVR-2008-004 (2008)"},{"key":"15_CR3","unstructured":"NVIDIA Corporation: Whitepaper NVIDIAs Next Generation CUDA Compute Architecture: Kepler GK110. itepaper.pdf (2012), \n                    \n                      http:\/\/www.nvidia.com\/content\/PDF\/kepler\/NVIDIA-Kepler-GK110-Architecture-Wh"},{"key":"15_CR4","unstructured":"Davis, J.D., Chung, E.S.: SpMV: A Memory-Bound Application on the GPU Stuck Between a Rock and a Hard Place. Microsoft Technical Report MSR\u2013TR\u20132012\u201395 (2012)"},{"key":"15_CR5","unstructured":"Davis, T., Hu, Y.: The University of Florida Sparse Matrix Collection, \n                    \n                      http:\/\/www.cise.ufl.edu\/research\/sparse\/matrices\/"},{"key":"15_CR6","doi-asserted-by":"publisher","first-page":"3","DOI":"10.1002\/cpe.1732","volume":"24","author":"A.H. Zein El","year":"2012","unstructured":"El Zein, A.H., Rendell, A.P.: Generating Optimal CUDA Sparse Matrix Vector Product Implementations for Evolving GPU Hardware. Concurrency and Computation: Practice and Experience\u00a024, 3\u201313 (2012)","journal-title":"Concurrency and Computation: Practice and Experience"},{"key":"15_CR7","doi-asserted-by":"crossref","unstructured":"Feng, X., Jin, H., Zheng, R., Hu, K., Zeng, J., Shao, Z.: Optimization of Sparse Matrix-Vector Multiplication with Variant CSR on GPUs. In: Proc. IEEE 17th International Conference on Parallel and Distributed Systems (ICPADS 2011), pp. 165\u2013172 (2011)","DOI":"10.1109\/ICPADS.2011.91"},{"key":"15_CR8","doi-asserted-by":"crossref","unstructured":"Guo, P., Wang, L.: Auto-Tuning CUDA Parameters for Sparse Matrix-Vector Multiplication on GPUs. In: Proc. International Conference on Computational and Information Sciences (ICCIS 2010), pp. 1154\u20131157 (2010)","DOI":"10.1109\/ICCIS.2010.285"},{"key":"15_CR9","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"547","DOI":"10.1007\/978-3-642-21887-3_42","volume-title":"Computational Science and Its Applications - ICCSA 2011","author":"Y. Kubota","year":"2011","unstructured":"Kubota, Y., Takahashi, D.: Optimization of Sparse Matrix-Vector Multiplication by Auto Selecting Storage Schemes on GPU. In: Murgante, B., Gervasi, O., Iglesias, A., Taniar, D., Apduhan, B.O. (eds.) ICCSA 2011, Part II. LNCS, vol.\u00a06783, pp. 547\u2013561. Springer, Heidelberg (2011)"},{"key":"15_CR10","doi-asserted-by":"crossref","unstructured":"Matam, K., Kothapalli, K.: Accelerating Sparse Matrix Vector Multiplication in Iterative Methods Using GPU. In: Proc. International Conference on Parallel Processing (ICPP 2011), pp. 612\u2013621 (2011)","DOI":"10.1109\/ICPP.2011.82"},{"key":"15_CR11","unstructured":"NVIDIA Corporation: cuSPARSE Library (included in CUDA Toolkit), \n                    \n                      https:\/\/developer.nvidia.com\/cusparse"},{"key":"15_CR12","doi-asserted-by":"crossref","unstructured":"Reguly, I., Giles, M.: Efficient sparse matrix-vector multiplication on cache-based GPUs. In: Proc. Innovative Parallel Computing: Foundations and Applications of GPU, Manycore, and Heterogeneous Systems (InPar 2012), pp. 1\u201312 (2012)","DOI":"10.1109\/InPar.2012.6339602"},{"key":"15_CR13","doi-asserted-by":"crossref","unstructured":"Xu, W., Zhang, H., Jiao, S., Wang, D., Song, F., Liu, Z.: Optimizing Sparse Matrix Vector Multiplication Using Cache Blocking Method on Fermi GPU. In: Proc. 13th ACIS International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel\/Distributed Computing (SNPD 2012), pp. 231\u2013235 (2012)","DOI":"10.1109\/SNPD.2012.20"},{"key":"15_CR14","doi-asserted-by":"crossref","unstructured":"Yoshizawa, H., Takahashi, D.: Automatic Tuning of Sparse Matrix-Vector Multiplication for CRS format on GPUs. In: Proc. 15th IEEE International Conference on Computational Science and Engineering (CSE 2012), pp. 130\u2013136 (2012)","DOI":"10.1109\/ICCSE.2012.28"}],"container-title":["Lecture Notes in Computer Science","Computational Science and Its Applications \u2013 ICCSA 2013"],"original-title":[],"link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-642-39640-3_15","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,5,14]],"date-time":"2019-05-14T07:58:28Z","timestamp":1557820708000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-642-39640-3_15"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2013]]},"ISBN":["9783642396397","9783642396403"],"references-count":14,"URL":"https:\/\/doi.org\/10.1007\/978-3-642-39640-3_15","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2013]]}}}