{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,6,19]],"date-time":"2025-06-19T04:49:31Z","timestamp":1750308571898,"version":"3.41.0"},"publisher-location":"New York, NY, USA","reference-count":41,"publisher":"ACM","license":[{"start":{"date-parts":[[2016,2,29]],"date-time":"2016-02-29T00:00:00Z","timestamp":1456704000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.acm.org\/publications\/policies\/copyright_policy#Background"}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2016,2,29]]},"DOI":"10.1145\/2854038.2854040","type":"proceedings-article","created":{"date-parts":[[2016,3,1]],"date-time":"2016-03-01T15:33:04Z","timestamp":1456846384000},"page":"82-93","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":24,"title":["Portable and transparent software managed scheduling on accelerators for fair resource sharing"],"prefix":"10.1145","author":[{"given":"Christos","family":"Margiolas","sequence":"first","affiliation":[{"name":"University of Edinburgh, UK"}]},{"given":"Michael F. P.","family":"O'Boyle","sequence":"additional","affiliation":[{"name":"University of Edinburgh, UK"}]}],"member":"320","published-online":{"date-parts":[[2016,2,29]]},"reference":[{"key":"e_1_3_2_1_1_1","doi-asserted-by":"publisher","DOI":"10.1109\/HPCA.2012.6168946"},{"key":"e_1_3_2_1_2_1","volume-title":"Opencl programming guide revision 2.7","author":"MD.","year":"2013","unstructured":"A MD. Accelerated parallel processing : Opencl programming guide revision 2.7 , 2013 . AMD. Accelerated parallel processing: Opencl programming guide revision 2.7, 2013."},{"key":"e_1_3_2_1_3_1","doi-asserted-by":"publisher","DOI":"10.1145\/2581122.2544165"},{"key":"e_1_3_2_1_4_1","doi-asserted-by":"publisher","DOI":"10.1145\/2287076.2287090"},{"key":"e_1_3_2_1_5_1","unstructured":"N. Brunie etal Simultaneous branch and warp interweaving for sustained gpu performance. ISCA \u201912.   N. Brunie et al. Simultaneous branch and warp interweaving for sustained gpu performance. ISCA \u201912."},{"key":"e_1_3_2_1_6_1","doi-asserted-by":"publisher","DOI":"10.1109\/MM.2004.37"},{"key":"e_1_3_2_1_7_1","doi-asserted-by":"publisher","DOI":"10.1109\/IPDPS.2013.95"},{"key":"e_1_3_2_1_8_1","unstructured":"J. Duato etal rcuda: Reducing the number of gpu-based accelerators in high performance clusters. HPCS \u201910.  J. Duato et al. rcuda: Reducing the number of gpu-based accelerators in high performance clusters. HPCS \u201910."},{"key":"e_1_3_2_1_9_1","doi-asserted-by":"publisher","DOI":"10.1145\/1736020.1736058"},{"key":"e_1_3_2_1_10_1","doi-asserted-by":"publisher","DOI":"10.1109\/MM.2008.44"},{"key":"e_1_3_2_1_11_1","doi-asserted-by":"publisher","DOI":"10.1145\/1736020.1736033"},{"key":"e_1_3_2_1_12_1","doi-asserted-by":"publisher","DOI":"10.1109\/MICRO.2007.12"},{"key":"e_1_3_2_1_13_1","doi-asserted-by":"publisher","DOI":"10.1109\/MICRO.2006.25"},{"key":"e_1_3_2_1_14_1","unstructured":"A. Ghodsi etal Dominant resource fairness: Fair allocation of multiple resource types. NSDI \u201911.   A. Ghodsi et al. Dominant resource fairness: Fair allocation of multiple resource types. NSDI \u201911."},{"volume-title":"Workshop on Programming Models for Emerging Architectures \u201909","author":"Guevara M.","key":"e_1_3_2_1_15_1","unstructured":"M. Guevara Enabling task parallelism in the cuda scheduler . In Workshop on Programming Models for Emerging Architectures \u201909 . M. Guevara et al. Enabling task parallelism in the cuda scheduler. In Workshop on Programming Models for Emerging Architectures \u201909."},{"key":"e_1_3_2_1_16_1","doi-asserted-by":"publisher","DOI":"10.1145\/2464996.2479870"},{"key":"e_1_3_2_1_17_1","unstructured":"R. Jain etal A quantitative measure of fairness and discrimination for resource allocation in shared computer systems.  R. Jain et al. A quantitative measure of fairness and discrimination for resource allocation in shared computer systems."},{"key":"e_1_3_2_1_18_1","unstructured":"Q. Jiao etal Improving gpgpu energy-efficiency through concurrent kernel execution and dvfs. CGO \u201915.   Q. Jiao et al. Improving gpgpu energy-efficiency through concurrent kernel execution and dvfs. CGO \u201915."},{"key":"e_1_3_2_1_19_1","doi-asserted-by":"publisher","DOI":"10.1145\/2451116.2451158"},{"key":"e_1_3_2_1_20_1","unstructured":"S. Kato etal Timegraph: Gpu scheduling for real-time multitasking environments. USENIX ATC \u201911.   S. Kato et al. Timegraph: Gpu scheduling for real-time multitasking environments. USENIX ATC \u201911."},{"key":"e_1_3_2_1_21_1","unstructured":"Khronos Group. The opencl specification version 1.2 \u201911.  Khronos Group. The opencl specification version 1.2 \u201911."},{"key":"e_1_3_2_1_22_1","unstructured":"Khronos Group. Spir (standard portable intermediate representation) version 1.2 \u201912.  Khronos Group. Spir (standard portable intermediate representation) version 1.2 \u201912."},{"key":"e_1_3_2_1_23_1","unstructured":"C. Lattner etal Llvm: A compilation framework for lifelong program analysis & transformation. CGO \u2019\u201904.   C. Lattner et al. Llvm: A compilation framework for lifelong program analysis & transformation. CGO \u2019\u201904."},{"key":"e_1_3_2_1_24_1","unstructured":"J. Lee etal Transparent cpu-gpu collaboration for dataparallel kernels on heterogeneous systems. PACT \u201913.   J. Lee et al. Transparent cpu-gpu collaboration for dataparallel kernels on heterogeneous systems. PACT \u201913."},{"key":"e_1_3_2_1_25_1","unstructured":"M. Lee etal Improving gpgpu resource utilization through alternative thread block scheduling. HPCA \u201914.  M. Lee et al. Improving gpgpu resource utilization through alternative thread block scheduling. HPCA \u201914."},{"key":"e_1_3_2_1_26_1","doi-asserted-by":"publisher","DOI":"10.1145\/2751205.2751217"},{"key":"e_1_3_2_1_27_1","doi-asserted-by":"publisher","DOI":"10.1145\/2541940.2541963"},{"key":"e_1_3_2_1_28_1","doi-asserted-by":"publisher","DOI":"10.1109\/MICRO.2007.40"},{"key":"e_1_3_2_1_29_1","doi-asserted-by":"publisher","DOI":"10.1145\/2155620.2155656"},{"key":"e_1_3_2_1_30_1","volume-title":"Nvidia kepler gk110 architecture","author":"NVIDIA.","year":"2012","unstructured":"NVIDIA. Nvidia kepler gk110 architecture , 2012 . NVIDIA. Nvidia kepler gk110 architecture, 2012."},{"key":"e_1_3_2_1_31_1","doi-asserted-by":"publisher","DOI":"10.1145\/2451116.2451160"},{"key":"e_1_3_2_1_32_1","doi-asserted-by":"publisher","DOI":"10.1145\/2451116.2451162"},{"key":"e_1_3_2_1_33_1","doi-asserted-by":"publisher","DOI":"10.1109\/MICRO.2012.16"},{"key":"e_1_3_2_1_34_1","doi-asserted-by":"publisher","DOI":"10.1145\/2043556.2043579"},{"key":"e_1_3_2_1_35_1","doi-asserted-by":"publisher","DOI":"10.1145\/2465829.2465830"},{"key":"e_1_3_2_1_36_1","doi-asserted-by":"publisher","DOI":"10.1145\/356989.357011"},{"key":"e_1_3_2_1_37_1","volume-title":"Parboil: A revised benchmark suite for scientific and commercial throughput computing","author":"Stratton J. A.","year":"2012","unstructured":"J. A. Stratton Parboil: A revised benchmark suite for scientific and commercial throughput computing . Center for Reliable and High-Performance Computing , 2012 . J. A. Stratton et al. Parboil: A revised benchmark suite for scientific and commercial throughput computing. Center for Reliable and High-Performance Computing, 2012."},{"key":"e_1_3_2_1_38_1","doi-asserted-by":"publisher","DOI":"10.1145\/74851.74866"},{"key":"e_1_3_2_1_39_1","doi-asserted-by":"publisher","DOI":"10.1109\/TPDS.2013.257"},{"key":"e_1_3_2_1_40_1","unstructured":"H. Zhou etal Gpes: a preemptive execution system for gpgpu computing. RTAS \u201915.  H. Zhou et al. Gpes: a preemptive execution system for gpgpu computing. RTAS \u201915."},{"key":"e_1_3_2_1_41_1","doi-asserted-by":"publisher","DOI":"10.1145\/1736020.1736036"}],"event":{"name":"CGO '16: 14th Annual IEEE\/ACM International Symposium on Code Generation and Optimization","sponsor":["SIGPLAN ACM Special Interest Group on Programming Languages","SIGMICRO ACM Special Interest Group on Microarchitectural Research and Processing","IEEE-CS Computer Society"],"location":"Barcelona Spain","acronym":"CGO '16"},"container-title":["Proceedings of the 2016 International Symposium on Code Generation and Optimization"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/2854038.2854040","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/2854038.2854040","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,18]],"date-time":"2025-06-18T19:04:30Z","timestamp":1750273470000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/2854038.2854040"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2016,2,29]]},"references-count":41,"alternative-id":["10.1145\/2854038.2854040","10.1145\/2854038"],"URL":"https:\/\/doi.org\/10.1145\/2854038.2854040","relation":{},"subject":[],"published":{"date-parts":[[2016,2,29]]},"assertion":[{"value":"2016-02-29","order":2,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}