{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,1]],"date-time":"2025-11-01T09:34:58Z","timestamp":1761989698601,"version":"3.41.0"},"publisher-location":"New York, NY, USA","reference-count":33,"publisher":"ACM","license":[{"start":{"date-parts":[[2022,11,7]],"date-time":"2022-11-07T00:00:00Z","timestamp":1667779200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"funder":[{"name":"US National Science Foundation","award":["CRI-1823270"],"award-info":[{"award-number":["CRI-1823270"]}]},{"name":"US National Science Foundation","award":["CNS-1818971"],"award-info":[{"award-number":["CNS-1818971"]}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2022,11,7]]},"DOI":"10.1145\/3528535.3565247","type":"proceedings-article","created":{"date-parts":[[2022,12,20]],"date-time":"2022-12-20T13:40:01Z","timestamp":1671543601000},"page":"228-240","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":6,"title":["Slice-Tune"],"prefix":"10.1145","author":[{"given":"Aditya","family":"Dhakal","sequence":"first","affiliation":[{"name":"University of California"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"K. K.","family":"Ramakrishnan","sequence":"additional","affiliation":[{"name":"University of California"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Sameer G.","family":"Kulkarni","sequence":"additional","affiliation":[{"name":"IIT Gandhinagar"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Puneet","family":"Sharma","sequence":"additional","affiliation":[{"name":"Hewlett Packard Labs"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Junguk","family":"Cho","sequence":"additional","affiliation":[{"name":"Hewlett Packard Labs"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2022,11,8]]},"reference":[{"volume-title":"Retrieved","year":"2021","unstructured":"2021. Virtual GPU device plugin for Kubernetes. Retrieved December 10, 2021 from https:\/\/github.com\/awslabs\/aws-virtual-gpu-device-plugin.","key":"e_1_3_2_1_1_1"},{"unstructured":"2022. Alexa Amazon. Retrieved February 10 2022 from https:\/\/alexa.amazon.com\/.","key":"e_1_3_2_1_2_1"},{"unstructured":"2022. NVIDIA Docker. Retrieved February 10 2022 from https:\/\/github.com\/NVIDIA\/nvidia-docker.","key":"e_1_3_2_1_3_1"},{"volume-title":"Retrieved","year":"2022","unstructured":"2022. NVIDIA Visual Profiler User Guide. Retrieved February 10, 2022 from https:\/\/docs.nvidia.com\/pdf\/CUDA_Profiler_Users_Guide.pdf.","key":"e_1_3_2_1_4_1"},{"unstructured":"2022. Siri Apple. Retrieved January 10 2022 from https:\/\/www.apple.com\/siri\/.","key":"e_1_3_2_1_5_1"},{"key":"e_1_3_2_1_6_1","volume-title":"Retrieved","author":"Ahn Byung Hoon","year":"2019","unstructured":"Byung Hoon Ahn, Prannoy Pilligundla, and Hadi Esmaeilzadeh. 2019. Reinforcement Learning and Adaptive Sampling for Optimized DNN Compilation. arXiv preprint arXiv:1905.12799 (2019). Retrieved October 17, 2022 from https:\/\/cseweb.ucsd.edu\/~bhahn221\/doc\/paper\/icmlw19-release.pdf."},{"key":"e_1_3_2_1_7_1","volume-title":"Chameleon: Adaptive Code Optimization for Expedited Deep Neural Network Compilation. ICLR 2020, Virtual Conference (2020","author":"Ahn Byung Hoon","year":"2020","unstructured":"Byung Hoon Ahn, Prannoy Pilligundla, and Hadi Esmaeilzadeh. 2020. Chameleon: Adaptive Code Optimization for Expedited Deep Neural Network Compilation. ICLR 2020, Virtual Conference (2020). Retrieved October 17, 2022 from https:\/\/cseweb.ucsd.edu\/\/~bhahn221\/doc\/paper\/iclr20-chameleon.pdf."},{"key":"e_1_3_2_1_8_1","volume-title":"Retrieved","author":"Chen Tianqi","year":"2018","unstructured":"Tianqi Chen, Thierry Moreau, Ziheng Jiang, Lianmin Zheng, Eddie Yan, Haichen Shen, Meghan Cowan, Leyuan Wang, Yuwei Hu, Luis Ceze, et al. 2018. {TVM}: An automated end-to-end optimizing compiler for deep learning. In 13th {USENIX} Symposium on Operating Systems Design and Implementation ({OSDI} 18) Carlsbad, CA, USA. 578--594. Retrieved October 17, 2022 from https:\/\/www.usenix.org\/system\/files\/osdi18-chen.pdf."},{"key":"e_1_3_2_1_9_1","volume-title":"Retrieved","author":"Chen Tianqi","year":"2018","unstructured":"Tianqi Chen, Lianmin Zheng, Eddie Yan, Ziheng Jiang, Thierry Moreau, Luis Ceze, Carlos Guestrin, and Arvind Krishnamurthy. 2018. Learning to optimize tensor programs. In Advances in Neural Information Processing Systems. Montreal, Canada, 3389--3400. Retrieved October 17, 2022 from https:\/\/proceedings.neurips.cc\/paper\/2018\/file\/8b5700012be65c9da25f49408d959ca0-Paper.pdf."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_10_1","DOI":"10.1145\/3419111.3421285"},{"key":"e_1_3_2_1_11_1","volume-title":"Spatial Sharing of GPU for Autotuning DNN models. arXiv preprint arXiv:2008.03602","author":"Dhakal Aditya","year":"2020","unstructured":"Aditya Dhakal, Junguk Cho, Sameer G Kulkarni, KK Ramakrishnan, and Puneet Sharma. 2020. Spatial Sharing of GPU for Autotuning DNN models. arXiv preprint arXiv:2008.03602 (2020). Retrieved from https:\/\/arxiv.org\/pdf\/2008.03602.pdf."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_12_1","DOI":"10.1109\/CloudNet51028.2020.9335804"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_13_1","DOI":"10.1109\/ICNP49622.2020.9259361"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_14_1","DOI":"10.1145\/3419111.3421284"},{"key":"e_1_3_2_1_15_1","volume-title":"14th USENIX Symposium on Operating Systems Design and Implementation (OSDI 20)","author":"Gujarati Arpan","year":"2020","unstructured":"Arpan Gujarati, Reza Karimi, Safya Alzayat, Wei Hao, Antoine Kaufmann, Ymir Vigfusson, and Jonathan Mace. 2020. Serving {DNNs} like Clockwork: Performance Predictability from the Bottom Up. In 14th USENIX Symposium on Operating Systems Design and Implementation (OSDI 20). 443--462. Retrieved October 17, 2022 from https:\/\/www.usenix.org\/system\/files\/osdi20-gujarati.pdf."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_16_1","DOI":"10.1145\/3472883.3486993"},{"key":"e_1_3_2_1_17_1","volume-title":"The Architectural Implications of Distributed Reinforcement Learning on CPU-GPU Systems. arXiv preprint arXiv:2012.04210","author":"Inci Ahmet","year":"2020","unstructured":"Ahmet Inci, Evgeny Bolotin, Yaosheng Fu, Gal Dalal, Shie Mannor, David Nellans, and Diana Marculescu. 2020. The Architectural Implications of Distributed Reinforcement Learning on CPU-GPU Systems. arXiv preprint arXiv:2012.04210 (2020). arXiv:2012.04210 [cs.LG] Retrieved from https:\/\/arxiv.org\/pdf\/2012.04210.pdf."},{"key":"e_1_3_2_1_18_1","volume-title":"Alexey Tumanov, Joseph Gonzalez, and Ion Stoica.","author":"Jain Paras","year":"2018","unstructured":"Paras Jain, Xiangxi Mo, Ajay Jain, Harikaran Subbaraj, Rehan Sohail Durrani, Alexey Tumanov, Joseph Gonzalez, and Ion Stoica. 2018. Dynamic Space-Time Scheduling for GPU Inference. arXiv preprint arXiv:1901.00041 (2018). Retrieved from https:\/\/arxiv.org\/pdf\/1901.00041.pdf."},{"key":"e_1_3_2_1_19_1","volume-title":"AdaTune: Adaptive Tensor Program Compilation Made Efficient. In 34th Conference on Neural Information Processing Systems (NeurIPS 2020)","author":"Li Menghao","year":"2020","unstructured":"Menghao Li, Minjia Zhang, Chi Wang, and Mingqin Li. 2020. AdaTune: Adaptive Tensor Program Compilation Made Efficient. In 34th Conference on Neural Information Processing Systems (NeurIPS 2020) (Virtual Event). Retrieved October 17, 2022 from https:\/\/proceedings.neurips.cc\/paper\/2020\/file\/a9b7ba70783b617e9998dc4dd82eb3c5-Paper.pdf."},{"key":"e_1_3_2_1_20_1","volume-title":"Retrieved","author":"Liu Yizhi","year":"2019","unstructured":"Yizhi Liu, Yao Wang, Ruofei Yu, Mu Li, Vin Sharma, and Yida Wang. 2019. Optimizing {CNN} Model Inference on CPUs. In 2019 {USENIX} Annual Technical Conference ({USENIX}{ATC} 19). Renton, WA, USA, 1025--1040. Retrieved October 17, 2022 from https:\/\/www.usenix.org\/system\/files\/atc19-liu-yizhi.pdf."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_21_1","DOI":"10.1109\/DAC18072.2020.9218700"},{"key":"e_1_3_2_1_22_1","volume-title":"Retrieved","author":"NVIDIA.","year":"2021","unstructured":"NVIDIA. 2021. NVIDIA Tesla V100 GPU Architecture. Retrieved October 17, 2022 from https:\/\/images.nvidia.com\/content\/volta-architecture\/pdf\/volta-architecture-whitepaper.pdf."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_23_1","DOI":"10.1109\/RTAS54340.2022.00020"},{"key":"e_1_3_2_1_24_1","volume-title":"2021 USENIX Annual Technical Conference (USENIX ATC 21)","author":"Romero Francisco","year":"2021","unstructured":"Francisco Romero, Qian Li, Neeraja J Yadwadkar, and Christos Kozyrakis. 2021. {INFaaS}: Automated Model-less Inference Serving. In 2021 USENIX Annual Technical Conference (USENIX ATC 21). Virtual Event, 397--411. Retrieved October 17, 2022 from https:\/\/www.usenix.org\/system\/files\/atc21-romero.pdf."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_25_1","DOI":"10.1145\/3472883.3486972"},{"key":"e_1_3_2_1_26_1","volume-title":"Retrieved","author":"Rotem Nadav","year":"2018","unstructured":"Nadav Rotem, Jordan Fix, Saleem Abdulrasool, Garret Catron, Summer Deng, Roman Dzhabarov, Nick Gibson, James Hegeman, Meghan Lele, Roman Levenstein, et al. 2018. Glow: Graph lowering compiler techniques for neural networks. arXiv preprint arXiv:1805.00907 (2018). Retrieved October 17, 2022 from https:\/\/arxiv.org\/pdf\/1805.00907."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_27_1","DOI":"10.1145\/3341301.3359658"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_28_1","DOI":"10.1109\/CVPRW.2018.00101"},{"key":"e_1_3_2_1_29_1","volume-title":"Simulating Execution Time of Tensor Programs using Graph Neural Networks. arXiv preprint arXiv:1904.11876","author":"Tomczak Jakub M","year":"2019","unstructured":"Jakub M Tomczak, Romain Lepert, and Auke Wiggers. 2019. Simulating Execution Time of Tensor Programs using Graph Neural Networks. arXiv preprint arXiv:1904.11876 (2019). Retrieved from https:\/\/arxiv.org\/pdf\/1904.11876."},{"key":"e_1_3_2_1_30_1","volume-title":"Tensor comprehensions: Framework-agnostic high-performance machine learning abstractions. arXiv preprint arXiv:1802.04730","author":"Vasilache Nicolas","year":"2018","unstructured":"Nicolas Vasilache, Oleksandr Zinenko, Theodoros Theodoridis, Priya Goyal, Zachary DeVito, William S Moses, Sven Verdoolaege, Andrew Adams, and Albert Cohen. 2018. Tensor comprehensions: Framework-agnostic high-performance machine learning abstractions. arXiv preprint arXiv:1802.04730 (2018). Retrieved from https:\/\/arxiv.org\/pdf\/1802.04730."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_31_1","DOI":"10.1109\/TC.2021.3064352"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_32_1","DOI":"10.1145\/3330345.3330351"},{"key":"e_1_3_2_1_33_1","volume-title":"Retrieved","author":"Zheng Lianmin","year":"2020","unstructured":"Lianmin Zheng, Chengfan Jia, Minmin Sun, Zhao Wu, Cody Hao Yu, Ameer Haj-Ali, Yida Wang, Jun Yang, Danyang Zhuo, Koushik Sen, et al. 2020. Ansor: Generating high-performance tensor programs for deep learning. In 14th {USENIX} Symposium on Operating Systems Design and Implementation ({OSDI} 20). Virtual Event, 863--879. Retrieved October 17, 2022 from https:\/\/www.usenix.org\/system\/files\/osdi20-zheng.pdf."}],"event":{"sponsor":["ACM Association for Computing Machinery","IFIP"],"acronym":"Middleware '22","name":"Middleware '22: 23rd International Middleware Conference","location":"Quebec QC Canada"},"container-title":["Proceedings of the 23rd ACM\/IFIP International Middleware Conference"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3528535.3565247","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3528535.3565247","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,17]],"date-time":"2025-06-17T19:02:43Z","timestamp":1750186963000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3528535.3565247"}},"subtitle":["a system for high performance DNN autotuning"],"short-title":[],"issued":{"date-parts":[[2022,11,7]]},"references-count":33,"alternative-id":["10.1145\/3528535.3565247","10.1145\/3528535"],"URL":"https:\/\/doi.org\/10.1145\/3528535.3565247","relation":{},"subject":[],"published":{"date-parts":[[2022,11,7]]},"assertion":[{"value":"2022-11-08","order":2,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}