{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,20]],"date-time":"2026-05-20T16:28:12Z","timestamp":1779294492314,"version":"3.51.4"},"reference-count":42,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"8","license":[{"start":{"date-parts":[[2022,8,1]],"date-time":"2022-08-01T00:00:00Z","timestamp":1659312000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2022,8,1]],"date-time":"2022-08-01T00:00:00Z","timestamp":1659312000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2022,8,1]],"date-time":"2022-08-01T00:00:00Z","timestamp":1659312000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"name":"Department of Science and Technology (DST), Government of India"},{"name":"TCS Research Scholarship"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Trans. Intell. Transport. Syst."],"published-print":{"date-parts":[[2022,8]]},"DOI":"10.1109\/tits.2021.3096998","type":"journal-article","created":{"date-parts":[[2021,7,27]],"date-time":"2021-07-27T20:28:05Z","timestamp":1627417685000},"page":"10902-10911","source":"Crossref","is-referenced-by-count":43,"title":["Hierarchical Program-Triggered Reinforcement Learning Agents for Automated Driving"],"prefix":"10.1109","volume":"23","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-6488-9326","authenticated-orcid":false,"given":"Briti","family":"Gangopadhyay","sequence":"first","affiliation":[{"name":"Department of Computer Science and Engineering, IIT Kharagpur, Kharagpur, India"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Harshit","family":"Soora","sequence":"additional","affiliation":[{"name":"Department of Computer Science and Engineering, IIT Kharagpur, Kharagpur, India"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-2178-8154","authenticated-orcid":false,"given":"Pallab","family":"Dasgupta","sequence":"additional","affiliation":[{"name":"Department of Computer Science and Engineering, IIT Kharagpur, Kharagpur, India"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1016\/j.trc.2015.09.011"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1002\/rob.20258"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2010.2046037"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1016\/j.engappai.2013.02.001"},{"key":"ref5","first-page":"305","article-title":"ALVINN: An autonomous land vehicle in a neural network","volume-title":"Advances in Neural Information Processing Systems","author":"Pomerleau","year":"1989"},{"key":"ref6","article-title":"End to end learning for self-driving cars","author":"Bojarski","year":"2016","journal-title":"arXiv:1604.07316"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/TKDE.2019.2903036"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1038\/nature16961"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/IVS.2018.8500630"},{"key":"ref10","first-page":"1928","article-title":"Asynchronous methods for deep reinforcement learning","volume-title":"Proc. 33rd Int. Conf. Mach. Learn.","author":"Mnih"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/TNNLS.2020.3026621"},{"key":"ref12","first-page":"1","article-title":"Safe, multi-agent, reinforcement learning for autonomous driving","volume-title":"Proc. NIPS Workshop Learn. Inference Control Multi-Agent Syst","author":"Shalev-Shwartz"},{"key":"ref13","article-title":"On a formal model of safe and scalable self-driving cars","author":"Shalev-Shwartz","year":"2017","journal-title":"arXiv:1708.06374"},{"key":"ref14","first-page":"1","article-title":"CARLA: An open urban driving simulator","volume-title":"Proc. 1st Annu. Conf. Robot Learn.","author":"Dosovitskiy"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-96145-3_33"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1108\/JICV-01-2018-0003"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/CVPRW.2017.64"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.2352\/ISSN.2470-1173.2017.19.AVM-023"},{"key":"ref19","article-title":"Tactical decision making for lane changing with deep reinforcement learning","volume-title":"Proc. NIPS Workshop Mach. Learn. Intell. Transp. Syst.","author":"Mukadam"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2019.8793742"},{"key":"ref21","first-page":"3682","article-title":"Hierarchical deep reinforcement learning: Integrating temporal abstraction and intrinsic motivation","volume-title":"Proc. 30th Int. Conf. Neural Inf. Process. Syst. (NIPS)","author":"Tejas Kulkarni"},{"key":"ref22","article-title":"Towards practical hierarchical reinforcement learning for multi-lane autonomous driving","volume-title":"Proc. NIPS MLITS Workshop","author":"Nosrati"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1049\/iet-its.2019.0317"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/CVPRW.2019.00172"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/ITSC.2018.8569612"},{"key":"ref26","article-title":"Concrete problems in AI safety","author":"Amodei","year":"2016","journal-title":"arXiv:1606.06565"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v33i01.33012970"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/IV47402.2020.9304735"},{"key":"ref29","article-title":"Program guided agent","volume-title":"Proc. Int. Conf. Learn. Represent.","author":"Sun"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1023\/A:1022140919877"},{"key":"ref31","volume-title":"Hierarchical-Program-Triggered-RL (Simulation Videos)"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1145\/3359986.3361203"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/ICCPS48487.2020.00012"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1109\/SFCS.1977.32"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1007\/10722167_21"},{"key":"ref36","volume-title":"Principles of Model Checking","author":"Baier","year":"2008"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.3390\/app9112335"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1016\/S0065-2458(05)65002-4"},{"key":"ref39","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-662-46681-0_61"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1007\/3-540-45657-0_29"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01234-2_36"},{"key":"ref42","volume-title":"Hierarchical-Program-Triggered-RL (Code Distribution and Videos)"}],"container-title":["IEEE Transactions on Intelligent Transportation Systems"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/6979\/9853713\/09497870.pdf?arnumber=9497870","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,1,11]],"date-time":"2024-01-11T22:38:01Z","timestamp":1705012681000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9497870\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,8]]},"references-count":42,"journal-issue":{"issue":"8"},"URL":"https:\/\/doi.org\/10.1109\/tits.2021.3096998","relation":{},"ISSN":["1524-9050","1558-0016"],"issn-type":[{"value":"1524-9050","type":"print"},{"value":"1558-0016","type":"electronic"}],"subject":[],"published":{"date-parts":[[2022,8]]}}}