{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,20]],"date-time":"2026-05-20T18:46:28Z","timestamp":1779302788940,"version":"3.51.4"},"reference-count":31,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"9","license":[{"start":{"date-parts":[[2021,9,1]],"date-time":"2021-09-01T00:00:00Z","timestamp":1630454400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2021,9,1]],"date-time":"2021-09-01T00:00:00Z","timestamp":1630454400000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2021,9,1]],"date-time":"2021-09-01T00:00:00Z","timestamp":1630454400000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100001659","name":"Deutsche Forschungsgemeinschaft","doi-asserted-by":"publisher","award":["315248657"],"award-info":[{"award-number":["315248657"]}],"id":[{"id":"10.13039\/501100001659","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Robert Bosch Centre for Cyber Physical Systems"},{"DOI":"10.13039\/100007780","name":"Indian Institute of Science","doi-asserted-by":"publisher","id":[{"id":"10.13039\/100007780","id-type":"DOI","asserted-by":"publisher"}]},{"name":"J. C. Bose National Fellowship"},{"DOI":"10.13039\/501100001843","name":"Science and Engineering Research Board","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100001843","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Department of Science and Technology under the Interdisciplinary Cyber Physical Systems Program"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Trans. Automat. Contr."],"published-print":{"date-parts":[[2021,9]]},"DOI":"10.1109\/tac.2020.3026269","type":"journal-article","created":{"date-parts":[[2020,9,23]],"date-time":"2020-09-23T20:24:18Z","timestamp":1600892658000},"page":"3969-3983","source":"Crossref","is-referenced-by-count":5,"title":["Asynchronous Stochastic Approximations With Asymptotically Biased Errors and Deep Multiagent Learning"],"prefix":"10.1109","volume":"66","author":[{"ORCID":"https:\/\/orcid.org\/0000-0001-7547-8111","authenticated-orcid":false,"given":"Arunselvan","family":"Ramaswamy","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7644-3914","authenticated-orcid":false,"given":"Shalabh","family":"Bhatnagar","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-4804-5481","authenticated-orcid":false,"given":"Daniel E.","family":"Quevedo","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2019.2921781"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2017\/700"},{"key":"ref10","author":"billingsley","year":"2013","journal-title":"Convergence of Probability Measures"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1007\/978-93-86279-38-5"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1137\/S0363012997331639"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1137\/S0363012995282784"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/JPROC.2018.2863026"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2018.2872607"},{"key":"ref16","author":"kushner","year":"2003","journal-title":"Stochastic Approximation and Recursive Algorithms and Applications"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1016\/j.automatica.2019.108759"},{"key":"ref18","article-title":"Deep reinforcement learning: An overview","author":"li","year":"2017"},{"key":"ref19","doi-asserted-by":"crossref","first-page":"529","DOI":"10.1038\/nature14236","article-title":"Human-level control through deep reinforcement learning","volume":"518","author":"mnih","year":"2015","journal-title":"Nature"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1214\/aoms\/1177729586"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1007\/BF02218617"},{"key":"ref27","article-title":"Optimization over time-varying networks with unbounded delays","author":"ramaswamy","year":"2019"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1137\/S0363012993253534"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1287\/moor.1060.0213"},{"key":"ref29","first-page":"1057","article-title":"Policy gradient methods for reinforcement learning with function approximation","author":"sutton","year":"0","journal-title":"Proc Int Conf Neural Inf Process"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1137\/S0363012904439301"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1016\/j.sysconle.2011.04.002"},{"key":"ref7","author":"bertsekas","year":"1996","journal-title":"Neuro-Dynamic Programming"},{"key":"ref2","volume":"264","author":"aubin","year":"2012","journal-title":"Differential Inclusions Set-Valued Maps and Viability Theory"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1080\/17442508.2018.1539086"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1137\/S0363012998346621"},{"key":"ref20","first-page":"1928","article-title":"Asynchronous methods for deep reinforcement learning","author":"mnih","year":"0","journal-title":"Proc Conf Int Conf Mach Learn"},{"key":"ref22","first-page":"1006","article-title":"Error bounds for approximate value iteration","volume":"20","author":"munos","year":"0","journal-title":"Proc Nat Conf Artif Intell"},{"key":"ref21","first-page":"560","article-title":"Error bounds for approximate policy iteration","volume":"3","author":"munos","year":"0","journal-title":"Proc 20th Int Conf Int Conf Mach Learn"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/TAC.2017.2744598"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1214\/11-SSY056"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1287\/moor.2016.0821"},{"key":"ref25","article-title":"Conditions for stability and convergence of set-valued stochastic approximations: Applications to approximate value and fixed point iterations","author":"ramaswamy","year":"2017"}],"container-title":["IEEE Transactions on Automatic Control"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9\/9524301\/09204854.pdf?arnumber=9204854","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,5,10]],"date-time":"2022-05-10T14:52:33Z","timestamp":1652194353000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9204854\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,9]]},"references-count":31,"journal-issue":{"issue":"9"},"URL":"https:\/\/doi.org\/10.1109\/tac.2020.3026269","relation":{},"ISSN":["0018-9286","1558-2523","2334-3303"],"issn-type":[{"value":"0018-9286","type":"print"},{"value":"1558-2523","type":"electronic"},{"value":"2334-3303","type":"electronic"}],"subject":[],"published":{"date-parts":[[2021,9]]}}}