{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,13]],"date-time":"2026-02-13T05:36:17Z","timestamp":1770960977191,"version":"3.50.1"},"reference-count":32,"publisher":"IEEE","license":[{"start":{"date-parts":[[2019,7,1]],"date-time":"2019-07-01T00:00:00Z","timestamp":1561939200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2019,7,1]],"date-time":"2019-07-01T00:00:00Z","timestamp":1561939200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2019,7]]},"DOI":"10.23919\/acc.2019.8814892","type":"proceedings-article","created":{"date-parts":[[2019,11,25]],"date-time":"2019-11-25T18:42:46Z","timestamp":1574707366000},"page":"4159-4166","source":"Crossref","is-referenced-by-count":14,"title":["Distributed Reinforcement Learning with ADMM-RL"],"prefix":"10.23919","author":[{"given":"Peter","family":"Graf","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jennifer","family":"Annoni","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Christopher","family":"Bay","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Dave","family":"Biagioni","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Devon","family":"Sigler","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Monte","family":"Lunacek","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Wesley","family":"Jones","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"crossref","DOI":"10.1109\/TNN.1998.712192","volume-title":"Introduction to Reinforcement Learning","author":"Sutton","year":"1998"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1038\/nature16961"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1561\/2200000016"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1145\/2783258.2783313"},{"key":"ref5","volume-title":"Decomposing linearly constrained nonconvex problems by a proximal primal dual approach: Algorithms, convergence, and applications","author":"Hong","year":"2016"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/TAC.2013.2257618"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.23919\/ACC.2018.8430751"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/TPWRS.2014.2306495"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/TSG.2013.2248175"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/CDC.2018.8619839"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/TSG.2017.2662639"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/TSG.2016.2536740"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/TSG.2017.2701821"},{"key":"ref14","volume-title":"Online optimization with feedback","author":"Bernstein","year":"2018"},{"key":"ref15","volume-title":"Online optimization as a feedback controller: Stability and tracking","author":"Colombino","year":"2018"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1002\/we.1822"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1016\/j.ifacol.2017.08.380"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.23919\/ACC.2017.7962923"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/TSG.2016.2544882"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1002\/tee.22549"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/ENERGYCON.2016.7513964"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/ISGTEurope.2013.6695317"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1017\/jfm.2016.595"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1002\/0470846062"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.5194\/wes-3-819-2018"},{"key":"ref26","volume-title":"Dynamic Programming","author":"Bellman","year":"2003"},{"key":"ref27","volume-title":"Simple random search provides a competitive approach to reinforcement learning","author":"Mania"},{"key":"ref28","volume-title":"Openai gym","year":"2018"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1561\/2200000016"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1587\/transfun.E101.A.623"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1007\/BFb0120845"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1007\/BF01581204"}],"event":{"name":"2019 American Control Conference (ACC)","location":"Philadelphia, PA, USA","start":{"date-parts":[[2019,7,10]]},"end":{"date-parts":[[2019,7,12]]}},"container-title":["2019 American Control Conference (ACC)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8789884\/8814292\/08814892.pdf?arnumber=8814892","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,8,21]],"date-time":"2025-08-21T18:20:01Z","timestamp":1755800401000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8814892\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2019,7]]},"references-count":32,"URL":"https:\/\/doi.org\/10.23919\/acc.2019.8814892","relation":{},"subject":[],"published":{"date-parts":[[2019,7]]}}}