{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,3]],"date-time":"2026-06-03T14:30:10Z","timestamp":1780497010216,"version":"3.54.1"},"reference-count":28,"publisher":"Society for Industrial & Applied Mathematics (SIAM)","issue":"4","funder":[{"DOI":"10.13039\/100000001","name":"National Science Foundation","doi-asserted-by":"publisher","award":["EPCN-2144316"],"award-info":[{"award-number":["EPCN-2144316"]}],"id":[{"id":"10.13039\/100000001","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/100000001","name":"National Science Foundation","doi-asserted-by":"publisher","award":["CPS-2240982"],"award-info":[{"award-number":["CPS-2240982"]}],"id":[{"id":"10.13039\/100000001","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/100000001","name":"National Science Foundation","doi-asserted-by":"publisher","award":["CMMI-2112533"],"award-info":[{"award-number":["CMMI-2112533"]}],"id":[{"id":"10.13039\/100000001","id-type":"DOI","asserted-by":"publisher"}]},{"name":"RTX"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["SIAM Journal on Mathematics of Data Science"],"published-print":{"date-parts":[[2023,12,31]]},"DOI":"10.1137\/22m1499261","type":"journal-article","created":{"date-parts":[[2023,12,7]],"date-time":"2023-12-07T11:56:25Z","timestamp":1701950185000},"page":"1078-1101","source":"Crossref","is-referenced-by-count":4,"title":["Target Network and Truncation Overcome the Deadly Triad in \\(\\boldsymbol{Q}\\)-Learning"],"prefix":"10.1137","volume":"5","author":[{"ORCID":"https:\/\/orcid.org\/0000-0001-9915-5595","authenticated-orcid":true,"given":"Zaiwei","family":"Chen","sequence":"first","affiliation":[{"name":"Computing + Mathematical Sciences, California Institute of Technology, Pasadena, CA 91106 USA."}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"John-Paul","family":"Clarke","sequence":"additional","affiliation":[{"name":"Aerospace Engineering and Engineering Mechanics, University of Texas at Austin, Austin, TX 78712 USA."}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Siva Theja","family":"Maguluri","sequence":"additional","affiliation":[{"name":"Industrial & Systems Engineering, Georgia Institute of Technology, Atlanta, GA 30332 USA."}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"351","published-online":{"date-parts":[[2023,12,7]]},"reference":[{"key":"ref3","volume-title":"Neuro-Dynamic Programming","author":"Bertsekas D. P.","year":"1996"},{"key":"ref5","doi-asserted-by":"crossref","first-page":"104947","DOI":"10.1016\/j.sysconle.2021.104947","volume":"153","author":"Borkar V. S.","year":"2021","journal-title":"Systems Control Lett."},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1137\/S0363012997331639"},{"key":"ref7","author":"Cai Q.","year":"2023","journal-title":"Math. Oper. Res."},{"key":"ref8","volume":"33","author":"Carvalho D.","year":"2020","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref10","first-page":"21440","volume":"34","author":"Chen Z.","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref11","doi-asserted-by":"crossref","first-page":"110623","DOI":"10.1016\/j.automatica.2022.110623","volume":"146","author":"Chen Z.","year":"2022","journal-title":"Automatica"},{"key":"ref12","first-page":"2235","volume-title":"Advances in Neural Information Processing Systems","author":"Devraj A. M.","year":"2017"},{"key":"ref13","volume-title":"Advances in Neural Information Processing Systems","author":"Du S. S.","year":"2020"},{"key":"ref16","first-page":"503","volume":"6","author":"Ernst D.","year":"2005","journal-title":"J. Mach. Learn. Res."},{"key":"ref17","first-page":"486","volume-title":"Learning for Dynamics and Control, PMLR","author":"Fan J.","year":"2020"},{"key":"ref19","doi-asserted-by":"crossref","DOI":"10.1007\/b97848","volume-title":"A Distribution-free Theory of Nonparametric Regression","volume":"1","author":"Gy\u00f6rfi L.","year":"2002"},{"key":"ref20","first-page":"2613","volume":"23","author":"Hasselt H.","year":"2010","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref21","first-page":"703","volume-title":"Advances in Neural Information Processing Systems","author":"Jaakkola T.","year":"1994"},{"key":"ref25","first-page":"15556","volume":"33","author":"Lee D.","year":"2020","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref26","doi-asserted-by":"crossref","DOI":"10.1090\/mbk\/107","volume-title":"Markov Chains and Mixing Times","author":"Levin D. A.","year":"2017"},{"key":"ref27","volume":"34","author":"Li G.","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref28","volume":"34","author":"Li G.","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref29","first-page":"7031","volume":"33","author":"Li G.","year":"2020","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref33","doi-asserted-by":"crossref","first-page":"529","DOI":"10.1038\/nature14236","volume":"518","author":"Mnih V.","year":"2015","journal-title":"Nature"},{"key":"ref34","volume":"9","author":"Munos R.","year":"2008","journal-title":"J. Mach. Learn. Res."},{"key":"ref36","doi-asserted-by":"crossref","first-page":"400","DOI":"10.1214\/aoms\/1177729586","volume":"22","author":"Robbins H.","year":"1951","journal-title":"Ann. Math. Statist."},{"key":"ref37","first-page":"227","volume":"16","author":"Singh S. P.","year":"1994","journal-title":"Mach. Learn."},{"key":"ref40","volume-title":"Reinforcement Learning: An Introduction","author":"Sutton R. S.","year":"2018"},{"key":"ref42","first-page":"185","volume":"16","author":"Tsitsiklis J. N.","year":"1994","journal-title":"Mach. Learn."},{"key":"ref43","doi-asserted-by":"crossref","first-page":"674","DOI":"10.1109\/9.580874","volume":"42","author":"Tsitsiklis J. N.","year":"1997","journal-title":"IEEE Trans. Automat. Control"},{"key":"ref46","first-page":"279","volume":"8","author":"Watkins C. J.","year":"1992","journal-title":"Mach. Learn."},{"key":"ref55","first-page":"8668","volume-title":"Advances in Neural Information Processing Systems","author":"Zou S.","year":"2019"}],"container-title":["SIAM Journal on Mathematics of Data Science"],"original-title":[],"language":"en","deposited":{"date-parts":[[2023,12,21]],"date-time":"2023-12-21T21:47:26Z","timestamp":1703195246000},"score":1,"resource":{"primary":{"URL":"https:\/\/epubs.siam.org\/doi\/10.1137\/22M1499261"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2023,12,7]]},"references-count":28,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2023,12,31]]}},"alternative-id":["10.1137\/22M1499261"],"URL":"https:\/\/doi.org\/10.1137\/22m1499261","relation":{},"ISSN":["2577-0187"],"issn-type":[{"value":"2577-0187","type":"electronic"}],"subject":[],"published":{"date-parts":[[2023,12,7]]}}}