{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,22]],"date-time":"2024-10-22T21:57:39Z","timestamp":1729634259184,"version":"3.28.0"},"reference-count":15,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"DOI":"10.1109\/cdc.2003.1272354","type":"proceedings-article","created":{"date-parts":[[2004,6,3]],"date-time":"2004-06-03T20:14:56Z","timestamp":1086293696000},"page":"4820-4824","source":"Crossref","is-referenced-by-count":0,"title":["A system theoretic perspective of learning and optimization"],"prefix":"10.1109","author":[{"family":"Xi-Ren Cao","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"15","doi-asserted-by":"publisher","DOI":"10.1016\/S0005-1098(99)00099-0"},{"key":"13","doi-asserted-by":"publisher","DOI":"10.1109\/9.905687"},{"journal-title":"Reinforcement Learning An Introduction","year":"1998","author":"sutton","key":"14"},{"key":"11","doi-asserted-by":"publisher","DOI":"10.1109\/TAC.2004.825647"},{"key":"12","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4615-4024-3"},{"key":"3","volume":"1 2","author":"bertsekas","year":"1995","journal-title":"Dynamic Programming and Optimal Control"},{"key":"2","doi-asserted-by":"crossref","first-page":"351","DOI":"10.1613\/jair.807","article-title":"Experiments with Infinite-Horizon Policy-Gradient Estimation","volume":"15","author":"baxter","year":"2001","journal-title":"Journal of Artificial Intelligence Research"},{"key":"1","doi-asserted-by":"crossref","first-page":"319","DOI":"10.1613\/jair.806","article-title":"Infinite-Horizon Policy-Gradient Estimation","volume":"15","author":"baxter","year":"2001","journal-title":"Journal of Artificial Intelligence Research"},{"key":"10","doi-asserted-by":"publisher","DOI":"10.1109\/9.299620"},{"key":"7","doi-asserted-by":"publisher","DOI":"10.1109\/9.633827"},{"key":"6","doi-asserted-by":"crossref","first-page":"71","DOI":"10.1023\/A:1008260528575","article-title":"The Relation Among Potentials, Perturbation Analysis, Markov Decision Processes, and Other Topics","volume":"8","author":"cao","year":"1998","journal-title":"Journal of Discrete Event Dynamic Systems"},{"key":"5","doi-asserted-by":"publisher","DOI":"10.1007\/BFb0035250"},{"key":"4","first-page":"834","article-title":"Convergence of Parameter Sensitivity Estimates in a Stochastic Experiment","volume":"ac 30","author":"cao","year":"1985","journal-title":"IEEE Trans on Automatic Control"},{"key":"9","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4757-4070-7"},{"key":"8","doi-asserted-by":"publisher","DOI":"10.1109\/87.701341"}],"event":{"name":"42nd IEEE International Conference on Decision and Control","acronym":"CDC-03","location":"Maui, HI, USA"},"container-title":["42nd IEEE International Conference on Decision and Control (IEEE Cat. No.03CH37475)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx5\/8969\/28459\/01272354.pdf?arnumber=1272354","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2020,4,2]],"date-time":"2020-04-02T10:04:36Z","timestamp":1585821876000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/1272354\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[null]]},"references-count":15,"URL":"https:\/\/doi.org\/10.1109\/cdc.2003.1272354","relation":{},"subject":[]}}