{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,30]],"date-time":"2024-10-30T00:08:00Z","timestamp":1730246880659,"version":"3.28.0"},"reference-count":17,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2018,8]]},"DOI":"10.1109\/icinfa.2018.8812454","type":"proceedings-article","created":{"date-parts":[[2019,8,27]],"date-time":"2019-08-27T00:19:17Z","timestamp":1566865157000},"page":"1338-1343","source":"Crossref","is-referenced-by-count":0,"title":["Research on Online Reinforcement Learning Method Based on Experience-Replay"],"prefix":"10.1109","author":[{"given":"Ning","family":"Hu","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zhijun","family":"Ge","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xuanwen","family":"Chen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Chunguang","family":"Ding","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Haobin","family":"Shi","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","first-page":"769","article-title":"Tree based discretization for continuous state space reinforcement learning[C]\/\/ Fifteenth National\/tenth Conference on Artificial Intelligence\/innovative Applications of Artificial Intelligence","author":"uther","year":"1998","journal-title":"American Association for Artificial Intelligence"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/TNNLS.2014.2371046"},{"key":"ref12","first-page":"257","article-title":"Adaptive Subgradient Methods for Online Learning and Stochastic Optimization[J]","volume":"12","author":"duchi","year":"2011","journal-title":"Journal of Machine Learning Research"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1515\/jisys-2015-0010"},{"key":"ref14","article-title":"Efficient Memory-based Learning for Robot Control[J]","author":"goode","year":"1990","journal-title":"PhD thesis Cambridge University Computer Laboratory"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/MCAS.2009.933854"},{"key":"ref16","first-page":"267","article-title":"Approximately Optimal Approximate Reinforcement Learning[C]","author":"kakade","year":"2002","journal-title":"Proceedings of the Nineteenth International Conference on Machine Learning"},{"key":"ref17","article-title":"Near optimal losed-loop control. Application to electric power systems","author":"ernst","year":"2003","journal-title":"Ph D Dissertation"},{"article-title":"On-Line Q-Learning Using Connectionist Systems[J]","year":"1994","author":"rummery","key":"ref4"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.2307\/2999632"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1007\/978-0-585-33656-5_7"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1007\/BF00115009"},{"key":"ref8","doi-asserted-by":"crossref","first-page":"354","DOI":"10.1038\/nature24270","article-title":"Mastering the game of Go without human knowledge.[J]","volume":"550","author":"silver","year":"2017","journal-title":"Nature"},{"key":"ref7","article-title":"Deep Attention Recurrent Q-Network[J]","author":"sorokin","year":"2015","journal-title":"Computer Science"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1177\/0278364913495721"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1038\/nature14540"},{"key":"ref9","article-title":"Traffic Signal Control Based on Q-learning and BP Neural Network[J]","author":"zhao","year":"2007","journal-title":"J Highway Transportation Res Develop"}],"event":{"name":"2018 IEEE International Conference on Information and Automation (ICIA)","start":{"date-parts":[[2018,8,11]]},"location":"Wuyishan, China","end":{"date-parts":[[2018,8,13]]}},"container-title":["2018 IEEE International Conference on Information and Automation (ICIA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8796847\/8812311\/08812454.pdf?arnumber=8812454","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,9,17]],"date-time":"2019-09-17T01:42:24Z","timestamp":1568684544000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8812454\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,8]]},"references-count":17,"URL":"https:\/\/doi.org\/10.1109\/icinfa.2018.8812454","relation":{},"subject":[],"published":{"date-parts":[[2018,8]]}}}