{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,19]],"date-time":"2025-10-19T05:59:15Z","timestamp":1760853555154,"version":"3.28.0"},"reference-count":18,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2011,4]]},"DOI":"10.1109\/adprl.2011.5967361","type":"proceedings-article","created":{"date-parts":[[2011,8,3]],"date-time":"2011-08-03T21:40:00Z","timestamp":1312407600000},"page":"279-286","source":"Crossref","is-referenced-by-count":13,"title":["Improved neural fitted Q iteration applied to a novel computer gaming and learning benchmark"],"prefix":"10.1109","author":[{"given":"Thomas","family":"Gabel","sequence":"first","affiliation":[]},{"given":"Christian","family":"Lutz","sequence":"additional","affiliation":[]},{"given":"Martin","family":"Riedmiller","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1023\/A:1017928328829"},{"key":"ref11","first-page":"1547","article-title":"Model-Free Least-Squares Policy Iteration","author":"lagoudakis","year":"2001","journal-title":"Proceedings of Neural Information Processing Systems (NIPS2001)"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/FBIT.2007.37"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/ACC.2008.4587201"},{"key":"ref14","first-page":"504","article-title":"Tree-Based Batch Mode Reinforcement Learning","author":"ernst","year":"2005","journal-title":"Journal of Machine Learning Research"},{"key":"ref15","doi-asserted-by":"crossref","DOI":"10.1007\/11564096_32","article-title":"Neural Fitted Q Iteration First Experiences with a Data Efficient Neural Reinforcement Learning Method","author":"riedmiller","year":"2005","journal-title":"Machine Learning ECML 2005"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1007\/s005210050038"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/ICNN.1993.298623"},{"journal-title":"Star Ships Learning Framework Manual","year":"2010","author":"gabel","key":"ref18"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/CIG.2007.368095"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1016\/S0004-3702(01)00127-8"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-540-25940-4_68"},{"key":"ref5","first-page":"55","article-title":"RoboCup 2001: The Fifth Robotic Soccer World Championships","author":"veloso","year":"2002","journal-title":"AI Magazine"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/CIG.2007.368074"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1007\/s10514-009-9120-4"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1016\/S0004-3702(01)00129-1"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1162\/neco.1994.6.2.215"},{"key":"ref9","first-page":"1052","article-title":"Stable Fitted Reinforcement Learning","volume":"8","author":"gordon","year":"1996","journal-title":"Advances in neural information processing systems"}],"event":{"name":"2011 Ieee Symposium On Adaptive Dynamic Programming And Reinforcement Learning","start":{"date-parts":[[2011,4,11]]},"location":"Paris, France","end":{"date-parts":[[2011,4,15]]}},"container-title":["2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning (ADPRL)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx5\/5958170\/5967347\/05967361.pdf?arnumber=5967361","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2017,6,20]],"date-time":"2017-06-20T00:11:48Z","timestamp":1497917508000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/5967361\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2011,4]]},"references-count":18,"URL":"https:\/\/doi.org\/10.1109\/adprl.2011.5967361","relation":{},"subject":[],"published":{"date-parts":[[2011,4]]}}}