{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,7]],"date-time":"2024-09-07T22:13:26Z","timestamp":1725747206211},"publisher-location":"Berlin, Heidelberg","reference-count":13,"publisher":"Springer Berlin Heidelberg","isbn-type":[{"type":"print","value":"9783642407277"},{"type":"electronic","value":"9783642407284"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2013]]},"DOI":"10.1007\/978-3-642-40728-4_22","type":"book-chapter","created":{"date-parts":[[2013,9,4]],"date-time":"2013-09-04T11:56:43Z","timestamp":1378295803000},"page":"170-177","source":"Crossref","is-referenced-by-count":1,"title":["Novel Feature Selection and Kernel-Based Value Approximation Method for Reinforcement Learning"],"prefix":"10.1007","author":[{"given":"Hunor Sandor","family":"Jakab","sequence":"first","affiliation":[]},{"given":"Lehel","family":"Csat\u00f3","sequence":"additional","affiliation":[]}],"member":"297","reference":[{"issue":"2-3","key":"22_CR1","doi-asserted-by":"publisher","first-page":"233","DOI":"10.1023\/A:1017936530646","volume":"49","author":"J.A. Boyan","year":"2002","unstructured":"Boyan, J.A.: Technical update: Least-squares temporal difference learning. Machine Learning\u00a049(2-3), 233\u2013246 (2002)","journal-title":"Machine Learning"},{"key":"22_CR2","doi-asserted-by":"crossref","unstructured":"Bradtke, S.J., Barto, A.G., Kaelbling, P.: Linear least-squares algorithms for temporal difference learning. In: Machine Learning, pp. 22\u201333 (1996)","DOI":"10.1007\/BF00114723"},{"key":"22_CR3","doi-asserted-by":"crossref","unstructured":"Csat\u00f3, L., Opper, M.: Sparse On-Line Gaussian Processes. In: Neural Computation, vol. 14(3), pp. 641\u2013668 (2002)","DOI":"10.1162\/089976602317250933"},{"key":"22_CR4","doi-asserted-by":"publisher","first-page":"2275","DOI":"10.1109\/TSP.2004.830985","volume":"52","author":"Y. Engel","year":"2003","unstructured":"Engel, Y., Mannor, S., Meir, R.: The kernel recursive least squares algorithm. IEEE Transactions on Signal Processing\u00a052, 2275\u20132285 (2003)","journal-title":"IEEE Transactions on Signal Processing"},{"key":"22_CR5","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"220","DOI":"10.1007\/978-3-540-28649-3_27","volume-title":"Pattern Recognition","author":"B. Haasdonk","year":"2004","unstructured":"Haasdonk, B., Bahlmann, C.: Learning with distance substitution kernels. In: Rasmussen, C.E., B\u00fclthoff, H.H., Sch\u00f6lkopf, B., Giese, M.A. (eds.) DAGM 2004. LNCS, vol.\u00a03175, pp. 220\u2013227. Springer, Heidelberg (2004)"},{"key":"22_CR6","first-page":"1107","volume":"4","author":"M.G. Lagoudakis","year":"2003","unstructured":"Lagoudakis, M.G., Parr, R.: Least-squares policy iteration. J. Mach. Learn. Res.\u00a04, 1107\u20131149 (2003)","journal-title":"J. Mach. Learn. Res."},{"key":"22_CR7","doi-asserted-by":"publisher","DOI":"10.1002\/9780470316887","volume-title":"Markov Decision Processes: Discrete Stochastic Dynamic Programming","author":"M.L. Puterman","year":"1994","unstructured":"Puterman, M.L.: Markov Decision Processes: Discrete Stochastic Dynamic Programming. John Wiley & Sons, Inc., New York (1994)"},{"key":"22_CR8","doi-asserted-by":"crossref","unstructured":"Ruggeri, M.R., Saupe, D.: Isometry-invariant matching of point set surfaces. In: Eurographics Workshop on 3D Object Retrieval (2008)","DOI":"10.1007\/s11263-009-0250-0"},{"key":"22_CR9","doi-asserted-by":"crossref","unstructured":"Szepesv\u00e1ri, C.: Algorithms for Reinforcement Learning. Morgan & Claypool (2011)","DOI":"10.1007\/978-3-031-01551-9"},{"key":"22_CR10","first-page":"1017","volume-title":"Proceedings of the 26th Annual International Conference on Machine Learning, ICML 2009","author":"G. Taylor","year":"2009","unstructured":"Taylor, G., Parr, R.: Kernelized value function approximation for reinforcement learning. In: Proceedings of the 26th Annual International Conference on Machine Learning, ICML 2009, pp. 1017\u20131024. ACM, New York (2009)"},{"key":"22_CR11","doi-asserted-by":"crossref","unstructured":"von Luxburg, U.: A tutorial on spectral clustering. Statistics and Computing\u00a017(4) (2007)","DOI":"10.1007\/s11222-007-9033-z"},{"key":"22_CR12","doi-asserted-by":"crossref","unstructured":"Xu, X., Hu, D., Lu, X.: Kernel-based least squares policy iteration for reinforcement learning. IEEE Transactions on Neural Networks, 973\u2013992 (2007)","DOI":"10.1109\/TNN.2007.899161"},{"key":"22_CR13","doi-asserted-by":"crossref","unstructured":"Sutton, R.S., Barto, A.G.: Reinforcement Learning: An Introduction. MIT Press (1998)","DOI":"10.1109\/TNN.1998.712192"}],"container-title":["Lecture Notes in Computer Science","Artificial Neural Networks and Machine Learning \u2013 ICANN 2013"],"original-title":[],"link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-642-40728-4_22","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,7,4]],"date-time":"2023-07-04T09:13:16Z","timestamp":1688461996000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-642-40728-4_22"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2013]]},"ISBN":["9783642407277","9783642407284"],"references-count":13,"URL":"https:\/\/doi.org\/10.1007\/978-3-642-40728-4_22","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2013]]}}}