{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,7]],"date-time":"2024-09-07T04:53:49Z","timestamp":1725684829557},"publisher-location":"Berlin, Heidelberg","reference-count":8,"publisher":"Springer Berlin Heidelberg","isbn-type":[{"type":"print","value":"9783642299452"},{"type":"electronic","value":"9783642299469"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2012]]},"DOI":"10.1007\/978-3-642-29946-9_21","type":"book-chapter","created":{"date-parts":[[2012,5,18]],"date-time":"2012-05-18T17:01:49Z","timestamp":1337360509000},"page":"201-212","source":"Crossref","is-referenced-by-count":0,"title":["A Framework for Computing Bounds for the Return of a Policy"],"prefix":"10.1007","author":[{"given":"Cosmin","family":"P\u0103duraru","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Doina","family":"Precup","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Joelle","family":"Pineau","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","reference":[{"key":"21_CR1","unstructured":"Brunskill, E., Leffler, B., Li, L., Littman, M., Roy, N.: CORL: A continuous-state offset-dynamics reinforcement learner. In: Proceedings of the International Conference on Uncertainty in Artificial Intelligence, pp. 53\u201361 (2008)"},{"issue":"1","key":"21_CR2","doi-asserted-by":"publisher","first-page":"203","DOI":"10.1287\/opre.1080.0685","volume":"58","author":"E. Delage","year":"2009","unstructured":"Delage, E., Mannor, S.: Percentile Optimization for Markov Decision Processes with Parameter Uncertainty. Operations Research\u00a058(1), 203\u2013213 (2009)","journal-title":"Operations Research"},{"key":"21_CR3","unstructured":"Ermon, S., Conrad, J., Gomes, C., Selman, B.: Playing games against nature: optimal policies for renewable resource allocation. In: Proceedings of The 26th Conference on Uncertainty in Artificial Intelligence (2010)"},{"key":"21_CR4","doi-asserted-by":"crossref","unstructured":"Fonteneau, R., Murphy, S., Wehenkel, L., Ernst, D.: Inferring bounds on the performance of a control policy from a sample of trajectories. In: IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning (ADPRL), pp. 117\u2013123 (2009)","DOI":"10.1109\/ADPRL.2009.4927534"},{"key":"21_CR5","series-title":"CCIS","doi-asserted-by":"publisher","first-page":"61","DOI":"10.1007\/978-3-642-19890-8_5","volume-title":"Agents and Artificial Intelligence","author":"R. Fonteneau","year":"2011","unstructured":"Fonteneau, R., Murphy, S.A., Wehenkel, L., Ernst, D.: Towards Min Max Generalization in Reinforcement Learning. In: Filipe, J., Fred, A., Sharp, B. (eds.) ICAART 2010. CCIS, vol.\u00a0129, pp. 61\u201377. Springer, Heidelberg (2011)"},{"key":"21_CR6","doi-asserted-by":"crossref","unstructured":"Kaelbling, L.P.: Learning in embedded systems. MIT Press (1993)","DOI":"10.7551\/mitpress\/4168.001.0001"},{"key":"21_CR7","unstructured":"Kakade, S., Kearns, M., Langford, J.: Exploration in Metric State Spaces. In: International Conference on Machine Learning, vol.\u00a020, p. 306 (2003)"},{"issue":"5","key":"21_CR8","doi-asserted-by":"publisher","first-page":"780","DOI":"10.1287\/opre.1050.0216","volume":"53","author":"A. Nilim","year":"2005","unstructured":"Nilim, A., El Ghaoui, L.: Robust Control of Markov Decision Processes with Uncertain Transition Matrices. Operations Research\u00a053(5), 780\u2013798 (2005)","journal-title":"Operations Research"}],"container-title":["Lecture Notes in Computer Science","Recent Advances in Reinforcement Learning"],"original-title":[],"link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-642-29946-9_21.pdf","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2021,5,4]],"date-time":"2021-05-04T11:22:28Z","timestamp":1620127348000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-642-29946-9_21"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2012]]},"ISBN":["9783642299452","9783642299469"],"references-count":8,"URL":"https:\/\/doi.org\/10.1007\/978-3-642-29946-9_21","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2012]]}}}