{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,2,21]],"date-time":"2025-02-21T10:08:09Z","timestamp":1740132489675,"version":"3.37.3"},"reference-count":18,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"10","license":[{"start":{"date-parts":[[2014,10,1]],"date-time":"2014-10-01T00:00:00Z","timestamp":1412121600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"}],"funder":[{"DOI":"10.13039\/100000001","name":"National Science Foundation","doi-asserted-by":"publisher","award":["CMMI-1030832"],"award-info":[{"award-number":["CMMI-1030832"]}],"id":[{"id":"10.13039\/100000001","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Rolls-Royce Corporation"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Trans. Automat. Contr."],"published-print":{"date-parts":[[2014,10]]},"DOI":"10.1109\/tac.2014.2314527","type":"journal-article","created":{"date-parts":[[2014,4,1]],"date-time":"2014-04-01T14:02:30Z","timestamp":1396360950000},"page":"2796-2800","source":"Crossref","is-referenced-by-count":4,"title":["An Argument for the Bayesian Control of Partially Observable Markov Decision Processes"],"prefix":"10.1109","volume":"59","author":[{"given":"Erik","family":"Vargo","sequence":"first","affiliation":[]},{"given":"Randy","family":"Cogill","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"journal-title":"Continuous Multivariate Distributions Volume 1 Models and Applications","year":"2002","author":"johnson","key":"ref10"},{"key":"ref11","first-page":"1729","article-title":"A Bayesian approach for learning and planning in partially observable Markov decision processes","volume":"12","author":"ross","year":"2011","journal-title":"J Mach Learning Res"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1145\/1390156.1390189"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2009.5354013"},{"key":"ref14","first-page":"150","article-title":"Model based Bayesian exploration","author":"dearden","year":"0","journal-title":"Proc 15th Conf Uncertainty Artif Intell"},{"key":"ref15","article-title":"Local bandit approximation for optimal learning problems","author":"duff","year":"0","journal-title":"Proc Adv Neural Inform Processing Syst 9"},{"key":"ref16","article-title":"Expectation-maximization methods for solving (PO)MDPs and optimal control problems","author":"toussaint","year":"2010","journal-title":"Inference and Learning in Dynamic Models"},{"key":"ref17","first-page":"50","article-title":"Solving deterministic policy (PO)MPDs using expectation-maximisation and antifreeze","author":"barber","year":"0","journal-title":"Proc Eur Conf Mach Learning (LEMIR Workshop)"},{"key":"ref18","first-page":"241","article-title":"Variational methods for reinforcement learning","volume":"9","author":"furmston","year":"0","journal-title":"Proc AISTATS"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1287\/opre.42.4.739"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1287\/opre.21.3.728"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1287\/moor.12.3.441"},{"journal-title":"Optimal Learning Computational Procedures for Bayes-adaptive Markov Decision Processes","year":"2002","author":"duff","key":"ref5"},{"key":"ref8","first-page":"2329","article-title":"Point-based value iteration for continuous POMDPs","volume":"7","author":"porta","year":"2006","journal-title":"J Mach Learning Res"},{"journal-title":"Exact and approximate algorithms for partially observable Markov decision processes","year":"1998","author":"cassandra","key":"ref7"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1287\/opre.1050.0216"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/TAC.2008.930182"},{"key":"ref9","first-page":"253","article-title":"Gamma function and related functions","author":"davis","year":"1972","journal-title":"Handbook of Math Functions"}],"container-title":["IEEE Transactions on Automatic Control"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9\/6902837\/06781561.pdf?arnumber=6781561","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,1,12]],"date-time":"2022-01-12T11:51:06Z","timestamp":1641988266000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/6781561\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2014,10]]},"references-count":18,"journal-issue":{"issue":"10"},"URL":"https:\/\/doi.org\/10.1109\/tac.2014.2314527","relation":{},"ISSN":["0018-9286","1558-2523","2334-3303"],"issn-type":[{"type":"print","value":"0018-9286"},{"type":"electronic","value":"1558-2523"},{"type":"electronic","value":"2334-3303"}],"subject":[],"published":{"date-parts":[[2014,10]]}}}