{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,5,2]],"date-time":"2024-05-02T03:10:37Z","timestamp":1714619437632},"reference-count":51,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"8","license":[{"start":{"date-parts":[[2012,12,1]],"date-time":"2012-12-01T00:00:00Z","timestamp":1354320000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE J. Sel. Top. Signal Process."],"published-print":{"date-parts":[[2012,12]]},"DOI":"10.1109\/jstsp.2012.2229962","type":"journal-article","created":{"date-parts":[[2012,11,27]],"date-time":"2012-11-27T19:02:33Z","timestamp":1354042953000},"page":"917-927","source":"Crossref","is-referenced-by-count":7,"title":["Building Adaptive Dialogue Systems Via Bayes-Adaptive POMDPs"],"prefix":"10.1109","volume":"6","author":[{"given":"Shaowei","family":"Png","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Joelle","family":"Pineau","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Brahim","family":"Chaib-Draa","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref39","author":"duff","year":"2002","journal-title":"Computational procedures for optimal learning"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1177\/0278364911404092"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1145\/1966407.1966411"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1162\/coli.2008.07-028-R2-05-82"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1016\/j.csl.2009.07.001"},{"key":"ref30","article-title":"Monte-Carlo planning in large POMDPs","author":"silver","year":"2010","journal-title":"Proc Neural Inf Process Syst"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/SLT.2010.5700863"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1080\/09540090802413145"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1145\/1966407.1966412"},{"key":"ref34","first-page":"127","article-title":"Reinforcement learning for parameter estimation in statistical spoken dialogue systems","volume":"26","author":"jurvek","year":"2012","journal-title":"Comput Speech Lang"},{"key":"ref28","article-title":"Real-time decision making for large POMDPs","author":"paquet","year":"2005","journal-title":"Proc Adv Artif Intell"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1023\/A:1009634810396"},{"key":"ref29","author":"paquet","year":"2006","journal-title":"Distributed decision-making and task coordination in dynamic uncertain and real-time multiagent environments"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2010.2076394"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/MSP.2010.935874"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1287\/opre.21.5.1071"},{"key":"ref22","doi-asserted-by":"crossref","first-page":"335","DOI":"10.1613\/jair.2078","article-title":"Anytime point-based approximations for large POMDPs","volume":"27","author":"pineau","year":"2006","journal-title":"J Artif Intell Res"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1016\/S0004-3702(98)00023-X"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.2008.4543611"},{"key":"ref23","doi-asserted-by":"crossref","first-page":"195","DOI":"10.1613\/jair.1659","article-title":"Perseus: Randomized point-based value iteration for POMDPs","volume":"24","author":"spaan","year":"2005","journal-title":"J Artif Intell Res"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1007\/11564096_35"},{"key":"ref25","doi-asserted-by":"crossref","first-page":"663","DOI":"10.1613\/jair.2567","article-title":"Online planning algorithms for POMDPs","volume":"32","author":"ross","year":"2008","journal-title":"J Artif Intell Res"},{"key":"ref50","author":"atrash","year":"2011","journal-title":"A Bayesian framework for online parameter learning in POMDPs"},{"key":"ref51","article-title":"Model-based Bayesian reinfrocement learning in large structured domains","author":"ross","year":"2008","journal-title":"Proc UAI"},{"key":"ref10","doi-asserted-by":"crossref","DOI":"10.21437\/Eurospeech.1997-380","article-title":"A stochastic model of computer-human interaction for learning dialogue strategies","author":"levin","year":"1997","journal-title":"Proc Eur Conf Speech Commun Technol"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/89.817450"},{"key":"ref40","article-title":"Model based Bayesian exploration","author":"dearden","year":"1999","journal-title":"Proc Uncertainty in Artif Intell"},{"key":"ref12","first-page":"1233","article-title":"Fast reinforcement learning of dialog strategies","author":"goddeau","year":"2000","journal-title":"Proc ICASSP"},{"key":"ref13","doi-asserted-by":"crossref","first-page":"387","DOI":"10.1613\/jair.713","article-title":"An application of reinforcement learning to dialogue strategy selection in a spoken dialogue system for email","volume":"12","author":"walker","year":"2000","journal-title":"J Artif Intell Res"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.3115\/1289189.1289246"},{"key":"ref15","doi-asserted-by":"crossref","first-page":"105","DOI":"10.1613\/jair.859","article-title":"Optimizing dialogue management with reinforcement learning: Experiments with the NJFun system","volume":"16","author":"singh","year":"2002","journal-title":"J Artif Intell Res"},{"key":"ref16","article-title":"Learning dialogue policies using state aggregation in reinforcement learning","author":"denecke","year":"2004","journal-title":"Proc Int Conf Spoken Lang Process"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.3115\/1075218.1075231"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1145\/1228716.1228726"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1016\/0022-247X(65)90154-X"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4020-6821-8_8"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1016\/j.csl.2006.06.008"},{"key":"ref6","article-title":"Bayes-adaptive POMDPs","author":"ross","year":"2007","journal-title":"Proc Neural Inf Process Syst"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2011.5946754"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1098\/rsta.2000.0593"},{"key":"ref7","first-page":"1729","article-title":"A Bayesian approach for learning and planning in partially observable Markov decision processes","volume":"12","author":"ross","year":"2011","journal-title":"J Mach Learn Res"},{"key":"ref49","doi-asserted-by":"crossref","DOI":"10.1145\/1502650.1502700","article-title":"A Bayesian reinforcement learning approach for customizing human-robot interfaces","author":"atrash","year":"2009","journal-title":"Proc IUI"},{"key":"ref9","author":"white","year":"0","journal-title":"OpenCCT The OpenNLP CCG Library"},{"key":"ref46","article-title":"A decision-theoretic approach to task assistance for persons with dementia","author":"boger","year":"2005","journal-title":"Proc IJCAI"},{"key":"ref45","article-title":"Learning the reward model of dialogue POMDPs from data","author":"boularias","year":"2010","journal-title":"Proc NIPS Workshop Mach Learn for Assist Tech"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.1007\/s12369-009-0032-4"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2011.5946754"},{"key":"ref42","article-title":"A variance analysis for POMDP policy evaluation","author":"fard","year":"2008","journal-title":"Proc AAAI"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1145\/1143844.1143932"},{"key":"ref44","author":"williams","year":"2005","journal-title":"The SACTI-1 Corpus Guide for Research Users"},{"key":"ref43","article-title":"Acting optimally in partially observable stochastic domains","author":"cassandra","year":"1995","journal-title":"Proc Nat Conf Artif Intell"}],"container-title":["IEEE Journal of Selected Topics in Signal Processing"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx5\/4200690\/6392940\/06362158.pdf?arnumber=6362158","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,5,2]],"date-time":"2024-05-02T02:49:21Z","timestamp":1714618161000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/6362158\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2012,12]]},"references-count":51,"journal-issue":{"issue":"8"},"URL":"https:\/\/doi.org\/10.1109\/jstsp.2012.2229962","relation":{},"ISSN":["1932-4553","1941-0484"],"issn-type":[{"value":"1932-4553","type":"print"},{"value":"1941-0484","type":"electronic"}],"subject":[],"published":{"date-parts":[[2012,12]]}}}