{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,7]],"date-time":"2026-05-07T00:32:43Z","timestamp":1778113963621,"version":"3.51.4"},"update-to":[{"DOI":"10.1371\/journal.pcbi.1006116","type":"new_version","label":"New version","source":"publisher","updated":{"date-parts":[[2018,5,1]],"date-time":"2018-05-01T00:00:00Z","timestamp":1525132800000}}],"reference-count":46,"publisher":"Public Library of Science (PLoS)","issue":"4","license":[{"start":{"date-parts":[[2018,4,19]],"date-time":"2018-04-19T00:00:00Z","timestamp":1524096000000},"content-version":"vor","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"funder":[{"DOI":"10.13039\/100000025","name":"National Institute of Mental Health","doi-asserted-by":"publisher","award":["R01MH080066"],"award-info":[{"award-number":["R01MH080066"]}],"id":[{"id":"10.13039\/100000025","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/100000001","name":"National Science Foundation","doi-asserted-by":"publisher","award":["1460604"],"award-info":[{"award-number":["1460604"]}],"id":[{"id":"10.13039\/100000001","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["www.ploscompbiol.org"],"crossmark-restriction":false},"short-container-title":["PLoS Comput Biol"],"DOI":"10.1371\/journal.pcbi.1006116","type":"journal-article","created":{"date-parts":[[2018,4,19]],"date-time":"2018-04-19T13:47:05Z","timestamp":1524145625000},"page":"e1006116","update-policy":"https:\/\/doi.org\/10.1371\/journal.pcbi.corrections_policy","source":"Crossref","is-referenced-by-count":46,"title":["Compositional clustering in task structure learning"],"prefix":"10.1371","volume":"14","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-4657-9690","authenticated-orcid":true,"given":"Nicholas T.","family":"Franklin","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Michael J.","family":"Frank","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"340","published-online":{"date-parts":[[2018,4,19]]},"reference":[{"issue":"6209","key":"ref1","doi-asserted-by":"crossref","first-page":"551","DOI":"10.1126\/science.1261661","article-title":"The atoms of neural computation","volume":"346","author":"G Marcus","year":"2014","journal-title":"Science"},{"issue":"1","key":"ref2","doi-asserted-by":"crossref","first-page":"197","DOI":"10.1037\/a0017808","article-title":"Context, learning, and extinction","volume":"117","author":"SJ Gershman","year":"2010","journal-title":"Psychological review"},{"issue":"1","key":"ref3","doi-asserted-by":"crossref","first-page":"190","DOI":"10.1037\/a0030852","article-title":"Cognitive control over learning: creating, clustering, and generalizing task-set structure","volume":"120","author":"AG Collins","year":"2013","journal-title":"Psychological review"},{"key":"ref4","doi-asserted-by":"crossref","first-page":"160","DOI":"10.1016\/j.cognition.2016.04.002","article-title":"Neural signature of hierarchically structured expectations predicts clustering and transfer of rule sets in reinforcement learning","volume":"152","author":"AG Collins","year":"2016","journal-title":"Cognition"},{"issue":"13","key":"ref5","doi-asserted-by":"crossref","first-page":"4677","DOI":"10.1523\/JNEUROSCI.3900-13.2014","article-title":"Human EEG uncovers latent generalizable rule structure during learning","volume":"34","author":"AG Collins","year":"2014","journal-title":"Journal of Neuroscience"},{"issue":"1","key":"ref6","doi-asserted-by":"crossref","first-page":"99","DOI":"10.1007\/s10994-016-5547-y","article-title":"Bayesian policy reuse","volume":"104","author":"B Rosman","year":"2016","journal-title":"Machine Learning"},{"key":"ref7","unstructured":"Mahmud MM, Hawasly M, Rosman B, Ramamoorthy S. Clustering markov decision processes for continual transfer. arXiv preprint arXiv:1311.3959. 2013 Nov 15."},{"key":"ref8","unstructured":"Wilson A, Fern A, Tadepalli P. Transfer learning in sequential decision problems: A hierarchical bayesian approach. In Proceedings of ICML Workshop on Unsupervised and Transfer Learning 2012 Jun 27 (pp. 217-227)."},{"key":"ref9","unstructured":"Leffler BR, Littman ML, Edmunds T. Efficient reinforcement learning with relocatable action models. In AAAI 2007 Jul 22 (Vol. 7, pp. 572-577)."},{"key":"ref10","unstructured":"Lehnert L, Tellex S, Littman ML. Advantages and Limitations of using Successor Features for Transfer in Reinforcement Learning. arXiv preprint arXiv:1708.00102. 2017 Jul 31."},{"key":"ref11","unstructured":"Kansky K, Silver T, M\u00e9ly DA, Eldawy M, L\u00e1zaro-Gredilla M, Lou X, Dorfman N, Sidor S, Phoenix S, George D. Schema Networks: Zero-shot Transfer with a Generative Causal Model of Intuitive Physics. arXiv preprint arXiv:1706.04317. 2017 Jun 14."},{"key":"ref12","first-page":"1","article-title":"Building machines that learn and think like people","author":"BM Lake","year":"2016","journal-title":"Behavioral and Brain Sciences"},{"key":"ref13","first-page":"474","article-title":"The principles of psychology","volume":"Vol. 1","author":"W James","year":"1890"},{"issue":"6","key":"ref14","doi-asserted-by":"crossref","first-page":"371","DOI":"10.1080\/00222895.2010.526467","article-title":"Evidence for model-based action planning in a sequential finger movement task","volume":"42","author":"A Fermin","year":"2010","journal-title":"J Mot Behav"},{"issue":"July","key":"ref15","first-page":"1","article-title":"Model-based action planning involves cortico-cerebellar and basal ganglia networks","volume":"6","author":"ASR Fermin","year":"2016","journal-title":"Sci Rep"},{"key":"ref16","doi-asserted-by":"crossref","first-page":"237","DOI":"10.1613\/jair.301","article-title":"Reinforcement learning: A survey","volume":"4","author":"LP Kaelbling","year":"1996","journal-title":"Journal of artificial intelligence research"},{"issue":"4","key":"ref17","doi-asserted-by":"crossref","first-page":"1144","DOI":"10.1037\/a0020511","article-title":"Rational approximations to rational models: alternative algorithms for category learning","volume":"117","author":"AN Sanborn","year":"2010","journal-title":"Psychological review"},{"issue":"1","key":"ref18","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1016\/j.cognition.2011.02.010","article-title":"A probabilistic model of cross-categorization","volume":"120","author":"P Shafto","year":"2011","journal-title":"Cognition"},{"key":"ref19","first-page":"1","article-title":"\u00c9cole d\u2019\u00c9t\u00e9 de Probabilit\u00e9s de Saint-Flour XIII\u20141983","author":"DJ Aldous","year":"1985"},{"issue":"1-2","key":"ref20","doi-asserted-by":"crossref","first-page":"181","DOI":"10.1016\/S0004-3702(99)00052-1","article-title":"Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning","volume":"112","author":"RS Sutton","year":"1999","journal-title":"Artificial intelligence"},{"issue":"3","key":"ref21","doi-asserted-by":"crossref","first-page":"262","DOI":"10.1016\/j.cognition.2008.08.011","article-title":"Hierarchically organized behavior and its neural foundations: a reinforcement learning perspective","volume":"113","author":"MM Botvinick","year":"2009","journal-title":"Cognition"},{"key":"ref22","unstructured":"Sanborn AN, Griffiths TL, Navarro DJ. A More Rational Model of Categorization. Proc 28th Annu Conf Cogn Sci Soc. 2006;1\u20136."},{"key":"ref23","doi-asserted-by":"crossref","unstructured":"Frank MJ, Badre D. Mechanisms of hierarchical reinforcement learning in corticostriatal circuits 1: computational analysis. Cereb Cortex 2012 Mar","DOI":"10.1093\/cercor\/bhr114"},{"issue":"6","key":"ref24","doi-asserted-by":"crossref","first-page":"1347","DOI":"10.1162\/089976602753712972","article-title":"Multiple model-based reinforcement learning","volume":"14","author":"K Doya","year":"2002","journal-title":"Neural Comput"},{"issue":"3\/4","key":"ref25","doi-asserted-by":"crossref","first-page":"285","DOI":"10.2307\/2332286","article-title":"On the likelihood that one unknown probability exceeds another in view of the evidence of two samples","volume":"25","author":"WR Thompson","year":"1933","journal-title":"Biometrika"},{"key":"ref26","doi-asserted-by":"crossref","DOI":"10.1007\/978-1-4757-4286-2","article-title":"Statistical decision theory and Bayesian analysis","author":"JO Berger","year":"1985"},{"issue":"8","key":"ref27","doi-asserted-by":"crossref","first-page":"357","DOI":"10.1016\/j.tics.2010.05.004","article-title":"Probabilistic models of cognition: exploring representations and inductive biases","volume":"14","author":"TL Griffiths","year":"2010","journal-title":"Trends Cogn Sci"},{"issue":"6","key":"ref28","doi-asserted-by":"crossref","first-page":"1237","DOI":"10.1093\/cercor\/bhr200","article-title":"Compositionality of Rule Representations in Human Prefrontal Cortex","volume":"22","author":"C Reverberi","year":"2012","journal-title":"Cereb Cortex"},{"issue":"41","key":"ref29","doi-asserted-by":"crossref","first-page":"16390","DOI":"10.1073\/pnas.1303547110","article-title":"Indirection and symbol-like processing in the prefrontal cortex and basal ganglia","volume":"110","author":"T Kriete","year":"2013","journal-title":"Proc Natl Acad Sci"},{"key":"ref30","doi-asserted-by":"crossref","unstructured":"Diuk C, Cohen A, Littman ML. An object-oriented representation for efficient reinforcement learning. InProceedings of the 25th international conference on Machine learning 2008 Jul 5 (pp. 240-247). ACM.","DOI":"10.1145\/1390156.1390187"},{"key":"ref31","first-page":"895","article-title":"Building portable options: Skill transfer in reinforcement learning","author":"G Konidaris","year":"2007","journal-title":"IJCAI Int Jt Conf Artif Intell"},{"key":"ref32","unstructured":"Konidaris G. Constructing Abstraction Hierarchies Using a Skill-Symbol Loop. In: IJCAI International Joint Conference on Artificial Intelligence. 2016. p. 1648\u20131654."},{"issue":"8","key":"ref33","doi-asserted-by":"crossref","first-page":"e1003779","DOI":"10.1371\/journal.pcbi.1003779","article-title":"Optimal Behavioral Hierarchy","volume":"10","author":"A Solway","year":"2014","journal-title":"PLoS Comput Biol [Internet]"},{"key":"ref34","article-title":"Scene Construction, Visual Foraging, and Active Inference","author":"MB Mirza","year":"2016","journal-title":"Front Comput Neurosci"},{"issue":"1","key":"ref35","doi-asserted-by":"crossref","first-page":"e0190429","DOI":"10.1371\/journal.pone.0190429","article-title":"Human visual exploration reduces uncertainty about the sensed world","volume":"13","author":"MB Mirza","year":"2018","journal-title":"PloS one"},{"key":"ref36","doi-asserted-by":"crossref","first-page":"55","DOI":"10.1023\/A:1009778005914","article-title":"On Bias, Variance, 0 \/ 1\u2014Loss, and the Curse-of-Dimensionality","volume":"77","author":"JH Friedman","year":"1997","journal-title":"Data Min Knowl Discov"},{"key":"ref37","unstructured":"Wingate D, Diuk C, Donnell TO, Tenenbaum JB, Gershman S, Labs L, et al. Compositional Policy Priors Compositional Policy Priors. 2013"},{"key":"ref38","first-page":"1","article-title":"Predictive representations can link model\u2014based reinforcement learning to model\u2014free mechanisms","author":"EM Russek","year":"2017","journal-title":"PLoS Computational Biology"},{"issue":"9","key":"ref39","doi-asserted-by":"crossref","first-page":"680","DOI":"10.1038\/s41562-017-0180-8","article-title":"The successor representation in human reinforcement learning","volume":"1","author":"I Momennejad","year":"2017","journal-title":"Nature Human Behaviour"},{"key":"ref40","unstructured":"Machado MC, Bellemare MG, Bowling M. A Laplacian Framework for Option Discovery in Reinforcement Learning. arXiv preprint arXiv:1703.00956. 2017 Mar 2."},{"key":"ref41","article-title":"Connectionism and cognitive architecture: A critical analysis","author":"J Fodor","year":"1988","journal-title":"Cognition"},{"issue":"13","key":"ref42","doi-asserted-by":"crossref","first-page":"4677","DOI":"10.1523\/JNEUROSCI.3900-13.2014","article-title":"Human EEG Uncovers Latent Generalizable Rule Structure during Learning","volume":"34","author":"AGE Collins","year":"2014","journal-title":"J Neurosci"},{"issue":"11","key":"ref43","doi-asserted-by":"crossref","first-page":"1643","DOI":"10.1038\/nn.4650","article-title":"The hippocampus as a predictive map","volume":"20","author":"KL Stachenfeld","year":"2017","journal-title":"Nat Neurosci"},{"key":"ref44","unstructured":"Nagabandi A, Kahn G, Fearing RS, Levine S. Neural Network Dynamics for Model-Based Deep Reinforcement Learning with Model-Free Fine-Tuning. 2017; Available from: <ext-link xmlns:xlink=\"http:\/\/www.w3.org\/1999\/xlink\" ext-link-type=\"uri\" xlink:href=\"http:\/\/arxiv.org\/abs\/1708.02596\" xlink:type=\"simple\">http:\/\/arxiv.org\/abs\/1708.02596<\/ext-link>"},{"issue":"4","key":"ref45","doi-asserted-by":"crossref","first-page":"585","DOI":"10.1016\/j.neuron.2010.04.016","article-title":"States versus rewards: Dissociable neural prediction error signals underlying model-based and model-free reinforcement learning","volume":"66","author":"J Gl\u00e4scher","year":"2010","journal-title":"Neuron"},{"issue":"3","key":"ref46","article-title":"Bonsai trees in your head: How the pavlovian system sculpts goal-directed choices by pruning decision trees","volume":"8","author":"QJM Huys","year":"2012","journal-title":"PLoS Comput Biol"}],"updated-by":[{"DOI":"10.1371\/journal.pcbi.1006116","type":"new_version","label":"New version","source":"publisher","updated":{"date-parts":[[2018,5,1]],"date-time":"2018-05-01T00:00:00Z","timestamp":1525132800000}}],"container-title":["PLOS Computational Biology"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/dx.plos.org\/10.1371\/journal.pcbi.1006116","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2020,5,9]],"date-time":"2020-05-09T10:10:56Z","timestamp":1589019056000},"score":1,"resource":{"primary":{"URL":"https:\/\/dx.plos.org\/10.1371\/journal.pcbi.1006116"}},"subtitle":[],"editor":[{"given":"Jean","family":"Daunizeau","sequence":"first","affiliation":[],"role":[{"role":"editor","vocabulary":"crossref"}]}],"short-title":[],"issued":{"date-parts":[[2018,4,19]]},"references-count":46,"journal-issue":{"issue":"4","published-online":{"date-parts":[[2018,4,19]]}},"URL":"https:\/\/doi.org\/10.1371\/journal.pcbi.1006116","relation":{"has-preprint":[{"id-type":"doi","id":"10.1101\/196923","asserted-by":"object"}]},"ISSN":["1553-7358"],"issn-type":[{"value":"1553-7358","type":"electronic"}],"subject":[],"published":{"date-parts":[[2018,4,19]]}}}