{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,16]],"date-time":"2026-05-16T02:00:04Z","timestamp":1778896804214,"version":"3.51.4"},"reference-count":30,"publisher":"IEEE","license":[{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100000923","name":"Australian Research Council","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100000923","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2020,10,24]]},"DOI":"10.1109\/iros45743.2020.9341372","type":"proceedings-article","created":{"date-parts":[[2021,3,15]],"date-time":"2021-03-15T14:49:56Z","timestamp":1615819796000},"page":"6069-6076","source":"Crossref","is-referenced-by-count":7,"title":["Multiplicative Controller Fusion: Leveraging Algorithmic Priors for Sample-efficient Reinforcement Learning and Safe Sim-To-Real Transfer"],"prefix":"10.1109","author":[{"given":"Krishan","family":"Rana","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Vibhavari","family":"Dasagi","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ben","family":"Talbot","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Michael","family":"Milford","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Niko","family":"Sunderhauf","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref30","article-title":"Spinning Up in Deep Reinforcement Learning","author":"achiam","year":"2018"},{"key":"ref10","doi-asserted-by":"crossref","first-page":"529","DOI":"10.1038\/nature14236","article-title":"Human-level control through deep reinforcement learning","volume":"518","author":"mnih","year":"2015","journal-title":"Nature"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2013.6630809"},{"key":"ref12","author":"yun","year":"0","journal-title":"Visual-based autonomous driving deployment from a stochastic and uncertainty-aware perspective"},{"key":"ref13","article-title":"Deep neural network for real-time autonomous indoor navigation","author":"kim","year":"2015"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2017.7989182"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2017.7989381"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8202134"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2018.8461203"},{"key":"ref18","article-title":"Uncertainty-aware reinforcement learning for collision avoidance","author":"kahn","year":"2017","journal-title":"arXiv preprint arXiv 1702 02206"},{"key":"ref19","article-title":"Safe reinforcement learning with model uncertainty estimates","author":"l\u00fctjens","year":"2018","journal-title":"arXiv preprint arXiv 1810 04805"},{"key":"ref28","article-title":"On evaluation of embodied navigation agents","author":"anderson","year":"2018","journal-title":"arXiv preprint arXiv 1807 06757"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/70.88137"},{"key":"ref27","first-page":"4754","article-title":"Deep reinforcement learning in a handful of trials using probabilistic dynamics models","author":"chua","year":"2018","journal-title":"Advances in neural information processing systems"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2016.2624754"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/70.127236"},{"key":"ref29","article-title":"Soft actor-critic: Off-policy maximum entropy deep reinforcement learning with a stochastic actor","author":"haarnoja","year":"2018","journal-title":"arXiv preprint arXiv 1801 01000"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.1989.100007"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1007\/s10846-007-9157-6"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2005.1545172"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.1991.131810"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1016\/j.robot.2008.10.024"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4613-8997-2_29"},{"key":"ref20","article-title":"Combining optimal control and learning for visual navigation in novel environments","author":"bansal","year":"2019","journal-title":"arXiv preprint arXiv 1903 00066"},{"key":"ref22","article-title":"Policies modulating trajectory generators","author":"iscen","year":"2018","journal-title":"CoRL"},{"key":"ref21","article-title":"Residual reactive navigation: Combining classical and learned navigation strategies for deployment in unknown environments","author":"rana","year":"2019","journal-title":"arXiv preprint arXiv 1909 11324"},{"key":"ref24","article-title":"Learning complex dexterous manipulation with deep reinforcement learning and demonstrations","author":"rajeswaran","year":"2017","journal-title":"arXiv preprint arXiv 1709 10119"},{"key":"ref23","doi-asserted-by":"crossref","DOI":"10.1609\/aaai.v32i1.11757","article-title":"Deep q-learning from demonstrations","author":"hester","year":"2018","journal-title":"Thirty-Second AAAI Conference on Artificial Intelligence"},{"key":"ref26","article-title":"Reinforcement learning from imperfect demonstrations","author":"gao","year":"2018","journal-title":"arXiv preprint arxiv 1802 05807"},{"key":"ref25","article-title":"Leveraging demonstrations for deep reinforcement learning on robotics problems with sparse rewards","author":"vecerik","year":"2017","journal-title":"arXiv preprint arXiv 1707 08817"}],"event":{"name":"2020 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)","location":"Las Vegas, NV, USA","start":{"date-parts":[[2020,10,24]]},"end":{"date-parts":[[2021,1,24]]}},"container-title":["2020 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9340668\/9340635\/09341372.pdf?arnumber=9341372","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,12,21]],"date-time":"2022-12-21T14:52:47Z","timestamp":1671634367000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9341372\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,10,24]]},"references-count":30,"URL":"https:\/\/doi.org\/10.1109\/iros45743.2020.9341372","relation":{},"subject":[],"published":{"date-parts":[[2020,10,24]]}}}