{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,1]],"date-time":"2026-02-01T05:03:04Z","timestamp":1769922184723,"version":"3.49.0"},"reference-count":38,"publisher":"IEEE","license":[{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2020,10,24]]},"DOI":"10.1109\/iros45743.2020.9341378","type":"proceedings-article","created":{"date-parts":[[2021,3,15]],"date-time":"2021-03-15T10:49:56Z","timestamp":1615805396000},"page":"5564-5571","source":"Crossref","is-referenced-by-count":8,"title":["Optimizing a Continuum Manipulator\u2019s Search Policy Through Model-Free Reinforcement Learning"],"prefix":"10.1109","author":[{"given":"Chase","family":"Frazelle","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jonathan","family":"Rogers","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ioannis","family":"Karamouzas","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ian","family":"Walker","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref38","article-title":"Soft actor-critic: Offpolicy maximum entropy deep reinforcement learning with a stochastic actor","author":"haarnoja","year":"2018"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/TNN.1998.712192"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/ROBIO49542.2019.8961852"},{"key":"ref31","doi-asserted-by":"crossref","first-page":"124","DOI":"10.1109\/TRO.2018.2878318","article-title":"Model-based reinforcement learning for closed-loop dynamic control of soft robotic manipulators","volume":"35","author":"thuruthel","year":"2018","journal-title":"IEEE Transactions on Robotics"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2019.8793653"},{"key":"ref37","article-title":"Proximal policy optimization algorithms","author":"schulman","year":"2017"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2011.5979830"},{"key":"ref35","year":"2020","journal-title":"Gazebo-robot simulation made easy"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1080\/01691864.2015.1036772"},{"key":"ref10","doi-asserted-by":"crossref","first-page":"43","DOI":"10.1109\/TRO.2005.861458","article-title":"Kinematics for multisection continuum robots","volume":"22","author":"jones","year":"2006","journal-title":"IEEE Trans Robot"},{"key":"ref11","first-page":"264","article-title":"On the inverse kinematics of redundant manipulators","author":"burdick","year":"1989","journal-title":"Proc IEEE Int Conf Robot Autom"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2011.5979607"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.2003.1242160"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TMECH.2003.812829"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2015.7354158"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/IROS40897.2019.8967841"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8206553"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2016.7487598"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/IROS40897.2019.8968172"},{"key":"ref28","article-title":"Iterative reinforcement learning based design of dynamic locomotion skills for cassie","author":"xie","year":"2019","journal-title":"Conference on Robot Learning"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/BIOROB.2006.1639170"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.15607\/RSS.2018.XIV.010"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1108\/01439910210425531"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1111\/j.1096-3642.1985.tb01178.x"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2017.7989079"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/AERO.2018.8396541"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1155\/2008\/520417"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1089\/soro.2017.0007"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2015.2489500"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/70.294209"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.5402\/2013\/726506"},{"key":"ref20","first-page":"5919","article-title":"Real-time adaptive motion planning for a continuum manipulator","author":"xiao","year":"2010","journal-title":"Proc IEEE\/RSJ Int Conf Intel Robot Syst"},{"key":"ref22","doi-asserted-by":"crossref","first-page":"1082","DOI":"10.1126\/science.1107799","article-title":"Efficient bipedal robots based on passive-dynamic walkers","volume":"307","author":"collins","year":"2005","journal-title":"Science"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1089\/soro.2018.0034"},{"key":"ref24","first-page":"363","article-title":"Autonomous inverted helicopter flight via reinforcement learning","author":"ng","year":"2003","journal-title":"International Symposium on Experimental Robotics"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.2004.1307456"},{"key":"ref26","article-title":"Learning to walk via deep reinforcement learning","author":"haarnoja","year":"2018","journal-title":"Robotics Science and Systems"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1177\/0278364913495721"}],"event":{"name":"2020 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)","location":"Las Vegas, NV, USA","start":{"date-parts":[[2020,10,24]]},"end":{"date-parts":[[2021,1,24]]}},"container-title":["2020 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9340668\/9340635\/09341378.pdf?arnumber=9341378","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,6,28]],"date-time":"2022-06-28T17:57:23Z","timestamp":1656439043000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9341378\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,10,24]]},"references-count":38,"URL":"https:\/\/doi.org\/10.1109\/iros45743.2020.9341378","relation":{},"subject":[],"published":{"date-parts":[[2020,10,24]]}}}