{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,30]],"date-time":"2026-04-30T14:57:24Z","timestamp":1777561044448,"version":"3.51.4"},"reference-count":34,"publisher":"IEEE","license":[{"start":{"date-parts":[[2021,5,30]],"date-time":"2021-05-30T00:00:00Z","timestamp":1622332800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2021,5,30]],"date-time":"2021-05-30T00:00:00Z","timestamp":1622332800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2021,5,30]],"date-time":"2021-05-30T00:00:00Z","timestamp":1622332800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2021,5,30]]},"DOI":"10.1109\/icra48506.2021.9561639","type":"proceedings-article","created":{"date-parts":[[2021,10,20]],"date-time":"2021-10-20T00:28:35Z","timestamp":1634689715000},"page":"5973-5979","source":"Crossref","is-referenced-by-count":25,"title":["Real-Time Trajectory Adaptation for Quadrupedal Locomotion using Deep Reinforcement Learning"],"prefix":"10.1109","author":[{"given":"Siddhant","family":"Gangapurwala","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mathieu","family":"Geisert","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Romeo","family":"Orsolino","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Maurice","family":"Fallon","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ioannis","family":"Havoutis","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/ICHR.2006.321385"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2020.2983318"},{"key":"ref31","article-title":"Sim-to-real robot learning from pixels with progressive nets","author":"rusu","year":"2016"},{"key":"ref30","first-page":"1","article-title":"Sparse autoencoder","volume":"72","author":"ng","year":"2011","journal-title":"Cs294a lecture notes"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2018.2792536"},{"key":"ref10","article-title":"Robust recovery controller for a quadrupedal robot using deep reinforcement learning","author":"lee","year":"2019"},{"key":"ref11","first-page":"5343","article-title":"First steps: Latent-space control with semantic constraints for quadruped locomotion","author":"mitchell","year":"0","journal-title":"2020 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2020.2979660"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1126\/scirobotics.abc5986"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2020.2979656"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2016.7758092"},{"key":"ref16","article-title":"On stochastic optimal control and reinforcement learning by approximate inference","author":"rawlik","year":"2013","journal-title":"Twenty-Third International Joint Conference on Artificial Intelligence"},{"key":"ref17","doi-asserted-by":"crossref","first-page":"76","DOI":"10.1109\/MCS.2012.2214134","article-title":"Reinforcement learning and feedback control: Using natural decision methods to design optimal adaptive controllers","volume":"32","author":"lewis","year":"2012","journal-title":"IEEE Control Systems Magazine"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1162\/089976602753712972"},{"key":"ref19","first-page":"1","article-title":"Guided policy search","volume":"28","author":"levine","year":"0"},{"key":"ref28","article-title":"High-dimensional continuous control using generalized advantage estimation","author":"schulman","year":"2015"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2018.2798285"},{"key":"ref27","article-title":"Proximal policy optimization algorithms","author":"schulman","year":"2017"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8206174"},{"key":"ref6","article-title":"Reliable trajectories for dynamic quadrupeds using analytical costs and learned initializations","author":"melon","year":"2019"},{"key":"ref29","article-title":"Provably efficient rl with rich observations via latent state decoding","author":"du","year":"2019"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2018.8463154"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA40945.2020.9196903"},{"key":"ref7","article-title":"Learning an Expert Skill-Space for Replanning Dynamic Quadruped Locomotion over Obstacles","author":"surovik","year":"2020","journal-title":"2020 Conference on Robot Learning (CoRL)"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA40945.2020.9197312"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1126\/scirobotics.aau5872"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/IROS40897.2019.8968031"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2016.7487175"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2018.8593722"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2019.8794127"},{"key":"ref24","article-title":"Rloc: Terrain-aware legged locomotion using reinforcement learning and optimal control","author":"gangapurwala","year":"2020"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/HUMANOIDS.2016.7803401"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2019.2931284"},{"key":"ref25","article-title":"On the implementation of a primal-dual interior point filter line search algorithm for large-scale nonlinear programming","volume":"106","author":"w\u00e4achter","year":"2004","journal-title":"Mathematical Programming"}],"event":{"name":"2021 IEEE International Conference on Robotics and Automation (ICRA)","location":"Xi'an, China","start":{"date-parts":[[2021,5,30]]},"end":{"date-parts":[[2021,6,5]]}},"container-title":["2021 IEEE International Conference on Robotics and Automation (ICRA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9560720\/9560666\/09561639.pdf?arnumber=9561639","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,5,10]],"date-time":"2022-05-10T15:47:26Z","timestamp":1652197646000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9561639\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,5,30]]},"references-count":34,"URL":"https:\/\/doi.org\/10.1109\/icra48506.2021.9561639","relation":{},"subject":[],"published":{"date-parts":[[2021,5,30]]}}}