{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,18]],"date-time":"2026-04-18T16:16:25Z","timestamp":1776528985968,"version":"3.51.2"},"reference-count":29,"publisher":"IEEE","license":[{"start":{"date-parts":[[2022,5,23]],"date-time":"2022-05-23T00:00:00Z","timestamp":1653264000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2022,5,23]],"date-time":"2022-05-23T00:00:00Z","timestamp":1653264000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2022,5,23]]},"DOI":"10.1109\/icra46639.2022.9811554","type":"proceedings-article","created":{"date-parts":[[2022,7,12]],"date-time":"2022-07-12T19:36:40Z","timestamp":1657654600000},"page":"4487-4493","source":"Crossref","is-referenced-by-count":1,"title":["Learning to Rock-and-Walk: Dynamic, Non-Prehensile, and Underactuated Object Locomotion Through Reinforcement Learning"],"prefix":"10.1109","author":[{"given":"Abdullah","family":"Nazir","sequence":"first","affiliation":[{"name":"The Hong Kong University of Science and Technology,Clear Water Bay,Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xu","family":"Pu","sequence":"additional","affiliation":[{"name":"The Hong Kong University of Science and Technology,Clear Water Bay,Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Juan","family":"Rojas","sequence":"additional","affiliation":[{"name":"The Chinese University of Hong Kong,Department of Mechanical and Automation Engineering,Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jungwon","family":"Seo","sequence":"additional","affiliation":[{"name":"The Hong Kong University of Science and Technology,Clear Water Bay,Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1177\/027836499000900206"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1177\/02783640122067561"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.2004.1302452"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-32552-1"},{"key":"ref14","author":"sutton","year":"2018","journal-title":"Reinforcement Learning An Introduction"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1177\/0278364920987859"},{"key":"ref16","article-title":"Playing atari with deep reinforcement learning","author":"mnih","year":"0","journal-title":"NIPS Deep Learning Workshop 2013"},{"key":"ref17","article-title":"Emergence of locomotion behaviours in rich environments","author":"heess","year":"2017","journal-title":"ArXiv Preprint"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2018.8462863"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2018.8593986"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2021.3140147"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.1992.220275"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.7551\/mitpress\/4527.001.0001"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/56.800"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2017.2693391"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2019.8794163"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1177\/02783649922066079"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1177\/0278364908099463"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1177\/0278364913514466"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/IROS40897.2019.8968161"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1177\/0278364908091023"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1016\/j.jas.2012.09.029"},{"key":"ref20","article-title":"Solving rubik's cube with a robot hand","author":"akkaya","year":"2019","journal-title":"ArXiv Preprint"},{"key":"ref22","article-title":"Learning task space actions for bipedal locomotion","volume":"abs 2011 4741","author":"duan","year":"2020","journal-title":"CoRR"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.15607\/RSS.2018.XIV.010"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.15607\/RSS.2019.XV.011"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2018.8460756"},{"key":"ref26","author":"coumans","year":"2016","journal-title":"Pybullet a python module for physics simulation for games robotics and machine learning"},{"key":"ref25","author":"raffin","year":"2019","journal-title":"Stable baselines3"}],"event":{"name":"2022 IEEE International Conference on Robotics and Automation (ICRA)","location":"Philadelphia, PA, USA","start":{"date-parts":[[2022,5,23]]},"end":{"date-parts":[[2022,5,27]]}},"container-title":["2022 International Conference on Robotics and Automation (ICRA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9811522\/9811357\/09811554.pdf?arnumber=9811554","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,11,3]],"date-time":"2022-11-03T23:08:53Z","timestamp":1667516933000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9811554\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,5,23]]},"references-count":29,"URL":"https:\/\/doi.org\/10.1109\/icra46639.2022.9811554","relation":{},"subject":[],"published":{"date-parts":[[2022,5,23]]}}}