{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,12]],"date-time":"2026-03-12T05:35:08Z","timestamp":1773293708681,"version":"3.50.1"},"reference-count":38,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2017,5]]},"DOI":"10.1109\/icra.2017.7989079","type":"proceedings-article","created":{"date-parts":[[2017,7,25]],"date-time":"2017-07-25T17:44:28Z","timestamp":1501004668000},"page":"634-641","source":"Crossref","is-referenced-by-count":64,"title":["Deep reinforcement learning for tensegrity robot locomotion"],"prefix":"10.1109","author":[{"given":"Marvin","family":"Zhang","sequence":"first","affiliation":[]},{"given":"Xinyang","family":"Geng","sequence":"additional","affiliation":[]},{"given":"Jonathan","family":"Bruce","sequence":"additional","affiliation":[]},{"given":"Ken","family":"Caluwaerts","sequence":"additional","affiliation":[]},{"given":"Massimo","family":"Vespignani","sequence":"additional","affiliation":[]},{"given":"Vytas","family":"SunSpiral","sequence":"additional","affiliation":[]},{"given":"Pieter","family":"Abbeel","sequence":"additional","affiliation":[]},{"given":"Sergey","family":"Levine","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2016.7487331"},{"key":"ref33","article-title":"Covariant policy search","author":"bagnell","year":"2003","journal-title":"International Joint Conference on Artificial Intelligence (IJCAI)"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2015.7139590"},{"key":"ref31","author":"snelson","year":"1965","journal-title":"Continuous tension discontinuous compression structures united states patent 3169611"},{"key":"ref30","author":"fuller","year":"1975","journal-title":"Synergetics Explorations in the Geometry of Thinking"},{"key":"ref37","year":"0","journal-title":"Flann Fast Library for Approximate Nearest Neighbors"},{"key":"ref36","first-page":"1334","article-title":"End-to-end training of deep visuomotor policies","volume":"17","author":"levine","year":"2016","journal-title":"Journal of Machine Learning Resaerch"},{"key":"ref35","article-title":"Relative entropy policy search","author":"peters","year":"2010","journal-title":"AAAI Conference on Artificial Intelligence"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1016\/j.neunet.2008.02.003"},{"key":"ref10","article-title":"Guided policy search as approximate mirror descent","author":"montgomery","year":"2016","journal-title":"Advances in Neural Information Processing Systems (NIPS)"},{"key":"ref11","article-title":"Fast biped walking with a reflexive controller and realtime policy searching","author":"geng","year":"2006","journal-title":"NIPS"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1177\/0278364907084980"},{"key":"ref13","article-title":"Guided policy search","author":"levine","year":"2013","journal-title":"ICML"},{"key":"ref14","article-title":"Learning neural network policies with guided policy search under unknown dynamics","author":"levine","year":"2014","journal-title":"NIPS"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1016\/B978-190399637-9\/50038-X"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1016\/j.mechmachtheory.2007.06.010"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1177\/0278364908091152"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2015.7354204"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1016\/j.robot.2008.10.010"},{"key":"ref28","doi-asserted-by":"crossref","first-page":"655","DOI":"10.1109\/TRO.2015.2419431","article-title":"Real-world reinforcement learning via multifidelity simulators","volume":"31","author":"cutler","year":"2016","journal-title":"IEEE Transactions on Robotics"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1007\/s10472-015-9463-9"},{"key":"ref27","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1561\/2300000021","article-title":"A survey on policy search for robotics","volume":"2","author":"deisenroth","year":"2013","journal-title":"Foundations and Trends in Robotics"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.2004.1307456"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2009.5354701"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2015.7354126"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1177\/0278364910390537"},{"key":"ref8","article-title":"Trust region policy optimization","author":"schulman","year":"2015","journal-title":"International Conference on Machine Learning (ICML)"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2016.7487140"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2004.1389841"},{"key":"ref9","article-title":"Continuous control with deep reinforcement learning","author":"lillicrap","year":"2016","journal-title":"International Conference on Learning Representations (ICLR)"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2014.6907361"},{"key":"ref20","year":"0","journal-title":"NASA tensegrity robotics toolkit"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1089\/soro.2015.0012"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2014.6942864"},{"key":"ref24","doi-asserted-by":"crossref","first-page":"1082","DOI":"10.1126\/science.1107799","article-title":"Efficient bipedal robots based on passive-dynamic walkers","volume":"307","author":"collins","year":"2005","journal-title":"Science"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2015.7354134"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1242\/jeb.00463"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1177\/02783640122067309"}],"event":{"name":"2017 IEEE International Conference on Robotics and Automation (ICRA)","location":"Singapore, Singapore","start":{"date-parts":[[2017,5,29]]},"end":{"date-parts":[[2017,6,3]]}},"container-title":["2017 IEEE International Conference on Robotics and Automation (ICRA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/7960754\/7988677\/07989079.pdf?arnumber=7989079","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,10,1]],"date-time":"2019-10-01T12:10:06Z","timestamp":1569931806000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/7989079\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2017,5]]},"references-count":38,"URL":"https:\/\/doi.org\/10.1109\/icra.2017.7989079","relation":{},"subject":[],"published":{"date-parts":[[2017,5]]}}}