{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,11]],"date-time":"2025-10-11T08:25:40Z","timestamp":1760171140259,"version":"3.28.0"},"reference-count":33,"publisher":"IEEE","license":[{"start":{"date-parts":[[2019,5,1]],"date-time":"2019-05-01T00:00:00Z","timestamp":1556668800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2019,5,1]],"date-time":"2019-05-01T00:00:00Z","timestamp":1556668800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2019,5,1]],"date-time":"2019-05-01T00:00:00Z","timestamp":1556668800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2019,5]]},"DOI":"10.1109\/icra.2019.8793733","type":"proceedings-article","created":{"date-parts":[[2019,8,13]],"date-time":"2019-08-13T01:26:12Z","timestamp":1565659572000},"page":"3615-3621","source":"Crossref","is-referenced-by-count":33,"title":["Leveraging Contact Forces for Learning to Grasp"],"prefix":"10.1109","author":[{"given":"Hamza","family":"Merzic","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Miroslav","family":"Bogdanovic","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Daniel","family":"Kappler","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ludovic","family":"Righetti","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jeannette","family":"Bohg","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref33","first-page":"3195","article-title":"Probabilistic object tracking using a range camera","author":"w\u00fcthrich","year":"2013","journal-title":"IEEE Int Conf Intelligent Robots and Systems"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2015.7354090"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2018.2819658"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2012.6386109"},{"key":"ref10","article-title":"Qt-opt: Scalable deep reinforcement learning for vision-based robotic manipulation","volume":"abs 1806 10293","author":"kalashnikov","year":"2018","journal-title":"CoRR"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2018.2795645"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2015.7139793"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2004.1389727"},{"key":"ref14","article-title":"Learning dexterous manipulation policies from experience and imitation","author":"kumar","year":"2016","journal-title":"arXiv preprint arXiv 1611 05095"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.2174\/1573399812666160613113556"},{"key":"ref16","first-page":"278364917710318","article-title":"Learning hand-eye coordination for robotic grasping with deep learning and large-scale data collection","author":"levine","year":"2016","journal-title":"The International Journal of Robotics Research"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.15607\/RSS.2017.XIII.058"},{"key":"ref18","article-title":"Playing atari with deep reinforcement learning","author":"mnih","year":"2013","journal-title":"arXiv preprint arXiv 1312 5602"},{"key":"ref19","first-page":"278","article-title":"Policy invariance under reward transformations: Theory and application to reward shaping","volume":"99","author":"ng","year":"1999","journal-title":"ICML"},{"key":"ref28","first-page":"1057","article-title":"Policy gradient methods for reinforcement learning with function approximation","author":"sutton","year":"1999","journal-title":"Advances in Neural Information Processing Systems (NIPS) NIPS'99"},{"key":"ref4","doi-asserted-by":"crossref","first-page":"289","DOI":"10.1109\/TRO.2013.2289018","article-title":"Data-driven grasp synthesisa survey","volume":"30","author":"bohg","year":"2014","journal-title":"IEEE Transactions on Robotics"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/HUMANOIDS.2015.7363558"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2011.2132870"},{"key":"ref6","article-title":"Generalizing regrasping with supervised policy learning","author":"chebotar","year":"2016","journal-title":"International Symposium on Experimental Robotics (ISER)"},{"key":"ref29","article-title":"Grasp pose detection in point clouds","volume":"abs 1706 9911","author":"pas","year":"2017","journal-title":"CoRR"},{"key":"ref5","article-title":"The feeling of success: Does touch sensing help predict grasp outcomes?","author":"calandra","year":"2017","journal-title":"arXiv preprint arXiv 1710 05512"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8202149"},{"journal-title":"OpenAI Baselines","year":"2017","author":"dhariwal","key":"ref7"},{"key":"ref2","doi-asserted-by":"crossref","first-page":"899","DOI":"10.1109\/TRO.2012.2189498","article-title":"Physical human interactive guidance: Identifying grasping principles from human-planned grasps","volume":"28","author":"balasubramanian","year":"2012","journal-title":"IEEE Transactions on Robotics"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.1992.219918"},{"key":"ref1","article-title":"Reinforcement learning for pivoting task","author":"antonova","year":"2017","journal-title":"arXiv preprint arXiv 1703 06870"},{"key":"ref20","article-title":"Sim-to-Real Transfer of Robotic Control with Dynamics Randomization","author":"peng","year":"2017","journal-title":"ArXiv e-prints"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2018.8460537"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2016.7487517"},{"key":"ref24","article-title":"Learning complex dexterous manipulation with deep reinforcement learning and demonstrations","author":"rajeswaran","year":"2017","journal-title":"arXiv preprint arXiv 1 709 10087"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1177\/0278364913506757"},{"key":"ref26","article-title":"Proximal policy optimization algorithms","author":"schulman","year":"2017","journal-title":"arXiv preprint arXiv 1707 07816"},{"key":"ref25","first-page":"1889","article-title":"Trust region policy optimization","author":"schulman","year":"2015","journal-title":"Proceedings of the 32nd International Conference on Machine Learning (ICML-15)"}],"event":{"name":"2019 International Conference on Robotics and Automation (ICRA)","start":{"date-parts":[[2019,5,20]]},"location":"Montreal, QC, Canada","end":{"date-parts":[[2019,5,24]]}},"container-title":["2019 International Conference on Robotics and Automation (ICRA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8780387\/8793254\/08793733.pdf?arnumber=8793733","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,7,15]],"date-time":"2022-07-15T03:17:33Z","timestamp":1657855053000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8793733\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2019,5]]},"references-count":33,"URL":"https:\/\/doi.org\/10.1109\/icra.2019.8793733","relation":{},"subject":[],"published":{"date-parts":[[2019,5]]}}}