{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,3]],"date-time":"2026-06-03T18:47:29Z","timestamp":1780512449271,"version":"3.54.1"},"reference-count":28,"publisher":"IEEE","license":[{"start":{"date-parts":[[2022,5,23]],"date-time":"2022-05-23T00:00:00Z","timestamp":1653264000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2022,5,23]],"date-time":"2022-05-23T00:00:00Z","timestamp":1653264000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2022,5,23]]},"DOI":"10.1109\/icra46639.2022.9811973","type":"proceedings-article","created":{"date-parts":[[2022,7,12]],"date-time":"2022-07-12T19:36:40Z","timestamp":1657654600000},"page":"9881-9887","source":"Crossref","is-referenced-by-count":32,"title":["Learning Insertion Primitives with Discrete-Continuous Hybrid Action Space for Robotic Assembly Tasks"],"prefix":"10.1109","author":[{"given":"Xiang","family":"Zhang","sequence":"first","affiliation":[{"name":"UC Berkeley,Department of Mechanical Engineering,CA,USA,94720"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Shiyu","family":"Jin","sequence":"additional","affiliation":[{"name":"UC Berkeley,Department of Mechanical Engineering,CA,USA,94720"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Changhao","family":"Wang","sequence":"additional","affiliation":[{"name":"UC Berkeley,Department of Mechanical Engineering,CA,USA,94720"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Xinghao","family":"Zhu","sequence":"additional","affiliation":[{"name":"UC Berkeley,Department of Mechanical Engineering,CA,USA,94720"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Masayoshi","family":"Tomizuka","sequence":"additional","affiliation":[{"name":"UC Berkeley,Department of Mechanical Engineering,CA,USA,94720"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA40945.2020.9196958"},{"key":"ref11","first-page":"735","article-title":"Continuous-discrete reinforcement learning for hybrid control in robotics","author":"neunert","year":"0","journal-title":"Conference on Robot Learning"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.3389\/fncom.2014.00062"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v31i1.10916"},{"key":"ref14","article-title":"Discrete and continuous action representation for practical rl in video games","author":"delalleau","year":"2019","journal-title":"ArXiv Preprint"},{"key":"ref15","article-title":"Multi-pass q-networks for deep reinforcement learning with parameterised action spaces","author":"bester","year":"2019","journal-title":"ArXiv Preprint"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA48506.2021.9561029"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v30i1.10226"},{"key":"ref18","article-title":"Playing atari with deep reinforcement learning","author":"mnih","year":"2013","journal-title":"ArXiv Preprint"},{"key":"ref19","article-title":"Continuous control with deep reinforcement learning","author":"lillicrap","year":"2015","journal-title":"ArXiv Preprint"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2021.3061374"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/IROS45743.2020.9341644"},{"key":"ref27","year":"0","journal-title":"Rail-berkeley\/rlkit Collection of reinforcement learning algorithms"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/IROS45743.2020.9341714"},{"key":"ref6","article-title":"Transferable force-torque dynamics model for peg-in-hole task","author":"ding","year":"2019","journal-title":"ArXiv Preprint"},{"key":"ref5","first-page":"1","article-title":"Stability-guaranteed reinforcement learning for contact-rich manipulation","volume":"6","author":"khader","year":"2020","journal-title":"IEEE l of Robotics and Automation"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA48506.2021.9561081"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/IROS45743.2020.9340848"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/IROS45743.2020.9341390"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA40945.2020.9196619"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8202244"},{"key":"ref20","article-title":"Hierarchical approaches for reinforcement learning in parameterized action space","author":"wei","year":"2018","journal-title":"ArXiv Preprint"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2019\/316"},{"key":"ref21","article-title":"Deep reinforcement learning in parameterized action space","author":"hausknecht","year":"2015","journal-title":"ArXiv Preprint"},{"key":"ref24","first-page":"1587","article-title":"Addressing function approximation error in actor-critic methods","author":"fujimoto","year":"0","journal-title":"International Conference on Machine Learning"},{"key":"ref23","article-title":"Parametrized deep q-networks learning: Reinforcement learning with discrete-continuous hybrid action space","author":"xiong","year":"2018","journal-title":"ArXiv Preprint"},{"key":"ref26","article-title":"Soft actor-critic algorithms and applications","author":"haarnoja","year":"2018","journal-title":"ArXiv Preprint"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2012.6386109"}],"event":{"name":"2022 IEEE International Conference on Robotics and Automation (ICRA)","location":"Philadelphia, PA, USA","start":{"date-parts":[[2022,5,23]]},"end":{"date-parts":[[2022,5,27]]}},"container-title":["2022 International Conference on Robotics and Automation (ICRA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9811522\/9811357\/09811973.pdf?arnumber=9811973","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,11,3]],"date-time":"2022-11-03T23:05:38Z","timestamp":1667516738000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9811973\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,5,23]]},"references-count":28,"URL":"https:\/\/doi.org\/10.1109\/icra46639.2022.9811973","relation":{},"subject":[],"published":{"date-parts":[[2022,5,23]]}}}