{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,23]],"date-time":"2024-10-23T04:31:24Z","timestamp":1729657884145,"version":"3.28.0"},"reference-count":18,"publisher":"IEEE","license":[{"start":{"date-parts":[[2019,8,1]],"date-time":"2019-08-01T00:00:00Z","timestamp":1564617600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2019,8,1]],"date-time":"2019-08-01T00:00:00Z","timestamp":1564617600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2019,8,1]],"date-time":"2019-08-01T00:00:00Z","timestamp":1564617600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2019,8]]},"DOI":"10.1109\/coase.2019.8842940","type":"proceedings-article","created":{"date-parts":[[2019,9,20]],"date-time":"2019-09-20T00:08:11Z","timestamp":1568938091000},"page":"1651-1656","source":"Crossref","is-referenced-by-count":15,"title":["Deep Reinforcement Learning of Robotic Precision Insertion Skill Accelerated by Demonstrations"],"prefix":"10.1109","author":[{"given":"Xiapeng","family":"Wu","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Dapeng","family":"Zhang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Fangbo","family":"Qin","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"De","family":"Xu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"crossref","DOI":"10.1609\/aaai.v32i1.11757","article-title":"Deep Q-learning from demonstrations","author":"hester","year":"2018","journal-title":"Conference on Artificial Intelligence"},{"key":"ref11","volume":"10","author":"sutton","year":"1998","journal-title":"Introduction to Reinforcement Learning"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1038\/nature14236"},{"key":"ref13","first-page":"293","article-title":"Self-improving reactive agents based on reinforcement learning, planning and teaching","volume":"8 3","author":"li","year":"1992","journal-title":"Machine Learning"},{"key":"ref14","first-page":"1995","article-title":"Dueling Network Architectures for Deep Reinforcement Learning","author":"wang","year":"2016","journal-title":"International Conference on Machine Learning"},{"key":"ref15","article-title":"Prioritized Experience Replay","author":"schaul","year":"2016","journal-title":"In International Conference on Learning Representations"},{"key":"ref16","article-title":"Deep Recurrent Q-Learning for Partially Observable MDPs","author":"hausknecht","year":"2015","journal-title":"AAAI Fall Symposium on Sequential Decision Making for Intelligent Agents (SDMIA)"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/TASE.2014.2332543"},{"key":"ref18","article-title":"Adam: A Method for Stochastic optimization","author":"kingma","year":"2014","journal-title":"Computer Science"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1007\/s11633-013-0732-y"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/TMECH.2019.2909081"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1177\/0278364917710318"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.1994.351117"},{"key":"ref8","first-page":"105","article-title":"6D frictional contact for rigid bodies","author":"bouchard","year":"2015","journal-title":"Graphics Interface Conference Canadian Information Processing Society"},{"key":"ref7","first-page":"734","article-title":"Sim-to-Real Reinforcement Learning for Deformable Object Manipulation","author":"matas","year":"2018","journal-title":"Conference on Robot Learning"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/TSMC.2017.2669219"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/TIE.2014.2347004"},{"key":"ref9","first-page":"447","article-title":"Exploration from demonstration for interactive reinforcement learning","author":"subramanian","year":"2016","journal-title":"Proc of International Conference on Autonomous Agents and Multiagent Systems"}],"event":{"name":"2019 IEEE 15th International Conference on Automation Science and Engineering (CASE)","start":{"date-parts":[[2019,8,22]]},"location":"Vancouver, BC, Canada","end":{"date-parts":[[2019,8,26]]}},"container-title":["2019 IEEE 15th International Conference on Automation Science and Engineering (CASE)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8827189\/8842826\/08842940.pdf?arnumber=8842940","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,9,29]],"date-time":"2022-09-29T02:55:52Z","timestamp":1664420152000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8842940\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2019,8]]},"references-count":18,"URL":"https:\/\/doi.org\/10.1109\/coase.2019.8842940","relation":{},"subject":[],"published":{"date-parts":[[2019,8]]}}}