{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,11]],"date-time":"2026-03-11T01:44:50Z","timestamp":1773193490310,"version":"3.50.1"},"reference-count":36,"publisher":"IEEE","license":[{"start":{"date-parts":[[2019,5,1]],"date-time":"2019-05-01T00:00:00Z","timestamp":1556668800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2019,5,1]],"date-time":"2019-05-01T00:00:00Z","timestamp":1556668800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2019,5,1]],"date-time":"2019-05-01T00:00:00Z","timestamp":1556668800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2019,5]]},"DOI":"10.1109\/icra.2019.8793979","type":"proceedings-article","created":{"date-parts":[[2019,8,12]],"date-time":"2019-08-12T21:26:12Z","timestamp":1565645172000},"page":"5993-6000","source":"Crossref","is-referenced-by-count":65,"title":["Deep Reinforcement Learning of Navigation in a Complex and Crowded Environment with a Limited Field of View"],"prefix":"10.1109","author":[{"given":"Jinyoung","family":"Choi","sequence":"first","affiliation":[]},{"given":"Kyungsik","family":"Park","sequence":"additional","affiliation":[]},{"given":"Minsu","family":"Kim","sequence":"additional","affiliation":[]},{"given":"Sangok","family":"Seok","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/ICUWB.2010.5616888"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2016.7759617"},{"key":"ref31","article-title":"Empirical evaluation of rectified activations in convolutional network","author":"xu","year":"2015","journal-title":"arXiv preprint arXiv 1505 03854"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1007\/BF01386390"},{"key":"ref36","article-title":"Neural map: Structured memory for deep reinforcement learning","author":"parisotto","year":"2017","journal-title":"arXiv preprint arXiv 1702 08502"},{"key":"ref35","article-title":"Learning end-to-end multimodal sensor policies for autonomous navigation","author":"liu","year":"2017","journal-title":"arXiv preprint arXiv 1705 10422"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00277"},{"key":"ref10","article-title":"Towards optimally decentralized multi-robot collision avoidance via deep reinforcement learning","author":"long","year":"2017","journal-title":"arXiv preprint arXiv 1709 10119"},{"key":"ref11","article-title":"Motion planning for a sixlegged lunar robot","author":"hauser","year":"2006","journal-title":"The Seventh International Workshop on the Algorithmic Foundations of Robotics"},{"key":"ref12","first-page":"2244","article-title":"Learning multiagent communication with backpropagation","author":"sukhbaatar","year":"2016","journal-title":"Advances in neural information processing systems"},{"key":"ref13","article-title":"Multi-focus attention network for efficient deep reinforcement learning","author":"choi","year":"2017","journal-title":"arXiv preprint arXiv 1712 04603"},{"key":"ref14","first-page":"2137","article-title":"Learning to communicate with deep multi-agent reinforcement learning","author":"foerster","year":"2016","journal-title":"Advances in neural information processing systems"},{"key":"ref15","first-page":"6379","article-title":"Multi-agent actor-critic for mixed cooperative-competitive environments","author":"lowe","year":"2017","journal-title":"Advances in neural information processing systems"},{"key":"ref16","doi-asserted-by":"crossref","first-page":"529","DOI":"10.1038\/nature14236","article-title":"Human-level control through deep reinforcement learning","volume":"518","author":"mnih","year":"2015","journal-title":"Nature"},{"key":"ref17","first-page":"1928","article-title":"Asynchronous methods for deep reinforcement learning","author":"mnih","year":"2016","journal-title":"International Conference on Machine Learning"},{"key":"ref18","doi-asserted-by":"crossref","first-page":"484","DOI":"10.1038\/nature16961","article-title":"Mastering the game of go with deep neural networks and tree search","volume":"529","author":"silver","year":"2016","journal-title":"Nature"},{"key":"ref19","article-title":"Sim-toreal: Learning agile locomotion for quadruped robots","author":"tan","year":"2018","journal-title":"arXiv preprint arXiv 1804 10204"},{"key":"ref28","author":"lin","year":"1993","journal-title":"Reinforcement learning for robots using neural networks"},{"key":"ref4","article-title":"Crowdmove: Autonomous mapless navigation in crowded scenarios","author":"fan","year":"2018","journal-title":"arXiv preprint arXiv 1807 07870"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1162\/neco.1997.9.8.1735"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1016\/j.arcontrol.2012.09.008"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2017.7989381"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.28"},{"key":"ref5","article-title":"Prm-rl: Long-range robotic navigation tasks by combining reinforcement learning and sampling-based planning","author":"faust","year":"2017","journal-title":"arXiv preprint arXiv 1710 03937"},{"key":"ref8","article-title":"Building generalizable agents with a realistic and rich 3d environment","author":"wu","year":"2018","journal-title":"arXiv preprint arXiv 1801 04144"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8202312"},{"key":"ref2","doi-asserted-by":"crossref","first-page":"23","DOI":"10.1109\/100.580977","article-title":"The dynamic window approach to collision avoidance","volume":"4","author":"fox","year":"1997","journal-title":"IEEE Robotics & Automation Magazine"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1002\/rob.20244"},{"key":"ref1","doi-asserted-by":"crossref","first-page":"1141","DOI":"10.1016\/j.mcm.2004.05.001","article-title":"Autonomous robot navigation using adaptive potential fields","volume":"40","author":"cos\u00edo","year":"2004","journal-title":"Mathematical and Computer Modelling"},{"key":"ref20","article-title":"Sim-to-real transfer of robotic control with dynamics randomization","author":"peng","year":"2017","journal-title":"arXiv preprint arXiv 1710 06537"},{"key":"ref22","doi-asserted-by":"crossref","first-page":"387","DOI":"10.1007\/978-3-642-27645-3_12","article-title":"Partially observable markov decision processes","author":"spaan","year":"2012","journal-title":"Reinforcement Learning"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8202133"},{"key":"ref24","article-title":"Continuous control with deep reinforcement learning","author":"lillicrap","year":"2015","journal-title":"arXiv preprint arXiv 1509 02971"},{"key":"ref23","volume":"135","author":"sutton","year":"1998","journal-title":"Introduction to Reinforcement Learning"},{"key":"ref26","article-title":"Soft actor-critic: Off-policy maximum entropy deep reinforcement learning with a stochastic actor","author":"haarnoja","year":"2018","journal-title":"arXiv preprint arXiv 1801 04144"},{"key":"ref25","article-title":"Proximal policy optimization algorithms","author":"schulman","year":"2017","journal-title":"arXiv preprint arXiv 1707 07816"}],"event":{"name":"2019 International Conference on Robotics and Automation (ICRA)","location":"Montreal, QC, Canada","start":{"date-parts":[[2019,5,20]]},"end":{"date-parts":[[2019,5,24]]}},"container-title":["2019 International Conference on Robotics and Automation (ICRA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8780387\/8793254\/08793979.pdf?arnumber=8793979","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,7,14]],"date-time":"2022-07-14T23:13:23Z","timestamp":1657840403000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8793979\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2019,5]]},"references-count":36,"URL":"https:\/\/doi.org\/10.1109\/icra.2019.8793979","relation":{},"subject":[],"published":{"date-parts":[[2019,5]]}}}