{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,20]],"date-time":"2026-03-20T00:04:27Z","timestamp":1773965067861,"version":"3.50.1"},"reference-count":30,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2024,1,1]],"date-time":"2024-01-01T00:00:00Z","timestamp":1704067200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/legalcode"}],"funder":[{"DOI":"10.13039\/501100013153","name":"Haikou Science and Technology Plan Project","doi-asserted-by":"publisher","award":["2022-007"],"award-info":[{"award-number":["2022-007"]}],"id":[{"id":"10.13039\/501100013153","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Key Laboratory of Phytium Kylin System Technologies Research of Hainan, China","award":["2022-007"],"award-info":[{"award-number":["2022-007"]}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Access"],"published-print":{"date-parts":[[2024]]},"DOI":"10.1109\/access.2024.3463732","type":"journal-article","created":{"date-parts":[[2024,9,19]],"date-time":"2024-09-19T17:28:57Z","timestamp":1726766937000},"page":"145496-145510","source":"Crossref","is-referenced-by-count":3,"title":["Reinforcement Learning for Autonomous Agents: Scene-Specific Dynamic Obstacle Avoidance and Target Pursuit in Unknown Environments"],"prefix":"10.1109","volume":"12","author":[{"ORCID":"https:\/\/orcid.org\/0009-0002-0434-6394","authenticated-orcid":false,"given":"Zixiang","family":"Tang","sequence":"first","affiliation":[{"name":"School of Computer Science and Technology, Hainan University, Hainan, China"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-4811-7692","authenticated-orcid":false,"given":"Fa","family":"Fu","sequence":"additional","affiliation":[{"name":"School of Computer Science and Technology, Hainan University, Hainan, China"}]},{"given":"Gaoshang","family":"Lu","sequence":"additional","affiliation":[{"name":"School of Computer Science and Technology, Hainan University, Hainan, China"}]},{"given":"Da","family":"Chen","sequence":"additional","affiliation":[{"name":"School of Computer Science and Technology, Hainan University, Hainan, China"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1016\/j.arcontrol.2016.04.018"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1016\/j.tre.2024.103518"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1016\/j.trf.2023.03.005"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1016\/j.asjsur.2022.05.044"},{"key":"ref5","doi-asserted-by":"crossref","DOI":"10.1109\/TNN.1998.712192","volume-title":"Introduction to Reinforcement Learning","author":"Sutton","year":"1998"},{"key":"ref6","first-page":"1","article-title":"A survey on military intelligent command","volume-title":"Proc. 8th China Command Control Conf.","author":"Yin"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1007\/s10462-022-10299-x"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1103\/PRXEnergy.2.043007"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1063\/5.0216874"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/ICRTIT.2011.5972477"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1016\/j.robot.2019.02.013"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1016\/j.eswa.2024.123539"},{"issue":"20","key":"ref13","first-page":"4","article-title":"Application of deep reinforcement learning algorithm in intelligent military decision-making","volume":"57","author":"Guo","year":"2021","journal-title":"Comput. Eng. Appl."},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/SMC.2017.8122622"},{"issue":"1","key":"ref15","first-page":"1","article-title":"A multi-agent reinforcement learning algorithm based ont improved DDPG int actor\u2013critic framework","volume":"36","author":"Chen","year":"2021","journal-title":"Control Decision"},{"key":"ref16","first-page":"1","article-title":"Unmanned ship full coverage path planning based on deep reinforcement learning","volume":"45","author":"Song","year":"2022","journal-title":"Mod. Electron. Techn."},{"issue":"1","key":"ref17","first-page":"1","article-title":"Target finding design of exhibition hall inspection robot based on reinforcement learning","volume":"20","author":"Dong","year":"2023","journal-title":"Comput. Multimedia Technol. Electron. Technol. SoftWare Eng."},{"key":"ref18","first-page":"1","article-title":"Research on T-DQN intelligent obstacle avoidance algorithm for unmanned boats","volume":"49","author":"Zhou","year":"2023","journal-title":"Acta Automatica Sinica"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/ICInfA.2015.7279322"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/ISCO.2016.7727034"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.5772\/10528"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/SoutheastCon42311.2019.9020521"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/ITNEC.2019.8729554"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/ICARSC.2019.8733621"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1016\/j.asoc.2020.106796"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/twc.2022.3162749"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/lwc.2021.3089876"},{"key":"ref28","first-page":"1","article-title":"Local path planning of anti-mine unmanned vehicle based on reinforcement learning","volume":"28","author":"Yang","year":"2021","journal-title":"Electron. Optics Control"},{"key":"ref29","article-title":"Deep reinforcement learning doesn\u2019t work yet","volume-title":"Medium","year":"2019"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/TSMCA.2012.2227719"}],"container-title":["IEEE Access"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/6287639\/10380310\/10684182.pdf?arnumber=10684182","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,10,14]],"date-time":"2024-10-14T17:27:01Z","timestamp":1728926821000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10684182\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024]]},"references-count":30,"URL":"https:\/\/doi.org\/10.1109\/access.2024.3463732","relation":{},"ISSN":["2169-3536"],"issn-type":[{"value":"2169-3536","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024]]}}}