{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,12]],"date-time":"2026-03-12T04:15:46Z","timestamp":1773288946084,"version":"3.50.1"},"reference-count":21,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"1","license":[{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"am","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"name":"NSF","award":["CNS-1837382"],"award-info":[{"award-number":["CNS-1837382"]}]},{"DOI":"10.13039\/100000181","name":"Air Force Office of Scientific Research","doi-asserted-by":"publisher","award":["MURI FA9550-23-1-0400"],"award-info":[{"award-number":["MURI FA9550-23-1-0400"]}],"id":[{"id":"10.13039\/100000181","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/100000006","name":"ONR","doi-asserted-by":"publisher","award":["N00014-23-1-2850"],"award-info":[{"award-number":["N00014-23-1-2850"]}],"id":[{"id":"10.13039\/100000006","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Robot. Autom. Lett."],"published-print":{"date-parts":[[2025,1]]},"DOI":"10.1109\/lra.2024.3511412","type":"journal-article","created":{"date-parts":[[2024,12,4]],"date-time":"2024-12-04T19:19:21Z","timestamp":1733339961000},"page":"572-579","source":"Crossref","is-referenced-by-count":7,"title":["Modular Reinforcement Learning for a Quadrotor UAV With Decoupled Yaw Control"],"prefix":"10.1109","volume":"10","author":[{"ORCID":"https:\/\/orcid.org\/0009-0007-3261-1665","authenticated-orcid":false,"given":"Beomyeol","family":"Yu","sequence":"first","affiliation":[{"name":"Flight Dynamics and Control Lab, Mechanical and Aerospace Engineering, The George Washington University, Washington, DC, USA"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-4982-4150","authenticated-orcid":false,"given":"Taeyoung","family":"Lee","sequence":"additional","affiliation":[{"name":"Flight Dynamics and Control Lab, Mechanical and Aerospace Engineering, The George Washington University, Washington, DC, USA"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.23919\/ACC.2019.8815189"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1115\/1.4052714"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2017.2720851"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1007\/s10846-018-0891-8"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.23919\/ACC55779.2023.10156379"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/IROS40897.2019.8967695"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.3390\/s21134560"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/IROS47612.2022.9981229"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.3390\/app11073257"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2024.3396025"},{"key":"ref11","article-title":"Beyond Tabula-Rasa: A modular reinforcement learning approach for physically embedded 3D sokoban","author":"Karkus","year":"2020"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.23919\/ACC60939.2024.10644789"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1038\/s41586-023-06419-4"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA46639.2022.9811564"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.3390\/drones7070418"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/CDC.2010.5717652"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA48506.2021.9561138"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/LARS\/SBR\/WRE.2018.00094"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/CoG52621.2021.9619008"},{"key":"ref20","first-page":"1587","article-title":"Addressing function approximation error in actor-critic methods","volume-title":"Proc. Int. Conf. Mach. Learn.","author":"Fujimoto","year":"2018"},{"key":"ref21","article-title":"Reducing overestimation bias in multi-agent domains using double centralized critics","author":"Ackermann","year":"2019"}],"container-title":["IEEE Robotics and Automation Letters"],"original-title":[],"link":[{"URL":"https:\/\/ieeexplore.ieee.org\/ielam\/7083369\/10768868\/10777540-aam.pdf","content-type":"application\/pdf","content-version":"am","intended-application":"syndication"},{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/7083369\/10768868\/10777540.pdf?arnumber=10777540","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,12,12]],"date-time":"2024-12-12T19:27:14Z","timestamp":1734031634000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10777540\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,1]]},"references-count":21,"journal-issue":{"issue":"1"},"URL":"https:\/\/doi.org\/10.1109\/lra.2024.3511412","relation":{},"ISSN":["2377-3766","2377-3774"],"issn-type":[{"value":"2377-3766","type":"electronic"},{"value":"2377-3774","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025,1]]}}}