{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,7,15]],"date-time":"2026-07-15T16:47:29Z","timestamp":1784134049873,"version":"3.55.0"},"reference-count":43,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"12","license":[{"start":{"date-parts":[[2020,12,1]],"date-time":"2020-12-01T00:00:00Z","timestamp":1606780800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2020,12,1]],"date-time":"2020-12-01T00:00:00Z","timestamp":1606780800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2020,12,1]],"date-time":"2020-12-01T00:00:00Z","timestamp":1606780800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"name":"National Key Research and Development Program of China","award":["2018AAA0102401"],"award-info":[{"award-number":["2018AAA0102401"]}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["61831013"],"award-info":[{"award-number":["61831013"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["61771274"],"award-info":[{"award-number":["61771274"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["61531011"],"award-info":[{"award-number":["61531011"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100004826","name":"Beijing Municipal Natural Science Foundation","doi-asserted-by":"publisher","award":["4182030"],"award-info":[{"award-number":["4182030"]}],"id":[{"id":"10.13039\/501100004826","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100004826","name":"Beijing Municipal Natural Science Foundation","doi-asserted-by":"publisher","award":["L182042"],"award-info":[{"award-number":["L182042"]}],"id":[{"id":"10.13039\/501100004826","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Trans. Wireless Commun."],"published-print":{"date-parts":[[2020,12]]},"DOI":"10.1109\/twc.2020.3016024","type":"journal-article","created":{"date-parts":[[2020,8,19]],"date-time":"2020-08-19T20:17:35Z","timestamp":1597868255000},"page":"7796-7809","source":"Crossref","is-referenced-by-count":303,"title":["3D UAV Trajectory Design and Frequency Band Allocation for Energy-Efficient and Fair Communication: A Deep Reinforcement Learning Approach"],"prefix":"10.1109","volume":"19","author":[{"ORCID":"https:\/\/orcid.org\/0000-0001-7441-3199","authenticated-orcid":false,"given":"Ruijin","family":"Ding","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-8896-352X","authenticated-orcid":false,"given":"Feifei","family":"Gao","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-4140-287X","authenticated-orcid":false,"given":"Xuemin Sherman","family":"Shen","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"263","reference":[{"key":"ref39","first-page":"1008","article-title":"Actor-critic algorithms","author":"konda","year":"2000","journal-title":"Proc NIPS"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1016\/0377-2217(92)90138-Y"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2019.2922849"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2019.2923214"},{"key":"ref31","first-page":"387","article-title":"Deterministic policy gradient algorithms","author":"silver","year":"2014","journal-title":"Proc ICML"},{"key":"ref30","author":"sutton","year":"2018","journal-title":"Reinforcement Learning An Introduction"},{"key":"ref37","author":"jain","year":"1984","journal-title":"A Quantitative Measure Of Fairness And Discrimination"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1109\/GLOCOM.2014.7037248"},{"key":"ref35","article-title":"Continuous control with deep reinforcement learning","author":"lillicrap","year":"2016","journal-title":"Proc Int Conf Learn Represent (ICLR)"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1109\/JSAC.2018.2864373"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/LCOMM.2016.2633248"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1038\/nature14236"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/JSAC.2018.2804239"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2018.2789466"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/LCOMM.2016.2524405"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/JSAC.2019.2906789"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TCOMM.2019.2895088"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/JSAC.2018.2864375"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/ICC.2019.8761403"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/ICCW.2018.8403626"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.23919\/ELINFOCOM.2019.8706417"},{"key":"ref28","author":"grant","year":"2008","journal-title":"CVX MATLAB Software for Disciplined Convex Programming (Version 2 1)"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/MCOM.2017.1700452"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/TWC.2019.2902559"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/LCOMM.2018.2824800"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2018.2811942"},{"key":"ref29","first-page":"1","article-title":"Playing atari with deep reinforcement learning","author":"mnih","year":"2013","journal-title":"NIPS Deep Learning Workshop"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/MWC.2018.1800160"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/LWC.2017.2700840"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/LCOMM.2016.2578312"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2018.2879637"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/ICC.2016.7510820"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/MCOM.2016.7470933"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2019.2925629"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/LWC.2014.2342736"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/TCOMM.2019.2910263"},{"key":"ref42","article-title":"Adam: A method for stochastic optimization","author":"kingma","year":"2013","journal-title":"Proc Int Conf Learn Represent (ICLR)"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/LCOMM.2017.2763135"},{"key":"ref41","first-page":"278","article-title":"Policy invariance under reward transformations: Theory and application to reward shaping","volume":"99","author":"ng","year":"1999","journal-title":"Proc ICML"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/LWC.2016.2604306"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/GLOCOM.2018.8647595"},{"key":"ref43","author":"bramwell","year":"2001","journal-title":"Bramwell&#x2019;s Helicopter Dynamics"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/TWC.2017.2688328"}],"container-title":["IEEE Transactions on Wireless Communications"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/7693\/9289043\/09171468.pdf?arnumber=9171468","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,4,27]],"date-time":"2022-04-27T16:27:07Z","timestamp":1651076827000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9171468\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,12]]},"references-count":43,"journal-issue":{"issue":"12"},"URL":"https:\/\/doi.org\/10.1109\/twc.2020.3016024","relation":{},"ISSN":["1536-1276","1558-2248"],"issn-type":[{"value":"1536-1276","type":"print"},{"value":"1558-2248","type":"electronic"}],"subject":[],"published":{"date-parts":[[2020,12]]}}}