{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,21]],"date-time":"2026-02-21T18:18:55Z","timestamp":1771697935735,"version":"3.50.1"},"reference-count":18,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2018,12]]},"DOI":"10.1109\/glocom.2018.8647593","type":"proceedings-article","created":{"date-parts":[[2019,2,21]],"date-time":"2019-02-21T18:34:06Z","timestamp":1550774046000},"page":"1-6","source":"Crossref","is-referenced-by-count":43,"title":["Joint Offloading and Resource Allocation in Mobile Edge Computing Systems: An Actor-Critic Approach"],"prefix":"10.1109","author":[{"given":"Zhicai","family":"Zhang","sequence":"first","affiliation":[]},{"given":"F. Richard","family":"Yu","sequence":"additional","affiliation":[]},{"given":"Fang","family":"Fu","sequence":"additional","affiliation":[]},{"given":"Qiao","family":"Yan","sequence":"additional","affiliation":[]},{"given":"Zhouyang","family":"Wang","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2017.2672701"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/TWC.2017.2734081"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/TWC.2017.2703901"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/JSAC.2014.2332093"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TWC.2017.2717986"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2017.2751641"},{"key":"ref16","author":"sutton","year":"2017","journal-title":"Reinforcement Learning An Introduction"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1137\/S0363012901385691"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2015.2413394"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/TCOMM.2017.2699660"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/COMST.2017.2758763"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/TWC.2017.2769644"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2017.2702750"},{"key":"ref8","first-page":"1057","article-title":"Policy gradient methods for reinforcement learning with function approximation","volume":"12","author":"sutton","year":"2000","journal-title":"ACM SIGMETRICS Perform Eval Rev"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/JSAC.2016.2611846"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/COMST.2017.2682318"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/LWC.2017.2696539"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1007\/BF00992698"}],"event":{"name":"GLOBECOM 2018 - 2018 IEEE Global Communications Conference","location":"Abu Dhabi, United Arab Emirates","start":{"date-parts":[[2018,12,9]]},"end":{"date-parts":[[2018,12,13]]}},"container-title":["2018 IEEE Global Communications Conference (GLOBECOM)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8634808\/8647127\/08647593.pdf?arnumber=8647593","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,1,27]],"date-time":"2022-01-27T02:28:34Z","timestamp":1643250514000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8647593\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,12]]},"references-count":18,"URL":"https:\/\/doi.org\/10.1109\/glocom.2018.8647593","relation":{},"subject":[],"published":{"date-parts":[[2018,12]]}}}