{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,8]],"date-time":"2024-09-08T09:06:27Z","timestamp":1725786387810},"reference-count":16,"publisher":"IEEE","license":[{"start":{"date-parts":[[2024,4,21]],"date-time":"2024-04-21T00:00:00Z","timestamp":1713657600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2024,4,21]],"date-time":"2024-04-21T00:00:00Z","timestamp":1713657600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2024,4,21]]},"DOI":"10.1109\/wcnc57260.2024.10570617","type":"proceedings-article","created":{"date-parts":[[2024,7,3]],"date-time":"2024-07-03T17:25:49Z","timestamp":1720027549000},"page":"1-6","source":"Crossref","is-referenced-by-count":0,"title":["Design of Scalable Population of Reinforcement Learning Agents for Autonomous 5G Radio Link Control"],"prefix":"10.1109","author":[{"given":"John","family":"Cosmas","sequence":"first","affiliation":[{"name":"Brunel University London,Middlesex"}]},{"given":"Kareem","family":"Ali","sequence":"additional","affiliation":[{"name":"Brunel University London,Middlesex"}]},{"given":"Ali","family":"Mahbas","sequence":"additional","affiliation":[{"name":"Brunel University London,Middlesex"}]},{"given":"Prince Kwaku","family":"Boakye","sequence":"additional","affiliation":[{"name":"Brunel University London,Middlesex"}]},{"given":"John","family":"Miguel","sequence":"additional","affiliation":[{"name":"Brunel University London,Middlesex"}]},{"given":"Victor","family":"Gabillon","sequence":"additional","affiliation":[{"name":"Thales SIX GTS,Gennevilliers (Hauts-de-Seine),France"}]},{"given":"Alexandre","family":"Kazmierowski","sequence":"additional","affiliation":[{"name":"Thales SIX GTS,Gennevilliers (Hauts-de-Seine),France"}]},{"given":"Lewis","family":"Sear","sequence":"additional","affiliation":[{"name":"Brunel University London,Middlesex"}]}],"member":"263","reference":[{"key":"ref1","article-title":"Final integration for AI-based E2E network slicing control and MANO","author":"Ara\u00fajo","year":"2023","journal-title":"6G BRAINS Deliverable D5.3"},{"volume-title":"5G NR Modulation and Coding Scheme - Modulation and Code Rate","year":"2020","key":"ref2"},{"journal-title":"A simple reinforcement learning mechanism for resource allocation in lte-a networks with markov decision process and q-learning","year":"2017","author":"Santos","key":"ref3"},{"journal-title":"6GBRAINS-T5.4 Brunel Powerpoint report","year":"2023","author":"John Cosmas","key":"ref4"},{"volume-title":"Train Reinforcement Learning Agent in MDP Environment","year":"2023","key":"ref5"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2018.2876544"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/PIMRC.2017.8292321"},{"journal-title":"Train Reinforcement Learning Agent in MDP Environment - MATLAB & Simulink - MathWorks United Kingdom","article-title":"Train Reinforcement Learning Agent in MDP Environment","year":"2023","key":"ref9"},{"volume-title":"Reinforcement learning: An introduction","year":"2018","author":"Sutton","key":"ref10"},{"journal-title":"5G; NR; Physical layer procedures for data","key":"ref11","article-title":"ETSI TS 138 214 V16.2.0 (2020-07)"},{"volume-title":"5G RAN Configuration and Control Using Reinforcement Learning","year":"2023","author":"Boakye","key":"ref12"},{"key":"ref13","article-title":"Preliminary integration for AI-based E2E network slicing control and MANO","author":"Kazmierowski","year":"2023","journal-title":"6G BRAINS Deliverable D5.2"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TWC.2013.112613.130716"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/vetecs.2010.5494007"},{"key":"ref16","first-page":"1917862","article-title":"Robust Adaptive Modulation and Coding (AMC) Selection in LTE Systems using Reinforcement Learning","author":"Bruno","year":"2015","journal-title":"Ares"},{"journal-title":"A Survey on Large-Population Systems and Scalable Multi-Agent Reinforcement Learning","author":"Cui","key":"ref17"}],"event":{"name":"2024 IEEE Wireless Communications and Networking Conference (WCNC)","start":{"date-parts":[[2024,4,21]]},"location":"Dubai, United Arab Emirates","end":{"date-parts":[[2024,4,24]]}},"container-title":["2024 IEEE Wireless Communications and Networking Conference (WCNC)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/10570463\/10570502\/10570617.pdf?arnumber=10570617","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,7,7]],"date-time":"2024-07-07T05:58:35Z","timestamp":1720331915000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10570617\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,4,21]]},"references-count":16,"URL":"https:\/\/doi.org\/10.1109\/wcnc57260.2024.10570617","relation":{},"subject":[],"published":{"date-parts":[[2024,4,21]]}}}