{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,9]],"date-time":"2026-06-09T16:18:53Z","timestamp":1781021933748,"version":"3.54.1"},"reference-count":51,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62222111"],"award-info":[{"award-number":["62222111"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62125108"],"award-info":[{"award-number":["62125108"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62431015"],"award-info":[{"award-number":["62431015"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62301471"],"award-info":[{"award-number":["62301471"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62293482"],"award-info":[{"award-number":["62293482"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100003399","name":"Science and Technology Commission Foundation of Shanghai","doi-asserted-by":"publisher","award":["24DP1500702"],"award-info":[{"award-number":["24DP1500702"]}],"id":[{"id":"10.13039\/501100003399","id-type":"DOI","asserted-by":"publisher"}]},{"name":"National Science and Technology Major Project\u2014Mobile Information Networks","award":["2024ZD1300700"],"award-info":[{"award-number":["2024ZD1300700"]}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Trans. Wireless Commun."],"published-print":{"date-parts":[[2026]]},"DOI":"10.1109\/twc.2025.3585163","type":"journal-article","created":{"date-parts":[[2025,7,18]],"date-time":"2025-07-18T17:47:30Z","timestamp":1752860850000},"page":"559-572","source":"Crossref","is-referenced-by-count":8,"title":["WDMoE: Wireless Distributed Mixture of Experts for Large Language Models"],"prefix":"10.1109","volume":"25","author":[{"given":"Nan","family":"Xue","sequence":"first","affiliation":[{"name":"Cooperative Medianet Innovation Center, Shanghai Jiao Tong University, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-6284-1639","authenticated-orcid":false,"given":"Yaping","family":"Sun","sequence":"additional","affiliation":[{"name":"Department of Broadband Communication, Peng Cheng Laboratory, Shenzhen, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-3540-389X","authenticated-orcid":false,"given":"Zhiyong","family":"Chen","sequence":"additional","affiliation":[{"name":"Cooperative Medianet Innovation Center, Shanghai Jiao Tong University, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-0799-0954","authenticated-orcid":false,"given":"Meixia","family":"Tao","sequence":"additional","affiliation":[{"name":"Cooperative Medianet Innovation Center, Shanghai Jiao Tong University, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Xiaodong","family":"Xu","sequence":"additional","affiliation":[{"name":"State Key Laboratory of Network and Switching Technology, Beijing University of Posts and Telecommunications, Beijing, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Liang","family":"Qian","sequence":"additional","affiliation":[{"name":"Cooperative Medianet Innovation Center, Shanghai Jiao Tong University, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-2608-775X","authenticated-orcid":false,"given":"Shuguang","family":"Cui","sequence":"additional","affiliation":[{"name":"School of Science and Engineering (SSE) and FNii, The Chinese University of Hong Kong, Shenzhen, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-8799-1182","authenticated-orcid":false,"given":"Wenjun","family":"Zhang","sequence":"additional","affiliation":[{"name":"Cooperative Medianet Innovation Center, Shanghai Jiao Tong University, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-0269-104X","authenticated-orcid":false,"given":"Ping","family":"Zhang","sequence":"additional","affiliation":[{"name":"State Key Laboratory of Network and Switching Technology, Beijing University of Posts and Telecommunications, Beijing, China"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/GLOBECOM52923.2024.10901084"},{"key":"ref2","volume-title":"Introducing ChatGPT","year":"2022"},{"key":"ref3","article-title":"Emergent abilities of large language models","author":"Wei","year":"2022","journal-title":"Trans. Mach. Learn. Res."},{"key":"ref4","article-title":"Sparks of artificial general intelligence: Early experiments with GPT-4","author":"Bubeck","year":"2023","journal-title":"arXiv:2303.12712"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.23919\/JCIN.2024.10582827"},{"key":"ref6","article-title":"LLM-empowered resource allocation in wireless communications systems","author":"Lee","year":"2024","journal-title":"arXiv:2408.02944"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.23919\/JCIN.2024.10582827"},{"key":"ref8","article-title":"Large language model (LLM) for telecommunications: A comprehensive survey on principles, key techniques, and opportunities","author":"Zhou","year":"2024","journal-title":"arXiv:2405.10825"},{"key":"ref9","article-title":"Generative AI for immersive communication: The next frontier in Internet-of-Senses through 6G","author":"Sehad","year":"2024","journal-title":"arXiv:2404.01713"},{"key":"ref10","article-title":"Scaling laws for neural language models","author":"Kaplan","year":"2020","journal-title":"arXiv:2001.08361"},{"key":"ref11","first-page":"30016","article-title":"Training compute-optimal large language models","volume-title":"Proc. 36th Int. Conf. Neural Inf. Process. Syst.","author":"Hoffmann"},{"key":"ref12","article-title":"On-device language models: A comprehensive review","author":"Xu","year":"2024","journal-title":"arXiv:2409.00088"},{"key":"ref13","first-page":"21702","article-title":"LLM-pruner: On the structural pruning of large language models","volume-title":"Proc. Adv. Neural Inf. Process. Syst.","author":"Ma"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1145\/3714983.3714987"},{"key":"ref15","article-title":"Phi-3 technical report: A highly capable language model locally on your phone","volume-title":"arXiv:2404.14219","author":"Abdin","year":"2024"},{"key":"ref16","first-page":"606","article-title":"Efficiently scaling transformer inference","volume-title":"Proc. Mach. Learn. Syst.","volume":"5","author":"Pope"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/MCOM.2016.7565182"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/MNET.2024.3420755"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/MWC.003.2300568"},{"key":"ref20","article-title":"Outrageously large neural networks: The sparsely-gated mixture-of-experts layer","volume-title":"Proc. Int. Conf. Learn. Represent.","author":"Shazeer"},{"key":"ref21","article-title":"GShard: Scaling giant models with conditional computation and automatic sharding","volume-title":"Proc. Int. Conf. Learn. Represent.","author":"Lepikhin"},{"key":"ref22","first-page":"9660","article-title":"On the adversarial robustness of mixture of experts","volume-title":"Proc. Adv. Neural Inf. Process. Syst.","author":"Puigcerver"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.48550\/ARXIV.1706.03762"},{"key":"ref24","article-title":"Improving language understanding by generative pre-training","author":"Radford","year":"2018"},{"key":"ref25","article-title":"BERT: Pre-training of deep bidirectional transformers for language understanding","author":"Devlin","year":"2018","journal-title":"arXiv:1810.04805"},{"issue":"8","key":"ref26","first-page":"9","article-title":"Language models are unsupervised multitask learners","volume":"1","author":"Radford","year":"2019","journal-title":"OpenAI Blog"},{"key":"ref27","first-page":"1877","article-title":"Language models are few-shot learners","volume-title":"Proc. NIPS","author":"Brown"},{"key":"ref28","article-title":"The llama 3 herd of models","author":"Grattafiori","year":"2024","journal-title":"arXiv:2407.21783"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1162\/neco.1991.3.1.79"},{"key":"ref30","article-title":"Mixtral of experts","author":"Jiang","year":"2024","journal-title":"arXiv:2401.04088"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV51070.2023.01591"},{"key":"ref32","article-title":"Harder tasks need more experts: Dynamic routing in MoE models","author":"Huang","year":"2024","journal-title":"arXiv:2403.07652"},{"key":"ref33","article-title":"LLM as a system service on mobile devices","author":"Yin","year":"2024","journal-title":"arXiv:2403.11805"},{"key":"ref34","article-title":"EDGE-LLM: Enabling efficient large language model adaptation on edge devices via layerwise unified compression and adaptive layer tuning and voting","author":"Yu","year":"2024","journal-title":"arXiv:2406.15758"},{"key":"ref35","article-title":"MobileLLM: Optimizing sub-billion parameter language models for on-device use cases","author":"Liu","year":"2024","journal-title":"arXiv:2402.14905"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2024.privatenlp-1.10"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/ieeestd.1985.82928"},{"key":"ref38","article-title":"Pruning convolutional neural networks for resource efficient inference","volume-title":"Proc. Int. Conf. Learn. Represent.","author":"Molchanov"},{"key":"ref39","volume-title":"Foundations of Bilevel Programming","author":"Dempe","year":"2002"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1017\/CBO9780511804441"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1038\/s41592-019-0686-2"},{"key":"ref42","doi-asserted-by":"publisher","DOI":"10.1109\/TCOMM.2023.3277878"},{"key":"ref43","doi-asserted-by":"publisher","DOI":"10.1109\/TWC.2022.3163809"},{"key":"ref44","volume-title":"OpenCompass: A Universal Evaluation Platform for Foundation Models","author":"Contributors","year":"2023"},{"key":"ref45","article-title":"Measuring massive multitask language understanding","volume-title":"Proc. Int. Conf. Learn. Represent.","author":"Hendrycks"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v34i05.6239"},{"key":"ref47","article-title":"Think you have solved question answering? Try ARC, the AI2 reasoning challenge","author":"Clark","year":"2018","journal-title":"arXiv:1803.05457"},{"key":"ref48","article-title":"Evaluating large language models trained on code","author":"Chen","year":"2021","journal-title":"arXiv:2107.03374"},{"key":"ref49","article-title":"Training verifiers to solve math word problems","author":"Cobbe","year":"2021","journal-title":"arXiv:2110.14168"},{"key":"ref50","article-title":"BoolQ: Exploring the surprising difficulty of natural yes\/no questions","author":"Clark","year":"2019","journal-title":"arXiv:1905.10044"},{"key":"ref51","article-title":"Program synthesis with large language models","author":"Austin","year":"2021","journal-title":"arXiv:2108.07732"}],"container-title":["IEEE Transactions on Wireless Communications"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/7693\/11298242\/11083676.pdf?arnumber=11083676","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,3,6]],"date-time":"2026-03-06T05:44:54Z","timestamp":1772775894000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11083676\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026]]},"references-count":51,"URL":"https:\/\/doi.org\/10.1109\/twc.2025.3585163","relation":{},"ISSN":["1536-1276","1558-2248"],"issn-type":[{"value":"1536-1276","type":"print"},{"value":"1558-2248","type":"electronic"}],"subject":[],"published":{"date-parts":[[2026]]}}}