{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,24]],"date-time":"2025-11-24T19:54:36Z","timestamp":1764014076015,"version":"3.45.0"},"reference-count":34,"publisher":"IEEE","license":[{"start":{"date-parts":[[2025,5,19]],"date-time":"2025-05-19T00:00:00Z","timestamp":1747612800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,5,19]],"date-time":"2025-05-19T00:00:00Z","timestamp":1747612800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025,5,19]]},"DOI":"10.1109\/icra55743.2025.11128456","type":"proceedings-article","created":{"date-parts":[[2025,9,2]],"date-time":"2025-09-02T17:28:56Z","timestamp":1756834136000},"page":"6559-6565","source":"Crossref","is-referenced-by-count":0,"title":["TaskExp: Enhancing Generalization of Multi-Robot Exploration with Multi-Task Pre-Training"],"prefix":"10.1109","author":[{"given":"Shaohao","family":"Zhu","sequence":"first","affiliation":[{"name":"College of Control Science and Engineering, Zhejiang University,Hangzhou,China,310027"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yixian","family":"Zhao","sequence":"additional","affiliation":[{"name":"College of Control Science and Engineering, Zhejiang University,Hangzhou,China,310027"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yang","family":"Xu","sequence":"additional","affiliation":[{"name":"College of Control Science and Engineering, Zhejiang University,Hangzhou,China,310027"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Anjun","family":"Chen","sequence":"additional","affiliation":[{"name":"College of Control Science and Engineering, Zhejiang University,Hangzhou,China,310027"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jiming","family":"Chen","sequence":"additional","affiliation":[{"name":"College of Control Science and Engineering, Zhejiang University,Hangzhou,China,310027"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jinming","family":"Xu","sequence":"additional","affiliation":[{"name":"College of Control Science and Engineering, Zhejiang University,Hangzhou,China,310027"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/ICCAR49639.2020.9107997"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-19842-7_29"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA57147.2024.10611573"},{"key":"ref4","article-title":"Asynchronous multi-agent reinforcement learning for efficient real-time multi-robot cooperative exploration","author":"Yu","year":"2023","journal-title":"arXiv preprint"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2022.3224667"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/ICPADS51040.2020.00032"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2023.3333409"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.3390\/s23073625"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1613\/jair.1.14174"},{"key":"ref10","first-page":"226","article-title":"Offline multi-agent reinforcement learning with knowledge distillation","volume":"35","author":"Tseng","year":"2022","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV51070.2023.00996"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/SSRR.2010.5981557"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA48506.2021.9561328"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/ROBOT.2010.5509503"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8202319"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1007\/s42979-023-02193-2"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/TVT.2020.3034800"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/MRA.2019.2923452"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1126\/scirobotics.adf0970"},{"key":"ref20","article-title":"Multi-agent actor-critic for mixed cooperative-competitive environments","volume":"30","author":"Lowe","year":"2017","journal-title":"Advances in neural information processing systems"},{"key":"ref21","article-title":"Skill discovery of coordination in multi-agent reinforcement learning","author":"He","year":"2020","journal-title":"arXiv preprint"},{"key":"ref22","first-page":"16509","article-title":"Multi-agent reinforcement learning is a sequence modeling problem","volume":"35","author":"Wen","year":"2022","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref23","article-title":"Updet: Universal multi-agent reinforcement learning via policy decoupling with transformers","author":"Hu","year":"2021","journal-title":"arXiv preprint"},{"journal-title":"First Workshop on Pre-training: Perspectives, Pitfalls, and Paths Forward at ICML 2022,2022","article-title":"Leader-based pre-training framework for cooperative multi-agent reinforcement learning","author":"Chen","key":"ref24"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA40945.2020.9197209"},{"key":"ref26","article-title":"Agent-centric representations for multi-agent reinforcement learning","author":"Shang","year":"2021","journal-title":"arXiv preprint"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1007\/s11633-022-1383-7"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/REDUNDANCY48165.2019.9003345"},{"key":"ref29","article-title":"Masked pretraining for multi-agent decision making","author":"Liu","year":"2023","journal-title":"arXiv preprint"},{"issue":"315","key":"ref30","first-page":"1","article-title":"Marllib: A scalable and efficient multi-agent reinforcement learning library","volume":"24","author":"Hu","year":"2023","journal-title":"Journal of Machine Learning Research"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.48550\/arXiv.2010.11929"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v35i13.17353"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/100.580977"},{"volume-title":"Dingo robot user guide (ros noetic)","year":"2024","author":"Robotics","key":"ref34"}],"event":{"name":"2025 IEEE International Conference on Robotics and Automation (ICRA)","start":{"date-parts":[[2025,5,19]]},"location":"Atlanta, GA, USA","end":{"date-parts":[[2025,5,23]]}},"container-title":["2025 IEEE International Conference on Robotics and Automation (ICRA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/11127273\/11127223\/11128456.pdf?arnumber=11128456","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,11,24]],"date-time":"2025-11-24T18:55:26Z","timestamp":1764010526000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11128456\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,5,19]]},"references-count":34,"URL":"https:\/\/doi.org\/10.1109\/icra55743.2025.11128456","relation":{},"subject":[],"published":{"date-parts":[[2025,5,19]]}}}