{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,17]],"date-time":"2026-03-17T08:09:34Z","timestamp":1773734974345,"version":"3.50.1"},"reference-count":37,"publisher":"IEEE","license":[{"start":{"date-parts":[[2025,11,18]],"date-time":"2025-11-18T00:00:00Z","timestamp":1763424000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,11,18]],"date-time":"2025-11-18T00:00:00Z","timestamp":1763424000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025,11,18]]},"DOI":"10.1109\/itsc60802.2025.11423551","type":"proceedings-article","created":{"date-parts":[[2026,3,16]],"date-time":"2026-03-16T20:10:23Z","timestamp":1773691823000},"page":"4094-4100","source":"Crossref","is-referenced-by-count":0,"title":["OPTIMA: Optimized Policy for Intelligent Multi-Agent Systems Enables Coordination-Aware Autonomous Vehicles"],"prefix":"10.1109","author":[{"given":"Rui","family":"Du","sequence":"first","affiliation":[{"name":"Bilibili Inc.,AI Platform Department,Shanghai,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Kai","family":"Zhao","sequence":"additional","affiliation":[{"name":"Bilibili Inc.,AI Platform Department,Shanghai,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jinlong","family":"Hou","sequence":"additional","affiliation":[{"name":"Bilibili Inc.,AI Platform Department,Shanghai,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Qiang","family":"Zhang","sequence":"additional","affiliation":[{"name":"Bilibili Inc.,AI Platform Department,Shanghai,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Tianjiao","family":"Li","sequence":"additional","affiliation":[{"name":"Bilibili Inc.,AI Platform Department,Shanghai,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Peter","family":"Zhang","sequence":"additional","affiliation":[{"name":"Heinz College of Information Systems and Public Policy, Carnegie Mellon University,Pittsburgh,PA,USA"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","first-page":"059","article-title":"National motor vehicle crash causation survey: Report to congress","volume-title":"National Highway Traffic Safety Administration Technical Report DOT HS","volume":"811","year":"2008"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2023.3290261"},{"key":"ref3","article-title":"On a formal model of safe and scalable self-driving cars","author":"Shalev-Shwartz","year":"2017","journal-title":"arXiv preprint"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.3390\/s23031509"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1016\/j.trc.2021.103133"},{"key":"ref6","article-title":"Analysis of a modular autonomous driving architecture: The top submission to carla leaderboard 2.0 challenge","author":"Zhang","year":"2024","journal-title":"arXiv preprint"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1016\/j.aap.2019.105299"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/TIV.2023.3274536"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/TIV.2022.3221767"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/TIV.2022.3189511"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/tits.2023.3323440"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2020.3047129"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2021.3054625"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1016\/j.trc.2021.103452"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2022.3216288"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2022.3190471"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.65109\/jcle4281"},{"key":"ref18","first-page":"10784","article-title":"Learning to simulate self-driven particles system with coordinated policy optimization","volume":"34","author":"Peng","year":"2021","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/tits.2023.3336670"},{"issue":"274","key":"ref20","first-page":"1","article-title":"Cleanrl: High-quality single-file implementations of deep reinforcement learning algorithms","volume":"23","author":"Huang","year":"2022","journal-title":"Journal of Machine Learning Research"},{"issue":"268","key":"ref21","first-page":"1","article-title":"Stable-baselines3: Reliable reinforcement learning implementations","volume":"22","author":"Raffin","year":"2021","journal-title":"Journal of Machine Learning Research"},{"key":"ref22","first-page":"245","article-title":"Ray rllib: A composable and scalable reinforcement learning library","volume":"85","author":"Liang","year":"2017","journal-title":"arXiv preprint"},{"key":"ref23","first-page":"3053","article-title":"Rllib: Abstractions for distributed reinforcement learning","volume-title":"International conference on machine learning","author":"Liang","year":"2018"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/TSMC.2018.2861826"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/CDC.2013.6760239"},{"key":"ref26","first-page":"1","article-title":"Carla: An open urban driving simulator","volume-title":"Conference on robot learning","author":"Dosovitskiy","year":"2017"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-67361-5_40"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4419-6142-6_7"},{"key":"ref29","article-title":"Reinforcement learning: an introduction","author":"Sutton","year":"2018","journal-title":"A Bradford Book"},{"key":"ref30","article-title":"Multi-agent actor-critic for mixed cooperative-competitive environments","volume":"30","author":"Lowe","year":"2017","journal-title":"Advances in neural information processing systems"},{"key":"ref31","article-title":"Continuous control with deep reinforcement learning","author":"Lillicrap","year":"2015","journal-title":"arXiv preprint"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.48550\/arXiv.1812.05905"},{"key":"ref33","article-title":"Proximal policy optimization algorithms","author":"Schulman","year":"2017","journal-title":"arXiv preprint"},{"key":"ref34","article-title":"Return-based scaling: Yet another normalisation trick for deep rl","author":"Schaul","year":"2021","journal-title":"arXiv preprint"},{"key":"ref35","article-title":"A new framework for multi-agent reinforcement learning\u2013centralized training and exploration with decentralized execution via policy distillation","author":"Chen","year":"2019","journal-title":"arXiv preprint"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-60801-3_27"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2021.3072774"}],"event":{"name":"2025 IEEE 28th International Conference on Intelligent Transportation Systems (ITSC)","location":"Gold Coast, Australia","start":{"date-parts":[[2025,11,18]]},"end":{"date-parts":[[2025,11,21]]}},"container-title":["2025 IEEE 28th International Conference on Intelligent Transportation Systems (ITSC)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/11422813\/11423000\/11423551.pdf?arnumber=11423551","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,3,17]],"date-time":"2026-03-17T05:55:51Z","timestamp":1773726951000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11423551\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,11,18]]},"references-count":37,"URL":"https:\/\/doi.org\/10.1109\/itsc60802.2025.11423551","relation":{},"subject":[],"published":{"date-parts":[[2025,11,18]]}}}