{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,14]],"date-time":"2026-04-14T15:52:38Z","timestamp":1776181958205,"version":"3.50.1"},"reference-count":27,"publisher":"IEEE","license":[{"start":{"date-parts":[[2024,8,28]],"date-time":"2024-08-28T00:00:00Z","timestamp":1724803200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2024,8,28]],"date-time":"2024-08-28T00:00:00Z","timestamp":1724803200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2024,8,28]]},"DOI":"10.1109\/case59546.2024.10711829","type":"proceedings-article","created":{"date-parts":[[2024,10,23]],"date-time":"2024-10-23T17:40:16Z","timestamp":1729705216000},"page":"2320-2327","source":"Crossref","is-referenced-by-count":4,"title":["Multi-Agent Vulnerability Discovery for Autonomous Driving Policy by Finding AV-Responsible Scenarios"],"prefix":"10.1109","author":[{"given":"Ye","family":"Mu","sequence":"first","affiliation":[{"name":"Tsinghua Shenzhen International Graduate School"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Weilin","family":"Liu","sequence":"additional","affiliation":[{"name":"Tsinghua University,Department of Electronic Engineering"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Chao","family":"Yu","sequence":"additional","affiliation":[{"name":"Tsinghua University,Department of Electronic Engineering"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xuefei","family":"Ning","sequence":"additional","affiliation":[{"name":"Tsinghua University,Department of Electronic Engineering"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zhong","family":"Cao","sequence":"additional","affiliation":[{"name":"Tsinghua University,School of Vehicle and Mobility"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zelai","family":"Xu","sequence":"additional","affiliation":[{"name":"Tsinghua University,Department of Electronic Engineering"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Shuang","family":"Liang","sequence":"additional","affiliation":[{"name":"Novauto Technology Co. Ltd,Beijing,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Huazhong","family":"Yang","sequence":"additional","affiliation":[{"name":"Tsinghua University,Department of Electronic Engineering"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yu","family":"Wang","sequence":"additional","affiliation":[{"name":"Tsinghua University,Department of Electronic Engineering"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","article-title":"Autonomous driving policy continual learning with one-shot disengagement case","author":"Cao","year":"2022","journal-title":"IEEE Transactions on Intelligent Vehicles"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ISSRE5003.2020.00012"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-28929-8"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2017\/525"},{"key":"ref5","first-page":"1328","article-title":"Certified adversarial robustness for deep reinforcement learning","volume-title":"Conference on Robot Learning","author":"L\u00fctjens"},{"key":"ref6","article-title":"Adversarial policies: Attacking deep reinforcement learning","volume-title":"International Conference on Learning Representations","author":"Gleave"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/MITS.2019.2898964"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1038\/s41467-021-21007-8"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA40945.2020.9197351"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2019\/832"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/ITSC.2019.8917242"},{"key":"ref12","article-title":"On a formal model of safe and scalable self-driving cars","author":"Shalev-Shwartz","year":"2017"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2016.2582208"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2017.2701846"},{"key":"ref15","article-title":"Efficient black-box assessment of autonomous vehicle safety","author":"Norden","year":"2019"},{"key":"ref16","article-title":"Scalable end-to-end autonomous vehicle testing via rare-event simulation","volume":"31","author":"O\u2019Kelly","year":"2018","journal-title":"Advances in neural information processing systems"},{"key":"ref17","article-title":"The surprising effectiveness of mappo in cooperative, multi-agent games","author":"Yu","year":"2021"},{"key":"ref18","article-title":"Proximal policy optimization algorithms","author":"Schulman","year":"2017"},{"key":"ref19","article-title":"Highdimensional continuous control using generalized advantage estimation","author":"Schulman","year":"2015"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/ITSC45102.2020.9294422"},{"key":"ref21","article-title":"Smarts: Scalable multi-agent reinforcement learning training school for autonomous driving","author":"Zhou","year":"2020"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1126\/science.153.3731.34"},{"key":"ref23","article-title":"Robust markov decision processes with uncertain transition matrices","volume-title":"Ph.D. dissertation","author":"Nilim","year":"2004"},{"key":"ref24","first-page":"1995","article-title":"Dueling network architectures for deep reinforcement learning","volume-title":"International conference on machine learning","author":"Wang"},{"key":"ref25","article-title":"An environment for autonomous driving decision-making","author":"Leurent","year":"2018"},{"key":"ref26","article-title":"Continuous control with deep reinforcement learning","author":"Lillicrap","year":"2015"},{"key":"ref27","article-title":"Driving-policy adaptive safeguard for autonomous vehicles using reinforcement learning","author":"Cao","year":"2020"}],"event":{"name":"2024 IEEE 20th International Conference on Automation Science and Engineering (CASE)","location":"Bari, Italy","start":{"date-parts":[[2024,8,28]]},"end":{"date-parts":[[2024,9,1]]}},"container-title":["2024 IEEE 20th International Conference on Automation Science and Engineering (CASE)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/10711304\/10711288\/10711829.pdf?arnumber=10711829","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,11,27]],"date-time":"2024-11-27T01:21:02Z","timestamp":1732670462000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10711829\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,8,28]]},"references-count":27,"URL":"https:\/\/doi.org\/10.1109\/case59546.2024.10711829","relation":{},"subject":[],"published":{"date-parts":[[2024,8,28]]}}}