{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,24]],"date-time":"2026-02-24T18:10:29Z","timestamp":1771956629783,"version":"3.50.1"},"reference-count":22,"publisher":"IEEE","license":[{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2020,10,24]],"date-time":"2020-10-24T00:00:00Z","timestamp":1603497600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2020,10,24]]},"DOI":"10.1109\/iros45743.2020.9341493","type":"proceedings-article","created":{"date-parts":[[2021,3,15]],"date-time":"2021-03-15T14:49:56Z","timestamp":1615819796000},"page":"2103-2110","source":"Crossref","is-referenced-by-count":17,"title":["Behaviorally Diverse Traffic Simulation via Reinforcement Learning"],"prefix":"10.1109","author":[{"given":"Shinya","family":"Shiroshita","sequence":"first","affiliation":[{"name":"Preferred Networks, Inc.,Japan"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Shirou","family":"Maruyama","sequence":"additional","affiliation":[{"name":"Preferred Networks, Inc.,Japan"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Daisuke","family":"Nishiyama","sequence":"additional","affiliation":[{"name":"Preferred Networks, Inc.,Japan"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mario Ynocente","family":"Castro","sequence":"additional","affiliation":[{"name":"Preferred Networks, Inc.,Japan"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Karim","family":"Hamzaoui","sequence":"additional","affiliation":[{"name":"Preferred Networks, Inc.,Japan"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Guy","family":"Rosman","sequence":"additional","affiliation":[{"name":"Toyota Research Institute,U.S."}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jonathan","family":"DeCastro","sequence":"additional","affiliation":[{"name":"Toyota Research Institute,U.S."}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Kuan-Hui","family":"Lee","sequence":"additional","affiliation":[{"name":"Toyota Research Institute,U.S."}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Adrien","family":"Gaidon","sequence":"additional","affiliation":[{"name":"Toyota Research Institute,U.S."}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","article-title":"Fluids: A first-order local urban intersection driving simulator","author":"zhao","year":"2018","journal-title":"Proc of CASE"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/IVS.2018.8500405"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/IVS.2017.7995802"},{"key":"ref13","article-title":"Microscopic traffic simulation by cooperative multi-agent deep reinforcement learning","author":"bacchiani","year":"2019","journal-title":"Proc of AAMAS"},{"key":"ref14","article-title":"Stein variational policy gradient","author":"liu","year":"2017","journal-title":"Proc Of UAI"},{"key":"ref15","article-title":"Diversity is all you need: Learning diverse skills without a reward function","author":"eysenbach","year":"2018"},{"key":"ref16","article-title":"A survey on intrinsic motivation in reinforcement learning","author":"aubret","year":"2019"},{"key":"ref17","article-title":"DROGON: A causal reasoning framework for future trajectory forecast","author":"choi","year":"2019"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/IVS.2017.7995816"},{"key":"ref19","article-title":"Toward onboard control system for mobile robots via deep reinforcement learning","author":"miyashita","year":"2018","journal-title":"Deep RL Workshop at Neurips"},{"key":"ref4","article-title":"Trajectron++: Multi-agent generative trajectory forecasting with heterogeneous data for control","author":"salzmann","year":"2020"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/IVS.2018.8500493"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1016\/0304-3975(85)90224-5"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/IROS40897.2019.8968478"},{"key":"ref8","article-title":"Discovering avoidable planner failures of autonomous vehicles using counterfactual analysis in behaviorally diverse simulation","author":"nishiyama","year":"2020","journal-title":"Proc of ITSC"},{"key":"ref7","first-page":"10 489","article-title":"Diversity-driven exploration strategy for deep reinforcement learning","author":"hong","year":"2018","journal-title":"Advances in Neural IInformation Processing Systems"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00240"},{"key":"ref1","first-page":"2575","article-title":"Microscopic traffic simulation using SUMO","author":"alvarez lopez","year":"2018","journal-title":"Proc of ITSC"},{"key":"ref9","first-page":"1","article-title":"CARLA: An open urban driving simulator","author":"dosovitskiy","year":"2017","journal-title":"Proc of CoRL"},{"key":"ref20","article-title":"Adam: A method for stochastic optimization","author":"kingma","year":"2015","journal-title":"Proc of ICLR"},{"key":"ref22","article-title":"Chainerrl: A deep reinforcement learning library","author":"fujita","year":"2019","journal-title":"Deep RL Workshop at Neurips"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1145\/3292500.3330756"}],"event":{"name":"2020 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)","location":"Las Vegas, NV, USA","start":{"date-parts":[[2020,10,24]]},"end":{"date-parts":[[2021,1,24]]}},"container-title":["2020 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9340668\/9340635\/09341493.pdf?arnumber=9341493","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,6,28]],"date-time":"2022-06-28T21:56:16Z","timestamp":1656453376000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9341493\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,10,24]]},"references-count":22,"URL":"https:\/\/doi.org\/10.1109\/iros45743.2020.9341493","relation":{},"subject":[],"published":{"date-parts":[[2020,10,24]]}}}