{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,18]],"date-time":"2026-04-18T16:11:22Z","timestamp":1776528682866,"version":"3.51.2"},"reference-count":17,"publisher":"IEEE","license":[{"start":{"date-parts":[[2025,12,9]],"date-time":"2025-12-09T00:00:00Z","timestamp":1765238400000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,12,9]],"date-time":"2025-12-09T00:00:00Z","timestamp":1765238400000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/100006754","name":"Army Research Laboratory","doi-asserted-by":"publisher","id":[{"id":"10.13039\/100006754","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025,12,9]]},"DOI":"10.1109\/cdc57313.2025.11312575","type":"proceedings-article","created":{"date-parts":[[2026,1,12]],"date-time":"2026-01-12T18:19:56Z","timestamp":1768241996000},"page":"4890-4895","source":"Crossref","is-referenced-by-count":2,"title":["Safety-Aware Reinforcement Learning for Control via Risk-Sensitive Action-Value Iteration and Quantile Regression"],"prefix":"10.1109","author":[{"given":"Clinton","family":"Enwerem","sequence":"first","affiliation":[{"name":"University of Maryland,Institute for Systems Research,College Park,MD"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Aniruddh G.","family":"Puranic","sequence":"additional","affiliation":[{"name":"University of Maryland,Institute for Systems Research,College Park,MD"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"John S.","family":"Baras","sequence":"additional","affiliation":[{"name":"University of Maryland,Institute for Systems Research,College Park,MD"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Calin","family":"Belta","sequence":"additional","affiliation":[{"name":"University of Maryland,Institute for Systems Research,College Park,MD"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","article-title":"Risk, Product Liability Trends, Triggers, and Insurance in Commercial Aerial Robots","volume-title":"We Robot Conference on Legal & Policy Issues Relating to Robotics","volume":"4","author":"Beyer"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.5555\/3016100.3016191"},{"key":"ref3","article-title":"Controlling Overestimation Bias with Truncated Mixture of Continuous Distributional Quantile Critics","author":"Kuznetsov","year":"2020"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v32i1.11791"},{"key":"ref5","article-title":"ROSARL: Reward-Only Safe Reinforcement Learning","author":"Tasse","year":"2023"},{"key":"ref6","article-title":"Safety Gymnasium: A Unified Safe Reinforcement Learning Benchmark","volume-title":"NeurIPS","volume":"36","author":"Ji"},{"key":"ref7","first-page":"1017","article-title":"P3O: Policy-on Policy-off Policy Optimization","volume-title":"Proceedings of The 35th Uncertainty in Artificial Intelligence Conference","author":"Fakoor"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2022\/510"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1016\/j.ifacol.2024.09.056"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-36568-4_3"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/tcyb.2025.3575240"},{"key":"ref12","article-title":"Risk-Constrained Reinforcement Learning with Percentile Risk Criteria","author":"Chow","year":"2017"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/MED54222.2022.9837242"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1201\/9781315140919"},{"key":"ref15","first-page":"30977","article-title":"Distributional Reinforcement Learning for Risk-Sensitive Policies","volume":"35","author":"Lim","year":"2022","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1090\/S0002-9904-1976-14091-8"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1080\/01621459.1987.10478550"}],"event":{"name":"2025 IEEE 64th Conference on Decision and Control (CDC)","location":"Rio de Janeiro, Brazil","start":{"date-parts":[[2025,12,9]]},"end":{"date-parts":[[2025,12,12]]}},"container-title":["2025 IEEE 64th Conference on Decision and Control (CDC)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/11311984\/11311968\/11312575.pdf?arnumber=11312575","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,1,13]],"date-time":"2026-01-13T08:45:51Z","timestamp":1768293951000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11312575\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,12,9]]},"references-count":17,"URL":"https:\/\/doi.org\/10.1109\/cdc57313.2025.11312575","relation":{},"subject":[],"published":{"date-parts":[[2025,12,9]]}}}