{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,1,30]],"date-time":"2026-01-30T23:19:21Z","timestamp":1769815161618,"version":"3.49.0"},"reference-count":13,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2017,9]]},"DOI":"10.1109\/iros.2017.8206234","type":"proceedings-article","created":{"date-parts":[[2017,12,14]],"date-time":"2017-12-14T22:12:59Z","timestamp":1513289579000},"page":"3834-3839","source":"Crossref","is-referenced-by-count":101,"title":["Reinforcement learning with temporal logic rewards"],"prefix":"10.1109","author":[{"given":"Xiao","family":"Li","sequence":"first","affiliation":[]},{"given":"Cristian-Ioan","family":"Vasile","sequence":"additional","affiliation":[]},{"given":"Calin","family":"Belta","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-540-30494-4_14"},{"key":"ref11","first-page":"854","article-title":"Linear temporal logic and Linear Dynamic Logic on finite traces","author":"de giacomo","year":"2013","journal-title":"IJCAI Int Joint Conf on Artificial Intelligence"},{"key":"ref12","article-title":"Benchmarking deep reinforcement learning for continuous control","author":"duan","year":"2016","journal-title":"Proc of the International Conference on Machine Learning (ICML)"},{"key":"ref13","author":"brockman","year":"2016","journal-title":"OpenAI Gym"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/CDC.2014.7039527"},{"key":"ref3","author":"aksaray","year":"2016","journal-title":"Q - Learning for Robust Satisfaction of Signal Temporal Logic Specifications"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1561\/2300000021"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.15607\/RSS.2014.X.039"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-662-44848-9_31"},{"key":"ref7","author":"chebotar","year":"2016","journal-title":"Path integral guided policy search"},{"key":"ref2","author":"dario","year":"0","journal-title":"Faulty reward functions in the wild"},{"key":"ref1","first-page":"1","author":"amodei","year":"2016","journal-title":"Concrete problems in ai safety"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-642-15297-9_9"}],"event":{"name":"2017 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)","location":"Vancouver, BC","start":{"date-parts":[[2017,9,24]]},"end":{"date-parts":[[2017,9,28]]}},"container-title":["2017 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8119304\/8202121\/08206234.pdf?arnumber=8206234","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2018,2,28]],"date-time":"2018-02-28T21:51:41Z","timestamp":1519854701000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/8206234\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2017,9]]},"references-count":13,"URL":"https:\/\/doi.org\/10.1109\/iros.2017.8206234","relation":{},"subject":[],"published":{"date-parts":[[2017,9]]}}}