{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,6]],"date-time":"2024-09-06T08:32:14Z","timestamp":1725611534288},"reference-count":19,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2018,7]]},"DOI":"10.1109\/ijcnn.2018.8489029","type":"proceedings-article","created":{"date-parts":[[2018,10,19]],"date-time":"2018-10-19T22:25:09Z","timestamp":1539987909000},"page":"1-8","source":"Crossref","is-referenced-by-count":3,"title":["Towards Designing Optimal Reward Functions in Multi-Agent Reinforcement Learning Problems"],"prefix":"10.1109","author":[{"given":"Ricardo","family":"Grunitzki","sequence":"first","affiliation":[]},{"given":"Bruno C.","family":"da Silva","sequence":"additional","affiliation":[]},{"given":"L. C.","family":"Ana Bazzan","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1287\/trsc.18.2.185"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/TAMD.2010.2051436"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1002\/9781119993308"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1145\/279943.279964"},{"key":"ref14","first-page":"2601","article-title":"Where do rewards come from","author":"singh","year":"2009","journal-title":"Proc 8th Conf Cognitive Sci Soc"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TAMD.2010.2051031"},{"key":"ref16","first-page":"2190","article-title":"Reward Design via Online Gradient Ascent","author":"sorg","year":"2010","journal-title":"Adv Neural Info Proc Sys"},{"journal-title":"Reinforcement Learning An Introduction","year":"1998","author":"sutton","key":"ref17"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1007\/BF00992698"},{"key":"ref19","first-page":"792","article-title":"Principled methods for advising reinforcement learning agents","author":"wiewiora","year":"2003","journal-title":"In Proc of the 20th Conf on ML"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/TSMCC.2007.913919"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/IJCNN.2016.7727899"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1162\/evco.2007.15.1.1"},{"key":"ref5","first-page":"183","article-title":"Multiagent reinforcement learning: An overview","author":"bu?oniu","year":"2010","journal-title":"Innovations in Multi-Agent Systems and Applications - 1"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/TAMD.2014.2362682"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/DevLrn.2012.6400862"},{"key":"ref2","first-page":"112","article-title":"Intrinsically motivated learning of hierarchical collections of skills","author":"barto","year":"2004","journal-title":"Proc 3rd Int Conf Development Learn"},{"key":"ref1","first-page":"535","article-title":"Regulating air traffic flow with coupled agents","author":"agogino","year":"2008","journal-title":"Proc Int Joint Conf Autonomous Agents and Multiagent Systems"},{"key":"ref9","first-page":"278","article-title":"Policy invariance under reward transformations: Theory and application to reward shaping","author":"ng","year":"1999","journal-title":"In Proc of 16th Int Conf on ML"}],"event":{"name":"2018 International Joint Conference on Neural Networks (IJCNN)","start":{"date-parts":[[2018,7,8]]},"location":"Rio de Janeiro","end":{"date-parts":[[2018,7,13]]}},"container-title":["2018 International Joint Conference on Neural Networks (IJCNN)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8465565\/8488986\/08489029.pdf?arnumber=8489029","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2020,8,24]],"date-time":"2020-08-24T05:14:54Z","timestamp":1598246094000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8489029\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,7]]},"references-count":19,"URL":"https:\/\/doi.org\/10.1109\/ijcnn.2018.8489029","relation":{},"subject":[],"published":{"date-parts":[[2018,7]]}}}