{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,6]],"date-time":"2025-11-06T00:53:40Z","timestamp":1762390420182},"reference-count":25,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"2","license":[{"start":{"date-parts":[[2010,6,1]],"date-time":"2010-06-01T00:00:00Z","timestamp":1275350400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Trans. Auton. Mental Dev."],"published-print":{"date-parts":[[2010,6]]},"DOI":"10.1109\/tamd.2010.2051436","type":"journal-article","created":{"date-parts":[[2010,6,3]],"date-time":"2010-06-03T13:18:21Z","timestamp":1275571101000},"page":"83-90","source":"Crossref","is-referenced-by-count":35,"title":["Genetic Programming for Reward Function Search"],"prefix":"10.1109","volume":"2","author":[{"given":"Scott","family":"Niekum","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Andrew G","family":"Barto","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Lee","family":"Spector","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","author":"poli","year":"2008","journal-title":"A Field Guide to Genetic Programming"},{"key":"ref11","author":"ackley","year":"1991","journal-title":"Artificial Life II"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1145\/1068009.1068292"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1023\/A:1014538503543"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1145\/1389095.1389343"},{"key":"ref15","doi-asserted-by":"crossref","first-page":"205","DOI":"10.1613\/jair.1190","article-title":"potential-based shaping and q-value initialization are equivalent","volume":"19","author":"wiewiora","year":"2003","journal-title":"J Artif Intell Res"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1007\/11553090_94"},{"key":"ref17","first-page":"136","article-title":"adaptation in constant utility nonstationary environments","author":"littman","year":"1991","journal-title":"Proc 4th Int Conf Genet Algorithms"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/DEVLRN.2007.4354052"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-540-69134-1_2"},{"key":"ref4","author":"sutton","year":"1998","journal-title":"Reinforcement Learning An Introduction"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/TAMD.2010.2051031"},{"key":"ref6","author":"watkins","year":"1989","journal-title":"Learning from delayed rewards"},{"key":"ref5","article-title":"internal rewards mitigate agent boundedness","author":"sorg","year":"2010","journal-title":"Proc 27th Int Conf Mach Learn"},{"key":"ref8","author":"koza","year":"1992","journal-title":"Genetic Programming On the Programming of Computers by Means of Natural Selection"},{"key":"ref7","author":"holland","year":"1992","journal-title":"Adaptation in Natural and Artificial Systems An Introductory Analysis With Applications to Biology Control and Artificial Intelligence"},{"key":"ref2","first-page":"2601","article-title":"where do rewards come from?","author":"singh","year":"2009","journal-title":"Proc 31st Annu Conf Cogn Sci Soc"},{"key":"ref9","author":"banzhaf","year":"1998","journal-title":"Genetic ProgrammingAn Introduction On the Automatic Evolution of Computer Programs and its Applications"},{"key":"ref1","first-page":"278","article-title":"policy invariance under reward transformations: theory and application to reward shaping","author":"ng","year":"1999","journal-title":"Proc 16th Int Conf Mach Learn"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1016\/j.neunet.2008.09.013"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1177\/1059712308092835"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1145\/1143844.1143906"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/TAMD.2010.2050205"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1016\/S0004-3702(99)00052-1"},{"key":"ref25","first-page":"1497","article-title":"Skill characterization based on betweenness","author":"simsek","year":"2008","journal-title":"Proc 22nd Annu Conf Neural Inform Process Syst"}],"container-title":["IEEE Transactions on Autonomous Mental Development"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx5\/4563672\/5497035\/05473118.pdf?arnumber=5473118","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2021,10,11]],"date-time":"2021-10-11T00:46:11Z","timestamp":1633913171000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/5473118\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2010,6]]},"references-count":25,"journal-issue":{"issue":"2"},"URL":"https:\/\/doi.org\/10.1109\/tamd.2010.2051436","relation":{},"ISSN":["1943-0604","1943-0612"],"issn-type":[{"value":"1943-0604","type":"print"},{"value":"1943-0612","type":"electronic"}],"subject":[],"published":{"date-parts":[[2010,6]]}}}