{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,2]],"date-time":"2025-10-02T06:11:42Z","timestamp":1759385502571,"version":"3.28.0"},"reference-count":17,"publisher":"IEEE","license":[{"start":{"date-parts":[[2019,10,1]],"date-time":"2019-10-01T00:00:00Z","timestamp":1569888000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2019,10,1]],"date-time":"2019-10-01T00:00:00Z","timestamp":1569888000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2019,10,1]],"date-time":"2019-10-01T00:00:00Z","timestamp":1569888000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2019,10]]},"DOI":"10.1109\/tencon.2019.8929523","type":"proceedings-article","created":{"date-parts":[[2019,12,13]],"date-time":"2019-12-13T02:01:41Z","timestamp":1576202501000},"page":"858-862","source":"Crossref","is-referenced-by-count":3,"title":["Monopoly Using Reinforcement Learning"],"prefix":"10.1109","author":[{"given":"Edupuganti","family":"Arun","sequence":"first","affiliation":[]},{"given":"Harikrishna","family":"Rajesh","sequence":"additional","affiliation":[]},{"given":"Debarka","family":"Chakrabarti","sequence":"additional","affiliation":[]},{"given":"Harikiran","family":"Cherala","sequence":"additional","affiliation":[]},{"given":"Koshy","family":"George","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1145\/1390156.1390240"},{"key":"ref11","doi-asserted-by":"crossref","first-page":"529","DOI":"10.1038\/nature14236","article-title":"Human-level control through deep reinforcement learning","volume":"518","author":"mnih","year":"2015","journal-title":"Nature"},{"journal-title":"Reinforcement learning for robots using neural networks","year":"1993","author":"lin","key":"ref12"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1037\/0033-295X.102.3.419"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1016\/j.tins.2010.01.006"},{"journal-title":"Markov Decision Processes Discrete Stochastic Dynamic Programming","year":"2005","author":"puterman","key":"ref15"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1007\/BF00992698"},{"key":"ref17","article-title":"ADAM: A method for stochastic optimization","author":"kingma","year":"2015","journal-title":"Proceedings of the 3rd International Conference on Learning Representations"},{"key":"ref4","article-title":"A gradient method for optimizing multi-stage allocation processes","author":"bailis","year":"2014","journal-title":"Proceedings of the 50th Anniversay Convention of the AISB AI & Games"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1145\/203330.203343"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1007\/BF00344251"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1126\/science.275.5306.1593"},{"key":"ref8","first-page":"255","article-title":"Issues in using function approximation for reinforcement learning","author":"thrun","year":"1993","journal-title":"Proceedings of the Fourth Connectionist Models Summer School"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2005.254"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/TNN.1998.712192"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1080\/0025570X.1972.11976187"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/9.580874"}],"event":{"name":"TENCON 2019 - 2019 IEEE Region 10 Conference (TENCON)","start":{"date-parts":[[2019,10,17]]},"location":"Kochi, India","end":{"date-parts":[[2019,10,20]]}},"container-title":["TENCON 2019 - 2019 IEEE Region 10 Conference (TENCON)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8910516\/8929228\/08929523.pdf?arnumber=8929523","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,7,19]],"date-time":"2022-07-19T20:22:21Z","timestamp":1658262141000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8929523\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2019,10]]},"references-count":17,"URL":"https:\/\/doi.org\/10.1109\/tencon.2019.8929523","relation":{},"subject":[],"published":{"date-parts":[[2019,10]]}}}