{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,6]],"date-time":"2024-09-06T05:07:51Z","timestamp":1725599271747},"reference-count":28,"publisher":"IEEE","license":[{"start":{"date-parts":[[2021,7,18]],"date-time":"2021-07-18T00:00:00Z","timestamp":1626566400000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2021,7,18]],"date-time":"2021-07-18T00:00:00Z","timestamp":1626566400000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2021,7,18]]},"DOI":"10.1109\/ijcnn52387.2021.9533369","type":"proceedings-article","created":{"date-parts":[[2021,9,20]],"date-time":"2021-09-20T17:27:41Z","timestamp":1632158861000},"page":"1-6","source":"Crossref","is-referenced-by-count":0,"title":["Attentive Relation Network for Object based Video Games"],"prefix":"10.1109","author":[{"given":"Hangyu","family":"Deng","sequence":"first","affiliation":[{"name":"Graduate School of Information, Product and System, Waseda University,Fukuoka,Japan,808-0135"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jia","family":"Luo","sequence":"additional","affiliation":[{"name":"Graduate School of Information, Product and System, Waseda University,Fukuoka,Japan,808-0135"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jinglu","family":"Hu","sequence":"additional","affiliation":[{"name":"Graduate School of Information, Product and System, Waseda University,Fukuoka,Japan,808-0135"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","article-title":"Human learning in atari","author":"tsividis","year":"0","journal-title":"2017 AAAI Spring Symposium Series"},{"key":"ref11","article-title":"A unified game-theoretic approach to multiagent reinforcement learning","author":"lanctot","year":"2017","journal-title":"ArXiv Preprint"},{"doi-asserted-by":"publisher","key":"ref12","DOI":"10.1017\/S0140525X16001837"},{"key":"ref13","first-page":"4967","article-title":"A simple neural network module for relational reasoning","author":"santoro","year":"2017","journal-title":"Advances in neural information processing systems"},{"key":"ref14","article-title":"Relational inductive biases, deep learning, and graph networks","author":"battaglia","year":"2018","journal-title":"ArXiv Preprint"},{"key":"ref15","article-title":"Deep reinforcement learning with relational inductive biases","author":"zambaldi","year":"0","journal-title":"Proceedings of the International Conference on Learning Representations"},{"key":"ref16","first-page":"5998","article-title":"Attention is all you need","author":"vaswani","year":"0","journal-title":"In Proceedings of Advances in Neural Information Processing Systems"},{"year":"2017","author":"dhariwal","journal-title":"OpenAI Baselines","key":"ref17"},{"doi-asserted-by":"publisher","key":"ref18","DOI":"10.1613\/jair.3912"},{"year":"2016","author":"brockman","journal-title":"OpenAI Gym","key":"ref19"},{"year":"2018","author":"raffin","journal-title":"RI baselines zoo","key":"ref28"},{"key":"ref4","first-page":"2139","article-title":"Data-efficient off-policy policy evaluation for reinforcement learning","author":"thomas","year":"0","journal-title":"International Conference on Machine Learning"},{"year":"2018","author":"hill","journal-title":"Stable Baselines","key":"ref27"},{"key":"ref3","article-title":"Prox-imal policy optimization algorithms","author":"schulman","year":"2017","journal-title":"ArXiv Preprint"},{"doi-asserted-by":"publisher","key":"ref6","DOI":"10.24963\/ijcai.2018\/820"},{"key":"ref5","article-title":"Q-prop: Sample-efficient policy gradient with an off-policy critic","author":"gu","year":"2016","journal-title":"ArXiv Preprint"},{"key":"ref8","article-title":"Sample-efficient reinforcement learning with maximum entropy mellowmax episodic control","author":"sarrico","year":"0","journal-title":"Workshop on Biological and Artificial Reinforcement Learning NeurIPS"},{"doi-asserted-by":"publisher","key":"ref7","DOI":"10.1016\/j.tics.2019.02.006"},{"key":"ref2","first-page":"1928","article-title":"Asynchronous methods for deep reinforcement learning","author":"mnih","year":"0","journal-title":"International Conference on Machine Learning"},{"key":"ref9","article-title":"Model-based reinforcement learning for atari","author":"kaiser","year":"2019","journal-title":"ArXiv Preprint"},{"doi-asserted-by":"publisher","key":"ref1","DOI":"10.1038\/nature14236"},{"key":"ref20","article-title":"Deep reinforcement learning that matters","author":"henderson","year":"0","journal-title":"Thirty-Second AAAI Conference on Artificial Intelligence"},{"key":"ref22","first-page":"803","article-title":"Temporal relational reasoning in videos","author":"zhou","year":"0","journal-title":"Proceedings of the European Conference on Computer Vision (ECCV)"},{"doi-asserted-by":"publisher","key":"ref21","DOI":"10.1109\/CVPR.2017.215"},{"doi-asserted-by":"publisher","key":"ref24","DOI":"10.1109\/ICDAR.2019.00118"},{"doi-asserted-by":"publisher","key":"ref23","DOI":"10.1109\/CVPR.2018.00131"},{"year":"2012","author":"tieleman","journal-title":"Lecture 6e rmsprop Divide the gradient by a running average of its recent magnitude","key":"ref26"},{"doi-asserted-by":"publisher","key":"ref25","DOI":"10.1080\/09540099108946587"}],"event":{"name":"2021 International Joint Conference on Neural Networks (IJCNN)","start":{"date-parts":[[2021,7,18]]},"location":"Shenzhen, China","end":{"date-parts":[[2021,7,22]]}},"container-title":["2021 International Joint Conference on Neural Networks (IJCNN)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9533266\/9533267\/09533369.pdf?arnumber=9533369","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,8,2]],"date-time":"2022-08-02T19:32:40Z","timestamp":1659468760000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9533369\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,7,18]]},"references-count":28,"URL":"https:\/\/doi.org\/10.1109\/ijcnn52387.2021.9533369","relation":{},"subject":[],"published":{"date-parts":[[2021,7,18]]}}}