{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,9,20]],"date-time":"2025-09-20T19:04:21Z","timestamp":1758395061425,"version":"3.37.3"},"reference-count":20,"publisher":"IEEE","license":[{"start":{"date-parts":[[2022,12,10]],"date-time":"2022-12-10T00:00:00Z","timestamp":1670630400000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2022,12,10]],"date-time":"2022-12-10T00:00:00Z","timestamp":1670630400000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2022,12,10]]},"DOI":"10.1109\/icsai57119.2022.10005466","type":"proceedings-article","created":{"date-parts":[[2023,1,9]],"date-time":"2023-01-09T21:28:16Z","timestamp":1673299696000},"page":"1-6","source":"Crossref","is-referenced-by-count":2,"title":["A Novel Ping-pong Task Strategy Based on Model-free Multi-dimensional Q-function Deep Reinforcement Learning"],"prefix":"10.1109","author":[{"given":"Hongxu","family":"Ma","sequence":"first","affiliation":[{"name":"Harbin Institute of Technology,Harbin,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jianyin","family":"Fan","sequence":"additional","affiliation":[{"name":"Harbin Institute of Technology,Harbin,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Qiang","family":"Wang","sequence":"additional","affiliation":[{"name":"Harbin Institute of Technology,Harbin,China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","article-title":"Reinforcement learning applications","author":"Li","year":"2019","journal-title":"arXiv preprint arXiv:1908.06973"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1126\/science.aar6404"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1145\/2702123.2702429"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1016\/j.apenergy.2018.12.061"},{"key":"ref5","article-title":"Openai gym","author":"Brockman","year":"2016","journal-title":"arXiv preprint arXiv:1606.01540"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2019.8793742"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2017.7989385"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA40945.2020.9196730"},{"key":"ref9","first-page":"651","article-title":"Scalable deep reinforcement learning for vision-based robotic manipulation","volume-title":"Conference on Robot Learning","author":"Kalashnikov"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/37.16766"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1007\/s10846-017-0515-8"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/ICIST.2019.8836894"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.3390\/s20020333"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2022.3176207"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1177\/1059712311419378"},{"key":"ref16","article-title":"Learning goal embeddings via self-play for hierarchical reinforcement learning","author":"Sukhbaatar","year":"2018","journal-title":"arXiv preprint arXiv:1811.09083"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/IROS45743.2020.9341191"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v24i1.7727"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1007\/s10489-022-04131-w"},{"article-title":"Pybullet, a python module for physics simulation for games, robotics and machine learning","year":"2016","author":"Coumans","key":"ref20"}],"event":{"name":"2022 8th International Conference on Systems and Informatics (ICSAI)","start":{"date-parts":[[2022,12,10]]},"location":"Kunming, China","end":{"date-parts":[[2022,12,12]]}},"container-title":["2022 8th International Conference on Systems and Informatics (ICSAI)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/10005314\/10005319\/10005466.pdf?arnumber=10005466","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,2,9]],"date-time":"2024-02-09T09:26:27Z","timestamp":1707470787000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10005466\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,12,10]]},"references-count":20,"URL":"https:\/\/doi.org\/10.1109\/icsai57119.2022.10005466","relation":{},"subject":[],"published":{"date-parts":[[2022,12,10]]}}}