{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,7,15]],"date-time":"2025-07-15T03:26:31Z","timestamp":1752549991260,"version":"3.29.0"},"reference-count":28,"publisher":"IEEE","license":[{"start":{"date-parts":[[2024,6,24]],"date-time":"2024-06-24T00:00:00Z","timestamp":1719187200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2024,6,24]],"date-time":"2024-06-24T00:00:00Z","timestamp":1719187200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/100006190","name":"Research and Development","doi-asserted-by":"publisher","id":[{"id":"10.13039\/100006190","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2024,6,24]]},"DOI":"10.1109\/icccnt61001.2024.10726128","type":"proceedings-article","created":{"date-parts":[[2024,11,4]],"date-time":"2024-11-04T23:06:46Z","timestamp":1730761606000},"page":"1-7","source":"Crossref","is-referenced-by-count":1,"title":["Does Human-Robot Collaboration Yield Better Search Performance? An Investigation Via Proximal Policy Optimization in Complex Search Tasks"],"prefix":"10.1109","author":[{"given":"Shashank","family":"Kapoor","sequence":"first","affiliation":[{"name":"Indian Institute of Technology Mandi,Applied Cognitive Science Laboratory,Mandi,India"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Shashank","family":"Uttrani","sequence":"additional","affiliation":[{"name":"Indian Institute of Technology Mandi,Applied Cognitive Science Laboratory,Mandi,India"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Gunjan","family":"Paul","sequence":"additional","affiliation":[{"name":"Indian Institute of Technology Mandi,Applied Cognitive Science Laboratory,Mandi,India"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Varun","family":"Dutt","sequence":"additional","affiliation":[{"name":"Indian Institute of Technology Mandi,Applied Cognitive Science Laboratory,Mandi,India"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","article-title":"A brief survey of deep reinforcement learning","author":"Arulkumaran","year":"2017","journal-title":"arXiv preprint arXiv:1708.05866"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1613\/jair.3912"},{"key":"ref3","article-title":"Dota 2 with large scale deep reinforcement learning","author":"Berner","year":"2019","journal-title":"arXiv preprint arXiv:1912.06680"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1287\/isre.2021.1079"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1207\/s15516709cog2704_2"},{"key":"ref6","article-title":"Deep learning for real-time Atari game play using offline Monte-Carlo tree search planning","volume":"27","author":"Guo","year":"2014","journal-title":"Advances in neural information processing systems"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.3390\/systems11050217"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.3390\/app12031379"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/IV48863.2021.9575669"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1002\/bdm.722"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.3390\/app12147006"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1073\/pnas.1521270113"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.3390\/robotics8040100"},{"volume-title":"Retrieved","key":"ref14","article-title":"Ml-agents 2021. from Unity Ml-agents Toolkit"},{"key":"ref15","article-title":"Playing atari with deep reinforcement learning","author":"Mnih","year":"2013","journal-title":"arXiv preprint arXiv:1312.5602"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1016\/j.intell.2021.101581"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1038\/s41598-022-18751-2"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1038\/s41586-020-03051-4"},{"key":"ref19","first-page":"1889","article-title":"Trust region policy optimization","volume-title":"International conference on machine learning. PMLR","author":"Schulman"},{"key":"ref20","article-title":"Proximal policy optimization algorithms","author":"Schulman","year":"2017","journal-title":"arXiv preprint arXiv:1707.06347"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2020.2980380"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1038\/nature24270"},{"issue":"1","key":"ref23","first-page":"2021","volume-title":"Training your agents 7 times faster with ML-Agents. Enlace","volume":"2","author":"Teng","year":"2019"},{"journal-title":"Strategies for Using Proximal Policy Optimization in Mobile Puzzle Games. arXiv e-prints","article-title":"Jeppe Theiss Kristensen and Paolo Burelli. 2020","year":"2020","key":"ref24"},{"key":"ref25","first-page":"348","article-title":"Evaluating the efficacyofdifferentneuralnetworkdeepreinforcementalgorithmsincomp lex search-and-retrieve virtual simulations","volume-title":"International Advanced Computing Conference","author":"Vohra"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.3389\/frai.2022.750763"},{"key":"ref27","article-title":"Learn what not to learn: Action elimination with deep reinforcement learning","volume":"31","author":"Zahavy","year":"2018","journal-title":"Advances in neural information processing systems"},{"key":"ref28","article-title":"Decoupling dynamics and reward for transfer learning","author":"Zhang","year":"2018","journal-title":"arXiv preprint arXiv:1804.10689"}],"event":{"name":"2024 15th International Conference on Computing Communication and Networking Technologies (ICCCNT)","start":{"date-parts":[[2024,6,24]]},"location":"Kamand, India","end":{"date-parts":[[2024,6,28]]}},"container-title":["2024 15th International Conference on Computing Communication and Networking Technologies (ICCCNT)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/10723818\/10723316\/10726128.pdf?arnumber=10726128","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,11,27]],"date-time":"2024-11-27T04:27:40Z","timestamp":1732681660000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10726128\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,6,24]]},"references-count":28,"URL":"https:\/\/doi.org\/10.1109\/icccnt61001.2024.10726128","relation":{},"subject":[],"published":{"date-parts":[[2024,6,24]]}}}