{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,30]],"date-time":"2024-10-30T12:58:15Z","timestamp":1730293095739,"version":"3.28.0"},"reference-count":23,"publisher":"IEEE","license":[{"start":{"date-parts":[[2023,12,4]],"date-time":"2023-12-04T00:00:00Z","timestamp":1701648000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2023,12,4]],"date-time":"2023-12-04T00:00:00Z","timestamp":1701648000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2023,12,4]]},"DOI":"10.1109\/robio58561.2023.10354837","type":"proceedings-article","created":{"date-parts":[[2023,12,22]],"date-time":"2023-12-22T19:20:45Z","timestamp":1703272845000},"page":"1-8","source":"Crossref","is-referenced-by-count":1,"title":["Learning RL policies for anticipative assistive robots by simulating human-robot interactions in real scenarios using egocentric videos"],"prefix":"10.1109","author":[{"given":"Silvia","family":"Abal-Fern\u00e1ndez","sequence":"first","affiliation":[{"name":"Universidad Carlos III de Madrid,Signal Theory and Communications Department,Spain"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"C\u00e9sar","family":"Caramazana-Zarzosa","sequence":"additional","affiliation":[{"name":"Universidad Carlos III de Madrid,Signal Theory and Communications Department,Spain"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mar\u00eda Beatriz","family":"Loureiro-Casalderrey","sequence":"additional","affiliation":[{"name":"Universidad Carlos III de Madrid,Signal Theory and Communications Department,Spain"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Santiago","family":"Mart\u00ednez","sequence":"additional","affiliation":[{"name":"Universidad Carlos III de Madrid,Robotics Lab,Spain"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Carlos","family":"Balaguer","sequence":"additional","affiliation":[{"name":"Universidad Carlos III de Madrid,Robotics Lab,Spain"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Fernando","family":"D\u00edaz-de-Mar\u00eda","sequence":"additional","affiliation":[{"name":"Universidad Carlos III de Madrid,Signal Theory and Communications Department,Spain"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Iv\u00e1n","family":"Gonz\u00e1lez-D\u00edaz","sequence":"additional","affiliation":[{"name":"Universidad Carlos III de Madrid,Signal Theory and Communications Department,Spain"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.46234\/ccdcw2021.160"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1186\/s12877-021-02277-9"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1145\/3277903"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.3390\/s21041292"},{"article-title":"The chef\u2019s hat simulation environment for reinforcement-learning-based agents","year":"2020","author":"Barros","key":"ref5"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/RO-MAN46459.2019.8956259"},{"article-title":"A survey of deep reinforcement learning in video games","year":"2019","author":"Shao","key":"ref7"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/CIG.2018.8490422"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2017.8202134"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.23919\/WAC50355.2021.9559586"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.2139\/ssrn.4253139"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/TCDS.2018.2843122"},{"journal-title":"Vrkitchen: An interactive 3d environment for learning real life cooking tasks","year":"2019","author":"Gao","key":"ref13"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.01111"},{"key":"ref15","first-page":"477","article-title":"Behavior: Benchmark for everyday household activities in virtual, interactive, and ecological environments","volume-title":"Proceedings of the 5th Conference on Robot Learning","volume":"164","author":"Srivastava"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA40945.2020.9197411"},{"journal-title":"Exploring human-robot interaction by simulating robots","year":"2022","author":"Kassem","key":"ref17"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1145\/3206025.3206073"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2018.11.013"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1098\/rstb.2013.0060"},{"article-title":"Deep recurrent q-learning for partially observable mdps","volume-title":"AAAI Fall Symposia","author":"Hausknecht","key":"ref21"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2015.169"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1145\/3434074.3446362"}],"event":{"name":"2023 IEEE International Conference on Robotics and Biomimetics (ROBIO)","start":{"date-parts":[[2023,12,4]]},"location":"Koh\u00a0Samui, Thailand","end":{"date-parts":[[2023,12,9]]}},"container-title":["2023 IEEE International Conference on Robotics and Biomimetics (ROBIO)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/10354348\/10354529\/10354837.pdf?arnumber=10354837","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,1,12]],"date-time":"2024-01-12T21:24:23Z","timestamp":1705094663000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10354837\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2023,12,4]]},"references-count":23,"URL":"https:\/\/doi.org\/10.1109\/robio58561.2023.10354837","relation":{},"subject":[],"published":{"date-parts":[[2023,12,4]]}}}