{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,13]],"date-time":"2026-03-13T04:51:42Z","timestamp":1773377502906,"version":"3.50.1"},"reference-count":36,"publisher":"IEEE","license":[{"start":{"date-parts":[[2021,9,19]],"date-time":"2021-09-19T00:00:00Z","timestamp":1632009600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2021,9,19]],"date-time":"2021-09-19T00:00:00Z","timestamp":1632009600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2021,9,19]]},"DOI":"10.1109\/icip42928.2021.9506258","type":"proceedings-article","created":{"date-parts":[[2021,8,23]],"date-time":"2021-08-23T17:08:41Z","timestamp":1629738521000},"page":"384-388","source":"Crossref","is-referenced-by-count":0,"title":["VVS: Action Recognition With Virtual View Synthesis"],"prefix":"10.1109","author":[{"given":"Gao","family":"Peng","sequence":"first","affiliation":[{"name":"Shanghai Jiao Tong University"}]},{"given":"Yong-Lu","family":"Li","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University"}]},{"given":"Hao","family":"Zhu","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University"}]},{"given":"Jiajun","family":"Tang","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University"}]},{"given":"Jin","family":"Xia","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University"}]},{"given":"Cewu","family":"Lu","sequence":"additional","affiliation":[{"name":"Qing Yuan Research Institute and MoE Key Lab of Artificial Intelligence"}]}],"member":"263","reference":[{"key":"ref33","first-page":"2440","article-title":"End-to-end memory networks","volume":"28","author":"sukhbaatar","year":"2015","journal-title":"Advances in neural information processing systems"},{"key":"ref32","article-title":"Neural turing machines","author":"graves","year":"2014","journal-title":"arXiv preprint arXiv 1410 5401"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/TIP.2017.2754941"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00772"},{"key":"ref36","article-title":"Videos as space-time region graphs","author":"wang","year":"2018","journal-title":"ECCV"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.90"},{"key":"ref34","article-title":"Memory networks","author":"weston","year":"2014","journal-title":"arXiv preprint arXiv 1410 3916"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1038\/s42256-020-0168-3"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR46437.2021.01122"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.00634"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00051"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2021.3054048"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.01018"},{"key":"ref16","article-title":"Hoi analysis: Integrating and decomposing human-object interaction","author":"li","year":"2020","journal-title":"NeurIPS"},{"key":"ref17","article-title":"Scaling egocentric vision: The epic-kitchens dataset","author":"damen","year":"2018","journal-title":"ECCV"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1068\/p2935"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4757-0629-1_1"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.01146"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2017.622"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2018.8462891"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v34i07.6855"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00813"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA48506.2021.9561409"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.00046"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.502"},{"key":"ref7","article-title":"Slowfast networks for video recognition","author":"feichtenhofer","year":"2018","journal-title":"arXiv preprint arXiv 1812 07636"},{"key":"ref2","article-title":"The kinetics human action video dataset","author":"kay","year":"2017","journal-title":"arXiv preprint arXiv 1705 06950"},{"key":"ref1","article-title":"Hollywood in homes: Crowdsourcing data collection for activity understanding","author":"sigurdsson","year":"2016","journal-title":"ECCV"},{"key":"ref9","article-title":"Asynchronous interaction aggregation for action detection","author":"tang","year":"2020","journal-title":"arXiv preprint arXiv 2004 06774"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1017\/CBO9780511526817"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2019.00718"},{"key":"ref21","doi-asserted-by":"crossref","DOI":"10.1609\/aaai.v35i3.16339","article-title":"Tdaf: Top-down attention framework for vision tasks","author":"pang","year":"2021","journal-title":"AAAI"},{"key":"ref24","article-title":"Attention is all we need: Nailing down object-centric attention for egocentric activity recognition","author":"sudhakaran","year":"2018","journal-title":"arXiv preprint arXiv 1807 11794"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00685"},{"key":"ref26","article-title":"From third person to first person: Dataset and baselines for synthesis and retrieval","author":"elfeki","year":"2018","journal-title":"arXiv preprint arXiv 1812 08942"},{"key":"ref25","article-title":"Charades-ego: A large-scale dataset of paired third and first person videos","author":"sigurdsson","year":"2018","journal-title":"arXiv preprint arXiv 1804 09023"}],"event":{"name":"2021 IEEE International Conference on Image Processing (ICIP)","location":"Anchorage, AK, USA","start":{"date-parts":[[2021,9,19]]},"end":{"date-parts":[[2021,9,22]]}},"container-title":["2021 IEEE International Conference on Image Processing (ICIP)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9506008\/9506009\/09506258.pdf?arnumber=9506258","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,3,12]],"date-time":"2026-03-12T20:34:07Z","timestamp":1773347647000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9506258\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,9,19]]},"references-count":36,"URL":"https:\/\/doi.org\/10.1109\/icip42928.2021.9506258","relation":{},"subject":[],"published":{"date-parts":[[2021,9,19]]}}}