{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,16]],"date-time":"2026-06-16T05:17:23Z","timestamp":1781587043596,"version":"3.54.5"},"reference-count":72,"publisher":"Association for Computing Machinery (ACM)","issue":"3","license":[{"start":{"date-parts":[[2021,7,22]],"date-time":"2021-07-22T00:00:00Z","timestamp":1626912000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.acm.org\/publications\/policies\/copyright_policy#Background"}],"funder":[{"DOI":"10.13039\/501100001824","name":"Czech Science Foundation","doi-asserted-by":"crossref","award":["19-22071Y"],"award-info":[{"award-number":["19-22071Y"]}],"id":[{"id":"10.13039\/501100001824","id-type":"DOI","asserted-by":"crossref"}]},{"name":"European Union\u2019s Horizon 2020 research and innovation programmes","award":["761802 MARCONI and 779962 V4Design"],"award-info":[{"award-number":["761802 MARCONI and 779962 V4Design"]}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":["ACM Trans. Multimedia Comput. Commun. Appl."],"published-print":{"date-parts":[[2021,8,31]]},"abstract":"<jats:p>Comprehensive and fair performance evaluation of information retrieval systems represents an essential task for the current information age. Whereas Cranfield-based evaluations with benchmark datasets support development of retrieval models, significant evaluation efforts are required also for user-oriented systems that try to boost performance with an interactive search approach. This article presents findings from the 9th Video Browser Showdown, a competition that focuses on a legitimate comparison of interactive search systems designed for challenging known-item search tasks over a large video collection. During previous installments of the competition, the interactive nature of participating systems was a key feature to satisfy known-item search needs, and this article continues to support this hypothesis. Despite the fact that top-performing systems integrate the most recent deep learning models into their retrieval process, interactive searching remains a necessary component of successful strategies for known-item search tasks. Alongside the description of competition settings, evaluated tasks, participating teams, and overall results, this article presents a detailed analysis of query logs collected by the top three performing systems, SOMHunter, VIRET, and vitrivr. The analysis provides a quantitative insight to the observed performance of the systems and constitutes a new baseline methodology for future events. The results reveal that the top two systems mostly relied on temporal queries before a correct frame was identified. An interaction log analysis complements the result log findings and points to the importance of result set and video browsing approaches. Finally, various outlooks are discussed in order to improve the Video Browser Showdown challenge in the future.<\/jats:p>","DOI":"10.1145\/3445031","type":"journal-article","created":{"date-parts":[[2021,7,22]],"date-time":"2021-07-22T14:44:29Z","timestamp":1626965069000},"page":"1-26","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":55,"title":["Is the Reign of Interactive Search Eternal? Findings from the Video Browser Showdown 2020"],"prefix":"10.1145","volume":"17","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-3558-4144","authenticated-orcid":false,"given":"Jakub","family":"Loko\u010d","sequence":"first","affiliation":[{"name":"Charles University, Czech Republic"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Patrik","family":"Vesel\u00fd","sequence":"additional","affiliation":[{"name":"Charles University, Czech Republic"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Franti\u0161ek","family":"Mejzl\u00edk","sequence":"additional","affiliation":[{"name":"Charles University, Czech Republic"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Gregor","family":"Koval\u010d\u00edk","sequence":"additional","affiliation":[{"name":"Charles University, Czech Republic"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Tom\u00e1\u0161","family":"Sou\u010dek","sequence":"additional","affiliation":[{"name":"Charles University, Czech Republic"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Luca","family":"Rossetto","sequence":"additional","affiliation":[{"name":"University of Zurich, Switzerland"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Klaus","family":"Schoeffmann","sequence":"additional","affiliation":[{"name":"Klagenfurt University, Klagenfurt, Austria"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Werner","family":"Bailer","sequence":"additional","affiliation":[{"name":"Joanneum Research, Austria"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Cathal","family":"Gurrin","sequence":"additional","affiliation":[{"name":"Dublin City University, Dublin, Ireland"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Loris","family":"Sauter","sequence":"additional","affiliation":[{"name":"University of Basel, Basel, Switzerland"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jaeyub","family":"Song","sequence":"additional","affiliation":[{"name":"Korea Advanced Institute of Science and Technology, Daejeon, South Korea"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Stefanos","family":"Vrochidis","sequence":"additional","affiliation":[{"name":"Information Technologies Institute, CERTH, Greece"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jiaxin","family":"Wu","sequence":"additional","affiliation":[{"name":"City University of Hong Kong, Hong Kong, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Bj\u00f6rn \u00fe\u00f3R","family":"J\u00f3nsson","sequence":"additional","affiliation":[{"name":"IT University of Copenhagen, Denmark"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"320","published-online":{"date-parts":[[2021,7,22]]},"reference":[{"key":"e_1_2_1_1_1","volume-title":"VERGE in VBS","author":"Andreadis Stelios","year":"2020","unstructured":"Stelios Andreadis , Anastasia Moumtzidou , Konstantinos Apostolidis , Konstantinos Gkountakos , Damianos Galanopoulos , Emmanouil Michail , Ilias Gialampoukidis , Stefanos Vrochidis , Vasileios Mezaris , and Ioannis Kompatsiaris . 2020. VERGE in VBS 2020 . In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing , Cham, 778\u2013783. Stelios Andreadis, Anastasia Moumtzidou, Konstantinos Apostolidis, Konstantinos Gkountakos, Damianos Galanopoulos, Emmanouil Michail, Ilias Gialampoukidis, Stefanos Vrochidis, Vasileios Mezaris, and Ioannis Kompatsiaris. 2020. VERGE in VBS 2020. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing, Cham, 778\u2013783."},{"key":"e_1_2_1_2_1","volume-title":"TRECVID","author":"Awad George","year":"2019","unstructured":"George Awad , Asad Butt , Keith Curtis , Yooyoung Lee , Jonathan Fiscus , Afzal Godil , Andrew Delgado , Alan F. Smeaton , Yvette Graham , Wessel Kraaij , and Georges Qu\u00e9not . 2019. TRECVID 2019: An evaluation campaign to benchmark video activity detection, video captioning and matching, and video search & retrieval . In TRECVID 2019 . NIST , USA. https:\/\/www.nist.gov\/publications\/trecvid-2019-evaluation-campaign-benchmark-video-activity-detection-video-captioning. George Awad, Asad Butt, Keith Curtis, Yooyoung Lee, Jonathan Fiscus, Afzal Godil, Andrew Delgado, Alan F. Smeaton, Yvette Graham, Wessel Kraaij, and Georges Qu\u00e9not. 2019. TRECVID 2019: An evaluation campaign to benchmark video activity detection, video captioning and matching, and video search & retrieval. In TRECVID 2019. NIST, USA. https:\/\/www.nist.gov\/publications\/trecvid-2019-evaluation-campaign-benchmark-video-activity-detection-video-captioning."},{"key":"e_1_2_1_3_1","volume-title":"TRECVID 2017: Evaluating ad-hoc and instance video search, events detection, video captioning and hyperlinking. In TRECVID 2017. NIST, USA.","author":"Awad George","year":"2017","unstructured":"George Awad , Asad Butt , Jonathan Fiscus , Martial Michel , David Joy , Wessel Kraaij , Alan F. Smeaton , Georges Qu\u00e9not , Maria Eskevich , Roeland Ordelman , Gareth J. F. Jones , and Benoit Huet . 2017 . TRECVID 2017: Evaluating ad-hoc and instance video search, events detection, video captioning and hyperlinking. In TRECVID 2017. NIST, USA. George Awad, Asad Butt, Jonathan Fiscus, Martial Michel, David Joy, Wessel Kraaij, Alan F. Smeaton, Georges Qu\u00e9not, Maria Eskevich, Roeland Ordelman, Gareth J. F. Jones, and Benoit Huet. 2017. TRECVID 2017: Evaluating ad-hoc and instance video search, events detection, video captioning and hyperlinking. In TRECVID 2017. NIST, USA."},{"key":"e_1_2_1_4_1","doi-asserted-by":"publisher","DOI":"10.1145\/3323873.3325051"},{"key":"e_1_2_1_5_1","volume-title":"A short note about kinetics-600. ArXiv abs\/1808.01340","author":"Carreira Jo\u00e3o","year":"2018","unstructured":"Jo\u00e3o Carreira , Eric Noland , Andras Banki-Horvath , Chloe Hillier , and Andrew Zisserman . 2018. A short note about kinetics-600. ArXiv abs\/1808.01340 ( 2018 ). Jo\u00e3o Carreira, Eric Noland, Andras Banki-Horvath, Chloe Hillier, and Andrew Zisserman. 2018. A short note about kinetics-600. ArXiv abs\/1808.01340 (2018)."},{"key":"e_1_2_1_6_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00511"},{"key":"e_1_2_1_7_1","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01234-2_49"},{"key":"e_1_2_1_8_1","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-016-3661-2"},{"key":"e_1_2_1_9_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.350"},{"key":"e_1_2_1_10_1","doi-asserted-by":"publisher","DOI":"10.1109\/83.817596"},{"key":"e_1_2_1_11_1","unstructured":"Dan Deng Haifeng Liu Xuelong Li and Deng Cai. 2018. PixelLink: Detecting scene text via instance segmentation. (2018). arxiv:cs.CV\/1801.01315  Dan Deng Haifeng Liu Xuelong Li and Deng Cai. 2018. PixelLink: Detecting scene text via instance segmentation. (2018). arxiv:cs.CV\/1801.01315"},{"key":"e_1_2_1_12_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2009.5206848"},{"key":"e_1_2_1_13_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00957"},{"key":"e_1_2_1_14_1","doi-asserted-by":"publisher","DOI":"10.1109\/MMUL.2013.66"},{"key":"e_1_2_1_15_1","doi-asserted-by":"publisher","DOI":"10.1109\/MMUL.2018.2873844"},{"key":"e_1_2_1_16_1","doi-asserted-by":"publisher","DOI":"10.1007\/s11263-014-0733-5"},{"key":"e_1_2_1_17_1","doi-asserted-by":"publisher","DOI":"10.1145\/3372278.3390737"},{"key":"e_1_2_1_18_1","doi-asserted-by":"publisher","DOI":"10.1145\/3323873.3326921"},{"key":"e_1_2_1_19_1","doi-asserted-by":"publisher","DOI":"10.1109\/CBMI.2016.7500252"},{"key":"e_1_2_1_20_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICE.2019.8792602"},{"key":"e_1_2_1_21_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.90"},{"key":"e_1_2_1_22_1","volume-title":"Finding tiny faces. CoRR abs\/1612.04402","author":"Hu Peiyun","year":"2016","unstructured":"Peiyun Hu and Deva Ramanan . 2016. Finding tiny faces. CoRR abs\/1612.04402 ( 2016 ). arxiv:1612.04402 Peiyun Hu and Deva Ramanan. 2016. Finding tiny faces. CoRR abs\/1612.04402 (2016). arxiv:1612.04402"},{"key":"e_1_2_1_23_1","doi-asserted-by":"publisher","DOI":"10.5555\/3045118.3045167"},{"key":"e_1_2_1_24_1","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2010.57"},{"key":"e_1_2_1_25_1","volume-title":"Dennis C. Koelma, Stevan Rudinac, Marcel Worring, and Jan Zah\u00e1lka.","author":"J\u00f3nsson Bj\u00f6rn \u00fe\u00f3r","year":"2020","unstructured":"Bj\u00f6rn \u00fe\u00f3r J\u00f3nsson , Omar Shahbaz Khan , Dennis C. Koelma, Stevan Rudinac, Marcel Worring, and Jan Zah\u00e1lka. 2020 . Exquisitor at the video browser showdown 2020. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing , Cham, 796\u2013802. Bj\u00f6rn \u00fe\u00f3r J\u00f3nsson, Omar Shahbaz Khan, Dennis C. Koelma, Stevan Rudinac, Marcel Worring, and Jan Zah\u00e1lka. 2020. Exquisitor at the video browser showdown 2020. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing, Cham, 796\u2013802."},{"key":"e_1_2_1_26_1","volume-title":"Proceedings of the European Conference on Information Retrieval (ECIR\u201920)","author":"Khan Omar Shahbaz","year":"2020","unstructured":"Omar Shahbaz Khan , Bj\u00f6rn \u00de\u00f3r J\u00f3nsson , Stevan Rudinac , Jan Zah\u00e1lka , Hanna Ragnarsd\u00f3ttir , \u00de\u00f3rhildur \u00deorleiksd\u00f3ttir , Gylfi \u00de\u00f3r Gu\u00f0mundsson , Laurent Amsaleg , and Marcel Worring . 2020 . Interactive learning for multimedia at large . In Proceedings of the European Conference on Information Retrieval (ECIR\u201920) . Springer, Lisboa, Portugal, 16. Omar Shahbaz Khan, Bj\u00f6rn \u00de\u00f3r J\u00f3nsson, Stevan Rudinac, Jan Zah\u00e1lka, Hanna Ragnarsd\u00f3ttir, \u00de\u00f3rhildur \u00deorleiksd\u00f3ttir, Gylfi \u00de\u00f3r Gu\u00f0mundsson, Laurent Amsaleg, and Marcel Worring. 2020. Interactive learning for multimedia at large. In Proceedings of the European Conference on Information Retrieval (ECIR\u201920). Springer, Lisboa, Portugal, 16."},{"key":"e_1_2_1_27_1","volume-title":"MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu","author":"Kratochv\u00edl Miroslav","unstructured":"Miroslav Kratochv\u00edl , Patrik Vesel\u00fd , Franti\u0161ek Mejzl\u00edk , and Jakub Loko\u010d . 2020. SOM-Hunter: Video browsing with relevance-to-SOM feedback loop . In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu , and Wesley De Neve (Eds.). Springer International Publishing , Cham , 790\u2013795. Miroslav Kratochv\u00edl, Patrik Vesel\u00fd, Franti\u0161ek Mejzl\u00edk, and Jakub Loko\u010d. 2020. SOM-Hunter: Video browsing with relevance-to-SOM feedback loop. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing, Cham, 790\u2013795."},{"key":"e_1_2_1_28_1","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-37734-2_71"},{"key":"e_1_2_1_29_1","volume-title":"International Journal of Computer Vision","author":"Kuznetsova Alina","year":"2018","unstructured":"Alina Kuznetsova , Hassan Rom , Neil Alldrin , Jasper R. R. Uijlings , Ivan Krasin , Jordi Pont-Tuset , Shahab Kamali , Stefan Popov , Matteo Malloci , Tom Duerig , and Vittorio Ferrari . 2018. The open images dataset V4 . International Journal of Computer Vision ( 2018 ), 1\u201326. https:\/\/link.springer.com\/article\/10.1007\/s11263-020-01316-z. Alina Kuznetsova, Hassan Rom, Neil Alldrin, Jasper R. R. Uijlings, Ivan Krasin, Jordi Pont-Tuset, Shahab Kamali, Stefan Popov, Matteo Malloci, Tom Duerig, and Vittorio Ferrari. 2018. The open images dataset V4. International Journal of Computer Vision (2018), 1\u201326. https:\/\/link.springer.com\/article\/10.1007\/s11263-020-01316-z."},{"key":"e_1_2_1_30_1","volume-title":"MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu","author":"Le Nguyen-Khang","unstructured":"Nguyen-Khang Le , Dieu-Hien Nguyen , and Minh-Triet Tran . 2020. An interactive video search platform for multi-modal retrieval with advanced concepts . In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu , and Wesley De Neve (Eds.). Springer International Publishing , Cham , 766\u2013771. Nguyen-Khang Le, Dieu-Hien Nguyen, and Minh-Triet Tran. 2020. An interactive video search platform for multi-modal retrieval with advanced concepts. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing, Cham, 766\u2013771."},{"key":"e_1_2_1_31_1","unstructured":"Kuang-Huei Lee Xi Chen Gang Hua Houdong Hu and Xiaodong He. 2018. Stacked cross attention for image-text matching. (2018). arxiv:cs.CV\/1803.08024  Kuang-Huei Lee Xi Chen Gang Hua Houdong Hu and Xiaodong He. 2018. Stacked cross attention for image-text matching. (2018). arxiv:cs.CV\/1803.08024"},{"key":"e_1_2_1_32_1","volume-title":"MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu","author":"Leibetseder Andreas","unstructured":"Andreas Leibetseder , Bernd M\u00fcnzer , J\u00fcrgen Primus , Sabrina Kletz , and Klaus Schoeffmann . 2020. diveXplore 4.0: The ITEC deep interactive video exploration system at VBS2020 . In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu , and Wesley De Neve (Eds.). Springer International Publishing , Cham , 753\u2013759. Andreas Leibetseder, Bernd M\u00fcnzer, J\u00fcrgen Primus, Sabrina Kletz, and Klaus Schoeffmann. 2020. diveXplore 4.0: The ITEC deep interactive video exploration system at VBS2020. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing, Cham, 753\u2013759."},{"key":"e_1_2_1_33_1","doi-asserted-by":"publisher","DOI":"10.1145\/3343031.3350906"},{"key":"e_1_2_1_34_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.502"},{"key":"e_1_2_1_35_1","doi-asserted-by":"publisher","DOI":"10.1145\/3394171.3414002"},{"key":"e_1_2_1_36_1","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2018.2830110"},{"key":"e_1_2_1_37_1","doi-asserted-by":"publisher","DOI":"10.1145\/3295663"},{"key":"e_1_2_1_38_1","volume-title":"Proceedings, Part II (Lecture Notes in Computer Science), Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.)","volume":"11962","author":"Loko\u010d Jakub","year":"2020","unstructured":"Jakub Loko\u010d , Gregor Koval\u010d\u00edk , and Tom\u00e1\u0161 Sou\u010dek . 2020 . VIRET at video browser showdown 2020. In MultiMedia Modeling - 26th International Conference (MMM\u201920) , Proceedings, Part II (Lecture Notes in Computer Science), Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.) , Vol. 11962 . Springer, 784\u2013789. DOI:https:\/\/doi.org\/10.1007\/978-3-030-37734-2_70 10.1007\/978-3-030-37734-2_70 Jakub Loko\u010d, Gregor Koval\u010d\u00edk, and Tom\u00e1\u0161 Sou\u010dek. 2020. VIRET at video browser showdown 2020. In MultiMedia Modeling - 26th International Conference (MMM\u201920), Proceedings, Part II (Lecture Notes in Computer Science), Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.), Vol. 11962. Springer, 784\u2013789. DOI:https:\/\/doi.org\/10.1007\/978-3-030-37734-2_70"},{"key":"e_1_2_1_39_1","doi-asserted-by":"publisher","DOI":"10.1145\/3343031.3351046"},{"key":"e_1_2_1_40_1","doi-asserted-by":"publisher","DOI":"10.1145\/3323873.3325034"},{"key":"e_1_2_1_41_1","doi-asserted-by":"publisher","DOI":"10.5555\/863401"},{"key":"e_1_2_1_42_1","volume-title":"Implicit and explicit concept relations in deep neural networks for multi-label video\/image annotation","author":"Markatopoulou Foteini","year":"2018","unstructured":"Foteini Markatopoulou , Vasileios Mezaris , and Ioannis Patras . 2018. Implicit and explicit concept relations in deep neural networks for multi-label video\/image annotation . IEEE Transactions on Circuits and Systems for Video Technology ( 2018 ). https:\/\/ieeexplore.ieee.org\/document\/8387768. Foteini Markatopoulou, Vasileios Mezaris, and Ioannis Patras. 2018. Implicit and explicit concept relations in deep neural networks for multi-label video\/image annotation. IEEE Transactions on Circuits and Systems for Video Technology (2018). https:\/\/ieeexplore.ieee.org\/document\/8387768."},{"key":"e_1_2_1_43_1","doi-asserted-by":"publisher","DOI":"10.1145\/2911996.2912036"},{"key":"e_1_2_1_44_1","doi-asserted-by":"publisher","DOI":"10.1145\/3377875"},{"key":"e_1_2_1_45_1","volume-title":"Enhanced VIREO KIS at VBS","author":"Nguyen Phuong Anh","year":"2018","unstructured":"Phuong Anh Nguyen , Yi-Jie Lu , Hao Zhang , and Chong-Wah Ngo . 2018. Enhanced VIREO KIS at VBS 2018 . In MultiMedia Modeling . 407\u2013412. Phuong Anh Nguyen, Yi-Jie Lu, Hao Zhang, and Chong-Wah Ngo. 2018. Enhanced VIREO KIS at VBS 2018. In MultiMedia Modeling. 407\u2013412."},{"key":"e_1_2_1_46_1","volume-title":"NIST TRECVID Workshop.","author":"Nguyen Phuong Anh","year":"2019","unstructured":"Phuong Anh Nguyen , Jiaxin Wu , Chong-Wah Ngo , Francis Danny , and Huet Benoit . 2019 . VIREO-EURECOM @ TRECVID 2019: Ad-hoc video search . In NIST TRECVID Workshop. Phuong Anh Nguyen, Jiaxin Wu, Chong-Wah Ngo, Francis Danny, and Huet Benoit. 2019. VIREO-EURECOM @ TRECVID 2019: Ad-hoc video search. In NIST TRECVID Workshop."},{"key":"e_1_2_1_47_1","volume-title":"MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu","author":"Nguyen Phuong Anh","unstructured":"Phuong Anh Nguyen , Jiaxin Wu , Chong-Wah Ngo , Danny Francis , and Benoit Huet . 2020. VIREO @ Video browser showdown 2020. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu , and Wesley De Neve (Eds.). Springer International Publishing , Cham , 772\u2013777. Phuong Anh Nguyen, Jiaxin Wu, Chong-Wah Ngo, Danny Francis, and Benoit Huet. 2020. VIREO @ Video browser showdown 2020. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing, Cham, 772\u2013777."},{"key":"e_1_2_1_48_1","volume-title":"IVIST: Interactive video search tool in VBS","author":"Park Sungjune","year":"2020","unstructured":"Sungjune Park , Jaeyub Song , Minho Park , and Yong Man Ro . 2020 . IVIST: Interactive video search tool in VBS 2020. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing , Cham, 809\u2013814. Sungjune Park, Jaeyub Song, Minho Park, and Yong Man Ro. 2020. IVIST: Interactive video search tool in VBS 2020. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing, Cham, 809\u2013814."},{"key":"e_1_2_1_49_1","volume-title":"Learning spatio-temporal representation with pseudo-3D residual networks. CoRR abs\/1711.10305","author":"Qiu Zhaofan","year":"2017","unstructured":"Zhaofan Qiu , Ting Yao , and Tao Mei . 2017. Learning spatio-temporal representation with pseudo-3D residual networks. CoRR abs\/1711.10305 ( 2017 ). arxiv:1711.10305 Zhaofan Qiu, Ting Yao, and Tao Mei. 2017. Learning spatio-temporal representation with pseudo-3D residual networks. CoRR abs\/1711.10305 (2017). arxiv:1711.10305"},{"key":"e_1_2_1_50_1","volume-title":"YOLO v3: An incremental improvement. arXiv preprint arXiv:1804.02767","author":"Redmon Joseph","year":"2018","unstructured":"Joseph Redmon and Ali Farhadi . 2018. YOLO v3: An incremental improvement. arXiv preprint arXiv:1804.02767 ( 2018 ). Joseph Redmon and Ali Farhadi. 2018. YOLO v3: An incremental improvement. arXiv preprint arXiv:1804.02767 (2018)."},{"key":"e_1_2_1_51_1","volume-title":"Proceedings of the 27th International Conference on MultiMedia Modeling.","author":"Rossetto Luca","year":"2021","unstructured":"Luca Rossetto , Werner Bailer , and Abraham Bernstein . 2021 . Considering human perception and memory in interactive multimedia retrieval evaluations . In Proceedings of the 27th International Conference on MultiMedia Modeling. Luca Rossetto, Werner Bailer, and Abraham Bernstein. 2021. Considering human perception and memory in interactive multimedia retrieval evaluations. In Proceedings of the 27th International Conference on MultiMedia Modeling."},{"key":"e_1_2_1_52_1","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2020.2980944"},{"key":"e_1_2_1_53_1","volume-title":"Proceedings of the 27th International Conference on MultiMedia Modeling.","author":"Rossetto Luca","year":"2021","unstructured":"Luca Rossetto , Ralph Gasser , Loris Sauter , Abraham Bernstein , and Heiko Schuldt . 2021 . A system for interactive multimedia retrieval evaluations . In Proceedings of the 27th International Conference on MultiMedia Modeling. Luca Rossetto, Ralph Gasser, Loris Sauter, Abraham Bernstein, and Heiko Schuldt. 2021. A system for interactive multimedia retrieval evaluations. In Proceedings of the 27th International Conference on MultiMedia Modeling."},{"key":"e_1_2_1_54_1","doi-asserted-by":"publisher","DOI":"10.1109\/ISM.2014.38"},{"key":"e_1_2_1_55_1","doi-asserted-by":"publisher","DOI":"10.1145\/2964284.2973797"},{"key":"e_1_2_1_56_1","volume-title":"Proceedings, Part II. 616\u2013621","author":"Rossetto Luca","year":"2019","unstructured":"Luca Rossetto , Mahnaz Amiri Parian , Ralph Gasser , Ivan Giangreco , Silvan Heller , and Heiko Schuldt . 2019 . Deep learning-based concept detection in vitrivr. In MultiMedia Modeling - 25th International Conference (MMM\u201919) , Proceedings, Part II. 616\u2013621 . DOI:https:\/\/doi.org\/10.1007\/978-3-030-05716-9_55 10.1007\/978-3-030-05716-9_55 Luca Rossetto, Mahnaz Amiri Parian, Ralph Gasser, Ivan Giangreco, Silvan Heller, and Heiko Schuldt. 2019. Deep learning-based concept detection in vitrivr. In MultiMedia Modeling - 25th International Conference (MMM\u201919), Proceedings, Part II. 616\u2013621. DOI:https:\/\/doi.org\/10.1007\/978-3-030-05716-9_55"},{"key":"e_1_2_1_57_1","volume-title":"Proceedings, Part I. 349\u2013360","author":"Rossetto Luca","unstructured":"Luca Rossetto , Heiko Schuldt , George Awad , and Asad A. Butt . 2019. V3C - A research video collection. In MultiMedia Modeling - 25th International Conference (MMM\u201919) , Proceedings, Part I. 349\u2013360 . DOI:https:\/\/doi.org\/10.1007\/978-3-030-05710-7_29 10.1007\/978-3-030-05710-7_29 Luca Rossetto, Heiko Schuldt, George Awad, and Asad A. Butt. 2019. V3C - A research video collection. In MultiMedia Modeling - 25th International Conference (MMM\u201919), Proceedings, Part I. 349\u2013360. DOI:https:\/\/doi.org\/10.1007\/978-3-030-05710-7_29"},{"key":"e_1_2_1_58_1","volume-title":"Ralph Gasser, Silvan Heller, Luca Rossetto, and Heiko Schuldt.","author":"Sauter Loris","year":"2020","unstructured":"Loris Sauter , Mahnaz Amiri Parian , Ralph Gasser, Silvan Heller, Luca Rossetto, and Heiko Schuldt. 2020 . Combining Boolean and multimedia retrieval in vitrivr for large-scale video search. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing , Cham, 760\u2013765. Loris Sauter, Mahnaz Amiri Parian, Ralph Gasser, Silvan Heller, Luca Rossetto, and Heiko Schuldt. 2020. Combining Boolean and multimedia retrieval in vitrivr for large-scale video search. In MultiMedia Modeling, Yong Man Ro, Wen-Huang Cheng, Junmo Kim, Wei-Ta Chu, Peng Cui, Jung-Woo Choi, Min-Chun Hu, and Wesley De Neve (Eds.). Springer International Publishing, Cham, 760\u2013765."},{"key":"e_1_2_1_59_1","doi-asserted-by":"publisher","DOI":"10.1109\/CBMI.2019.8877397"},{"key":"e_1_2_1_60_1","volume-title":"MultiMedia Modeling","author":"Schoeffmann Klaus","unstructured":"Klaus Schoeffmann , Bernd M\u00fcnzer , Andreas Leibetseder , J\u00fcrgen Primus , and Sabrina Kletz . 2019. Autopiloting feature maps: The deep interactive video exploration (diveXplore) System at VBS2019 . In MultiMedia Modeling . Springer International Publishing , Cham , 585\u2013590. Klaus Schoeffmann, Bernd M\u00fcnzer, Andreas Leibetseder, J\u00fcrgen Primus, and Sabrina Kletz. 2019. Autopiloting feature maps: The deep interactive video exploration (diveXplore) System at VBS2019. In MultiMedia Modeling. Springer International Publishing, Cham, 585\u2013590."},{"key":"e_1_2_1_61_1","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2018.2848939"},{"key":"e_1_2_1_62_1","doi-asserted-by":"publisher","DOI":"10.5555\/1304596.1304846"},{"key":"e_1_2_1_63_1","volume-title":"TransNet: A deep network for fast detection of common shot transitions. CoRR abs\/1906.03363","author":"Sou\u010dek Tom\u00e1\u0161","year":"2019","unstructured":"Tom\u00e1\u0161 Sou\u010dek , Jaroslav Moravec , and Jakub Loko\u010d . 2019. TransNet: A deep network for fast detection of common shot transitions. CoRR abs\/1906.03363 ( 2019 ). arxiv:1906.03363 Tom\u00e1\u0161 Sou\u010dek, Jaroslav Moravec, and Jakub Loko\u010d. 2019. TransNet: A deep network for fast detection of common shot transitions. CoRR abs\/1906.03363 (2019). arxiv:1906.03363"},{"key":"e_1_2_1_64_1","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2016.2587640"},{"key":"e_1_2_1_65_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.634"},{"key":"e_1_2_1_66_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.01058"},{"key":"e_1_2_1_67_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.571"},{"key":"e_1_2_1_68_1","doi-asserted-by":"publisher","DOI":"10.1145\/3397271.3401151"},{"key":"e_1_2_1_69_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.01064"},{"key":"e_1_2_1_70_1","doi-asserted-by":"publisher","DOI":"10.5555\/2968826.2968881"},{"key":"e_1_2_1_71_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.544"},{"key":"e_1_2_1_72_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.283"}],"container-title":["ACM Transactions on Multimedia Computing, Communications, and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3445031","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3445031","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,17]],"date-time":"2025-06-17T21:28:13Z","timestamp":1750195693000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3445031"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,7,22]]},"references-count":72,"journal-issue":{"issue":"3","published-print":{"date-parts":[[2021,8,31]]}},"alternative-id":["10.1145\/3445031"],"URL":"https:\/\/doi.org\/10.1145\/3445031","relation":{},"ISSN":["1551-6857","1551-6865"],"issn-type":[{"value":"1551-6857","type":"print"},{"value":"1551-6865","type":"electronic"}],"subject":[],"published":{"date-parts":[[2021,7,22]]},"assertion":[{"value":"2020-04-01","order":0,"name":"received","label":"Received","group":{"name":"publication_history","label":"Publication History"}},{"value":"2020-12-01","order":1,"name":"accepted","label":"Accepted","group":{"name":"publication_history","label":"Publication History"}},{"value":"2021-07-22","order":2,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}