{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,6]],"date-time":"2026-02-06T20:54:23Z","timestamp":1770411263310,"version":"3.49.0"},"publisher-location":"Singapore","reference-count":24,"publisher":"Springer Nature Singapore","isbn-type":[{"value":"9789819569625","type":"print"},{"value":"9789819569632","type":"electronic"}],"license":[{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2026]]},"DOI":"10.1007\/978-981-95-6963-2_23","type":"book-chapter","created":{"date-parts":[[2026,2,6]],"date-time":"2026-02-06T10:09:09Z","timestamp":1770372549000},"page":"214-221","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["H-EAGLE: Hierarchical Extension of\u00a0EAGLE for\u00a0Multi-level Semantic Video Retrieval"],"prefix":"10.1007","author":[{"ORCID":"https:\/\/orcid.org\/0000-0003-1953-7679","authenticated-orcid":false,"given":"Thang-Long","family":"Nguyen-Ho","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-8537-1331","authenticated-orcid":false,"given":"Viet-Tham","family":"Huynh","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-9597-1832","authenticated-orcid":false,"given":"Allie","family":"Tran","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-3046-3041","authenticated-orcid":false,"given":"Minh-Triet","family":"Tran","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-2903-3968","authenticated-orcid":false,"given":"Cathal","family":"Gurrin","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-6429-6339","authenticated-orcid":false,"given":"Graham","family":"Healy","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2026,2,7]]},"reference":[{"key":"23_CR1","doi-asserted-by":"publisher","first-page":"302","DOI":"10.1007\/978-981-96-2074-6_36","volume-title":"MultiMedia Modeling","author":"YT Cheng","year":"2025","unstructured":"Cheng, Y.T., Wu, J., Ma, Z., He, J., Wei, X.Y., Ngo, C.W.: Interactive video search with multi-modal LLM video captioning. In: Ide, I., et al. (eds.) MultiMedia Modeling, pp. 302\u2013309. Springer Nature Singapore, Singapore (2025)"},{"key":"23_CR2","doi-asserted-by":"crossref","unstructured":"Dave, I.R., Heilbron, F.C., Shah, M., Jenni, S.: Sync from the sea: retrieving alignable videos from large-scale datasets (2024). https:\/\/arxiv.org\/abs\/2409.01445","DOI":"10.1007\/978-3-031-73242-3_21"},{"key":"23_CR3","doi-asserted-by":"publisher","first-page":"318","DOI":"10.1007\/978-981-96-2074-6_38","volume-title":"MultiMedia Modeling","author":"BT Gia","year":"2025","unstructured":"Gia, B.T., et al.: NII-UIT at VBS2025: multimodal video retrieval with LLM integration and dynamic temporal search. In: Ide, I., et al. (eds.) MultiMedia Modeling, pp. 318\u2013325. Springer Nature Singapore, Singapore (2025)"},{"key":"23_CR4","doi-asserted-by":"crossref","unstructured":"Ho-Le, M.Q., et al.: SnapSeek 2.0 at video browser showdown 2025. In: Ide, I., et al. (eds.) MultiMedia Modeling, pp. 339\u2013346. Springer Nature Singapore, Singapore (2025)","DOI":"10.1007\/978-981-96-2074-6_41"},{"key":"23_CR5","unstructured":"Jia, C., et al.: Scaling up visual and vision-language representation learning with noisy text supervision (2021). https:\/\/arxiv.org\/abs\/2102.05918"},{"key":"23_CR6","doi-asserted-by":"publisher","first-page":"347","DOI":"10.1007\/978-3-031-53302-0_31","volume-title":"MultiMedia Modeling","author":"OS Khan","year":"2024","unstructured":"Khan, O.S., Zhu, H., Sharma, U., Kanoulas, E., Rudinac, S., J\u00f3nsson, B.: Exquisitor at the video browser showdown 2024: relevance feedback meets conversational search. In: Rudinac, S., et al. (eds.) MultiMedia Modeling, pp. 347\u2013355. Springer Nature Switzerland, Cham (2024)"},{"key":"23_CR7","doi-asserted-by":"publisher","unstructured":"Le-Hinh, N.T., Huynh, C.T., Ho-Le, M.Q., Ho, D.K., Tran, M.T., Huynh, V.T.: LUMINA-1: learning and understanding multimedia in immersive navigable archives for lifelog retrieval. In: Proceedings of the 8th Annual ACM Workshop on the Lifelog Search Challenge, LSC \u201925, pp. 15\u201322. Association for Computing Machinery, New York (2025). https:\/\/doi.org\/10.1145\/3729459.3748698","DOI":"10.1145\/3729459.3748698"},{"key":"23_CR8","unstructured":"Lee, C., et al.: NV-EMBED: improved techniques for training LLMs as generalist embedding models. arXiv preprint: arXiv:2405.17428 (2024)"},{"key":"23_CR9","unstructured":"Li, J., Li, D., Savarese, S., Hoi, S.: BLIP-2: bootstrapping language-image pre-training with frozen image encoders and large language models (2023). https:\/\/arxiv.org\/abs\/2301.12597"},{"key":"23_CR10","doi-asserted-by":"publisher","first-page":"286","DOI":"10.1007\/978-981-96-2074-6_34","volume-title":"MultiMedia Modeling","author":"T Nguyen","year":"2025","unstructured":"Nguyen, T., et al.: HORUS: multimodal large language models framework for video retrieval at VBS 2025. In: Ide, I., et al. (eds.) MultiMedia Modeling, pp. 286\u2013293. Springer Nature Singapore, Singapore (2025)"},{"key":"23_CR11","doi-asserted-by":"publisher","first-page":"347","DOI":"10.1007\/978-981-96-2074-6_42","volume-title":"MultiMedia Modeling","author":"TL Nguyen-Ho","year":"2025","unstructured":"Nguyen-Ho, T.L., et al.: VEAGLE: eye gaze-assisted guidance for video browser showdown. In: Ide, I., et al. (eds.) MultiMedia Modeling, pp. 347\u2013354. Springer Nature Singapore, Singapore (2025)"},{"key":"23_CR12","unstructured":"OpenAI, Achiam, J., et\u00a0al.: GPT-4 technical report (2024). https:\/\/arxiv.org\/abs\/2303.08774"},{"key":"23_CR13","doi-asserted-by":"publisher","first-page":"356","DOI":"10.1007\/978-3-031-53302-0_32","volume-title":"MultiMedia Modeling","author":"N Pantelidis","year":"2024","unstructured":"Pantelidis, N., et al.: VERGE in VBS 2024. In: Rudinac, S., et al. (eds.) MultiMedia Modeling, pp. 356\u2013363. Springer Nature Switzerland, Cham (2024)"},{"key":"23_CR14","unstructured":"Radford, A., et\u00a0al.: Learning transferable visual models from natural language supervision. In: International Conference on Machine Learning, pp. 8748\u20138763. PMLR (2021)"},{"key":"23_CR15","doi-asserted-by":"publisher","unstructured":"Schoeffmann, K.: Video browser showdown 2012\u20132019: a review. In: 2019 International Conference on Content-Based Multimedia Indexing (CBMI), pp.\u00a01\u20134 (2019). https:\/\/doi.org\/10.1109\/CBMI.2019.8877397","DOI":"10.1109\/CBMI.2019.8877397"},{"issue":"2","key":"23_CR16","doi-asserted-by":"publisher","first-page":"113","DOI":"10.1007\/s13735-013-0050-8","volume":"3","author":"K Schoeffmann","year":"2013","unstructured":"Schoeffmann, K., et al.: The video browser showdown: a live evaluation of interactive video search tools. Int. J. Multimedia Inf. Retrieval 3(2), 113\u2013127 (2013). https:\/\/doi.org\/10.1007\/s13735-013-0050-8","journal-title":"Int. J. Multimedia Inf. Retrieval"},{"key":"23_CR17","doi-asserted-by":"publisher","unstructured":"Schoeffmann, K., Loko\u010d, J., Bailer, W.: 10 years of video browser showdown. In: Proceedings of the 2nd ACM International Conference on Multimedia in Asia, MMAsia \u201920. Association for Computing Machinery, New York (2021). https:\/\/doi.org\/10.1145\/3444685.3450215","DOI":"10.1145\/3444685.3450215"},{"key":"23_CR18","doi-asserted-by":"publisher","unstructured":"Sch\u00f6ffmann, K., Bailer, W.: Video browser showdown. SIGMultimedia Rec. 4(2), 1\u20132 (2012). https:\/\/doi.org\/10.1145\/2350204.2350205","DOI":"10.1145\/2350204.2350205"},{"key":"23_CR19","doi-asserted-by":"publisher","first-page":"441","DOI":"10.1007\/978-3-030-67835-7_42","volume-title":"MultiMedia Modeling","author":"F Spiess","year":"2021","unstructured":"Spiess, F., Gasser, R., Heller, S., Rossetto, L., Sauter, L., Schuldt, H.: Competitive interactive video retrieval in virtual reality with vitrivr-VR. In: Loko\u010d, J., et al. (eds.) MultiMedia Modeling, pp. 441\u2013447. Springer International Publishing, Cham (2021)"},{"key":"23_CR20","doi-asserted-by":"publisher","first-page":"363","DOI":"10.1007\/978-981-96-2074-6_44","volume-title":"MultiMedia Modeling","author":"QL Tran","year":"2025","unstructured":"Tran, Q.L., Nguyen, B., Jones, G.J.F., Gurrin, C.: VideoEase at VBS2025: an interactive video retrieval system. In: Ide, I., et al. (eds.) MultiMedia Modeling, pp. 363\u2013370. Springer Nature Singapore, Singapore (2025)"},{"key":"23_CR21","doi-asserted-by":"publisher","first-page":"79342","DOI":"10.1109\/ACCESS.2024.3405638","volume":"12","author":"L Vadicamo","year":"2024","unstructured":"Vadicamo, L., et al.: Evaluating performance and trends in interactive video retrieval: insights from the 12th VBS competition. IEEE Access 12, 79342\u201379366 (2024)","journal-title":"IEEE Access"},{"key":"23_CR22","doi-asserted-by":"crossref","unstructured":"Vuong, G.H., et al.: ViewsInsight2.0: enhancing video retrieval for VBS 2025 with an automatic query generator powered by large language models. In: Ide, I., et al. (eds.) MultiMedia Modeling, pp. 371\u2013377. Springer Nature Singapore, Singapore (2025)","DOI":"10.1007\/978-981-96-2074-6_45"},{"key":"23_CR23","unstructured":"Yuan, L., et al.: Florence: a new foundation model for computer vision (2021). https:\/\/arxiv.org\/abs\/2111.11432"},{"key":"23_CR24","doi-asserted-by":"crossref","unstructured":"Zhai, X., Mustafa, B., Kolesnikov, A., Beyer, L.: Sigmoid loss for language image pre-training (2023). https:\/\/arxiv.org\/abs\/2303.15343","DOI":"10.1109\/ICCV51070.2023.01100"}],"container-title":["Lecture Notes in Computer Science","MultiMedia Modeling"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-981-95-6963-2_23","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,2,6]],"date-time":"2026-02-06T10:09:12Z","timestamp":1770372552000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-981-95-6963-2_23"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026]]},"ISBN":["9789819569625","9789819569632"],"references-count":24,"URL":"https:\/\/doi.org\/10.1007\/978-981-95-6963-2_23","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"value":"0302-9743","type":"print"},{"value":"1611-3349","type":"electronic"}],"subject":[],"published":{"date-parts":[[2026]]},"assertion":[{"value":"7 February 2026","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"MMM","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Multimedia Modeling","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Prague","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Czech Republic","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2026","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"29 January 2026","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"31 January 2026","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"32","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"mmm2026","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/mmm2026.cz\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}