{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,8]],"date-time":"2025-10-08T00:26:20Z","timestamp":1759883180102,"version":"build-2065373602"},"publisher-location":"Cham","reference-count":23,"publisher":"Springer Nature Switzerland","isbn-type":[{"value":"9783032060686","type":"print"},{"value":"9783032060693","type":"electronic"}],"license":[{"start":{"date-parts":[[2025,10,8]],"date-time":"2025-10-08T00:00:00Z","timestamp":1759881600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,10,8]],"date-time":"2025-10-08T00:00:00Z","timestamp":1759881600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2026]]},"DOI":"10.1007\/978-3-032-06069-3_12","type":"book-chapter","created":{"date-parts":[[2025,10,7]],"date-time":"2025-10-07T15:54:21Z","timestamp":1759852461000},"page":"140-153","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["Experimental Evaluation Of Static Image Sub-Region-Based Search Models Using CLIP"],"prefix":"10.1007","author":[{"ORCID":"https:\/\/orcid.org\/0009-0004-3341-1524","authenticated-orcid":false,"given":"Bastian","family":"J\u00e4ckl","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0003-2733-7690","authenticated-orcid":false,"given":"Vojt\u011bch","family":"Kloda","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7966-9740","authenticated-orcid":false,"given":"Daniel","family":"A. Keim","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-3558-4144","authenticated-orcid":false,"given":"Jakub","family":"Loko\u010d","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2025,10,8]]},"reference":[{"key":"12_CR1","doi-asserted-by":"publisher","unstructured":"Bla\u017eek, A., Loko\u010d, J., Matzner, F., Skopal, T.: Enhanced signature-based video browser. In: ACM MMM, pp. 243\u2013248 (2015). https:\/\/doi.org\/10.1007\/978-3-319-14442-9_22","DOI":"10.1007\/978-3-319-14442-9_22"},{"key":"12_CR2","doi-asserted-by":"publisher","unstructured":"Changpinyo, S., Pont-Tuset, J., Ferrari, V., Soricut, R.: Telling the what while pointing to the where: multimodal queries for image retrieval. In: ICCV, pp. 12116\u201312126 (2021). https:\/\/doi.org\/10.1109\/ICCV48922.2021.01192","DOI":"10.1109\/ICCV48922.2021.01192"},{"key":"12_CR3","doi-asserted-by":"publisher","unstructured":"Hinami, R., Matsui, Y., Satoh, S.: Region-based image retrieval revisited. In: ACM MM, MM 2017, pp. 528\u2013536. ACM (2017). https:\/\/doi.org\/10.1145\/3123266.3123312","DOI":"10.1145\/3123266.3123312"},{"key":"12_CR4","doi-asserted-by":"publisher","unstructured":"Kirillov, A., Mintun, E., Ravi, N., Mao, H., Rolland, C., Gustafson, L., et\u00a0al.: Segment anything. arXiv:2304.02643 (2023). https:\/\/doi.org\/10.48550\/arXiv.2304.02643","DOI":"10.48550\/arXiv.2304.02643"},{"key":"12_CR5","doi-asserted-by":"publisher","unstructured":"Korfhage, N., M\u00fchling, M., Freisleben, B.: Search anything: segmentation-based similarity search via region prompts. In: Multimedia Tools and Applications (2024). https:\/\/doi.org\/10.1007\/s11042-024-20509-z","DOI":"10.1007\/s11042-024-20509-z"},{"key":"12_CR6","doi-asserted-by":"publisher","unstructured":"Loko\u010d, J., B\u00e1toryov\u00e1, J., Smrz, D., Dobransk\u00fd, M.: Video search with collage queries. In: ACM MMM, pp. 429\u2013434 (2021). https:\/\/doi.org\/10.1007\/978-3-030-67835-7_40","DOI":"10.1007\/978-3-030-67835-7_40"},{"key":"12_CR7","doi-asserted-by":"publisher","unstructured":"Loko\u010d, J., Mejzl\u00edk, F., Vesel\u00fd, P., Soucek, T.: Enhanced somhunter for known-item search in lifelog data. In: Proceedings of the 4th Annual on Lifelog Search Challenge, LSC, pp. 71\u201373. ACM (2021). https:\/\/doi.org\/10.1145\/3463948.3469074","DOI":"10.1145\/3463948.3469074"},{"key":"12_CR8","doi-asserted-by":"publisher","unstructured":"Mai, L., Jin, H., Lin, Z., Fang, C., Brandt, J., Liu, F.: Spatial-semantic image search by visual feature synthesis. In: CVPR, pp. 1121\u20131130 (2017). https:\/\/doi.org\/10.1109\/CVPR.2017.125","DOI":"10.1109\/CVPR.2017.125"},{"key":"12_CR9","doi-asserted-by":"publisher","unstructured":"Oquab, M., Darcet, T., Moutakanni, T., Vo, H., Szafraniec, M., Khalidov, V., et\u00a0al.: Dinov2: learning robust visual features without supervision (2024). https:\/\/doi.org\/10.48550\/arXiv.2304.07193","DOI":"10.48550\/arXiv.2304.07193"},{"key":"12_CR10","doi-asserted-by":"publisher","unstructured":"Pe\u0161ka, L., Trojanov\u00e1, H.: Lineit: similarity search and recommendation tool for photo lineup assembling. In: DEXA, pp. 199\u2013209 (2019). https:\/\/doi.org\/10.1007\/978-3-030-27684-3_25","DOI":"10.1007\/978-3-030-27684-3_25"},{"key":"12_CR11","doi-asserted-by":"publisher","unstructured":"Pont-Tuset, J., Uijlings, J., Changpinyo, S., Soricut, R., Ferrari, V.: Connecting vision and language with localized narratives. In: ECCV, pp. 647\u2013664 (2020). https:\/\/doi.org\/10.1007\/978-3-030-58558-7_38","DOI":"10.1007\/978-3-030-58558-7_38"},{"key":"12_CR12","doi-asserted-by":"publisher","unstructured":"Radford, A., Kim, J.W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., et\u00a0al.: Learning transferable visual models from natural language supervision (2021). https:\/\/doi.org\/10.48550\/arXiv.2103.00020","DOI":"10.48550\/arXiv.2103.00020"},{"key":"12_CR13","doi-asserted-by":"publisher","unstructured":"Ranasinghe, K., Shukla, S.N., Poursaeed, O., Ryoo, M.S., Lin, T.Y.: Learning to localize objects improves spatial reasoning in visual-llms. In: CVPR, pp. 12977\u201312987 (2024). https:\/\/doi.org\/10.1109\/CVPR52733.2024.01233","DOI":"10.1109\/CVPR52733.2024.01233"},{"key":"12_CR14","doi-asserted-by":"publisher","unstructured":"Rossetto, L., Schuldt, H., Awad, G., Butt, A.A.: V3C - a research video collection. In: MMM, pp. 349\u2013360 (2019). https:\/\/doi.org\/10.1007\/978-3-030-05710-7_29","DOI":"10.1007\/978-3-030-05710-7_29"},{"key":"12_CR15","doi-asserted-by":"publisher","unstructured":"Sauter, L., Gasser, R., Schuldt, H., Bernstein, A., Rossetto, L.: Performance evaluation in multimedia retrieval. In: TOMM, no. 1 (2024). https:\/\/doi.org\/10.1145\/3678881","DOI":"10.1145\/3678881"},{"key":"12_CR16","doi-asserted-by":"publisher","unstructured":"Shlapentokh-Rothman, M., Blume, A., Xiao, Y., Wu, Y., TV, S., Tao, H., et\u00a0al.: Region-based representations revisited. In: CVPR, pp. 17107\u201317116 (2024). https:\/\/doi.org\/10.1109\/CVPR52733.2024.01619","DOI":"10.1109\/CVPR52733.2024.01619"},{"key":"12_CR17","doi-asserted-by":"crossref","unstructured":"Skopal, T., Pe\u0161ka, L., Gro\u0161up, T.: Interactive product search based on global and local visual-semantic features. In: SISAP, pp. 87\u201395 (2018)","DOI":"10.1007\/978-3-030-02224-2_7"},{"key":"12_CR18","doi-asserted-by":"publisher","unstructured":"Smith, J.R., Chang, S.F.: Visualseek: a fully automated content-based image query system. In: ACM MM, p. 87\u201398 (1997). https:\/\/doi.org\/10.1145\/244130.244151","DOI":"10.1145\/244130.244151"},{"key":"12_CR19","doi-asserted-by":"publisher","unstructured":"Stroh, M., et\u00a0al.: Prak tool v3: enhancing video item search using localized text and texture queries. In: ACM MMM, pp. 326\u2013333. Springer (2025). https:\/\/doi.org\/10.1007\/978-981-96-2074-6_39","DOI":"10.1007\/978-981-96-2074-6_39"},{"key":"12_CR20","doi-asserted-by":"publisher","unstructured":"Truong, Q.T., et al.: Marine video kit: a new marine video dataset for content-based analysis and retrieval. In: ACM MMM, pp. 539\u2013550. Springer (2023). https:\/\/doi.org\/10.1007\/978-3-031-27077-2_42","DOI":"10.1007\/978-3-031-27077-2_42"},{"key":"12_CR21","doi-asserted-by":"publisher","unstructured":"Vadicamo, L., Arnold, R., Bailer, W., Carrara, F., Gurrin, C., Hezel, N., et\u00a0al.: Evaluating performance and trends in interactive video retrieval: insights from the 12th vbs Competition, pp. 79342\u201379366. IEEE (2024). https:\/\/doi.org\/10.1109\/ACCESS.2024.3405638","DOI":"10.1109\/ACCESS.2024.3405638"},{"key":"12_CR22","doi-asserted-by":"publisher","unstructured":"Xu, H., Wang, J., Hua, X.S., Li, S.: Image search by concept map. In: SIGIR, SIGIR 2010, pp. 275\u2013282. ACM (2010). https:\/\/doi.org\/10.1145\/1835449.1835497","DOI":"10.1145\/1835449.1835497"},{"key":"12_CR23","doi-asserted-by":"publisher","unstructured":"Zhao, X., et al.: Fast segment anything (2023). https:\/\/doi.org\/10.48550\/arXiv.2306.12156","DOI":"10.48550\/arXiv.2306.12156"}],"container-title":["Lecture Notes in Computer Science","Similarity Search and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-032-06069-3_12","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,10,7]],"date-time":"2025-10-07T15:54:24Z","timestamp":1759852464000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-032-06069-3_12"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,10,8]]},"ISBN":["9783032060686","9783032060693"],"references-count":23,"URL":"https:\/\/doi.org\/10.1007\/978-3-032-06069-3_12","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"value":"0302-9743","type":"print"},{"value":"1611-3349","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025,10,8]]},"assertion":[{"value":"8 October 2025","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"The authors have no competing interests to declare that are relevant to the content of this article.","order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Disclosure of Interests"}},{"value":"SISAP","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Similarity Search and Applications","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Reykjavik","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Iceland","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2025","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"1 October 2025","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"3 October 2025","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"18","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"sisap2025","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/www.sisap.org\/2025\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}