{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,1,15]],"date-time":"2026-01-15T03:01:33Z","timestamp":1768446093252,"version":"3.49.0"},"publisher-location":"Singapore","reference-count":33,"publisher":"Springer Nature Singapore","isbn-type":[{"value":"9789819620531","type":"print"},{"value":"9789819620548","type":"electronic"}],"license":[{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025]]},"DOI":"10.1007\/978-981-96-2054-8_15","type":"book-chapter","created":{"date-parts":[[2025,1,2]],"date-time":"2025-01-02T15:45:25Z","timestamp":1735832725000},"page":"195-205","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":2,"title":["CLIP Multi-modal Hashing for\u00a0Multimedia Retrieval"],"prefix":"10.1007","author":[{"given":"Jian","family":"Zhu","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mingkai","family":"Sheng","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zhangmin","family":"Huang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jingfei","family":"Chang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jinling","family":"Jiang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jian","family":"Long","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Cheng","family":"Luo","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Lei","family":"Liu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2025,1,3]]},"reference":[{"key":"15_CR1","volume":"103","author":"J Zhu","year":"2024","unstructured":"Zhu, J., Hu, P., Li, B., Zhou, Y.: Fast metric multi-view hashing for multimedia retrieval. Inf. Fusion 103, 102130 (2024)","journal-title":"Inf. Fusion"},{"key":"15_CR2","doi-asserted-by":"crossref","unstructured":"Zhu, J., et al.: Adaptive confidence multi-view hashing for multimedia retrieval. In: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 7900\u20137904 (2024)","DOI":"10.1109\/ICASSP48485.2024.10447517"},{"key":"15_CR3","doi-asserted-by":"crossref","unstructured":"Zhu, J., et al.: Central similarity multi-view hashing for multimedia retrieval. In: Web and Big Data, pp. 486\u2013500. Springer, Singapore (2024)","DOI":"10.1007\/978-981-97-2390-4_33"},{"key":"15_CR4","doi-asserted-by":"crossref","first-page":"2065","DOI":"10.1109\/LSP.2024.3440968","volume":"31","author":"J Zhu","year":"2024","unstructured":"Zhu, J., Huang, Z., Liu, L., Tang, C., Dai, L.-R.: Boosted curriculum multi-view hashing for multimedia retrieval. IEEE Signal Process. Lett. 31, 2065\u20132069 (2024)","journal-title":"IEEE Signal Process. Lett."},{"issue":"2","key":"15_CR5","first-page":"1","volume":"11","author":"XL Lei Zhu","year":"2020","unstructured":"Lei Zhu, X.L., Cheng, Z., Li, J., Zhang, H.: Flexible multi-modal hashing for scalable multimedia retrieval. ACM Trans. Intell. Syst. Technol. (TIST) 11(2), 1\u201320 (2020)","journal-title":"ACM Trans. Intell. Syst. Technol. (TIST)"},{"key":"15_CR6","doi-asserted-by":"crossref","unstructured":"Tan, W., Zhu, L., Guan, W., Li, J., Cheng, Z.: Bit-aware semantic transformer hashing for multi-modal retrieval. In: Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval, pp. 982\u2013991 (2022)","DOI":"10.1145\/3477495.3531947"},{"key":"15_CR7","unstructured":"Simonyan, K., Zisserman, A.: Very deep convolutional networks for large-scale image recognition. arXiv preprint arXiv:1409.1556 (2014)"},{"issue":"1","key":"15_CR8","doi-asserted-by":"crossref","first-page":"43","DOI":"10.1007\/s13042-010-0001-0","volume":"1","author":"Y Zhang","year":"2010","unstructured":"Zhang, Y., Jin, R., Zhou, Z.-H.: Understanding bag-of-words model: a statistical framework. Int. J. Mach. Learn. Cybern. 1(1), 43\u201352 (2010)","journal-title":"Int. J. Mach. Learn. Cybern."},{"key":"15_CR9","doi-asserted-by":"crossref","unstructured":"Zhu, J., Ruan, X., Cheng, Y., Huang, Z., Cui, Y., Zeng, L.: Deep metric multi-view hashing for multimedia retrieval. arXiv preprint arXiv:2304.06358 (2023)","DOI":"10.1109\/ICME55011.2023.00335"},{"key":"15_CR10","doi-asserted-by":"crossref","unstructured":"He, K., Zhang, X., Ren, S., Sun, J.: Deep residual learning for image recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 770\u2013778 (2016)","DOI":"10.1109\/CVPR.2016.90"},{"key":"15_CR11","unstructured":"Devlin, J., Chang, M.-W., Lee, K., Toutanova, K.: Bert: pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805 (2018)"},{"key":"15_CR12","unstructured":"Radford, A., et al.: Learning transferable visual models from natural language supervision. In: International Conference on Machine Learning, pp. 8748\u20138763. PMLR (2021)"},{"key":"15_CR13","doi-asserted-by":"crossref","unstructured":"Liu, X., He, J., Liu, D., Lang, B.: Compact kernel hashing with multiple features. In: Proceedings of the 20th ACM International Conference on Multimedia, pp. 881\u2013884 (2012)","DOI":"10.1145\/2393347.2396337"},{"key":"15_CR14","doi-asserted-by":"crossref","unstructured":"Kang, Y., Kim, S., Choi, S.: Deep learning to hash with multiple representations. In: 2012 IEEE 12th International Conference on Data Mining, pp. 930\u2013935. IEEE (2012)","DOI":"10.1109\/ICDM.2012.24"},{"issue":"8","key":"15_CR15","doi-asserted-by":"crossref","first-page":"1997","DOI":"10.1109\/TMM.2013.2271746","volume":"15","author":"J Song","year":"2013","unstructured":"Song, J., Yang, Y., Huang, Z., Shen, H.T., Luo, J.: Effective multiple feature hashing for large-scale near-duplicate video retrieval. IEEE Trans. Multimedia 15(8), 1997\u20132008 (2013)","journal-title":"IEEE Trans. Multimedia"},{"issue":"3","key":"15_CR16","doi-asserted-by":"crossref","first-page":"956","DOI":"10.1109\/TIP.2015.2390975","volume":"24","author":"L Liu","year":"2015","unstructured":"Liu, L., Mengyang, Yu., Shao, L.: Multiview alignment hashing for efficient image search. IEEE Trans. Image Process. 24(3), 956\u2013966 (2015)","journal-title":"IEEE Trans. Image Process."},{"issue":"5","key":"15_CR17","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1145\/3178119","volume":"9","author":"X Shen","year":"2018","unstructured":"Shen, X., Shen, F., Liu, L., Yuan, Y.-H., Liu, W., Sun, Q.-S.: Multiview discrete hashing for scalable multimedia search. ACM Trans. Intell. Syst. Technol. (TIST) 9(5), 1\u201321 (2018)","journal-title":"ACM Trans. Intell. Syst. Technol. (TIST)"},{"key":"15_CR18","doi-asserted-by":"crossref","unstructured":"Yang, R., Shi, Y., Xu, X.-S.: Discrete multi-view hashing for effective image retrieval. In: Proceedings of the 2017 ACM on International Conference on Multimedia Retrieval, pp. 175\u2013183 (2017)","DOI":"10.1145\/3078971.3078981"},{"key":"15_CR19","doi-asserted-by":"crossref","unstructured":"Kim, S., Choi, S.: Multi-view anchor graph hashing. In: 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, pp. 3123\u20133127. IEEE (2013)","DOI":"10.1109\/ICASSP.2013.6638233"},{"key":"15_CR20","doi-asserted-by":"crossref","unstructured":"Shen, X., Shen, F., Sun, Q.-S., Yuan, Y.-H.: Multi-view latent hashing for efficient multimedia search. In: Proceedings of the 23rd ACM International Conference on Multimedia, pp. 831\u2013834 (2015)","DOI":"10.1145\/2733373.2806342"},{"issue":"2","key":"15_CR21","doi-asserted-by":"crossref","first-page":"300","DOI":"10.1109\/TNN.2008.2005582","volume":"20","author":"Y Hou","year":"2009","unstructured":"Hou, Y., Zhang, P., Xingxing, X., Zhang, X., Li, W.: Nonlinear dimensionality reduction by locally linear inlaying. IEEE Trans. Neural Networks 20(2), 300\u2013315 (2009)","journal-title":"IEEE Trans. Neural Networks"},{"issue":"Jun","key":"15_CR22","first-page":"119","volume":"4","author":"LK Saul","year":"2003","unstructured":"Saul, L.K., Roweis, S.T.: Think globally, fit locally: unsupervised learning of low dimensional manifolds. J. Mach. Learn. Res. 4(Jun), 119\u2013155 (2003)","journal-title":"J. Mach. Learn. Res."},{"issue":"3","key":"15_CR23","doi-asserted-by":"crossref","first-page":"1765","DOI":"10.1007\/s11063-020-10221-y","volume":"52","author":"L Liu","year":"2020","unstructured":"Liu, L., Zhang, Z., Huang, Z.: Flexible discrete multi-view hashing with collective latent feature learning. Neural Process. Lett. 52(3), 1765\u20131791 (2020)","journal-title":"Neural Process. Lett."},{"key":"15_CR24","doi-asserted-by":"crossref","unstructured":"Lu, X., Zhu, L., Cheng, Z., Li, J., Nie, X., Zhang, H.: Flexible online multi-modal hashing for large-scale multimedia retrieval. In: Proceedings of the 27th ACM International Conference on Multimedia, pp. 1129\u20131137 (2019)","DOI":"10.1145\/3343031.3350999"},{"key":"15_CR25","doi-asserted-by":"crossref","first-page":"4079","DOI":"10.1109\/TMM.2020.3037456","volume":"23","author":"C Zheng","year":"2020","unstructured":"Zheng, C., Zhu, L., Cheng, Z., Li, J., Liu, A.-A.: Adaptive partial multi-view hashing for efficient social image retrieval. IEEE Trans. Multimedia 23, 4079\u20134092 (2020)","journal-title":"IEEE Trans. Multimedia"},{"key":"15_CR26","doi-asserted-by":"crossref","first-page":"4643","DOI":"10.1109\/TIP.2020.2974065","volume":"29","author":"XL Lei Zhu","year":"2020","unstructured":"Lei Zhu, X.L., Cheng, Z., Li, J., Zhang, H.: Deep collaborative multi-view hashing for large-scale image search. IEEE Trans. Image Process. 29, 4643\u20134655 (2020)","journal-title":"IEEE Trans. Image Process."},{"key":"15_CR27","doi-asserted-by":"crossref","unstructured":"Lu, X., Zhu, L., Liu, L., Nie, L., Zhang, H.: Graph convolutional multi-modal hashing for flexible multimedia retrieval. In: Proceedings of the 29th ACM International Conference on Multimedia, pp. 1414\u20131422 (2021)","DOI":"10.1145\/3474085.3475598"},{"key":"15_CR28","unstructured":"Dosovitskiy, A., et al.: An image is worth 16x16 words: transformers for image recognition at scale. arXiv preprint arXiv:2010.11929 (2020)"},{"key":"15_CR29","unstructured":"Vaswani, A., et al.: Attention is all you need. In: Advances in Neural Information Processing Systems, vol. 30 (2017)"},{"key":"15_CR30","unstructured":"Miech, A., Laptev, I., Sivic, J.: Learnable pooling with context gating for video classification. arXiv preprint arXiv:1706.06905 (2017)"},{"key":"15_CR31","doi-asserted-by":"crossref","unstructured":"Huiskes, M.J., Lew, M.S.: The MIR flickr retrieval evaluation. In: Proceedings of the 1st ACM International Conference on Multimedia Information Retrieval, pp. 39\u201343 (2008)","DOI":"10.1145\/1460096.1460104"},{"key":"15_CR32","doi-asserted-by":"crossref","unstructured":"Chua, T.-S., Tang, J., Hong, R., Li, H., Luo, Z., Zheng, Y.: Nus-wide: a real-world web image database from national university of Singapore. In: Proceedings of the ACM International Conference on Image and Video Retrieval, pp. 1\u20139 (2009)","DOI":"10.1145\/1646396.1646452"},{"key":"15_CR33","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"740","DOI":"10.1007\/978-3-319-10602-1_48","volume-title":"Computer Vision \u2013 ECCV 2014","author":"T-Y Lin","year":"2014","unstructured":"Lin, T.-Y., et al.: Microsoft COCO: common objects in context. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014. LNCS, vol. 8693, pp. 740\u2013755. Springer, Cham (2014). https:\/\/doi.org\/10.1007\/978-3-319-10602-1_48"}],"container-title":["Lecture Notes in Computer Science","MultiMedia Modeling"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-981-96-2054-8_15","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,3,23]],"date-time":"2025-03-23T01:43:33Z","timestamp":1742694213000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-981-96-2054-8_15"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025]]},"ISBN":["9789819620531","9789819620548"],"references-count":33,"URL":"https:\/\/doi.org\/10.1007\/978-981-96-2054-8_15","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"value":"0302-9743","type":"print"},{"value":"1611-3349","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025]]},"assertion":[{"value":"3 January 2025","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"MMM","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Multimedia Modeling","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Nara","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Japan","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2025","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"9 January 2025","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"11 January 2025","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"31","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"mmm2025","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/mmm2025.net\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}