{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,30]],"date-time":"2025-10-30T07:18:19Z","timestamp":1761808699665,"version":"3.37.3"},"reference-count":50,"publisher":"Springer Science and Business Media LLC","issue":"42","license":[{"start":{"date-parts":[[2024,5,18]],"date-time":"2024-05-18T00:00:00Z","timestamp":1715990400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,5,18]],"date-time":"2024-05-18T00:00:00Z","timestamp":1715990400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"name":"the Science and Technology Research Program of Chongqing Municipal Education Commission","award":["KJZD-K202200513"],"award-info":[{"award-number":["KJZD-K202200513"]}]},{"name":"Chongqing Natural Science Foundation of China","award":["CSTB2022NSCQ-MSX1417"],"award-info":[{"award-number":["CSTB2022NSCQ-MSX1417"]}]},{"name":"the Open Foundation of Yunnan Key Laboratory of Software Engineering","award":["2023SE204"],"award-info":[{"award-number":["2023SE204"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"DOI":"10.1007\/s11042-024-19371-w","type":"journal-article","created":{"date-parts":[[2024,5,18]],"date-time":"2024-05-18T05:02:08Z","timestamp":1716008528000},"page":"90487-90509","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":2,"title":["Hierarchical modal interaction balance cross-modal hashing for unsupervised image-text retrieval"],"prefix":"10.1007","volume":"83","author":[{"given":"Jie","family":"Zhang","sequence":"first","affiliation":[]},{"given":"Ziyong","family":"Lin","sequence":"additional","affiliation":[]},{"given":"Xiaolong","family":"Jiang","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-5517-3633","authenticated-orcid":false,"given":"Mingyong","family":"Li","sequence":"additional","affiliation":[]},{"given":"Chao","family":"Wang","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2024,5,18]]},"reference":[{"key":"19371_CR1","doi-asserted-by":"crossref","unstructured":"Zhu L, Wu X, Li J, Zhang Z, Guan W, Shen HT (2022) Work together: correlation-identity reconstruction hashing for unsupervised cross-modal retrieval. IEEE Trans. Knowl, Data Eng","DOI":"10.1109\/TKDE.2022.3218656"},{"issue":"21","key":"19371_CR2","doi-asserted-by":"publisher","first-page":"32967","DOI":"10.1007\/s11042-023-14653-1","volume":"82","author":"RK Dey","year":"2023","unstructured":"Dey RK, Das AK (2023) Modified term frequency-inverse document frequency based deep hybrid framework for sentiment analysis. Multimed Tools Appl 82(21):32967\u201332990","journal-title":"Multimed Tools Appl"},{"key":"19371_CR3","doi-asserted-by":"crossref","unstructured":"Dey RK, Das AK (2024) Neighbour adjusted dispersive flies optimization based deep hybrid sentiment analysis framework. Multimed Tools Appl 1\u201324","DOI":"10.1007\/s11042-023-17953-8"},{"key":"19371_CR4","doi-asserted-by":"crossref","unstructured":"Tu RC, Jiang J, Lin Q, Cai C, Tian S, Wang H, Liu W (2023) Unsupervised cross-modal hashing with modality-interaction. IEEE Trans Circ Syst Video Tech","DOI":"10.1109\/TCSVT.2023.3251395"},{"key":"19371_CR5","doi-asserted-by":"crossref","unstructured":"Yuan X, Zhang Z, Wang X, Wu L (2023) Semantic-aware adversarial training for reliable deep hashing retrieval. IEEE Trans Inf Forensics Secur","DOI":"10.1109\/TIFS.2023.3297791"},{"key":"19371_CR6","doi-asserted-by":"publisher","first-page":"4667","DOI":"10.1109\/TIP.2021.3073867","volume":"30","author":"Y Hu","year":"2021","unstructured":"Hu Y, Liu M, Su X, Gao Z, Nie L (2021) Video moment localization via deep cross-modal hashing. IEEE Trans Image Process 30:4667\u20134677","journal-title":"IEEE Trans Image Process"},{"key":"19371_CR7","doi-asserted-by":"crossref","unstructured":"Sun Y, Ren Z, Hu P, Peng D, Wang X (2023) Hierarchical consensus hashing for cross-modal retrieval. IEEE Trans Multimed","DOI":"10.1109\/TMM.2023.3272169"},{"key":"19371_CR8","doi-asserted-by":"crossref","unstructured":"Luo K, Zhang C, Li H, Jia X, Chen C (2023) Adaptive marginalized semantic hashing for unpaired cross-modal retrieval. IEEE Trans Multimedia","DOI":"10.1109\/TMM.2023.3245400"},{"key":"19371_CR9","unstructured":"Radford A, Kim JW, Hallacy C, Ramesh A, Goh G, Agarwal S, Sastry G, Askell A, Mishkin P, Clark J et al (2021) Learning transferable visual models from natural language supervision. In: International conference on machine learning, pp 8748\u20138763. PMLR"},{"key":"19371_CR10","doi-asserted-by":"publisher","first-page":"95","DOI":"10.3389\/fnins.2019.00095","volume":"13","author":"A Sengupta","year":"2019","unstructured":"Sengupta A, Ye Y, Wang R, Liu C, Roy K (2019) Going deeper in spiking neural networks: VGG and residual architectures. Front Neurosci 13:95","journal-title":"Front Neurosci"},{"key":"19371_CR11","doi-asserted-by":"publisher","first-page":"346","DOI":"10.1016\/j.neucom.2014.12.123","volume":"173","author":"Q Zou","year":"2016","unstructured":"Zou Q, Zeng J, Cao L, Ji R (2016) A novel features ranking metric with application to scalable visual and bioinformatics data classification. Neurocomputing 173:346\u2013354","journal-title":"Neurocomputing"},{"issue":"7","key":"19371_CR12","doi-asserted-by":"publisher","first-page":"3157","DOI":"10.1109\/TIP.2016.2564638","volume":"25","author":"J Tang","year":"2016","unstructured":"Tang J, Wang K, Shao L (2016) Supervised matrix factorization hashing for cross-modal retrieval. IEEE Trans Image Process 25(7):3157\u20133166","journal-title":"IEEE Trans Image Process"},{"key":"19371_CR13","doi-asserted-by":"crossref","unstructured":"Huo Y, Qin Q, Dai J, Wang L, Zhang W, Huang L, Wang C (2024) Deep semantic-aware proxy hashing for multi-label cross-modal retrieval. IEEE Trans Circuits Syst Video Technol 34(1):576\u2013589","DOI":"10.1109\/TCSVT.2023.3285266"},{"key":"19371_CR14","doi-asserted-by":"crossref","unstructured":"Qin Q, Huo Y, Huang L, Dai J, Zhang H, Zhang W (2024) Deep Neighborhood-preserving Hashing with Quadratic Spherical Mutual Information for Cross-modal Retrieval. IEEE Trans Multimedia","DOI":"10.1109\/TMM.2023.3349075"},{"key":"19371_CR15","doi-asserted-by":"crossref","unstructured":"Huo Y, Qin Q, Dai J, Zhang W, Huang L, Wang C (2024) Deep Neighborhood-aware Proxy Hashing with Uniform Distribution Constraint for Cross-modal Retrieval. ACM Trans Multimed Comput","DOI":"10.1145\/3643639"},{"key":"19371_CR16","unstructured":"Su M, Gu G, Ren X, Fu H, Zhao Y (2021) Semi-supervised knowledge distillation for cross-modal hashing. IEEE Trans Multimed"},{"issue":"6","key":"19371_CR17","first-page":"6475","volume":"35","author":"C Zhang","year":"2022","unstructured":"Zhang C, Li H, Gao Y, Chen C (2022) Weakly-supervised enhanced semantic-aware hashing for cross-modal retrieval. IEEE Trans Knowl Data Eng 35(6):6475\u20136488","journal-title":"IEEE Trans Knowl Data Eng"},{"key":"19371_CR18","doi-asserted-by":"crossref","unstructured":"Bai C, Zeng C, Ma Q, Zhang J, Chen S (2020) Deep adversarial discrete hashing for cross-modal retrieval. In: Proceedings of the 2020 international conference on multimedia retrieval, pp 525\u2013531","DOI":"10.1145\/3372278.3390711"},{"issue":"10","key":"19371_CR19","doi-asserted-by":"publisher","first-page":"10064","DOI":"10.1109\/TCYB.2021.3059886","volume":"52","author":"Y Wang","year":"2021","unstructured":"Wang Y, Chen ZD, Luo X, Li R, Xu XS (2021) Fast cross-modal hashing with global and local similarity embedding. IEEE Trans Cybern 52(10):10064\u201310077","journal-title":"IEEE Trans Cybern"},{"issue":"1","key":"19371_CR20","first-page":"401","volume":"31","author":"X Nie","year":"2020","unstructured":"Nie X, Wang B, Li J, Hao F, Jian M, Yin Y (2020) Deep multiscale fusion hashing for cross-modal retrieval. IEEE Trans Circuits Syst 31(1):401\u2013410","journal-title":"IEEE Trans Circuits Syst"},{"key":"19371_CR21","doi-asserted-by":"crossref","unstructured":"Ding G, Guo Y, Zhou J (2014) Collective matrix factorization hashing for multimodal data. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 2075\u20132082","DOI":"10.1109\/CVPR.2014.267"},{"key":"19371_CR22","doi-asserted-by":"crossref","unstructured":"Su S, Zhong Z, Zhang C (2019) Deep joint-semantics reconstructing hashing for large-scale unsupervised cross-modal retrieval. In: Proceedings of the IEEE\/CVF international conference on computer vision, pp. 3027\u20133035","DOI":"10.1109\/ICCV.2019.00312"},{"key":"19371_CR23","doi-asserted-by":"crossref","unstructured":"Yang D, Wu D, Zhang W, Zhang H, Li B, Wang W (2020) Deep semantic-alignment hashing for unsupervised cross-modal retrieval. In: Proceedings of the 2020 international conference on multimedia retrieval, pp 44\u201352","DOI":"10.1145\/3372278.3390673"},{"issue":"3","key":"19371_CR24","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/3389547","volume":"38","author":"M Cheng","year":"2020","unstructured":"Cheng M, Jing L, Ng MK (2020) Robust unsupervised cross-modal hashing for multimedia retrieval. ACM Trans Inf Syst 38(3):1\u201325","journal-title":"ACM Trans Inf Syst"},{"key":"19371_CR25","unstructured":"Veli\u010dkovi\u0107 P, Cucurull G, Casanova A, Romero A, Lio P, Bengio Y (2017) Graph attention networks. arXiv:1710.10903"},{"key":"19371_CR26","doi-asserted-by":"crossref","unstructured":"Lu X, Zhu L, Liu L, Nie L, Zhang H (2021) Graph convolutional multi-modal hashing for flexible multimedia retrieval. In: Proceedings of the 29th ACM international conference on multimedia, pp 1414\u20131422","DOI":"10.1145\/3474085.3475598"},{"key":"19371_CR27","doi-asserted-by":"publisher","first-page":"466","DOI":"10.1109\/TMM.2021.3053766","volume":"24","author":"PF Zhang","year":"2021","unstructured":"Zhang PF, Li Y, Huang Z, Xu XS (2021) Aggregation-based graph convolutional hashing for unsupervised cross-modal retrieval. IEEE Trans Multimed 24:466\u2013479","journal-title":"IEEE Trans Multimed"},{"issue":"10","key":"19371_CR28","doi-asserted-by":"publisher","first-page":"7255","DOI":"10.1109\/TCSVT.2022.3172716","volume":"32","author":"Y Shi","year":"2022","unstructured":"Shi Y, Zhao Y, Liu X, Zheng F, Ou W, You X, Peng Q (2022) Deep adaptively-enhanced hashing with discriminative similarity guidance for unsupervised cross-modal retrieval. IEEE Trans Circuits Syst Video Technol 32(10):7255\u20137268","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"issue":"1","key":"19371_CR29","doi-asserted-by":"publisher","first-page":"2","DOI":"10.1007\/s13735-023-00268-7","volume":"12","author":"L Mingyong","year":"2023","unstructured":"Mingyong L, Yewen L, Mingyuan G, Longfei M (2023) CLIP-based fusion-modal reconstructing hashing for large-scale unsupervised cross-modal retrieval. Int J Multimed Inf Retr 12(1):2","journal-title":"Int J Multimed Inf Retr"},{"key":"19371_CR30","doi-asserted-by":"crossref","unstructured":"Zhong F, Chu C, Zhu Z, Chen Z (2023) Hypergraph-enhanced hashing for unsupervised cross-modal retrieval via robust similarity guidance. In: Proceedings of the 31st ACM international conference on multimedia, pp 3517\u20133527","DOI":"10.1145\/3581783.3612116"},{"key":"19371_CR31","doi-asserted-by":"crossref","unstructured":"Jiang QY, Li WJ (2017) Deep cross-modal hashing. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 3232\u20133240","DOI":"10.1109\/CVPR.2017.348"},{"key":"19371_CR32","doi-asserted-by":"crossref","unstructured":"Liu S, Qian S, Guan Y, Zhan J, Ying L (2020) Joint-modal distribution-based similarity hashing for large-scale unsupervised deep cross-modal retrieval. In: Proceedings of the 43rd international ACM SIGIR conference on research and development in information retrieval, pp. 1379\u20131388","DOI":"10.1145\/3397271.3401086"},{"key":"19371_CR33","doi-asserted-by":"crossref","unstructured":"Li L, Zheng B, Sun W (2022) Adaptive structural similarity preserving for unsupervised cross modal hashing. In: Proceedings of the 30th ACM international conference on multimedia, pp 3712\u20133721","DOI":"10.1145\/3503161.3548431"},{"key":"19371_CR34","doi-asserted-by":"crossref","unstructured":"Zhao H, Liu M, Li M (2023) Feature fusion and metric learning network for zero-shot sketch-based image retrieval. Entropy 25(3):502","DOI":"10.3390\/e25030502"},{"issue":"10","key":"19371_CR35","doi-asserted-by":"publisher","first-page":"2703","DOI":"10.1109\/TCSVT.2017.2723302","volume":"28","author":"D Wang","year":"2017","unstructured":"Wang D, Wang Q, Gao X (2017) Robust and flexible discrete hashing for cross-modal similarity search. IEEE Trans Circuits Syst Video Technol 28(10):2703\u20132715","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"19371_CR36","unstructured":"Wu L, Sun P, Hong R, Fu Y, Wang X, Wang M (2018) Socialgcn: an efficient graph convolutional network based model for social recommendation. arXiv:1811.02815"},{"key":"19371_CR37","doi-asserted-by":"crossref","unstructured":"Huiskes MJ, Lew MS (2008) The mir flickr retrieval evaluation. In: Proceedings of the 1st ACM international conference on Multimedia information retrieval, pp 39\u201343","DOI":"10.1145\/1460096.1460104"},{"issue":"1","key":"19371_CR38","doi-asserted-by":"publisher","first-page":"174","DOI":"10.1109\/TMM.2019.2922128","volume":"22","author":"J Zhang","year":"2019","unstructured":"Zhang J, Peng Y (2019) Multi-pathway generative adversarial hashing for unsupervised cross-modal retrieval. IEEE Trans Multimed 22(1):174\u2013187","journal-title":"IEEE Trans Multimed"},{"key":"19371_CR39","doi-asserted-by":"crossref","unstructured":"Chua TS, Tang J, Hong R, Li H, Luo Z, Zheng Y (2009) Nus-wide: a real-world web image database from national university of singapore. In: Proceedings of the ACM international conference on image and video retrieval, pp 1\u20139","DOI":"10.1145\/1646396.1646452"},{"key":"19371_CR40","doi-asserted-by":"crossref","unstructured":"Lin TY, Maire M, Belongie S, Hays J, Perona P, Ramanan D, Doll\u00e1r P, Zitnick CL (2014) Microsoft coco: common objects in context. In: Computer Vision\u2013ECCV 2014: 13th European Conference, Zurich, Switzerland, September 6-12, 2014, Proceedings, Part V 13, pp 740\u2013755. Springer","DOI":"10.1007\/978-3-319-10602-1_48"},{"key":"19371_CR41","doi-asserted-by":"crossref","unstructured":"Song J, Yang Y, Yang Y, Huang Z, Shen HT (2013) Inter-media hashing for large-scale retrieval from heterogeneous data sources. In: Proceedings of the 2013 ACM SIGMOD international conference on management of data, pp 785\u2013796","DOI":"10.1145\/2463676.2465274"},{"key":"19371_CR42","doi-asserted-by":"crossref","unstructured":"Zhou J, Ding G, Guo Y (2014) Latent semantic sparse hashing for cross-modal similarity search. In: Proceedings of the 37th international ACM SIGIR conference on Research & development in information retrieval, pp 415\u2013424","DOI":"10.1145\/2600428.2609610"},{"key":"19371_CR43","doi-asserted-by":"crossref","unstructured":"Mikriukov G, Ravanbakhsh M, Demir B (2022) Deep unsupervised contrastive hashing for large-scale cross-modal text-image retrieval in remote sensing. arXiv:2201.08125","DOI":"10.1109\/ICASSP43922.2022.9746251"},{"key":"19371_CR44","doi-asserted-by":"publisher","first-page":"4626","DOI":"10.1609\/aaai.v35i5.16592","volume":"35","author":"J Yu","year":"2021","unstructured":"Yu J, Zhou H, Zhan Y, Tao D (2021) Deep graph-neighbor coherence preserving network for unsupervised cross-modal hashing. Proceedings of the AAAI conference on artificial intelligence 35:4626\u20134634","journal-title":"Proceedings of the AAAI conference on artificial intelligence"},{"key":"19371_CR45","doi-asserted-by":"publisher","first-page":"563","DOI":"10.1007\/s11280-020-00859-y","volume":"24","author":"PF Zhang","year":"2021","unstructured":"Zhang PF, Luo Y, Huang Z, Xu XS, Song J (2021) High-order nonlocal Hashing for unsupervised cross-modal retrieval. World Wide Web 24:563\u2013583","journal-title":"World Wide Web"},{"key":"19371_CR46","unstructured":"Wang D, Gao X, Wang X, He L (2015) Semantic topic multimodal hashing for cross-media retrieval. In: Twenty-fourth international joint conference on artificial intelligence"},{"key":"19371_CR47","doi-asserted-by":"publisher","first-page":"43","DOI":"10.1007\/s13042-010-0001-0","volume":"1","author":"Y Zhang","year":"2010","unstructured":"Zhang Y, Jin R, Zhou ZH (2010) Understanding bag-of-words model: a statistical framework. Int J Mach Learn Cybern 1:43\u201352","journal-title":"Int J Mach Learn Cybern"},{"key":"19371_CR48","doi-asserted-by":"publisher","first-page":"107479","DOI":"10.1016\/j.patcog.2020.107479","volume":"107","author":"D Wang","year":"2020","unstructured":"Wang D, Wang Q, He L, Gao X, Tian Y (2020) Joint and individual matrix factorization hashing for large-scale cross-modal retrieval. Pattern Recognit 107:107479","journal-title":"Pattern Recognit"},{"key":"19371_CR49","doi-asserted-by":"crossref","unstructured":"Hu H, Xie L, Hong R, Tian Q (2020) Creating something from nothing: unsupervised knowledge distillation for cross-modal hashing. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp 3123\u20133132","DOI":"10.1109\/CVPR42600.2020.00319"},{"key":"19371_CR50","doi-asserted-by":"crossref","unstructured":"Zhang J, Peng Y, Yuan M (2018) Unsupervised generative adversarial cross-modal hashing. In: Proceedings of the AAAI conference on artificial intelligence, vol 32","DOI":"10.1609\/aaai.v32i1.11263"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-024-19371-w.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11042-024-19371-w\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-024-19371-w.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,12,28]],"date-time":"2024-12-28T20:07:33Z","timestamp":1735416453000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11042-024-19371-w"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,5,18]]},"references-count":50,"journal-issue":{"issue":"42","published-online":{"date-parts":[[2024,12]]}},"alternative-id":["19371"],"URL":"https:\/\/doi.org\/10.1007\/s11042-024-19371-w","relation":{},"ISSN":["1573-7721"],"issn-type":[{"type":"electronic","value":"1573-7721"}],"subject":[],"published":{"date-parts":[[2024,5,18]]},"assertion":[{"value":"9 November 2023","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"22 April 2024","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"6 May 2024","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"18 May 2024","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare no competing interests.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}]}}