{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,25]],"date-time":"2025-11-25T11:52:46Z","timestamp":1764071566227,"version":"3.45.0"},"reference-count":38,"publisher":"Springer Science and Business Media LLC","issue":"15","license":[{"start":{"date-parts":[[2025,10,16]],"date-time":"2025-10-16T00:00:00Z","timestamp":1760572800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,10,16]],"date-time":"2025-10-16T00:00:00Z","timestamp":1760572800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"name":"Key technologies for major risk prevention, control, and safety assurance of the China Russia pipeline","award":["2022YFC30701"],"award-info":[{"award-number":["2022YFC30701"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Cluster Comput"],"published-print":{"date-parts":[[2025,12]]},"DOI":"10.1007\/s10586-025-05731-0","type":"journal-article","created":{"date-parts":[[2025,10,16]],"date-time":"2025-10-16T14:26:00Z","timestamp":1760624760000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["Visual relation-aware and knowledge-guided multi-modal relation extraction"],"prefix":"10.1007","volume":"28","author":[{"given":"Chunyu","family":"Lu","sequence":"first","affiliation":[]},{"given":"Tianran","family":"Chen","sequence":"additional","affiliation":[]},{"given":"Duo","family":"Shang","sequence":"additional","affiliation":[]},{"given":"Jun","family":"Luo","sequence":"additional","affiliation":[]},{"given":"Xin","family":"Hui","sequence":"additional","affiliation":[]},{"given":"Ruhui","family":"Shi","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2025,10,16]]},"reference":[{"key":"5731_CR1","doi-asserted-by":"crossref","unstructured":"Cong, X., Sheng, J., Cui, S., et al.: Relation-guided few-shot relational triple extraction[C]\/\/Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval. : 2206\u20132213. (2022)","DOI":"10.1145\/3477495.3531831"},{"key":"5731_CR2","doi-asserted-by":"crossref","unstructured":"Xue, F., Sun, A., Zhang, H., et al.: An embarrassingly simple model for dialogue relation extraction[C]\/\/ICASSP 2022\u20132022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, : 6707\u20136711. (2022)","DOI":"10.1109\/ICASSP43922.2022.9747486"},{"issue":"2","key":"5731_CR3","doi-asserted-by":"publisher","first-page":"715","DOI":"10.1109\/TKDE.2022.3224228","volume":"36","author":"X Zhu","year":"2022","unstructured":"Zhu, X., Li, Z., Wang, X., et al.: Multi-modal knowledge graph construction and application: A survey[J]. IEEE Trans. Knowl. Data Eng. 36(2), 715\u2013735 (2022)","journal-title":"IEEE Trans. Knowl. Data Eng."},{"key":"5731_CR4","doi-asserted-by":"crossref","unstructured":"Wang Z, You H, Li L H, et al. SGEITL: Scene graph enhanced image-text learning for visual commonsense reasoning[C]\/\/Proceedings of the AAAI Conference on Artificial Intelligence. 36(5), 5914\u20135922 (2022)","DOI":"10.1609\/aaai.v36i5.20536"},{"key":"5731_CR5","doi-asserted-by":"publisher","DOI":"10.1016\/j.neucom.2024.128667","volume":"611","author":"S Hou","year":"2025","unstructured":"Hou, S., Qian, Y., Chen, J., et al.: HiNER: Hierarchical feature fusion for Chinese named entity recognition. Neurocomputing 611, 128667 (2025)","journal-title":"Neurocomputing"},{"key":"5731_CR6","unstructured":"He, S., Ding, L., Dong, D., et al.: Cherry Hypothesis: Identifying the Cherry on the Cake for Dynamic networks[J], p. 2211. arXiv preprint arXiv (2022)"},{"issue":"16","key":"5731_CR7","doi-asserted-by":"publisher","first-page":"18408","DOI":"10.1609\/aaai.v38i16.29801","volume":"38","author":"L Kong","year":"2024","unstructured":"Kong, L., Wang, J., Ma, Z., et al.: A Hierarchical Network for Multimodal Document-Level Relation Extraction. Proceedings of the AAAI Conference on Artificial Intelligence 38(16), 18408\u201318416 (2024)","journal-title":"Proceedings of the AAAI Conference on Artificial Intelligence"},{"key":"5731_CR8","doi-asserted-by":"crossref","unstructured":"Li, Y., Chen, J., Li, Y., et al.: Vision, deduction and alignment: An empirical study on multi-modal knowledge graph alignment[C]\/\/ICASSP 2023\u20132023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, : 1\u20135. (2023)","DOI":"10.1109\/ICASSP49357.2023.10094863"},{"issue":"3","key":"5731_CR9","doi-asserted-by":"publisher","DOI":"10.1016\/j.ipm.2023.103264","volume":"60","author":"Q Zhao","year":"2023","unstructured":"Zhao, Q., Gao, T., Guo, N.: Tsvfn: Two-stage visual fusion network for multimodal relation extraction. Inf. Process. Manag. 60(3), 103264 (2023)","journal-title":"Inf. Process. Manag."},{"key":"5731_CR10","doi-asserted-by":"publisher","first-page":"130034","DOI":"10.1016\/j.neucom.2025.130034","volume":"636","author":"CS4TE","year":"2025","unstructured":"CS4TE: A novel coded Self-Attention and semantic synergy network for triple Extraction[J]. Neurocomputing. 636, 130034 (2025)","journal-title":"Neurocomputing"},{"key":"5731_CR11","doi-asserted-by":"crossref","unstructured":"Liu, X., Hu, C., Zhang, R., et al.: Multimodal Relation Extraction via a Mixture of Hierarchical Visual Context Learners[C]\/\/Proceedings of the ACM on Web Conference 2024. : 4283\u20134294. (2024)","DOI":"10.1145\/3589334.3645603"},{"issue":"2","key":"5731_CR12","doi-asserted-by":"publisher","DOI":"10.3390\/e25020247","volume":"25","author":"XB Jin","year":"2023","unstructured":"Jin, X.B., Wang, Z.Y., Kong, J.L., et al.: Deep spatio-temporal graph network with self-optimization for air quality prediction. Entropy 25(2), 247 (2023)","journal-title":"Entropy"},{"issue":"4","key":"5731_CR13","doi-asserted-by":"publisher","DOI":"10.3390\/math11040837","volume":"11","author":"XB Jin","year":"2023","unstructured":"Jin, X.B., Wang, Z.Y., Gong, W.T., et al.: Variational bayesian network with information interpretability filtering for air quality forecasting. Mathematics 11(4), 837 (2023)","journal-title":"Mathematics"},{"issue":"3","key":"5731_CR14","doi-asserted-by":"publisher","DOI":"10.3390\/agronomy13030625","volume":"13","author":"JL Kong","year":"2023","unstructured":"Kong, J.L., Fan, X.M., Jin, X.B., et al.: BMAE-Net: A data-driven weather prediction network for smart agriculture. Agronomy 13(3), 625 (2023)","journal-title":"Agronomy"},{"issue":"4","key":"5731_CR15","doi-asserted-by":"publisher","first-page":"669","DOI":"10.1086\/726581","volume":"1","author":"J Roth","year":"2023","unstructured":"Roth, J., Sant\u2019Anna, P.H.C.: Efficient Estimation for staggered rollout designs. Journal of Political Economy Microeconomics 1(4), 669\u2013709 (2023)","journal-title":"Journal of Political Economy Microeconomics"},{"key":"5731_CR16","doi-asserted-by":"crossref","unstructured":"Brochier, R., Guille, A., Velcin, J.: Global vectors for node representations[C]\/\/The World Wide Web Conference. : 2587\u20132593. (2019)","DOI":"10.1145\/3308558.3313595"},{"issue":"1","key":"5731_CR17","first-page":"9933929","volume":"2022","author":"H Xu","year":"2022","unstructured":"Xu, H., Hu, B.: [Retracted] legal text recognition using LSTM-CRF deep learning Model[J]. Comput. Intell. Neurosci. 2022(1), 9933929 (2022)","journal-title":"Comput. Intell. Neurosci."},{"key":"5731_CR18","doi-asserted-by":"publisher","first-page":"35479","DOI":"10.1109\/ACCESS.2023.3266093","volume":"11","author":"AB Amjoud","year":"2023","unstructured":"Amjoud, A.B., Amrouch, M.: Object detection using deep learning, CNNs and vision transformers: A review. IEEE Access 11, 35479\u201335516 (2023)","journal-title":"IEEE Access"},{"key":"5731_CR19","unstructured":"Vaswani, A.: Attention Is all You need[J]. Advances in Neural Information Processing Systems (2017)"},{"issue":"5","key":"5731_CR20","doi-asserted-by":"publisher","DOI":"10.3390\/s19051058","volume":"19","author":"YY Zheng","year":"2019","unstructured":"Zheng, Y.Y., Kong, J.L., Jin, X.B., et al.: CropDeep: The crop vision dataset for deep-learning-based classification and detection in precision agriculture. Sensors 19(5), 1058 (2019)","journal-title":"Sensors"},{"key":"5731_CR21","unstructured":"Baevski, A., Babu, A., Hsu, W.N., et al.: Efficient self-supervised learning with contextualized target representations for vision, speech and language[C]\/\/International Conference on Machine Learning. PMLR, : 1416\u20131429. (2023)"},{"issue":"03","key":"5731_CR22","doi-asserted-by":"publisher","first-page":"2901","DOI":"10.1609\/aaai.v34i03.5681","volume":"34","author":"W Liu","year":"2020","unstructured":"Liu, W., Zhou, P., Zhao, Z., et al.: K-bert: Enabling language representation with knowledge graph. Proceedings of the AAAI Conference on Artificial Intelligence 34(03), 2901\u20132908 (2020)","journal-title":"Proceedings of the AAAI Conference on Artificial Intelligence"},{"key":"5731_CR23","doi-asserted-by":"crossref","unstructured":"Chu, X., Zhao, J., Zou, L., et al.: H-ERNIE: A multi-granularity pre-trained language model for web search[C]\/\/Proceedings of the 45th International ACM SIGIR conference on research and development in information retrieval. : 1478\u20131489. (2022)","DOI":"10.1145\/3477495.3531986"},{"issue":"15","key":"5731_CR24","doi-asserted-by":"publisher","first-page":"13860","DOI":"10.1609\/aaai.v35i15.17633","volume":"35","author":"L Sun","year":"2021","unstructured":"Sun, L., Wang, J., Zhang, K., et al.: RpBERT: a text-image relation propagation-based BERT model for multimodal NER. Proceedings of the AAAI conference on artificial intelligence 35(15), 13860\u201313868 (2021)","journal-title":"Proceedings of the AAAI conference on artificial intelligence"},{"key":"5731_CR25","doi-asserted-by":"crossref","unstructured":"Cong, X., Yu, B., Liu, T., et al.: Inductive unsupervised domain adaptation for few-shot classification via clustering[C]\/\/Machine Learning and Knowledge Discovery in Databases: European Conference, ECML PKDD 2020, Ghent, Belgium, September 14\u201318, 2020, Proceedings, Part II. Springer International Publishing, : 624\u2013639. (2021)","DOI":"10.1007\/978-3-030-67661-2_37"},{"issue":"11","key":"5731_CR26","doi-asserted-by":"publisher","first-page":"13318","DOI":"10.1609\/aaai.v37i11.26563","volume":"37","author":"J Lou","year":"2023","unstructured":"Lou, J., Lu, Y., Dai, D., et al.: Universal information extraction as unified semantic matching. Proceedings of the AAAI Conference on Artificial Intelligence 37(11), 13318\u201313326 (2023)","journal-title":"Proceedings of the AAAI Conference on Artificial Intelligence"},{"key":"5731_CR27","doi-asserted-by":"publisher","first-page":"111","DOI":"10.1016\/j.inffus.2022.09.012","volume":"90","author":"J Zhu","year":"2023","unstructured":"Zhu, J., Huang, C., De Meo, P.: DFMKE: A dual fusion multi-modal knowledge graph embedding framework for entity alignment. Information Fusion 90, 111\u2013119 (2023)","journal-title":"Information Fusion"},{"issue":"9","key":"5731_CR28","doi-asserted-by":"publisher","first-page":"11051","DOI":"10.1609\/aaai.v37i9.26309","volume":"37","author":"L Yuan","year":"2023","unstructured":"Yuan, L., Cai, Y., Wang, J., et al.: Joint multimodal entity-relation extraction based on edge-enhanced graph alignment network and word-pair relation tagging. Proceedings of the AAAI conference on artificial intelligence 37(9), 11051\u201311059 (2023)","journal-title":"Proceedings of the AAAI conference on artificial intelligence"},{"key":"5731_CR29","doi-asserted-by":"crossref","unstructured":"Li, X., Yin, X., Li, C., et al.: Oscar: Object-semantics aligned pre-training for vision-language tasks[C]\/\/Computer Vision\u2013ECCV. : 16th European Conference, Glasgow, UK, August 23\u201328, 2020, Proceedings, Part XXX 16. Springer International Publishing, 2020: 121\u2013137. (2020)","DOI":"10.1007\/978-3-030-58577-8_8"},{"issue":"8","key":"5731_CR30","first-page":"9","volume":"1","author":"A Radford","year":"2019","unstructured":"Radford, A., Wu, J., Child, R., et al.: Language models are unsupervised multitask learners[J]. OpenAI Blog. 1(8), 9 (2019)","journal-title":"OpenAI Blog"},{"issue":"9","key":"5731_CR31","doi-asserted-by":"publisher","first-page":"35","DOI":"10.1016\/j.cja.2021.08.016","volume":"35","author":"TU Ya","year":"2022","unstructured":"Ya, T.U., Yun, L.I.N., Haoran, Z.H.A., et al.: Large-scale real-world radio signal recognition with deep learning[J]. Chin. J. Aeronaut. 35(9), 35\u201348 (2022)","journal-title":"Chin. J. Aeronaut."},{"key":"5731_CR32","unstructured":"Devlin, J., Chang, M. W., Lee, K., et al.: Bert: Pre-training of deep bidirectional transformers for language understanding[C]\/\/Proceedings of the 2019 conference of the North American chapter of the association for computational linguistics: human language technologies, volume 1 (long and short papers) 4171\u20134186 (2019)"},{"issue":"9","key":"5731_CR33","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/3560815","volume":"55","author":"P Liu","year":"2023","unstructured":"Liu, P., Yuan, W., Fu, J., et al.: Pre-train, prompt, and predict: A systematic survey of prompting methods in natural Language processing. ACM Computing Surveys 55(9), 1\u201335 (2023)","journal-title":"ACM Computing Surveys"},{"key":"5731_CR34","doi-asserted-by":"crossref","unstructured":"Zheng, C., Wu, Z., Feng, J., et al.: MNRE: A challenge multimodal dataset for neural relation extraction with visual evidence in social media posts[C]\/\/2021 IEEE International Conference on Multimedia and Expo (ICME). IEEE, : 1\u20136. (2021)","DOI":"10.1109\/ICME51207.2021.9428274"},{"issue":"6","key":"5731_CR35","doi-asserted-by":"publisher","first-page":"1137","DOI":"10.1109\/TPAMI.2016.2577031","volume":"39","author":"S Ren","year":"2016","unstructured":"Ren, S., He, K., Girshick, R., et al.: Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE Trans. Pattern Anal. Mach. Intell. 39(6), 1137\u20131149 (2016)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"5731_CR36","doi-asserted-by":"crossref","unstructured":"Li, J., Feng, S., Chiu, B.: Few-shot relation extraction with dual graph neural network interaction[J]. IEEE Transactions on Neural Networks and Learning Systems. 35(10), 14396\u201314408 (2023)","DOI":"10.1109\/TNNLS.2023.3278938"},{"key":"5731_CR37","doi-asserted-by":"crossref","unstructured":"He, L., Wang, H., Wu, Z., et al.: Focus & Gating: A Multimodal Approach for Unveiling Relations in Noisy Social Media[C]\/\/Proceedings of the 32nd ACM International Conference on Multimedia. : 1379\u20131388. (2024)","DOI":"10.1145\/3664647.3680995"},{"key":"5731_CR38","unstructured":"Wei, J., Wang, X., Schuurmans, D., et al.: Chain-of-thought prompting elicits reasoning in large language models[J]. Advances in Neural Information Processing Systems 35, 24824\u201324837 (2022)"}],"container-title":["Cluster Computing"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10586-025-05731-0.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10586-025-05731-0\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10586-025-05731-0.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,11,25]],"date-time":"2025-11-25T11:48:36Z","timestamp":1764071316000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10586-025-05731-0"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,10,16]]},"references-count":38,"journal-issue":{"issue":"15","published-print":{"date-parts":[[2025,12]]}},"alternative-id":["5731"],"URL":"https:\/\/doi.org\/10.1007\/s10586-025-05731-0","relation":{},"ISSN":["1386-7857","1573-7543"],"issn-type":[{"type":"print","value":"1386-7857"},{"type":"electronic","value":"1573-7543"}],"subject":[],"published":{"date-parts":[[2025,10,16]]},"assertion":[{"value":"5 November 2024","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"6 August 2025","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"10 August 2025","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"16 October 2025","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare no competing interests.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Competing interests"}}],"article-number":"1002"}}