{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,25]],"date-time":"2026-04-25T04:04:12Z","timestamp":1777089852538,"version":"3.51.4"},"reference-count":55,"publisher":"Springer Science and Business Media LLC","issue":"8","license":[{"start":{"date-parts":[[2024,4,1]],"date-time":"2024-04-01T00:00:00Z","timestamp":1711929600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,4,1]],"date-time":"2024-04-01T00:00:00Z","timestamp":1711929600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"name":"National Key Research and Development Project of China","award":["2023YFF0725600"],"award-info":[{"award-number":["2023YFF0725600"]}]},{"name":"Technological Project in Changsha City","award":["kh2202006"],"award-info":[{"award-number":["kh2202006"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Appl Intell"],"published-print":{"date-parts":[[2024,4]]},"DOI":"10.1007\/s10489-024-05490-2","type":"journal-article","created":{"date-parts":[[2024,5,9]],"date-time":"2024-05-09T09:02:56Z","timestamp":1715245376000},"page":"6252-6268","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":8,"title":["2M-NER: contrastive learning for multilingual and multimodal NER with language and modal fusion"],"prefix":"10.1007","volume":"54","author":[{"given":"Dongsheng","family":"Wang","sequence":"first","affiliation":[]},{"given":"Xiaoqin","family":"Feng","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-3691-8097","authenticated-orcid":false,"given":"Zeming","family":"Liu","sequence":"additional","affiliation":[]},{"given":"Chuan","family":"Wang","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2024,5,9]]},"reference":[{"key":"5490_CR1","doi-asserted-by":"publisher","first-page":"745","DOI":"10.1016\/j.ins.2022.11.042","volume":"619","author":"H Cui","year":"2023","unstructured":"Cui H, Peng T, Xiao F, Han J, Han R, Liu L (2023) Incorporating anticipation embedding into reinforcement learning framework for multi-hop knowledge graph question answering. Inf Sci 619:745\u2013761","journal-title":"Inf Sci"},{"key":"5490_CR2","doi-asserted-by":"publisher","first-page":"205","DOI":"10.1016\/j.ins.2023.01.098","volume":"627","author":"Y Du","year":"2023","unstructured":"Du Y, Jin X, Yan R, Yan J (2023) Sentiment enhanced answer generation and information fusing for product-related question answering. Inf Sci 627:205\u2013219","journal-title":"Inf Sci"},{"key":"5490_CR3","doi-asserted-by":"crossref","unstructured":"Li D, Li J, Li H, Niebles JC, Hoi SCH (2022) Align and prompt: video-and-language pre-training with entity prompts. In: CVPR. IEEE, pp 4943\u20134953","DOI":"10.1109\/CVPR52688.2022.00490"},{"key":"5490_CR4","doi-asserted-by":"crossref","unstructured":"Yang J, Yin Y, Ma S, Yang L, Guo H, Huang H, et al (2023) HanoiT: enhancing context-aware translation via selective context. In: DASFAA (3). vol. 13945 of lecture notes in computer science. Springer, pp 471\u2013486","DOI":"10.1007\/978-3-031-30675-4_34"},{"key":"5490_CR5","doi-asserted-by":"crossref","unstructured":"Guerreiro NM, Voita E, Martins AFT (2023) Looking for a needle in a haystack: a comprehensive study of hallucinations in neural machine translation. In: EACL. association for computational linguistics, pp 1059\u20131075","DOI":"10.18653\/v1\/2023.eacl-main.75"},{"key":"5490_CR6","unstructured":"Huang Z, Xu W, Yu K (2015) Bidirectional LSTM-CRF models for sequence tagging. CoRR arXiv:1508.01991"},{"key":"5490_CR7","doi-asserted-by":"crossref","unstructured":"Ma X, Hovy EH (2016) End-to-end sequence labeling via Bi-directional LSTM-CNNs-CRF. In: ACL (1). the association for computer linguistics","DOI":"10.18653\/v1\/P16-1101"},{"key":"5490_CR8","doi-asserted-by":"crossref","unstructured":"Yu J, Jiang J, Yang L, Xia R (2020) Improving multimodal named entity recognition via entity span detection with unified multimodal transformer. In: ACL. association for computational linguistics, pp 3342\u20133352","DOI":"10.18653\/v1\/2020.acl-main.306"},{"key":"5490_CR9","doi-asserted-by":"crossref","unstructured":"Zhang D, Wei S, Li S, Wu H, Zhu Q, Zhou G (2021) Multi-modal graph fusion for named entity recognition with targeted visual guidance. In: AAAI. AAAI Press, pp 14347\u201314355","DOI":"10.1609\/aaai.v35i16.17687"},{"issue":"9","key":"5490_CR10","doi-asserted-by":"publisher","first-page":"4245","DOI":"10.1109\/TKDE.2020.3038670","volume":"34","author":"J Li","year":"2022","unstructured":"Li J, Chiu B, Feng S, Wang H (2022) Few-Shot named entity recognition via meta-learning. IEEE Trans Knowl Data Eng 34(9):4245\u20134256","journal-title":"IEEE Trans Knowl Data Eng"},{"key":"5490_CR11","doi-asserted-by":"crossref","unstructured":"Agarwal O (2022) Towards robust named entity recognition via temporal domain adaptation and entity context understanding. In: AAAI. AAAI Press, pp 12866\u201312867","DOI":"10.1609\/aaai.v36i11.21570"},{"key":"5490_CR12","doi-asserted-by":"crossref","unstructured":"Shen Y, Wang X, Tan Z, Xu G, Xie P, Huang F et al (2022) Parallel instance query network for named entity recognition. In: ACL (1). association for computational linguistics, pp 947\u2013961","DOI":"10.18653\/v1\/2022.acl-long.67"},{"key":"5490_CR13","doi-asserted-by":"crossref","unstructured":"Schmidt FD, Vulic I, Glavas G (2022) SLICER: sliced fine-tuning for low-resource cross-lingual transfer for named entity recognition. In: EMNLP. association for computational linguistics, pp 10775\u201310785","DOI":"10.18653\/v1\/2022.emnlp-main.740"},{"key":"5490_CR14","unstructured":"Zhang X, Yuan J, Li L, Liu J (2023) Reducing the ltion. In: WSDM. ACM, pp 958\u2013966"},{"key":"5490_CR15","doi-asserted-by":"crossref","unstructured":"Kulkarni M, Preotiuc-Pietro D, Radhakrishnan K, Winata G, Wu S, Xie L, et al (2023) Towards a unified multi-domain multilingual named entity recognition model. In: EACL. association for computational linguistics, pp 2202\u20132211","DOI":"10.18653\/v1\/2023.eacl-main.161"},{"key":"5490_CR16","doi-asserted-by":"crossref","unstructured":"Zhang Y, Meng F, Chen Y, Xu J, Zhou J (2021) Target-oriented fine-tuning for zero-resource named entity recognition. In: ACL\/IJCNLP (Findings). vol. ACL\/IJCNLP 2021 of findings of ACL. association for computational linguistics, pp 1603\u20131615","DOI":"10.18653\/v1\/2021.findings-acl.140"},{"key":"5490_CR17","doi-asserted-by":"crossref","unstructured":"Boros E, Gonz\u00e1lez-Gallardo C, Moreno JG, Doucet A (2022) L3i at SemEval-2022 task 11: straightforward additional context for multilingual named entity recognition. In: SemEval@NAACL. association for computational linguistics, pp 1630\u20131638","DOI":"10.18653\/v1\/2022.semeval-1.225"},{"key":"5490_CR18","doi-asserted-by":"crossref","unstructured":"Zhang Q, Fu J, Liu X, Huang X (2018) Adaptive Co-attention network for named entity recognition in tweets. In: AAAI. AAAI Press, pp 5674\u20135681","DOI":"10.1609\/aaai.v32i1.11962"},{"key":"5490_CR19","doi-asserted-by":"crossref","unstructured":"Chen X, Zhang N, Li L, Deng S, Tan C, Xu C et al (2022) Hybrid transformer with multi-level fusion for multimodal knowledge graph completion. In: SIGIR. ACM, pp 904\u2013915","DOI":"10.1145\/3477495.3531992"},{"key":"5490_CR20","doi-asserted-by":"crossref","unstructured":"Wang X, Gui M, Jiang Y, Jia Z, Bach N, Wang T et al (2022) ITA: Image-text alignments for multi-modal named entity recognition. In: NAACL-HLT. association for computational linguistics, pp 3176\u20133189","DOI":"10.18653\/v1\/2022.naacl-main.232"},{"key":"5490_CR21","unstructured":"Sang EFTK (2002) Introduction to the CoNLL-2002 shared task: language-independent named entity recognition. In: CoNLL. ACL"},{"key":"5490_CR22","unstructured":"Sang EFTK (2003) Meulder FD. Introduction to the CoNLL-2003 shared Task: language-independent named entity recognition. In: CoNLL. ACL, pp 142\u2013147"},{"key":"5490_CR23","doi-asserted-by":"crossref","unstructured":"Pan X, Zhang B, May J, Nothman J, Knight K, Ji H (2017) Cross-lingual name tagging and linking for 282 languages. In: ACL (1). association for computational linguistics, pp 1946\u20131958","DOI":"10.18653\/v1\/P17-1178"},{"key":"5490_CR24","doi-asserted-by":"crossref","unstructured":"Lu D, Neves L, Carvalho V, Zhang N, Ji H (2018) Visual attention model for name tagging in multimodal social media. In: ACL (1). Association for computational linguistics, pp 1990\u20131999","DOI":"10.18653\/v1\/P18-1185"},{"key":"5490_CR25","doi-asserted-by":"crossref","unstructured":"Sui D, Tian Z, Chen Y, Liu K, Zhao J (2021) A large-scale chinese multimodal ner dataset with speech clues. In: ACL\/IJCNLP (1). association for computational linguistics, pp 2807\u20132818","DOI":"10.18653\/v1\/2021.acl-long.218"},{"key":"5490_CR26","unstructured":"Dosovitskiy A, Beyer L, Kolesnikov A, Weissenborn D, Zhai X, Unterthiner T et al (2021) An image is worth 16x16 words: transformers for image recognition at scale. In: ICLR. OpenReview.net"},{"key":"5490_CR27","doi-asserted-by":"crossref","unstructured":"He K, Zhang X, Ren S, Sun J (2016) Deep residual learning for image recognition. In: CVPR. IEEE computer society, pp 770\u2013778","DOI":"10.1109\/CVPR.2016.90"},{"issue":"1","key":"5490_CR28","doi-asserted-by":"publisher","first-page":"947","DOI":"10.1007\/s10489-023-05245-5","volume":"54","author":"E Sun","year":"2024","unstructured":"Sun E, Zhou D, Tian Y, Xu Z, Wang X (2024) Transformer-based few-shot object detection in traffic scenarios. Appl Intell 54(1):947\u2013958","journal-title":"Appl Intell"},{"key":"5490_CR29","doi-asserted-by":"crossref","unstructured":"Lample G, Ballesteros M, Subramanian S, Kawakami K, Dyer C (2016) Neural architectures for named entity recognition. In: HLT-NAACL. the association for computational linguistics, pp 260\u2013270","DOI":"10.18653\/v1\/N16-1030"},{"key":"5490_CR30","unstructured":"Devlin J, Chang M, Lee K, Toutanova K (2019) BERT: Pre-training of deep bidirectional transformers for language understanding. In: NAACL-HLT (1). association for computational linguistics, pp 4171\u20134186"},{"key":"5490_CR31","unstructured":"Sen P, Aji AF, Saffari A (2022) Mintaka: a complex, natural, and multilingual dataset for End-to-End question answering. In: COLING. international committee on computational linguistics, pp 1604\u20131619"},{"key":"5490_CR32","doi-asserted-by":"crossref","unstructured":"Perevalov A, Both A, Diefenbach D, Ngomo AN (2022) Can machine translation be a reasonable alternative for multilingual question answering systems over knowledge graphs. In: WWW. ACM, pp 977\u2013986","DOI":"10.1145\/3485447.3511940"},{"key":"5490_CR33","doi-asserted-by":"crossref","unstructured":"Wang R, Zhang Z, Zhuang F, Gao D, Wei Y, He Q (2021) Adversarial domain adaptation for cross-lingual information retrieval with multilingual BERT. In: CIKM. ACM, pp 3498\u20133502","DOI":"10.1145\/3459637.3482050"},{"key":"5490_CR34","doi-asserted-by":"crossref","unstructured":"Sun S, Duh K (2020) CLIRMatrix: a massively large collection of bilingual and multilingual datasets for cross-lingual information retrieval. In: EMNLP (1). association for computational linguistics, pp 4160\u20134170","DOI":"10.18653\/v1\/2020.emnlp-main.340"},{"key":"5490_CR35","doi-asserted-by":"crossref","unstructured":"Bhartiya A, Badola K, Mausam (2022) DiS-ReX: a multilingual dataset for distantly supervised relation extraction. In: ACL (2). association for computational linguistics, pp 849\u2013863","DOI":"10.18653\/v1\/2022.acl-short.95"},{"key":"5490_CR36","doi-asserted-by":"crossref","unstructured":"Rathore V, Badola K, Singla P, Mausam (2022) PARE: a simple and strong baseline for monolingual and multilingual distantly supervised relation extraction. In: ACL (2). association for computational linguistics, pp 340\u2013354","DOI":"10.18653\/v1\/2022.acl-short.38"},{"key":"5490_CR37","doi-asserted-by":"publisher","first-page":"151","DOI":"10.1016\/j.artint.2012.03.006","volume":"194","author":"J Nothman","year":"2013","unstructured":"Nothman J, Ringland N, Radford W, Murphy T, Curran JR (2013) Learning multilingual named entity recognition from Wikipedia. Artif Intell 194:151\u2013175","journal-title":"Artif Intell"},{"key":"5490_CR38","unstructured":"Malmasi S, Fang A, Fetahu B, Kar S, Rokhlenko O (2022) MultiCoNER: a large-scale multilingual dataset for complex named entity recognition. In: COLING. international committee on computational linguistics, pp 3798\u20133809"},{"key":"5490_CR39","doi-asserted-by":"crossref","unstructured":"Malmasi S, Fang A, Fetahu B, Kar S, Rokhlenko O (2022) SemEval-2022 task 11: multilingual complex named entity recognition (MultiCoNER). In: SemEval@NAACL. association for computational linguistics, pp 1412\u20131437","DOI":"10.18653\/v1\/2022.semeval-1.196"},{"key":"5490_CR40","doi-asserted-by":"crossref","unstructured":"Emelyanov AA, Artemova E (2019) Multilingual named entity recognition using pretrained embeddings, attention mechanism and NCRF. In: BSNLP@ACL. association for computational linguistics, pp 94\u201399","DOI":"10.18653\/v1\/W19-3713"},{"key":"5490_CR41","doi-asserted-by":"crossref","unstructured":"Arkhipov MY, Trofimova M, Kuratov Y, Sorokin A (2019) Tuning multilingual transformers for language-specific named entity recognition. In: BSNLP@ACL. association for computational linguistics, pp 89\u201393","DOI":"10.18653\/v1\/W19-3712"},{"key":"5490_CR42","doi-asserted-by":"crossref","unstructured":"Winata GI, Lin Z, Fung P (2019) Learning multilingual meta-embeddings for code-switching named entity recognition. In: RepL4NLP@ACL. association for computational linguistics, pp 181\u2013186","DOI":"10.18653\/v1\/W19-4320"},{"key":"5490_CR43","doi-asserted-by":"crossref","unstructured":"Wu Q, Lin Z, Wang G, Chen H, Karlsson BF, Huang B, et al (2020) Enhanced meta-learning for cross-lingual named entity recognition with minimal resources. In: AAAI. AAAI Press, pp 9274\u20139281","DOI":"10.1609\/aaai.v34i05.6466"},{"key":"5490_CR44","doi-asserted-by":"crossref","unstructured":"Moon S, Neves L, Carvalho V (2018) Multimodal named entity recognition for short social media posts. In: NAACL-HLT. association for computational linguistics, pp 852\u2013860","DOI":"10.18653\/v1\/N18-1078"},{"key":"5490_CR45","doi-asserted-by":"crossref","unstructured":"Zhao F, Li C, Wu Z, Xing S, Dai X (2022) Learning from different text-image pairs: a relation-enhanced graph convolutional network for multimodal NER. In: ACM multimedia. ACM,pp 3983\u20133992","DOI":"10.1145\/3503161.3548228"},{"key":"5490_CR46","doi-asserted-by":"crossref","unstructured":"Sun L, Wang J, Zhang K, Su Y, Weng F (2021) RpBERT: A text-image relation propagation-based BERT model for multimodal NER. In: AAAI. AAAI Press, pp 13860\u201313868","DOI":"10.1609\/aaai.v35i15.17633"},{"key":"5490_CR47","doi-asserted-by":"publisher","first-page":"2520","DOI":"10.1109\/TMM.2020.3013398","volume":"23","author":"C Zheng","year":"2021","unstructured":"Zheng C, Wu Z, Wang T, Cai Y, Li Q (2021) Object-aware multimodal named entity recognition in social media posts with adversarial learning. IEEE Trans Multim 23:2520\u20132532","journal-title":"IEEE Trans Multim"},{"issue":"5","key":"5490_CR48","first-page":"5532","volume":"53","author":"X Li","year":"2023","unstructured":"Li X, Kong D (2023) SRIF-RCNN: Sparsely represented inputs fusion of different sensors for 3D object detection. Appl Intell 53(5):5532\u20135553","journal-title":"Appl Intell"},{"key":"5490_CR49","doi-asserted-by":"crossref","unstructured":"Wu Z, Zheng C, Cai Y, Chen J, Leung H, Li Q (2020) Multimodal representation with embedded visual guiding objects for named entity recognition in social media posts. In: ACM Multimedia. ACM, pp 1038\u20131046","DOI":"10.1145\/3394171.3413650"},{"key":"5490_CR50","doi-asserted-by":"crossref","unstructured":"Liu Y, Gu J, Goyal N, Li X, Edunov S, Ghazvininejad M et al (2020) Multilingual denoising pre-training for neural machine translation. Trans Assoc Comput Linguistics 8:726\u2013742","DOI":"10.1162\/tacl_a_00343"},{"issue":"1","key":"5490_CR51","doi-asserted-by":"publisher","first-page":"37","DOI":"10.1177\/001316446002000104","volume":"20","author":"J Cohen","year":"1960","unstructured":"Cohen J (1960) A Coefficient of agreement for nominal scales. Educational and psychological measurement 20(1):37\u201346","journal-title":"Educational and psychological measurement"},{"key":"5490_CR52","doi-asserted-by":"publisher","first-page":"119374","DOI":"10.1016\/j.ins.2023.119374","volume":"646","author":"AG Oskouei","year":"2023","unstructured":"Oskouei AG, Balafar MA, Motamed C (2023) RDEIC-LFW-DSS: ResNet-based deep embedded image clustering using local feature weighting and dynamic sample selection mechanism. Inf Sci. 646:119374","journal-title":"Inf Sci."},{"key":"5490_CR53","unstructured":"Chen T, Kornblith S, Norouzi M, Hinton GE (2020) A simple framework for contrastive learning of visual representations. In: ICML. vol 119 of Proceedings of machine learning research. PMLR, pp 1597\u20131607"},{"key":"5490_CR54","doi-asserted-by":"crossref","unstructured":"He K, Fan H, Wu Y, Xie S, Girshick RB (2020) Momentum contrast for unsupervised visual representation learning. In: CVPR. computer vision foundation \/ IEEE, pp 9726\u20139735","DOI":"10.1109\/CVPR42600.2020.00975"},{"key":"5490_CR55","unstructured":"Radford A, Kim JW, Hallacy C, Ramesh A, Goh G, Agarwal S et al (2021) Learning transferable visual models from natural language supervision. In: ICML, vol 139 of proceedings of machine learning research. PMLR, pp 8748\u20138763"}],"container-title":["Applied Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-024-05490-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10489-024-05490-2\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-024-05490-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,6,15]],"date-time":"2024-06-15T12:15:00Z","timestamp":1718453700000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10489-024-05490-2"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,4]]},"references-count":55,"journal-issue":{"issue":"8","published-print":{"date-parts":[[2024,4]]}},"alternative-id":["5490"],"URL":"https:\/\/doi.org\/10.1007\/s10489-024-05490-2","relation":{},"ISSN":["0924-669X","1573-7497"],"issn-type":[{"value":"0924-669X","type":"print"},{"value":"1573-7497","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024,4]]},"assertion":[{"value":"20 April 2024","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"9 May 2024","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}