{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,1]],"date-time":"2025-11-01T09:36:19Z","timestamp":1761989779550,"version":"3.37.3"},"reference-count":38,"publisher":"Springer Science and Business Media LLC","issue":"9-10","license":[{"start":{"date-parts":[[2024,5,1]],"date-time":"2024-05-01T00:00:00Z","timestamp":1714521600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,5,1]],"date-time":"2024-05-01T00:00:00Z","timestamp":1714521600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Appl Intell"],"published-print":{"date-parts":[[2024,5]]},"DOI":"10.1007\/s10489-024-05539-2","type":"journal-article","created":{"date-parts":[[2024,5,29]],"date-time":"2024-05-29T07:02:18Z","timestamp":1716966138000},"page":"6946-6958","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":1,"title":["Dual-attention-transformer-based semantic reranking for large-scale image localization"],"prefix":"10.1007","volume":"54","author":[{"given":"Yilin","family":"Xiao","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-6967-958X","authenticated-orcid":false,"given":"Siliang","family":"Du","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xu","family":"Chen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mingzhong","family":"Liu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mingwei","family":"Sun","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2024,5,29]]},"reference":[{"key":"5539_CR1","doi-asserted-by":"crossref","unstructured":"Doan A-D, Latif Y, Chin T-J, Liu Y, Do T-T, Reid I (2019) Scalable place recognition under appearance change for autonomous driving. In: Proceedings of the IEEE\/CVF International Conference on Computer Vision (ICCV)","DOI":"10.1109\/ICCV.2019.00941"},{"key":"5539_CR2","unstructured":"Aggarwal AK (2015) Autonomous navigation of intelligent vehicles using vision based method. Int J Res Elect Comm Technol 3(5)"},{"key":"5539_CR3","doi-asserted-by":"crossref","unstructured":"Hausler S, Garg S, Chakravarty P, Shrivastava S, Vora A, Milford M (2023) Displacing objects: Improving dynamic vehicle detection via visual place recognition under adverse conditions. In: 2023 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS). IEEE, pp 1373\u20131380","DOI":"10.1109\/IROS55552.2023.10341550"},{"key":"5539_CR4","doi-asserted-by":"crossref","unstructured":"Garg S, Fischer T, Milford M (2021) Where is your place, visual place recognition? In: Proceedings of the Thirtieth International Joint Conference on Artificial Intelligence, IJCAI-21. pp 4416\u20134425","DOI":"10.24963\/ijcai.2021\/603"},{"key":"5539_CR5","doi-asserted-by":"crossref","unstructured":"Warburg F, Hauberg S, Lopez-Antequera M, Gargallo P, Kuang Y, Civera J (2020) Mapillary street-level sequences: a dataset for lifelong place recognition. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR)","DOI":"10.1109\/CVPR42600.2020.00270"},{"key":"5539_CR6","doi-asserted-by":"publisher","first-page":"14","DOI":"10.1016\/j.imavis.2017.07.003","volume":"68","author":"C H\u00e4ne","year":"2017","unstructured":"H\u00e4ne C, Heng L, Lee GH, Fraundorfer F, Furgale P, Sattler T, Pollefeys M (2017) 3d visual perception for self-driving cars using a multi-camera system: Calibration, mapping, localization, and obstacle detection. Image Vis Comput 68:14\u201327. https:\/\/doi.org\/10.1016\/j.imavis.2017.07.003","journal-title":"Image Vis Comput"},{"issue":"1","key":"5539_CR7","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1109\/TRO.2015.2496823","volume":"32","author":"S Lowry","year":"2016","unstructured":"Lowry S, S\u00fcnderhauf N, Newman P, Leonard JJ, Cox D, Corke P, Milford MJ (2016) Visual place recognition: A survey. IEEE Trans Robotics 32(1):1\u201319. https:\/\/doi.org\/10.1109\/TRO.2015.2496823","journal-title":"IEEE Trans Robotics"},{"key":"5539_CR8","doi-asserted-by":"publisher","first-page":"107760","DOI":"10.1016\/j.patcog.2020.107760","volume":"113","author":"X Zhang","year":"2021","unstructured":"Zhang X, Wang L, Su Y (2021) Visual place recognition: a survey from deep learning perspective. Pattern Recognit 113:107760. https:\/\/doi.org\/10.1016\/j.patcog.2020.107760","journal-title":"Pattern Recognit"},{"key":"5539_CR9","doi-asserted-by":"crossref","unstructured":"Yadav R, Pani V, Mishra A, Tiwari N, Kala R (2023) Locality-constrained continuous place recognition for slam in extreme conditions. Appl Intell 1\u201317","DOI":"10.1007\/s10489-022-04415-1"},{"issue":"10","key":"5539_CR10","doi-asserted-by":"publisher","first-page":"11928","DOI":"10.1007\/s10489-021-03050-6","volume":"52","author":"R Yadav","year":"2022","unstructured":"Yadav R, Kala R (2022) Fusion of visual odometry and place recognition for slam in extreme conditions. Appl Intell 52(10):11928\u201311947","journal-title":"Appl Intell"},{"key":"5539_CR11","doi-asserted-by":"crossref","unstructured":"Ge Y, Wang H, Zhu F, Zhao R, Li H (2020) Self-supervising fine-grained region similarities for large-scale image localization. In: Vedaldi A, Bischof H, Brox T, Frahm J-M (eds) Computer Vision \u2013 ECCV 2020. Cham, pp. 369\u2013386","DOI":"10.1007\/978-3-030-58548-8_22"},{"issue":"6","key":"5539_CR12","doi-asserted-by":"publisher","first-page":"1437","DOI":"10.1109\/TPAMI.2017.2711011","volume":"40","author":"R Arandjelovi\u0107","year":"2018","unstructured":"Arandjelovi\u0107 R, Gronat P, Torii A, Pajdla T, Sivic J (2018) Netvlad: Cnn architecture for weakly supervised place recognition. IEEE Trans Pattern Anal Mach Intell 40(6):1437\u20131451. https:\/\/doi.org\/10.1109\/TPAMI.2017.2711011","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"5539_CR13","doi-asserted-by":"crossref","unstructured":"Jin\u00a0Kim H, Dunn E, Frahm J-M (2017) Learned contextual feature reweighting for image geo-localization. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)","DOI":"10.1109\/CVPR.2017.346"},{"key":"5539_CR14","doi-asserted-by":"crossref","unstructured":"Liu L, Li H, Dai Y (2019) Stochastic attraction-repulsion embedding for large scale image localization. In: Proceedings of the IEEE\/CVF International Conference on Computer Vision (ICCV)","DOI":"10.1109\/ICCV.2019.00266"},{"key":"5539_CR15","doi-asserted-by":"crossref","unstructured":"Ren H, Zheng Z, Wu Y, Lu H (2023) Daco: domain-agnostic contrastive learning for visual place recognition. Appl Intell 1\u201314","DOI":"10.1007\/s10489-023-04629-x"},{"issue":"4","key":"5539_CR16","first-page":"77","volume":"6","author":"K Arora","year":"2017","unstructured":"Arora K, Kumar A (2017) A comparative study on content based image retrieval methods. Int J Technol Eng Manag Appl Sci 6(4):77\u201380","journal-title":"Int J Technol Eng Manag Appl Sci"},{"key":"5539_CR17","doi-asserted-by":"crossref","unstructured":"Liu L, Li H, Dai Y (2017) Efficient global 2d-3d matching for camera localization in a large-scale 3d map. In: Proceedings of the IEEE International Conference on Computer Vision (ICCV)","DOI":"10.1109\/ICCV.2017.260"},{"key":"5539_CR18","doi-asserted-by":"publisher","unstructured":"Sattler T, Leibe B, Kobbelt L (2011) Fast image-based localization using direct 2d-to-3d matching. In: 2011 International Conference on Computer Vision. pp 667\u2013674. https:\/\/doi.org\/10.1109\/ICCV.2011.6126302","DOI":"10.1109\/ICCV.2011.6126302"},{"key":"5539_CR19","unstructured":"Surita Maini AKA (2018) Camera position estimation using 2d image dataset. Int J Inn Eng Technol"},{"issue":"2","key":"5539_CR20","doi-asserted-by":"publisher","first-page":"1134","DOI":"10.30534\/ijatcse\/2020\/36922020","volume":"9","author":"AKA Taruna Kumari","year":"2020","unstructured":"Taruna Kumari AKA, Syal Poonam, Guleria V (2020) Hybrid image registration methods: A review. Int J Adv Trends Comput Sci Eng 9(2):1134\u20131142","journal-title":"Int J Adv Trends Comput Sci Eng"},{"key":"5539_CR21","doi-asserted-by":"crossref","unstructured":"Seo PH, Weyand T, Sim J, Han B (2018) Cplanet: Enhancing image geolocalization by combinatorial partitioning of maps. In: Proceedings of the European Conference on Computer Vision (ECCV)","DOI":"10.1007\/978-3-030-01249-6_33"},{"key":"5539_CR22","doi-asserted-by":"crossref","unstructured":"Vo N, Jacobs N, Hays J (2017) Revisiting im2gps in the deep learning era. In: Proceedings of the IEEE International Conference on Computer Vision (ICCV)","DOI":"10.1109\/ICCV.2017.286"},{"key":"5539_CR23","doi-asserted-by":"crossref","unstructured":"Zeiler MD, Fergus R: Visualizing and understanding convolutional networks. In: Fleet D, Pajdla T, Schiele B, Tuytelaars T (eds) Computer Vision \u2013 ECCV 2014, pp. 818\u2013833. Springer, Cham (2014)","DOI":"10.1007\/978-3-319-10590-1_53"},{"key":"5539_CR24","doi-asserted-by":"crossref","unstructured":"Sattler T, Havlena M, Radenovic F, Schindler K, Pollefeys M (2015) Hyperpoints and fine vocabularies for large-scale location recognition. In: Proceedings of the IEEE International Conference on Computer Vision (ICCV)","DOI":"10.1109\/ICCV.2015.243"},{"issue":"2","key":"5539_CR25","doi-asserted-by":"publisher","first-page":"257","DOI":"10.1109\/TPAMI.2017.2667665","volume":"40","author":"A Torii","year":"2018","unstructured":"Torii A, Arandjelovi\u0107 R, Sivic J, Okutomi M, Pajdla T (2018) 24\/7 place recognition by view synthesis. IEEE Trans Pattern Anal Mach Intell 40(2):257\u2013271. https:\/\/doi.org\/10.1109\/TPAMI.2017.2667665","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"5539_CR26","doi-asserted-by":"publisher","unstructured":"Perronnin F, Dance C (2007) Fisher kernels on visual vocabularies for image categorization. In: 2007 IEEE Conference on Computer Vision and Pattern Recognition. pp. 1\u20138. https:\/\/doi.org\/10.1109\/CVPR.2007.383266","DOI":"10.1109\/CVPR.2007.383266"},{"key":"5539_CR27","doi-asserted-by":"publisher","unstructured":"Perronnin F, Liu Y, S\u00e1nchez J, Poirier H (2010) Large-scale image retrieval with compressed fisher vectors. In: 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. pp. 3384\u20133391. https:\/\/doi.org\/10.1109\/CVPR.2010.5540009","DOI":"10.1109\/CVPR.2010.5540009"},{"key":"5539_CR28","unstructured":"Babenko A, Lempitsky V (2015) Aggregating local deep features for image retrieval. In: Proceedings of the IEEE International Conference on Computer Vision (ICCV)"},{"key":"5539_CR29","unstructured":"Simonyan K, Zisserman A (2015) Very deep convolutional networks for large-scale image recognition. In: Bengio Y, LeCun Y (eds) 3rd International Conference on Learning Representations, ICLR 2015, San Diego, CA, USA, May 7-9, 2015, Conference Track Proceedings"},{"key":"5539_CR30","doi-asserted-by":"crossref","unstructured":"He K, Zhang X, Ren S, Sun J (2016) Deep residual learning for image recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)","DOI":"10.1109\/CVPR.2016.90"},{"issue":"7","key":"5539_CR31","doi-asserted-by":"publisher","first-page":"1655","DOI":"10.1109\/TPAMI.2018.2846566","volume":"41","author":"F Radenovi\u0107","year":"2019","unstructured":"Radenovi\u0107 F, Tolias G, Chum O (2019) Fine-tuning cnn image retrieval with no human annotation. IEEE Trans Pattern Anal Mach Intell 41(7):1655\u20131668. https:\/\/doi.org\/10.1109\/TPAMI.2018.2846566","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"5539_CR32","doi-asserted-by":"crossref","unstructured":"Peng G, Zhang J, Li H, Wang D (2021) Attentional pyramid pooling of salient visual residuals for place recognition. In: Proceedings of the IEEE\/CVF International Conference on Computer Vision (ICCV). pp 885\u2013894","DOI":"10.1109\/ICCV48922.2021.00092"},{"key":"5539_CR33","doi-asserted-by":"crossref","unstructured":"Berton G, Masone C, Caputo B (2022) Rethinking visual geo-localization for large-scale applications. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp 4878\u20134888","DOI":"10.1109\/CVPR52688.2022.00483"},{"key":"5539_CR34","doi-asserted-by":"crossref","unstructured":"Sarlin P-E, DeTone D, Malisiewicz T, Rabinovich A (2020) Superglue: Learning feature matching with graph neural networks. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR)","DOI":"10.1109\/CVPR42600.2020.00499"},{"key":"5539_CR35","doi-asserted-by":"crossref","unstructured":"Li H, Xiong P, Fan H, Sun J (2019) Dfanet: Deep feature aggregation for real-time semantic segmentation. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR)","DOI":"10.1109\/CVPR.2019.00975"},{"key":"5539_CR36","unstructured":"Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez AN, Kaiser \u0141, Polosukhin I (2017) Attention is all you need. In: Advances in neural information processing systems"},{"key":"5539_CR37","doi-asserted-by":"crossref","unstructured":"Ding M, Xiao B, Codella N, Luo P, Wang J, Yuan L: Davit: Dual attention vision transformers. In: Avidan S, Brostow G, Ciss\u00e9 M, Farinella GM, Hassner T (eds) Computer Vision \u2013 ECCV 2022, pp. 74\u201392. Springer, Cham (2022)","DOI":"10.1007\/978-3-031-20053-3_5"},{"issue":"11","key":"5539_CR38","doi-asserted-by":"publisher","first-page":"2346","DOI":"10.1109\/TPAMI.2015.2409868","volume":"37","author":"A Torii","year":"2015","unstructured":"Torii A, Sivic J, Okutomi M, Pajdla T (2015) Visual place recognition with repetitive structures. IEEE Trans Pattern Anal Mach Intell 37(11):2346\u20132359. https:\/\/doi.org\/10.1109\/TPAMI.2015.2409868","journal-title":"IEEE Trans Pattern Anal Mach Intell"}],"container-title":["Applied Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-024-05539-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10489-024-05539-2\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-024-05539-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,6,24]],"date-time":"2024-06-24T13:13:05Z","timestamp":1719234785000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10489-024-05539-2"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,5]]},"references-count":38,"journal-issue":{"issue":"9-10","published-print":{"date-parts":[[2024,5]]}},"alternative-id":["5539"],"URL":"https:\/\/doi.org\/10.1007\/s10489-024-05539-2","relation":{},"ISSN":["0924-669X","1573-7497"],"issn-type":[{"type":"print","value":"0924-669X"},{"type":"electronic","value":"1573-7497"}],"subject":[],"published":{"date-parts":[[2024,5]]},"assertion":[{"value":"17 May 2024","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"29 May 2024","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors have no competing interests to declare that are relevant to the content of this article.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Competing interests"}},{"value":"Pitts250k, Pitts30k, Tokyo 24\/7 and MSLS belong to public databases. The data involved in the database has obtained ethical approval. Our study is based on open source data, so there are no ethical issues and other conflicts of interest.","order":3,"name":"Ethics","group":{"name":"EthicsHeading","label":"Ethical and informed consent for data used"}}]}}