{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,7]],"date-time":"2026-06-07T04:32:59Z","timestamp":1780806779365,"version":"3.54.1"},"reference-count":56,"publisher":"Springer Science and Business Media LLC","issue":"22","license":[{"start":{"date-parts":[[2024,8,14]],"date-time":"2024-08-14T00:00:00Z","timestamp":1723593600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,8,14]],"date-time":"2024-08-14T00:00:00Z","timestamp":1723593600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Appl Intell"],"published-print":{"date-parts":[[2024,11]]},"DOI":"10.1007\/s10489-024-05743-0","type":"journal-article","created":{"date-parts":[[2024,8,14]],"date-time":"2024-08-14T04:02:11Z","timestamp":1723608131000},"page":"11248-11266","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":4,"title":["HEFANet: hierarchical efficient fusion and aggregation segmentation network for enhanced rgb-thermal urban scene parsing"],"prefix":"10.1007","volume":"54","author":[{"given":"Zhengwen","family":"Shen","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Zaiyu","family":"Pan","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Yuchen","family":"Weng","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Yulian","family":"Li","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jiangyu","family":"Wang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jun","family":"Wang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2024,8,14]]},"reference":[{"issue":"4","key":"5743_CR1","doi-asserted-by":"publisher","first-page":"5558","DOI":"10.1109\/LRA.2020.3007457","volume":"5","author":"L Sun","year":"2020","unstructured":"Sun L, Yang K, Hu X, Hu W, Wang K (2020) Real-time fusion network for rgb-d semantic segmentation incorporating unexpected obstacle detection for road-driving images. IEEE Robot Autom Let 5(4):5558\u20135565. https:\/\/doi.org\/10.1109\/LRA.2020.3007457","journal-title":"IEEE Robot Autom Let"},{"key":"5743_CR2","doi-asserted-by":"publisher","first-page":"1244","DOI":"10.1007\/s10489-020-01882-2","volume":"51","author":"X Dai","year":"2021","unstructured":"Dai X, Yuan X, Wei X (2021) Tirnet: Object detection in thermal infrared images for autonomous driving. Appl Intell 51:1244\u20131261. https:\/\/doi.org\/10.1007\/s10489-020-01882-2","journal-title":"Appl Intell"},{"key":"5743_CR3","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1109\/TIM.2023.3328708","volume":"72","author":"L Sun","year":"2023","unstructured":"Sun L, Bockman J, Sun C (2023) A Framework for Leveraging Inter-image Information in Stereo Images for Enhanced Semantic Segmentation in Autonomous Driving. IEEE Trans Instrum Meas 72:1\u201312. https:\/\/doi.org\/10.1109\/TIM.2023.3328708","journal-title":"IEEE Trans Instrum Meas"},{"issue":"2","key":"5743_CR4","doi-asserted-by":"publisher","first-page":"1508","DOI":"10.1007\/s10489-021-02506-z","volume":"52","author":"H Xia","year":"2022","unstructured":"Xia H, Ma M, Li H, Song S (2022) Mc-net: multi-scale context-attention network for medical ct image segmentation. Appl Intell 52(2):1508\u20131519. https:\/\/doi.org\/10.1007\/s10489-021-02506-z","journal-title":"Appl Intell"},{"issue":"15","key":"5743_CR5","doi-asserted-by":"publisher","first-page":"17974","DOI":"10.1007\/s10489-022-03345-2","volume":"52","author":"H Zhong","year":"2022","unstructured":"Zhong H, Sun H, Han D, Li Z, Jia R (2022) Lake water body extraction of optical remote sensing images based on semantic segmentation. Appl Intell 52(15):17974\u201317989. https:\/\/doi.org\/10.1007\/s10489-022-03345-2","journal-title":"Appl Intell"},{"issue":"13","key":"5743_CR6","doi-asserted-by":"publisher","first-page":"15462","DOI":"10.1007\/s10489-022-03310-z","volume":"52","author":"N Priyanka","year":"2022","unstructured":"Priyanka N, Lal S, Nalini J, Reddy C, Dell\u2019Acqua F (2022) Diresunet: Architecture for multiclass semantic segmentation of high resolution remote sensing imagery data. Appl Intell 52(13):15462\u201315482. https:\/\/doi.org\/10.1007\/s10489-022-03310-z","journal-title":"Appl Intell"},{"issue":"4","key":"5743_CR7","doi-asserted-by":"publisher","first-page":"640","DOI":"10.1109\/tpami.2016.2572683","volume":"39","author":"J Long","year":"2015","unstructured":"Long J, Shelhamer E, Darrell T (2015) Fully convolutional networks for semantic segmentation. IEEE Trans Pattern Anal Machine Intell 39(4):640\u2013651. https:\/\/doi.org\/10.1109\/tpami.2016.2572683","journal-title":"IEEE Trans Pattern Anal Machine Intell"},{"issue":"10","key":"5743_CR8","doi-asserted-by":"publisher","first-page":"3349","DOI":"10.1109\/TPAMI.2020.2983686","volume":"43","author":"J Wang","year":"2020","unstructured":"Wang J, Sun K, Cheng T, Jiang B, Deng C, Zhao Y, Xiao B (2020) Deep high-resolution representation learning for visual recognition. IEEE Trans Pattern Anal Machine Intell 43(10):3349\u20133364. https:\/\/doi.org\/10.1109\/TPAMI.2020.2983686","journal-title":"IEEE Trans Pattern Anal Machine Intell"},{"key":"5743_CR9","doi-asserted-by":"publisher","unstructured":"Dosovitskiy A, Beyer L, Kolesnikov A, Weissenborn D, Zhai X, Unterthiner T, Dehghani M, Minderer M, Heigold G, Gelly S et al (2021) An image is worth 16x16 words: Transformers for image recognition at scale. In: 2021 International conference on learning representations (ICLR). https:\/\/doi.org\/10.48550\/arXiv.2010.11929","DOI":"10.48550\/arXiv.2010.11929"},{"key":"5743_CR10","doi-asserted-by":"publisher","unstructured":"Liu Z, Lin Y, Cao Y, Hu H, Wei Y, Zhang Z, Lin S, Guo B (2021) Swin transformer: Hierarchical vision transformer using shifted windows. In: 2021 IEEE\/CVF International conference on computer vision (ICCV). IEEE, pp 10012\u201310022. https:\/\/doi.org\/10.1109\/ICCV48922.2021.00986","DOI":"10.1109\/ICCV48922.2021.00986"},{"key":"5743_CR11","doi-asserted-by":"publisher","unstructured":"Carion N, Massa F, Synnaeve G, Usunier N, Kirillov A, Zagoruyko S (2020) End-to-end object detection with transformers. In: European conference on computer vision (ECCV). Springer, pp 213-229. https:\/\/doi.org\/10.1007\/978-3-030-58452-8_13","DOI":"10.1007\/978-3-030-58452-8_13"},{"key":"5743_CR12","doi-asserted-by":"publisher","unstructured":"Xie E, Wang W, Yu Z, Anandkumar A, Alvarez J, Luo P (2021) Segformer: Simple and efficient design for semantic segmentation with transformers. In: 2021 Advances in neural information processing systems (NeurIPS). MIT Press, vol 34, pp 12077\u201312090. https:\/\/doi.org\/10.48550\/arXiv.2105.15203","DOI":"10.48550\/arXiv.2105.15203"},{"issue":"10","key":"5743_CR13","doi-asserted-by":"publisher","first-page":"12581","DOI":"10.1109\/TPAMI.2023.3282631","volume":"45","author":"K Li","year":"2023","unstructured":"Li K, Wang Y, Zhang J, Gao P, Song G, Liu Y, Li H, Qiao Y (2023) Uniformer: Unifying convolution and self-attention for visual recognition. IEEE Trans Pattern Anal Machine Intell 45(10):12581\u201312600. https:\/\/doi.org\/10.1109\/TPAMI.2023.3282631","journal-title":"IEEE Trans Pattern Anal Machine Intell"},{"key":"5743_CR14","doi-asserted-by":"publisher","unstructured":"Wang W, Xie E, Li X, Fan D, Song K, Liang D, Lu T, Luo P, Shao L (2021) Pyramid vision transformer: A versatile backbone for dense prediction without convolutions. In: IEEE\/CVF International conference on computer vision (ICCV). IEEE, pp 568\u2013578. https:\/\/doi.org\/10.1109\/ICCV48922.2021.00061","DOI":"10.1109\/ICCV48922.2021.00061"},{"key":"5743_CR15","doi-asserted-by":"publisher","unstructured":"Ha Q, Watanabe K, Karasawa T, Ushiku Y, Harada T (2017) Mfnet: Towards real-time semantic segmentation for autonomous vehicles with multi-spectral scenes. In: 2017 IEEE\/RSJ International conference on intelligent robots and systems (IROS), IEEE, pp. 5108\u20135115. https:\/\/doi.org\/10.1109\/IROS.2017.8206396","DOI":"10.1109\/IROS.2017.8206396"},{"issue":"3","key":"5743_CR16","doi-asserted-by":"publisher","first-page":"2576","DOI":"10.1109\/LRA.2019.2904733","volume":"4","author":"Y Sun","year":"2019","unstructured":"Sun Y, Zuo W, Liu M (2019) Rtfnet: Rgb-thermal fusion network for semantic segmentation of urban scenes. IEEE Robot Autom Let 4(3):2576\u20132583. https:\/\/doi.org\/10.1109\/LRA.2019.2904733","journal-title":"IEEE Robot Autom Let"},{"key":"5743_CR17","doi-asserted-by":"publisher","unstructured":"Liu J, Liu Z, Wu G, Ma L, Liu R, Zhong W, Luo Z, Fan X (2023) Multi-interactive feature learning and a full-time multi-modality benchmark for image fusion and segmentation. In: 2023 IEEE\/CVF International conference on computer vision (ICCV). IEEE, pp 8115-8124. https:\/\/doi.org\/10.1109\/ICCV51070.2023.00745","DOI":"10.1109\/ICCV51070.2023.00745"},{"issue":"3","key":"5743_CR18","doi-asserted-by":"publisher","first-page":"1000","DOI":"10.1109\/TASE.2020.2993143","volume":"18","author":"Y Sun","year":"2020","unstructured":"Sun Y, Zuo W, Yun P, Wang H, Liu M (2020) Fuseseg: Semantic segmentation of urban scenes based on rgb and thermal data fusion. IEEE Trans Autom Sci Eng 18(3):1000\u20131011. https:\/\/doi.org\/10.1109\/TASE.2020.2993143","journal-title":"IEEE Trans Autom Sci Eng"},{"key":"5743_CR19","doi-asserted-by":"publisher","first-page":"111294","DOI":"10.1016\/j.knosys.2023.111294","volume":"284","author":"M Ye","year":"2024","unstructured":"Ye M, Yan X, Jiang D, Xiang L, Chen N (2024) MIFDELN: A multi-sensor information fusion deep ensemble learning network for diagnosing bearing faults in noisy scenarios. Knowl Based Syst 284:111294. https:\/\/doi.org\/10.1016\/j.knosys.2023.111294","journal-title":"Knowl Based Syst"},{"key":"5743_CR20","doi-asserted-by":"publisher","first-page":"110664","DOI":"10.1016\/j.ymssp.2023.110664","volume":"202","author":"X Yan","year":"2023","unstructured":"Yan X, Yan WJ, Xu Y, Yuen K (2023) Machinery multi-sensor fault diagnosis based on adaptive multivariate feature mode decomposition and multi-attention fusion residual convolutional neural network. Mech Syst Signal Pr 202:110664. https:\/\/doi.org\/10.1016\/j.ymssp.2023.110664","journal-title":"Mech Syst Signal Pr"},{"key":"5743_CR21","doi-asserted-by":"publisher","unstructured":"Shivakumar S, Rodrigues N, Zhou A, Miller D, Kumar V, Taylor J (2020) Pst900: Rgb-thermal calibration, dataset and segmentation network. In: 2020 IEEE international conference on robotics and automation (ICRA). IEEE, pp 9441\u20139447. https:\/\/doi.org\/10.1109\/ICRA40945.2020.9196831","DOI":"10.1109\/ICRA40945.2020.9196831"},{"issue":"7","key":"5743_CR22","doi-asserted-by":"publisher","first-page":"4060","DOI":"10.1109\/LRA.2023.3272269","volume":"8","author":"M Liang","year":"2023","unstructured":"Liang M, Hu J, Bao C, Feng H, Deng F, Lam T (2023) Explicit attention-enhanced fusion for rgb-thermal perception tasks. IEEE Robot Autom Let 8(7):4060\u20134067. https:\/\/doi.org\/10.1109\/LRA.2023.3272269","journal-title":"IEEE Robot Autom Let"},{"key":"5743_CR23","doi-asserted-by":"publisher","unstructured":"Xiao Y, Yang M, Li C, Liu L, Tang J (2022) Attribute-based progressive fusion network for rgbt tracking. In: 2022 AAAI conference on artificial intelligence (AAAI). AAAI, vol 36, pp 2831\u20132838. https:\/\/doi.org\/10.1609\/aaai.v36i3.20187","DOI":"10.1609\/aaai.v36i3.20187"},{"key":"5743_CR24","doi-asserted-by":"publisher","unstructured":"Shen Z, Wang J, Pan Z, Wang J, Li Y (2022) Ctfusion: Convolutions integrate with transformers for multi-modal image fusion. In: 2022 Chinese conference on pattern recognition and computer vision (PRCV). Springer, pp 488\u2013498. https:\/\/doi.org\/10.1007\/978-3-031-18907-4_38","DOI":"10.1007\/978-3-031-18907-4_38"},{"key":"5743_CR25","doi-asserted-by":"publisher","first-page":"104579","DOI":"10.1016\/j.dsp.2024.104579","volume":"151","author":"Z Shen","year":"2024","unstructured":"Shen Z, Wang J, Weng Y, Pan Z, Li Y, Wang J (2024) ECFNet: Efficient Cross-layer Fusion Network for Real Time RGB-Thermal Urban Scene Parsing. Digit Signal Process 151:104579. https:\/\/doi.org\/10.1016\/j.dsp.2024.104579","journal-title":"Digit Signal Process"},{"key":"5743_CR26","doi-asserted-by":"publisher","first-page":"7790","DOI":"10.1109\/TIP.2021.3109518","volume":"30","author":"W Zhou","year":"2021","unstructured":"Zhou W, Liu J, Lei J, Yu L, Hwang J (2021) Gmnet: Graded-feature multilabel-learning network for rgb-thermal urban scene semantic segmentation. IEEE Trans Image Process 30:7790\u20137802. https:\/\/doi.org\/10.1109\/TIP.2021.3109518","journal-title":"IEEE Trans Image Process"},{"key":"5743_CR27","doi-asserted-by":"publisher","unstructured":"Zhang Q, Zhao S, Luo Y, Zhang D, Huang N, Han J (2021) Abmdrnet: Adaptive-weighted bi-directional modality difference reduction network for rgb-t semantic segmentation. In: 2021 IEEE\/CVF Conference on computer vision and pattern recognition (CVPR). IEEE, pp 2633\u20132642. https:\/\/doi.org\/10.1109\/CVPR46437.2021.00266","DOI":"10.1109\/CVPR46437.2021.00266"},{"issue":"12","key":"5743_CR28","doi-asserted-by":"publisher","first-page":"14679","DOI":"10.1109\/TITS.2023.3300537","volume":"24","author":"J Zhang","year":"2023","unstructured":"Zhang J, Liu H, Yang K, Hu X, Liu R, Stiefelhagen R (2023) Cmx: Cross-modal fusion for rgb-x semantic segmentation with transformers. IEEE Trans Intell Transp Syst 24(12):14679\u201314694. https:\/\/doi.org\/10.1109\/TITS.2023.3300537","journal-title":"IEEE Trans Intell Transp Syst"},{"issue":"3","key":"5743_CR29","doi-asserted-by":"publisher","first-page":"1223","DOI":"10.1109\/TCSVT.2022.3208833","volume":"33","author":"G Li","year":"2022","unstructured":"Li G, Wang Y, Liu Z, Zhang X, Zeng D (2022) Rgb-t semantic segmentation with location, activation, and sharpening. IEEE Trans Circuits Syst Video Technol 33(3):1223\u20131235. https:\/\/doi.org\/10.1109\/TCSVT.2022.3208833","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"issue":"12","key":"5743_CR30","doi-asserted-by":"publisher","first-page":"7737","DOI":"10.1109\/TCSVT.2023.3281419","volume":"33","author":"Y Wang","year":"2023","unstructured":"Wang Y, Li G, Liu Z (2023) Sgfnet: Semantic-guided fusion network for rgb-thermal semantic segmentation. IEEE Trans Circuits Syst Video Technol 33(12):7737\u20137748. https:\/\/doi.org\/10.1109\/TCSVT.2023.3281419","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"issue":"5","key":"5743_CR31","doi-asserted-by":"publisher","first-page":"7665","DOI":"10.1109\/TII.2024.3359454","volume":"20","author":"N Zeng","year":"2024","unstructured":"Zeng N, Wu P, Zhang Y, Li H, Mao J, Wang Z (2024) DPMSN: A Dual-Pathway Multiscale Network for Image Forgery Detection. IEEE Trans Ind Inform 20(5):7665\u20137674. https:\/\/doi.org\/10.1109\/TII.2024.3359454","journal-title":"IEEE Trans Ind Inform"},{"issue":"3","key":"5743_CR32","doi-asserted-by":"publisher","first-page":"3448","DOI":"10.1109\/TITS.2022.3228042","volume":"24","author":"H Pan","year":"2022","unstructured":"Pan H, Hong Y, Sun W, Jia Y (2022) Deep dual-resolution networks for real-time and accurate semantic segmentation of traffic scenes. IEEE Trans Intell Transp Syst 24(3):3448\u20133460. https:\/\/doi.org\/10.1109\/TITS.2022.3228042","journal-title":"IEEE Trans Intell Transp Syst"},{"issue":"1","key":"5743_CR33","doi-asserted-by":"publisher","first-page":"1346","DOI":"10.1109\/TIV.2023.3332594","volume":"9","author":"Z Dou","year":"2023","unstructured":"Dou Z, Ye D (2023) Multi-objective Neural Architecture Search for Efficient and Fast Semantic Segmentation on Edge. IEEE Trans Intell Veh 9(1):1346\u20131357. https:\/\/doi.org\/10.1109\/TIV.2023.3332594","journal-title":"IEEE Trans Intell Veh"},{"key":"5743_CR34","doi-asserted-by":"publisher","unstructured":"Xiao A, Shen B, Tian J, Hu Z (2023) PP-NAS: Searching for Plug-and-Play Blocks on Convolutional Neural Networks. IEEE Trans Neur Net Lear Syst, 1\u201313. https:\/\/doi.org\/10.1109\/TNNLS.2023.3264551","DOI":"10.1109\/TNNLS.2023.3264551"},{"key":"5743_CR35","doi-asserted-by":"publisher","first-page":"111466","DOI":"10.1016\/j.knosys.2024.111466","volume":"288","author":"L Hu","year":"2024","unstructured":"Hu L, Wang Z, Li H, Wu P, Mao J, Zeng N (2024) $$\\ell $$-DARTS: Light-weight differentiable architecture search with robustness enhancement strategy. Knowl Based Syst 288:111466. https:\/\/doi.org\/10.1016\/j.knosys.2024.111466","journal-title":"Knowl Based Syst"},{"issue":"1","key":"5743_CR36","doi-asserted-by":"publisher","first-page":"1547","DOI":"10.1109\/TIV.2023.3325343","volume":"9","author":"S Qiu","year":"2023","unstructured":"Qiu S, Cheng X, Lu H, Zhang H, Wan R, Xue X, Pu J (2023) Subclassified loss: Rethinking data imbalance from subclass perspective for semantic segmentation. IEEE Trans Intell Veh 9(1):1547\u20131558. https:\/\/doi.org\/10.1109\/TIV.2023.3325343","journal-title":"IEEE Trans Intell Veh"},{"key":"5743_CR37","doi-asserted-by":"publisher","unstructured":"Yang K, Yu Z, Chen W, Liang Z, Chen C (2024) Solving the Imbalanced Problem by Metric Learning and Oversampling. IEEE Trans Knowl Data Eng, 1-14. https:\/\/doi.org\/10.1109\/TKDE.2024.3419834","DOI":"10.1109\/TKDE.2024.3419834"},{"key":"5743_CR38","doi-asserted-by":"publisher","unstructured":"Li G, Yu Z, Yang K, Lin M, Chen C (2024) Exploring Feature Selection With Limited Labels: A Comprehensive Survey of Semi-Supervised and Unsupervised Approaches. IEEE Trans Knowl Data Eng, 1-20. https:\/\/doi.org\/10.1109\/TKDE.2024.3397878","DOI":"10.1109\/TKDE.2024.3397878"},{"issue":"6","key":"5743_CR39","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s10462-024-10759-6","volume":"57","author":"W Chen","year":"2024","unstructured":"Chen W, Yang K, Yu Z, Shi Y, Chen C (2024) A survey on imbalanced learning: latest research, applications and future directions. Artif Intell Rev 57(6):1\u201351. https:\/\/doi.org\/10.1007\/s10462-024-10759-6","journal-title":"Artif Intell Rev"},{"key":"5743_CR40","doi-asserted-by":"publisher","unstructured":"Zheng S, Lu J, Zhao H, Zhu X, Luo Z, Wang Y, Fu Y, Feng J, Xiang T, Torr H, et al (2021) Rethinking semantic\u00a0segmentation from a sequence-to-sequence perspective with transformers. In: 2021 IEEE\/CVF Conference on computer vision and pattern recognition (CVPR). IEEE, pp 6881\u20136890. https:\/\/doi.org\/10.1109\/CVPR46437.2021.00681","DOI":"10.1109\/CVPR46437.2021.00681"},{"key":"5743_CR41","doi-asserted-by":"publisher","unstructured":"Cheng B, Schwing A, Kirillov A (2021) Per-pixel classification is not all you need for semantic segmentation. In: 2021 Advances in Neural Information Processing Systems (NeurIPS). MIT Press, vol 22, pp 17864-17875. https:\/\/doi.org\/10.48550\/arXiv.2107.06278","DOI":"10.48550\/arXiv.2107.06278"},{"issue":"11","key":"5743_CR42","doi-asserted-by":"publisher","first-page":"12760","DOI":"10.1109\/TPAMI.2022.3202765","volume":"45","author":"H Wu","year":"2022","unstructured":"Wu H, Liu Y, Zhan X, Cheng M (2022) P2t: Pyramid pooling transformer for scene understanding. IEEE Trans Pattern Anal Machine Intell 45(11):12760\u201312771. https:\/\/doi.org\/10.1109\/TPAMI.2022.3202765","journal-title":"IEEE Trans Pattern Anal Machine Intell"},{"key":"5743_CR43","doi-asserted-by":"publisher","unstructured":"Jin Z, Hu X, Zhu L, Song L, Yuan L, Yu L (2024) IDRNet: Intervention-driven relation network for semantic segmentation. In: 2024 Advances in Neural Information Processing Systems (NeurIPS). MIT Press, vol 36. https:\/\/doi.org\/10.48550\/arXiv.2310.10755","DOI":"10.48550\/arXiv.2310.10755"},{"key":"5743_CR44","doi-asserted-by":"publisher","unstructured":"Deng F, Feng H, Liang M, Wang H, Yang Y, Gao Y, Chen J, Hu J, Guo X, Lam L (2021) Feanet: Feature-enhanced attention network for rgb-thermal real-time semantic segmentation. In: 2021 IEEE\/RSJ International conference on intelligent robots and systems (IROS). IEEE, pp 4467\u20134473. https:\/\/doi.org\/10.1109\/IROS51168.2021.9636084","DOI":"10.1109\/IROS51168.2021.9636084"},{"issue":"12","key":"5743_CR45","doi-asserted-by":"publisher","first-page":"7096","DOI":"10.1109\/TCSVT.2023.3275314","volume":"33","author":"W Zhou","year":"2023","unstructured":"Zhou W, Zhang H, Yan W, Lin W (2023) Mmsmcnet: Modal memory sharing and morphological complementary networks for rgb-t urban scene semantic segmentation. IEEE Trans Circuits Syst Video Technol 33(12):7096\u20137108. https:\/\/doi.org\/10.1109\/TCSVT.2023.3275314","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"issue":"8","key":"5743_CR46","doi-asserted-by":"publisher","first-page":"2375","DOI":"10.1007\/s11263-021-01465-9","volume":"129","author":"Y Yuan","year":"2021","unstructured":"Yuan Y, Huang L, Guo J, Zhang C, Chen X, Wang J (2021) Ocnet: Object context for semantic segmentation. Int J Comput Vision 129(8):2375\u20132398. https:\/\/doi.org\/10.1007\/s11263-021-01465-9","journal-title":"Int J Comput Vision"},{"key":"5743_CR47","doi-asserted-by":"publisher","unstructured":"Chen X, Lin Y, Wang J, Wu W, Qian C, Li H, Zeng G (2020) Bi-directional cross-modality feature propagation with separation-and-aggregation gate for rgb-d semantic segmentation. In: European Conference on Computer Vision (ECCV). Springer, pp 561\u2013577. https:\/\/doi.org\/10.1007\/978-3-030-58621-8_33","DOI":"10.1007\/978-3-030-58621-8_33"},{"key":"5743_CR48","doi-asserted-by":"publisher","unstructured":"Hu X, Yang K, Fei L, Wang K (2019 Acnet: Attention based network to exploit complementary features for rgbd semantic segmentation. In: 2019 IEEE International conference on image processing (ICIP). IEEE, pp 1440\u20131444. https:\/\/doi.org\/10.1109\/ICIP.2019.8803025","DOI":"10.1109\/ICIP.2019.8803025"},{"key":"5743_CR49","doi-asserted-by":"publisher","first-page":"179","DOI":"10.1016\/j.patrec.2021.03.015","volume":"146","author":"J Xu","year":"2021","unstructured":"Xu J, Lu K, Wang H (2021) Attention fusion network for multi-spectral semantic segmentation. Pattern Recognit Lett 146:179\u2013184. https:\/\/doi.org\/10.1016\/j.patrec.2021.03.015","journal-title":"Pattern Recognit Lett"},{"issue":"5","key":"5743_CR50","doi-asserted-by":"publisher","first-page":"5817","DOI":"10.1007\/s10489-021-02687-7","volume":"52","author":"X Lan","year":"2022","unstructured":"Lan X, Gu X, Gu X (2022) Mmnet: Multi-modal multi-stage network for rgb-t image semantic segmentation. Appl Intell 52(5):5817\u20135829. https:\/\/doi.org\/10.1007\/s10489-021-02687-7","journal-title":"Appl Intell"},{"key":"5743_CR51","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1109\/TIM.2023.3267529","volume":"72","author":"X He","year":"2023","unstructured":"He X, Wang M, Liu T, Zhao L, Yue Y (2023) Sfaf-ma: Spatial feature aggregation and fusion with modality adaptation for rgb-thermal semantic segmentation. IEEE Trans Instrum Meas 72:1\u201310. https:\/\/doi.org\/10.1109\/TIM.2023.3267529","journal-title":"IEEE Trans Instrum Meas"},{"key":"5743_CR52","doi-asserted-by":"publisher","unstructured":"Frigo O, Martin-Gaffe L, Wacongne C (2022) Doodlenet: Double deeplab enhanced feature fusion for thermal-color semantic segmentation. In: IEEE\/CVF Conference on computer vision and pattern recognition workshops (CVPRW). IEEE, pp 3021\u20133029. https:\/\/doi.org\/10.1109\/CVPRW56347.2022.00341","DOI":"10.1109\/CVPRW56347.2022.00341"},{"key":"5743_CR53","doi-asserted-by":"publisher","unstructured":"Zhao S, Liu Y, Jiao Q, Zhang Q, Han J (2023) Mitigating modality discrepancies for rgb-t semantic segmentation. IEEE Trans Neur Net Lear Syst, 1-15. https:\/\/doi.org\/10.1109\/TNNLS.2022.3233089","DOI":"10.1109\/TNNLS.2022.3233089"},{"key":"5743_CR54","doi-asserted-by":"publisher","unstructured":"Liu J, He J, Zhang J, Ren S, Li H (2020) Efficientfcn: Holistically-guided decoding for semantic segmentation. In: European conference on computer vision (ECCV). Springer, pp 1\u201317. https:\/\/doi.org\/10.1007\/978-3-030-58574-7_1","DOI":"10.1007\/978-3-030-58574-7_1"},{"issue":"6","key":"5743_CR55","doi-asserted-by":"publisher","first-page":"6896","DOI":"10.1109\/TPAMI.2020.3007032","volume":"45","author":"Z Huang","year":"2019","unstructured":"Huang Z, Wang X, Huang L, Huang C, Wei Y, Liu W (2019) Ccnet: Criss-cross attention for semantic segmentation. IEEE Trans Pattern Anal Machine Intell 45(6):6896\u20136908. https:\/\/doi.org\/10.1109\/TPAMI.2020.3007032","journal-title":"IEEE Trans Pattern Anal Machine Intell"},{"key":"5743_CR56","doi-asserted-by":"publisher","unstructured":"Zhou W, Dong S, Xu C, Qian Y, (2022) Edge-aware guidance fusion network for rgb-thermal scene parsing. In. (2022) AAAI conference on artificial intelligence (AAAI). AAAI vol 36, no 3, pp 3571\u20133579. https:\/\/doi.org\/10.1609\/aaai.v36i3.20269","DOI":"10.1609\/aaai.v36i3.20269"}],"container-title":["Applied Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-024-05743-0.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10489-024-05743-0\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-024-05743-0.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,9,18]],"date-time":"2024-09-18T15:23:36Z","timestamp":1726673016000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10489-024-05743-0"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,8,14]]},"references-count":56,"journal-issue":{"issue":"22","published-print":{"date-parts":[[2024,11]]}},"alternative-id":["5743"],"URL":"https:\/\/doi.org\/10.1007\/s10489-024-05743-0","relation":{},"ISSN":["0924-669X","1573-7497"],"issn-type":[{"value":"0924-669X","type":"print"},{"value":"1573-7497","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024,8,14]]},"assertion":[{"value":"4 August 2024","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"14 August 2024","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Competing Interests"}},{"value":"The article was submitted with the consent of all the authors to participate.","order":3,"name":"Ethics","group":{"name":"EthicsHeading","label":"Ethical standard"}},{"value":"The article was submitted with the consent of all the authors and institutions for publication.","order":4,"name":"Ethics","group":{"name":"EthicsHeading","label":"Consent for publication"}},{"value":"The data used in this paper are all from public datasets.","order":5,"name":"Ethics","group":{"name":"EthicsHeading","label":"Ethical and informed consent for data used"}}]}}