{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,7,9]],"date-time":"2026-07-09T14:08:07Z","timestamp":1783606087895,"version":"3.55.0"},"reference-count":60,"publisher":"Springer Science and Business Media LLC","issue":"4","license":[{"start":{"date-parts":[[2025,8,1]],"date-time":"2025-08-01T00:00:00Z","timestamp":1754006400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,8,1]],"date-time":"2025-08-01T00:00:00Z","timestamp":1754006400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"crossref","award":["62171043"],"award-info":[{"award-number":["62171043"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"crossref"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"crossref","award":["62171043"],"award-info":[{"award-number":["62171043"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"crossref"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"crossref","award":["62171043"],"award-info":[{"award-number":["62171043"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"crossref"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"crossref","award":["62171043"],"award-info":[{"award-number":["62171043"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"crossref"}]},{"name":"Beijing Natural Science Foundation","award":["4232025"],"award-info":[{"award-number":["4232025"]}]},{"name":"Beijing Natural Science Foundation","award":["4232025"],"award-info":[{"award-number":["4232025"]}]},{"name":"Beijing Natural Science Foundation","award":["4232025"],"award-info":[{"award-number":["4232025"]}]},{"name":"Beijing Natural Science Foundation","award":["4232025"],"award-info":[{"award-number":["4232025"]}]},{"name":"R&D Program of Beijing Municipal Education Commission","award":["KM202311232003"],"award-info":[{"award-number":["KM202311232003"]}]},{"name":"R&D Program of Beijing Municipal Education Commission","award":["KM202311232003"],"award-info":[{"award-number":["KM202311232003"]}]},{"name":"Qinghai Province Innovation Platform Construction Special Program","award":["2022-ZJ-T02"],"award-info":[{"award-number":["2022-ZJ-T02"]}]},{"name":"Qinghai Province Innovation Platform Construction Special Program","award":["2022-ZJ-T02"],"award-info":[{"award-number":["2022-ZJ-T02"]}]},{"name":"Qinghai Province Innovation Platform Construction Special Program","award":["2022-ZJ-T02"],"award-info":[{"award-number":["2022-ZJ-T02"]}]},{"name":"Qinghai Province Innovation Platform Construction Special Program","award":["2022-ZJ-T02"],"award-info":[{"award-number":["2022-ZJ-T02"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimedia Systems"],"published-print":{"date-parts":[[2025,8]]},"DOI":"10.1007\/s00530-025-01941-z","type":"journal-article","created":{"date-parts":[[2025,8,11]],"date-time":"2025-08-11T10:02:34Z","timestamp":1754906554000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":2,"title":["Multi-modal semi-supervised semantic segmentation for indoor scenes via adaptive CutMix and contrastive learning"],"prefix":"10.1007","volume":"31","author":[{"given":"Xueqiang","family":"Lyu","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Zihe","family":"Tian","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Xingqiang","family":"Zhao","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jing","family":"Han","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Zangtai","family":"Cai","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Yuzhong","family":"Chen","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2025,8,11]]},"reference":[{"key":"1941_CR1","doi-asserted-by":"publisher","first-page":"4070","DOI":"10.1109\/CVPR52733.2024.00390","volume":"2024","author":"H Chi","year":"2024","unstructured":"Chi, H., Pang, J., Zhang, B., Liu, W.: Adaptive bidirectional displacement for semi-supervised medical image segmentation, in. IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2024, 4070\u20134080 (2024). https:\/\/doi.org\/10.1109\/CVPR52733.2024.00390","journal-title":"IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR)"},{"key":"1941_CR2","doi-asserted-by":"crossref","unstructured":"Wang, Y., Chen, X., Cao, L., Huang, W., Sun, F., Wang, Y.: Multimodal token fusion for vision transformers, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, (2022), pp. 12186\u201312195","DOI":"10.1109\/CVPR52688.2022.01187"},{"key":"1941_CR3","doi-asserted-by":"publisher","first-page":"59","DOI":"10.1007\/s00138-024-01540-4","volume":"35","author":"H Yin","year":"2024","unstructured":"Yin, H., Yin, G., Sun, Y., Zhang, L., Tian, Y.: Robust semantic segmentation method of urban scenes in snowy environment. Mach. Vis. Appl. 35, 59 (2024)","journal-title":"Mach. Vis. Appl."},{"key":"1941_CR4","doi-asserted-by":"publisher","first-page":"8082","DOI":"10.1109\/TPAMI.2021.3083269","volume":"44","author":"B Zhang","year":"2022","unstructured":"Zhang, B., Xiao, J., Jiao, J., Wei, Y., Zhao, Y.: Affinity attention graph neural network for weakly supervised semantic segmentation. IEEE Trans. Pattern Anal. Mach. Intell. 44, 8082\u20138096 (2022). https:\/\/doi.org\/10.1109\/TPAMI.2021.3083269","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"1941_CR5","doi-asserted-by":"publisher","first-page":"1892","DOI":"10.1007\/s11263-023-01796-9","volume":"131","author":"B Zhang","year":"2023","unstructured":"Zhang, B., Xiao, J., Wei, Y., Zhao, Y.: Credible dual-expert learning for weakly supervised semantic segmentation. Int. J. Comput. Vision 131, 1892\u20131908 (2023)","journal-title":"Int. J. Comput. Vision"},{"key":"1941_CR6","doi-asserted-by":"publisher","first-page":"4198","DOI":"10.1109\/TPAMI.2025.3543191","volume":"47","author":"B Zhang","year":"2025","unstructured":"Zhang, B., Yu, S., Xiao, J., Wei, Y., Zhao, Y.: Frozen clip-dino: a strong backbone for weakly supervised semantic segmentation. IEEE Trans. Pattern Anal. Mach. Intell. 47, 4198\u20134214 (2025). https:\/\/doi.org\/10.1109\/TPAMI.2025.3543191","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"1941_CR7","doi-asserted-by":"crossref","unstructured":"Chen, X., Yuan, Y., Zeng, G., Wang, J.: Semi-supervised semantic segmentation with cross pseudo supervision, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 2613\u20132622 (2021)","DOI":"10.1109\/CVPR46437.2021.00264"},{"key":"1941_CR8","doi-asserted-by":"crossref","unstructured":"Wang, Y., Wang, H., Shen, Y., Fei, J., Li, W., Jin, G., Wu, L., Zhao, R., Le, X.: Semi-supervised semantic segmentation using unreliable pseudo-labels, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 4248\u20134257, (2022)","DOI":"10.1109\/CVPR52688.2022.00421"},{"key":"1941_CR9","doi-asserted-by":"crossref","unstructured":"Maheshwari, H., Liu, Y.-C., Kira, Z.: Missing modality robustness in semi-supervised multi-modal semantic segmentation, in: Proceedings of the IEEE\/CVF Winter Conference on Applications of Computer Vision, pp. 1020\u20131030, (2024)","DOI":"10.1109\/WACV57701.2024.00106"},{"key":"1941_CR10","doi-asserted-by":"crossref","unstructured":"Liu, X., Qiu, H., Li, M., Yu, Z., Yang, Y., Yan, Y.: Application of multimodal fusion deep learning model in disease recognition, arXiv preprint arXiv:2406.18546 (2024)","DOI":"10.1109\/ICSECE61636.2024.10729504"},{"key":"1941_CR11","doi-asserted-by":"crossref","unstructured":"Cao, J., Leng, H., Lischinski, D., Cohen-Or, D., Tu, C., Li, Y.: Shapeconv: shape-aware convolutional layer for indoor rgb-d semantic segmentation, in: Proceedings of the IEEE\/CVF international conference on computer vision, pp. 7088\u20137097, (2021)","DOI":"10.1109\/ICCV48922.2021.00700"},{"key":"1941_CR12","first-page":"12077","volume":"34","author":"E Xie","year":"2021","unstructured":"Xie, E., Wang, W., Yu, Z., Anandkumar, A., Alvarez, J.M., Luo, P.: Segformer: simple and efficient design for semantic segmentation with transformers. Adv. Neural. Inf. Process. Syst. 34, 12077\u201312090 (2021)","journal-title":"Adv. Neural. Inf. Process. Syst."},{"key":"1941_CR13","doi-asserted-by":"publisher","DOI":"10.1016\/j.compbiomed.2023.106585","volume":"154","author":"R Mendel","year":"2023","unstructured":"Mendel, R., Rauber, D., de Souza Jr, L.A., Papa, J.P., Palm, C.: Error-correcting mean-teacher: corrections instead of consistency-targets applied to semi-supervised medical image segmentation. Comput. Biol. Med. 154, 106585 (2023)","journal-title":"Comput. Biol. Med."},{"key":"1941_CR14","doi-asserted-by":"publisher","DOI":"10.1016\/j.ijepes.2022.108535","volume":"144","author":"X Yu","year":"2023","unstructured":"Yu, X., Gu, J., Zhang, X., Mao, J.: Gan-based semi-supervised learning method for identification of the faulty feeder in resonant grounding distribution networks. Int. J. Electr. Power Energy Syst. 144, 108535 (2023)","journal-title":"Int. J. Electr. Power Energy Syst."},{"key":"1941_CR15","doi-asserted-by":"publisher","first-page":"53","DOI":"10.1109\/MSP.2017.2765202","volume":"35","author":"A Creswell","year":"2018","unstructured":"Creswell, A., White, T., Dumoulin, V., Arulkumaran, K., Sengupta, B., Bharath, A.A.: Generative adversarial networks: an overview. IEEE Signal Process. Mag. 35, 53\u201365 (2018)","journal-title":"IEEE Signal Process. Mag."},{"key":"1941_CR16","doi-asserted-by":"crossref","unstructured":"Zhang, J., Wang, X., Wan, Y., Wang, L., Wang, J., Yu, P.\u00a0S.: Sor-tc: self-attentive octave resnet with temporal consistency for compressed video action recognition. Neurocomputing (2023)","DOI":"10.1016\/j.neucom.2023.02.045"},{"key":"1941_CR17","doi-asserted-by":"crossref","unstructured":"Yang, L., Zhuo, W., Qi, L., Shi, Y., Gao, Y.: St++: make self-training work better for semi-supervised semantic segmentation, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 4268\u20134277, (2022)","DOI":"10.1109\/CVPR52688.2022.00423"},{"key":"1941_CR18","doi-asserted-by":"crossref","unstructured":"Guan, D., Huang, J., Xiao, A., Lu, S.: Unbiased subclass regularization for semi-supervised semantic segmentation, in: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 9968\u20139978, (2022)","DOI":"10.1109\/CVPR52688.2022.00973"},{"key":"1941_CR19","first-page":"22106","volume":"34","author":"H Hu","year":"2021","unstructured":"Hu, H., Wei, F., Hu, H., Ye, Q., Cui, J., Wang, L.: Semi-supervised semantic segmentation via adaptive equalization learning. Adv. Neural. Inf. Process. Syst. 34, 22106\u201322118 (2021)","journal-title":"Adv. Neural. Inf. Process. Syst."},{"key":"1941_CR20","doi-asserted-by":"crossref","unstructured":"Mai, H., Sun, R., Zhang, T., Wu, F.: Rankmatch: exploring the better consistency regularization for semi-supervised semantic segmentation, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 3391\u20133401, (2024)","DOI":"10.1109\/CVPR52733.2024.00326"},{"key":"1941_CR21","unstructured":"Sohn, K., Berthelot, D., Li, C.-L., Zhang, Z., Carlini, N., Cubuk, E.\u00a0D., Kurakin, A., Zhang, H., Raffel, C.: Fixmatch: simplifying semi-supervised learning with consistency and confidence, ArXiv abs\/2001.07685 (2020). https:\/\/api.semanticscholar.org\/CorpusID:210839228"},{"key":"1941_CR22","doi-asserted-by":"publisher","first-page":"21662","DOI":"10.1109\/ACCESS.2024.3363628","volume":"12","author":"J Ju","year":"2024","unstructured":"Ju, J., Noh, H., Wang, Y., Choi, D.-G.: Class-wise adaptive strategy for semi supervised semantic segmentation. IEEE Access 12, 21662\u201321672 (2024). https:\/\/doi.org\/10.1109\/ACCESS.2024.3363628","journal-title":"IEEE Access"},{"key":"1941_CR23","doi-asserted-by":"publisher","unstructured":"Maheshwari, H., Liu, Y.-C., Kira, Z.: Missing modality robustness in semi-supervised multi-modal semantic segmentation, in. IEEE\/CVF Winter Conf. Appl. Comput. Vis. (WACV) 2024, 1009\u20131019 (2024). https:\/\/doi.org\/10.1109\/WACV57701.2024.00106","DOI":"10.1109\/WACV57701.2024.00106"},{"key":"1941_CR24","doi-asserted-by":"crossref","unstructured":"Wei, S., Luo, C., Luo, Y.: Mmanet: margin-aware distillation and modality-aware regularization for incomplete multimodal learning, in: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 20039\u201320049, (2023)","DOI":"10.1109\/CVPR52729.2023.01919"},{"key":"1941_CR25","doi-asserted-by":"crossref","unstructured":"Wang, X., Zhang, B., Yu, L., Xiao, J.: Hunting sparsity: density-guided contrastive learning for semi-supervised semantic segmentation, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 3114\u20133123, (2023)","DOI":"10.1109\/CVPR52729.2023.00304"},{"key":"1941_CR26","doi-asserted-by":"crossref","unstructured":"Tian, Z., Zhang, X., Zhang, P., Zhan, K.: Improving semi-supervised semantic segmentation with dual-level siamese structure network, in: Proceedings of the 31st ACM International Conference on Multimedia, pp. 4200\u20134208, (2023)","DOI":"10.1145\/3581783.3611816"},{"key":"1941_CR27","doi-asserted-by":"crossref","unstructured":"Chen, X., Lin, K.-Y., Wang, J., Wu, W., Qian, C., Li, H., Zeng, G.: Bi-directional cross-modality feature propagation with separation-and-aggregation gate for rgb-d semantic segmentation, in: European conference on computer vision, Springer, pp. 561\u2013577, (2020)","DOI":"10.1007\/978-3-030-58621-8_33"},{"key":"1941_CR28","doi-asserted-by":"crossref","unstructured":"Valada, A., Vertens, J., Dhall, A., Burgard, W.: Adapnet: adaptive semantic segmentation in adverse environmental conditions, in: 2017 IEEE International Conference on Robotics and Automation (ICRA), IEEE, pp. 4644\u20134651, (2017)","DOI":"10.1109\/ICRA.2017.7989540"},{"key":"1941_CR29","doi-asserted-by":"publisher","first-page":"84283","DOI":"10.1109\/ACCESS.2023.3296098","volume":"11","author":"LM Pereira","year":"2023","unstructured":"Pereira, L.M., Salazar, A., Vergara, L.: A comparative analysis of early and late fusion for the multimodal two-class problem. IEEE Access 11, 84283\u201384300 (2023). https:\/\/doi.org\/10.1109\/ACCESS.2023.3296098","journal-title":"IEEE Access"},{"key":"1941_CR30","doi-asserted-by":"publisher","first-page":"1115","DOI":"10.1109\/LSP.2021.3084855","volume":"28","author":"Y Yue","year":"2021","unstructured":"Yue, Y., Zhou, W., Lei, J., Yu, L.: Two-stage cascaded decoder for semantic segmentation of rgb-d images. IEEE Signal Process. Lett. 28, 1115\u20131119 (2021)","journal-title":"IEEE Signal Process. Lett."},{"key":"1941_CR31","doi-asserted-by":"crossref","unstructured":"Su, Y., Yuan, Y., Jiang, Z., Deep feature selection-and-fusion for rgb-d semantic segmentation, in,: IEEE International conference on multimedia and expo (ICME). IEEE 2021, 1\u20136 (2021)","DOI":"10.1109\/ICME51207.2021.9428155"},{"key":"1941_CR32","doi-asserted-by":"crossref","unstructured":"Xiong, Z., Yuan, Y., Guo, N., Wang, Q.: Variational context-deformable convnets for indoor scene parsing, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 3992\u20134002, (2020)","DOI":"10.1109\/CVPR42600.2020.00405"},{"key":"1941_CR33","doi-asserted-by":"publisher","first-page":"50","DOI":"10.1109\/TMM.2021.3120873","volume":"25","author":"X Lin","year":"2023","unstructured":"Lin, X., Sun, S., Huang, W., Sheng, B., Li, P., Feng, D.D.: Eapt: efficient attention pyramid transformer for image processing. IEEE Trans. Multimed. 25, 50\u201361 (2023). https:\/\/doi.org\/10.1109\/TMM.2021.3120873","journal-title":"IEEE Trans. Multimed."},{"key":"1941_CR34","doi-asserted-by":"publisher","first-page":"3647","DOI":"10.1007\/s00371-023-02938-3","volume":"39","author":"S Huang","year":"2023","unstructured":"Huang, S., Liu, X., Tan, T., Hu, M., Wei, X., Chen, T., Sheng, B.: Transmrsr: transformer-based self-distilled generative prior for brain mri super-resolution. Vis. Comput. 39, 3647\u20133659 (2023)","journal-title":"Vis. Comput."},{"key":"1941_CR35","doi-asserted-by":"publisher","first-page":"4090","DOI":"10.1109\/JBHI.2022.3173948","volume":"26","author":"G Yue","year":"2022","unstructured":"Yue, G., Han, W., Jiang, B., Zhou, T., Cong, R., Wang, T.: Boundary constraint network with cross layer feature integration for polyp segmentation. IEEE J. Biomed. Health Inform. 26, 4090\u20134099 (2022). https:\/\/doi.org\/10.1109\/JBHI.2022.3173948","journal-title":"IEEE J. Biomed. Health Inform."},{"key":"1941_CR36","doi-asserted-by":"publisher","first-page":"487","DOI":"10.1109\/TETCI.2022.3193677","volume":"7","author":"G Yue","year":"2023","unstructured":"Yue, G., Li, S., Zhou, T., Wang, M., Du, J., Jiang, Q., Gao, W., Wang, T., Lv, J.: Adaptive context exploration network for polyp segmentation in colonoscopy images. IEEE Trans. Emerg. Topics Comput. Intell. 7, 487\u2013499 (2023). https:\/\/doi.org\/10.1109\/TETCI.2022.3193677","journal-title":"IEEE Trans. Emerg. Topics Comput. Intell."},{"key":"1941_CR37","doi-asserted-by":"publisher","first-page":"2461","DOI":"10.1109\/JBHI.2020.2981526","volume":"24","author":"R Wang","year":"2020","unstructured":"Wang, R., Fan, J., Li, Y.: Deep multi-scale fusion neural network for multi-class arrhythmia detection. IEEE J. Biomed. Health Inform. 24, 2461\u20132472 (2020). https:\/\/doi.org\/10.1109\/JBHI.2020.2981526","journal-title":"IEEE J. Biomed. Health Inform."},{"key":"1941_CR38","doi-asserted-by":"publisher","first-page":"5134","DOI":"10.1109\/TIP.2022.3193288","volume":"31","author":"W Tang","year":"2022","unstructured":"Tang, W., He, F., Liu, Y., Duan, Y.: Matr: Multimodal medical image fusion via multiscale adaptive transformer. IEEE Trans. Image Process. 31, 5134\u20135149 (2022). https:\/\/doi.org\/10.1109\/TIP.2022.3193288","journal-title":"IEEE Trans. Image Process."},{"key":"1941_CR39","doi-asserted-by":"publisher","first-page":"3286","DOI":"10.1109\/TCSVT.2023.3318672","volume":"34","author":"G Yue","year":"2024","unstructured":"Yue, G., Xiao, H., Xie, H., Zhou, T., Zhou, W., Yan, W., Zhao, B., Wang, T., Jiang, Q.: Dual-constraint coarse-to-fine network for camouflaged object detection. IEEE Trans. Circuits Syst. Video Technol. 34, 3286\u20133298 (2024). https:\/\/doi.org\/10.1109\/TCSVT.2023.3318672","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"1941_CR40","doi-asserted-by":"publisher","first-page":"432","DOI":"10.1016\/j.vrih.2022.08.007","volume":"4","author":"Y Zhao","year":"2022","unstructured":"Zhao, Y., Zhang, H., Lu, P., Li, P., Wu, E., Sheng, B.: Dsd-matchingnet: deformable sparse-to-dense feature matching for learning accurate correspondences. Virtual Real. Intell. Hardw. 4, 432\u2013443 (2022)","journal-title":"Virtual Real. Intell. Hardw."},{"key":"1941_CR41","doi-asserted-by":"publisher","first-page":"4499","DOI":"10.1109\/TNNLS.2021.3116209","volume":"34","author":"Z Xie","year":"2023","unstructured":"Xie, Z., Zhang, W., Sheng, B., Li, P., Chen, C.L.P.: Bagfn: broad attentive graph fusion network for high-order feature interactions. IEEE Trans. Neural Netw. Learn. Syst. 34, 4499\u20134513 (2023). https:\/\/doi.org\/10.1109\/TNNLS.2021.3116209","journal-title":"IEEE Trans. Neural Netw. Learn. Syst."},{"key":"1941_CR42","doi-asserted-by":"publisher","DOI":"10.1016\/j.ipm.2023.103264","volume":"60","author":"Q Zhao","year":"2023","unstructured":"Zhao, Q., Gao, T., Guo, N.: Tsvfn: two-stage visual fusion network for multimodal relation extraction. Inf. Process. Manag. 60, 103264 (2023)","journal-title":"Inf. Process. Manag."},{"key":"1941_CR43","doi-asserted-by":"publisher","first-page":"1369","DOI":"10.1109\/TPAMI.2019.2960224","volume":"43","author":"S Mittal","year":"2019","unstructured":"Mittal, S., Tatarchenko, M., Brox, T.: Semi-supervised semantic segmentation with high-and low-level consistency. IEEE Trans. Pattern Anal. Mach. Intell. 43, 1369\u20131379 (2019)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"1941_CR44","doi-asserted-by":"crossref","unstructured":"Lu, S., Zhang, Z., Yan, Z., Wang, Y., Cheng, T., Zhou, R., Yang, G.: Mutually aided uncertainty incorporated dual consistency regularization with pseudo label for semi-supervised medical image segmentation. Neurocomputing 548 (2023)","DOI":"10.1016\/j.neucom.2023.126411"},{"key":"1941_CR45","doi-asserted-by":"crossref","unstructured":"Kwon, D., Kwak, S.: Semi-supervised semantic segmentation with error localization network, in: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 9957\u20139967, (2022)","DOI":"10.1109\/CVPR52688.2022.00972"},{"key":"1941_CR46","unstructured":"Wang, J., Massiceti, D., Hu, X., Pavlovic, V., Lukasiewicz, T.: Np-semiseg: when neural processes meet semi-supervised semantic segmentation, in: International Conference on Machine Learning, PMLR, pp. 36138\u201336156, (2023)"},{"key":"1941_CR47","doi-asserted-by":"crossref","unstructured":"Hoyer, L., Tan, D.\u00a0J., Naeem, M.\u00a0F., Van\u00a0Gool, L., Tombari, F.: Semivl: semi-supervised semantic segmentation with vision-language guidance, arXiv preprint arXiv:2311.16241 (2023)","DOI":"10.1007\/978-3-031-72933-1_15"},{"key":"1941_CR48","doi-asserted-by":"crossref","unstructured":"Yang, L., Qi, L., Feng, L., Zhang, W., Shi, Y.: Revisiting weak-to-strong consistency in semi-supervised semantic segmentation, in: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 7236\u20137246, (2023)","DOI":"10.1109\/CVPR52729.2023.00699"},{"key":"1941_CR49","doi-asserted-by":"crossref","unstructured":"Yun, S., Han, D., Oh, S.\u00a0J., Chun, S., Choe, J., Yoo, Y.: Cutmix: regularization strategy to train strong classifiers with localizable features, in: Proceedings of the IEEE\/CVF international conference on computer vision, pp. 6023\u20136032, (2019)","DOI":"10.1109\/ICCV.2019.00612"},{"key":"1941_CR50","doi-asserted-by":"crossref","unstructured":"Ghiasi, G., Cui, Y., Srinivas, A., Qian, R., Lin, T.-Y., Cubuk, E.\u00a0D., Le, Q.\u00a0V., Zoph, B.: Simple copy-paste is a strong data augmentation method for instance segmentation, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 2918\u20132928, (2021)","DOI":"10.1109\/CVPR46437.2021.00294"},{"key":"1941_CR51","doi-asserted-by":"crossref","unstructured":"Zhao, Z., Yang, L., Long, S., Pi, J., Zhou, L., Wang, J.: Augmentation matters: a simple-yet-effective approach to semi-supervised semantic segmentation, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 11350\u201311359, (2023)","DOI":"10.1109\/CVPR52729.2023.01092"},{"key":"1941_CR52","unstructured":"Wang, Y., Chen, H., Heng, Q., Hou, W., Fan, Y., Wu, Z., Wang, J., Savvides, M., Shinozaki, T., Raj, B.: et\u00a0al., Freematch: self-adaptive thresholding for semi-supervised learning, arXiv preprint arXiv:2205.07246 (2022)"},{"key":"1941_CR53","doi-asserted-by":"crossref","unstructured":"Sun, B., Yang, Y., Zhang, L., Cheng, M.-M., Hou, Q.: Corrmatch: label propagation via correlation matching for semi-supervised semantic segmentation, in: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 3097\u20133107, (2024)","DOI":"10.1109\/CVPR52733.2024.00299"},{"key":"1941_CR54","doi-asserted-by":"crossref","unstructured":"Silberman, N., Hoiem, D., Kohli, P., Fergus, R.: Indoor segmentation and support inference from rgbd images. COMPUTER VISION - ECCV 2012. PT V 7576, 746\u2013760 (2012)","DOI":"10.1007\/978-3-642-33715-4_54"},{"key":"1941_CR55","doi-asserted-by":"crossref","unstructured":"Song, S., Lichtenberg, S.\u00a0P., Xiao, J.: Sun rgb-d: A rgb-d scene understanding benchmark suite, in: IEEE Conference on Computer Vision & Pattern Recognition, pp. 567\u2013576, (2015)","DOI":"10.1109\/CVPR.2015.7298655"},{"key":"1941_CR56","doi-asserted-by":"crossref","unstructured":"Liu, Y., Tian, Y., Chen, Y., Liu, F., Belagiannis, V., Carneiro, G.: Perturbed and strict mean teachers for semi-supervised semantic segmentation, in: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp. 4258\u20134267, (2022)","DOI":"10.1109\/CVPR52688.2022.00422"},{"key":"1941_CR57","doi-asserted-by":"publisher","first-page":"6183","DOI":"10.1109\/TIP.2023.3242819","volume":"32","author":"S Fan","year":"2023","unstructured":"Fan, S., Zhu, F., Feng, Z., Lv, Y., Song, M., Wang, F.-Y.: Conservative-progressive collaborative learning for semi-supervised semantic segmentation. IEEE Trans. Image Process. 32, 6183\u20136194 (2023)","journal-title":"IEEE Trans. Image Process."},{"key":"1941_CR58","unstructured":"Tarvainen, A., Valpola, H.: Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results. Advances in neural information processing systems 30 (2017)"},{"key":"1941_CR59","doi-asserted-by":"publisher","first-page":"4343","DOI":"10.1007\/s11263-024-02016-8","volume":"132","author":"H Xie","year":"2024","unstructured":"Xie, H., Wang, C., Zhao, J., Liu, Y., Dan, J., Fu, C., Sun, B.: Prcl: probabilistic representation contrastive learning for semi-supervised semantic segmentation. Int. J. Comput. Vision 132, 4343\u20134361 (2024)","journal-title":"Int. J. Comput. Vision"},{"key":"1941_CR60","doi-asserted-by":"crossref","unstructured":"Hu, X., Yang, K., Fei, L., Wang, K., Acnet: Attention based network to exploit complementary features for rgbd semantic segmentation, in,: IEEE international conference on image processing (ICIP). IEEE 2019, 1440\u20131444 (2019)","DOI":"10.1109\/ICIP.2019.8803025"}],"container-title":["Multimedia Systems"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-025-01941-z.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s00530-025-01941-z\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-025-01941-z.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,9,15]],"date-time":"2025-09-15T09:03:53Z","timestamp":1757927033000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s00530-025-01941-z"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,8]]},"references-count":60,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2025,8]]}},"alternative-id":["1941"],"URL":"https:\/\/doi.org\/10.1007\/s00530-025-01941-z","relation":{},"ISSN":["0942-4962","1432-1882"],"issn-type":[{"value":"0942-4962","type":"print"},{"value":"1432-1882","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025,8]]},"assertion":[{"value":"23 October 2024","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"12 July 2025","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"11 August 2025","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare no competing interests.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}],"article-number":"313"}}