{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,11]],"date-time":"2026-02-11T08:54:44Z","timestamp":1770800084298,"version":"3.50.0"},"reference-count":53,"publisher":"Springer Science and Business Media LLC","issue":"1","license":[{"start":{"date-parts":[[2025,12,4]],"date-time":"2025-12-04T00:00:00Z","timestamp":1764806400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,12,4]],"date-time":"2025-12-04T00:00:00Z","timestamp":1764806400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimedia Systems"],"published-print":{"date-parts":[[2026,2]]},"DOI":"10.1007\/s00530-025-02094-9","type":"journal-article","created":{"date-parts":[[2025,12,4]],"date-time":"2025-12-04T07:19:22Z","timestamp":1764832762000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["S-TsNet: a continuous sign language recognition network via Spatial-Temporal stage Network"],"prefix":"10.1007","volume":"32","author":[{"given":"Xu","family":"Xia","sequence":"first","affiliation":[]},{"given":"Zhenchao","family":"Cui","sequence":"additional","affiliation":[]},{"given":"Jing","family":"Qi","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2025,12,4]]},"reference":[{"key":"2094_CR1","doi-asserted-by":"crossref","unstructured":"Selvaraju, R.R., Cogswell, M., Das, A., et\u00a0al.: Grad-cam: Visual explanations from deep networks via gradient-based localization. In: Proceedings of the IEEE international conference on computer vision pp 618\u2013626 (2017)","DOI":"10.1109\/ICCV.2017.74"},{"key":"2094_CR2","doi-asserted-by":"crossref","unstructured":"Hu, H., Zhou, W., Li, H.: Hand-model-aware sign language recognition. In: Proceedings of the AAAI conference on artificial intelligence 1558\u20131566 (2021)","DOI":"10.1609\/aaai.v35i2.16247"},{"key":"2094_CR3","doi-asserted-by":"crossref","unstructured":"Tunga, A., Nuthalapati, S.V., Wachs, J.: Pose-based sign language recognition using gcn and bert. In: Proceedings of the IEEE\/CVF winter conference on applications of computer vision 31\u201340 (2021)","DOI":"10.1109\/WACVW52041.2021.00008"},{"issue":"7","key":"2094_CR4","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/3656046","volume":"20","author":"X Shen","year":"2024","unstructured":"Shen, X., Zheng, Z., Yang, Y.: Stepnet: Spatial-temporal part-aware network for isolated sign language recognition. ACM Trans. Multimed. Comput. Commun. Appl. 20(7), 1\u201319 (2024)","journal-title":"ACM Trans. Multimed. Comput. Commun. Appl."},{"key":"2094_CR5","doi-asserted-by":"crossref","unstructured":"Laines, D., Gonzalez-Mendoza, M., Ochoa-Ruiz, G., et\u00a0al.: Isolated sign language recognition based on tree structure skeleton images. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition 276\u2013284 (2023)","DOI":"10.1109\/CVPRW59228.2023.00033"},{"key":"2094_CR6","first-page":"76893","volume":"36","author":"A Desai","year":"2023","unstructured":"Desai, A., Berger, L., Minakov, F., et al.: Asl citizen: a community-sourced dataset for advancing isolated sign language recognition. Adv. Neural. Inf. Process. Syst. 36, 76893\u201376907 (2023)","journal-title":"Adv. Neural. Inf. Process. Syst."},{"issue":"17","key":"2094_CR7","doi-asserted-by":"publisher","first-page":"6452","DOI":"10.3390\/s22176452","volume":"22","author":"W Aditya","year":"2022","unstructured":"Aditya, W., Shih, T.K., Thaipisutikul, T., et al.: Novel Spatio-Temporal continuous sign language recognition using an attentive multi-feature network. Sensors 22(17), 6452 (2022)","journal-title":"Sensors"},{"key":"2094_CR8","doi-asserted-by":"crossref","unstructured":"Hao, A., Min, Y., Chen, X.: Self-mutual distillation learning for continuous sign language recognition. In: Proceedings of the IEEE\/CVF international conference on computer vision 11303\u201311312 (2021)","DOI":"10.1109\/ICCV48922.2021.01111"},{"issue":"1","key":"2094_CR9","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s00138-024-01633-0","volume":"36","author":"Q Zhu","year":"2025","unstructured":"Zhu, Q., Li, J., Yuan, F., et al.: Continuous sign language recognition based on motor attention mechanism and frame-level self-distillation. Mach. Vis. Appl. 36(1), 1\u201312 (2025)","journal-title":"Mach. Vis. Appl."},{"key":"2094_CR10","doi-asserted-by":"crossref","unstructured":"Guo, L., Xue, W., Guo, Q., et\u00a0al.: Distilling cross-temporal contexts for continuous sign language recognition. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition pp 10771\u201310780 (2023)","DOI":"10.1109\/CVPR52729.2023.01037"},{"key":"2094_CR11","doi-asserted-by":"crossref","unstructured":"Hu, L., Gao, L., Liu, Z., et\u00a0al.: Temporal lift pooling for continuous sign language recognition. In: European conference on computer vision, Springer 511\u2013527 (2022)","DOI":"10.1007\/978-3-031-19833-5_30"},{"key":"2094_CR12","doi-asserted-by":"crossref","unstructured":"Zheng, J., Wang, Y., Tan, C., et\u00a0al.: Cvt-slr: Contrastive visual-textual transformation for sign language recognition with variational alignment. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition 23141\u201323150 (2023)","DOI":"10.1109\/CVPR52729.2023.02216"},{"key":"2094_CR13","doi-asserted-by":"crossref","unstructured":"Hu, L., Gao, L., Liu, Z., et\u00a0al.: Adabrowse: Adaptive video browser for efficient continuous sign language recognition. In: Proceedings of the 31st ACM International Conference on Multimedia 709\u2013718 (2023)","DOI":"10.1145\/3581783.3611745"},{"key":"2094_CR14","doi-asserted-by":"crossref","unstructured":"Jiao, P., Min, Y., Li, Y., et\u00a0al.: Cosign: Exploring co-occurrence signals in skeleton-based continuous sign language recognition. In: Proceedings of the IEEE\/CVF international conference on computer vision 20676\u201320686 (2023)","DOI":"10.1109\/ICCV51070.2023.01890"},{"key":"2094_CR15","doi-asserted-by":"crossref","unstructured":"Hu, L., Gao, L., Liu, Z., et\u00a0al.: Self-emphasizing network for continuous sign language recognition. In: Proceedings of the AAAI Conference on Artificial Intelligence 854\u2013862 (2023)","DOI":"10.1609\/aaai.v37i1.25164"},{"key":"2094_CR16","doi-asserted-by":"crossref","unstructured":"Hu, L., Gao, L., Liu, Z., et\u00a0al.: Continuous sign language recognition with correlation network. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition 2529\u20132539 (2023)","DOI":"10.1109\/CVPR52729.2023.00249"},{"key":"2094_CR17","doi-asserted-by":"publisher","DOI":"10.1016\/j.imavis.2024.104991","volume":"146","author":"C Cheng","year":"2024","unstructured":"Cheng, C., Xu, H.: A 3d motion image recognition model based on 3D CNN-GRU model and attention mechanism. Image Vis. Comput. 146 104991 (2024)","journal-title":"Image Vis. Comput."},{"issue":"4","key":"2094_CR18","doi-asserted-by":"publisher","first-page":"141","DOI":"10.1007\/s42452-024-05774-9","volume":"6","author":"S Yosry","year":"2024","unstructured":"Yosry, S., Elrefaei, L., ElKamaar, R., et al.: Various frameworks for integrating image and video streams for spatiotemporal information learning employing 2D\u20133D residual networks for human action recognition. Discover Appl. Sci. 6(4), 141 (2024)","journal-title":"Discover Appl. Sci."},{"key":"2094_CR19","doi-asserted-by":"crossref","unstructured":"Xie, S., Sun, C., Huang, J., et\u00a0al.: Rethinking spatiotemporal feature learning: Speed-accuracy trade-offs in video classification. In: Proceedings of the European conference on computer vision (ECCV) pp 305\u2013321 (2018)","DOI":"10.1007\/978-3-030-01267-0_19"},{"key":"2094_CR20","doi-asserted-by":"publisher","first-page":"108","DOI":"10.1016\/j.cviu.2015.09.013","volume":"141","author":"O Koller","year":"2015","unstructured":"Koller, O., Forster, J., Ney, H.: Continuous sign language recognition: towards large vocabulary statistical recognition systems handling multiple signers. Comput. Vis. Image Underst. 141, 108\u2013125 (2015)","journal-title":"Comput. Vis. Image Underst."},{"key":"2094_CR21","unstructured":"Freeman, W.T., Roth, M.: Orientation histograms for hand gesture recognition. In: International workshop on automatic face and gesture recognition, Citeseer 296\u2013301 (1995)"},{"key":"2094_CR22","doi-asserted-by":"crossref","unstructured":"Koller, O., Zargaran, S., Ney, H.: Re-sign: Re-aligned end-to-end sequence modelling with deep recurrent cnn-hmms. In: Proceedings of the IEEE conference on computer vision and pattern recognition 4297\u20134305 (2017)","DOI":"10.1109\/CVPR.2017.364"},{"key":"2094_CR23","doi-asserted-by":"crossref","unstructured":"Koller, O., Zargaran, O., Ney, H., et\u00a0al.: Deep sign: Hybrid CNN-HMM for continuous sign language recognition. In: Proceedings of the British Machine Vision Conference (2016)","DOI":"10.5244\/C.30.136"},{"key":"2094_CR24","doi-asserted-by":"publisher","first-page":"45","DOI":"10.1016\/j.neucom.2020.12.006","volume":"434","author":"L Gao","year":"2021","unstructured":"Gao, L., Li, H., Liu, Z., et al.: RNN-transducer based Chinese sign language recognition. Neurocomputing 434, 45\u201354 (2021)","journal-title":"Neurocomputing"},{"key":"2094_CR25","first-page":"8457","volume-title":"ICASSP 2022\u20132022 IEEE International Conference on Acoustics","author":"M Parelli","year":"2022","unstructured":"Parelli, M., Papadimitriou, K., Potamianos, G., et al.: Spatio-Temporal graph convolutional networks for continuous sign language recognition. In: ICASSP 2022\u20132022 IEEE International Conference on Acoustics, pp. 8457\u20138461. IEEE, Speech and Signal Processing (ICASSP) (2022)"},{"key":"2094_CR26","doi-asserted-by":"crossref","unstructured":"He, K., Zhang, X., Ren, S., et\u00a0al.: (2016) Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition 770\u2013778 (2016)","DOI":"10.1109\/CVPR.2016.90"},{"key":"2094_CR27","doi-asserted-by":"crossref","unstructured":"Graves, A., Fern\u00e1ndez, S., Gomez, F., et\u00a0al.: Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks. In: Proceedings of the 23rd international conference on Machine learning 369\u2013376 (2006)","DOI":"10.1145\/1143844.1143891"},{"key":"2094_CR28","doi-asserted-by":"crossref","unstructured":"Zhou, H., Zhou, W., Zhou, Y., et\u00a0al.: Spatial-temporal multi-cue network for continuous sign language recognition. In: Proceedings of the AAAI conference on artificial intelligence 13009\u201313016 (2020)","DOI":"10.1609\/aaai.v34i07.7001"},{"key":"2094_CR29","doi-asserted-by":"crossref","unstructured":"Zuo, R., Mak, B.: C2slr: Consistency-enhanced continuous sign language recognition. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition 5131\u20135140 (2022)","DOI":"10.1109\/CVPR52688.2022.00507"},{"key":"2094_CR30","doi-asserted-by":"crossref","unstructured":"Zhang, X., Dong, K., Cheng, D., et\u00a0al.: Stwanet: Spatio-temporal wavelet attention aggregation network for remote sensing change detection. IEEE J. Select. Topics Appl. Earth Observ. Remote Sensing (2025)","DOI":"10.1109\/JSTARS.2025.3551093"},{"key":"2094_CR31","doi-asserted-by":"crossref","unstructured":"Zhang, X., Xu, C., Fan, G., et\u00a0al.: Fscmf: A dual-branch frequency-spatial joint perception cross-modality network for visible and infrared image fusion. Neurocomputing 130376 (2025)","DOI":"10.1016\/j.neucom.2025.130376"},{"key":"2094_CR32","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2024.111312","volume":"161","author":"W Lu","year":"2025","unstructured":"Lu, W., Wang, J., Wang, T., et al.: Visual style prompt learning using diffusion models for blind face restoration. Pattern Recogn. 161, 111312 (2025)","journal-title":"Pattern Recogn."},{"key":"2094_CR33","doi-asserted-by":"publisher","DOI":"10.1016\/j.displa.2024.102814","volume":"84","author":"X Dong","year":"2024","unstructured":"Dong, X., Shi, P., Qi, H., et al.: TS-BEV: BEV object detection algorithm based on temporal-spatial feature fusion. Displays 84, 102814 (2024)","journal-title":"Displays"},{"issue":"1","key":"2094_CR34","doi-asserted-by":"publisher","first-page":"1947","DOI":"10.1177\/03611981241258753","volume":"2679","author":"X Dong","year":"2025","unstructured":"Dong, X., Shi, P., Liang, T., et al.: Ctaffnet: CNN-transformer adaptive feature fusion object detection algorithm for complex traffic scenarios. Transp. Res. Rec. 2679(1), 1947\u20131965 (2025)","journal-title":"Transp. Res. Rec."},{"key":"2094_CR35","doi-asserted-by":"crossref","unstructured":"Wang, S., Cheng, D., Li, J.: Diffusion prior guided deep model driven network for infrared and visible image fusion. Expert Syst. Appl. 129161 (2025)","DOI":"10.1016\/j.eswa.2025.129161"},{"key":"2094_CR36","doi-asserted-by":"crossref","unstructured":"Zhang, X., Yuan, G., Hua, Z., et\u00a0al.: Tsmga: temporal-spatial multi-scale graph attention network for remote sensing change detection. IEEE J. Select. Topics Appl. Earth Observ. Remote Sens. (2025)","DOI":"10.1109\/JSTARS.2025.3526785"},{"key":"2094_CR37","doi-asserted-by":"publisher","DOI":"10.1016\/j.knosys.2025.113539","volume":"318","author":"P Shi","year":"2025","unstructured":"Shi, P., Dong, X., Ge, R., et al.: Dp-M3D: Monocular 3D object detection algorithm with depth perception capability. Knowl. Based Syst. 318, 113539 (2025)","journal-title":"Knowl. Based Syst."},{"key":"2094_CR38","doi-asserted-by":"publisher","DOI":"10.1016\/j.ins.2024.120286","volume":"662","author":"Y Zhou","year":"2024","unstructured":"Zhou, Y., Xia, H., Yu, D., et al.: Outlier detection method based on high-density iteration. Inf. Sci. 662, 120286 (2024)","journal-title":"Inf. Sci."},{"key":"2094_CR39","doi-asserted-by":"crossref","unstructured":"Min, Y., Hao, A., Chai, X., et\u00a0al.: Visual alignment constraint for continuous sign language recognition. In: Proceedings of the IEEE\/CVF international conference on computer vision 11542\u201311551 (2021)","DOI":"10.1109\/ICCV48922.2021.01134"},{"key":"2094_CR40","doi-asserted-by":"crossref","unstructured":"Hussein, N., Gavves, E., Smeulders, A. W.: Timeception for complex action recognition. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition 254\u2013263 (2019)","DOI":"10.1109\/CVPR.2019.00034"},{"key":"2094_CR41","doi-asserted-by":"crossref","unstructured":"Szegedy, C., Ioffe, S., Vanhoucke, V., et\u00a0al.: Inception-v4, inception-resnet and the impact of residual connections on learning. In: Proceedings of the AAAI conference on artificial intelligence (2017)","DOI":"10.1609\/aaai.v31i1.11231"},{"key":"2094_CR42","doi-asserted-by":"crossref","unstructured":"Camgoz, N.C., Hadfield, S., Koller, O., et\u00a0al.: Neural sign language translation. In: Proceedings of the IEEE conference on computer vision and pattern recognition 7784\u20137793 (2018)","DOI":"10.1109\/CVPR.2018.00812"},{"key":"2094_CR43","unstructured":"Kingma, D.P.: Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980 (2014)"},{"key":"2094_CR44","doi-asserted-by":"crossref","unstructured":"Cheng, K.L., Yang, Z., Chen, Q., et\u00a0al.: Fully convolutional networks for continuous sign language recognition. In: Computer Vision\u2013ECCV 2020: 16th European Conference, Glasgow, UK, August 23\u201328, 2020, Proceedings, Part XXIV 16, Springer 697\u2013714 (2020)","DOI":"10.1007\/978-3-030-58586-0_41"},{"issue":"7","key":"2094_CR45","doi-asserted-by":"publisher","first-page":"1880","DOI":"10.1109\/TMM.2018.2889563","volume":"21","author":"R Cui","year":"2019","unstructured":"Cui, R., Liu, H., Zhang, C.: A deep neural framework for continuous sign language recognition by iterative training. IEEE Trans. Multimedia 21(7), 1880\u20131891 (2019)","journal-title":"IEEE Trans. Multimedia"},{"key":"2094_CR46","doi-asserted-by":"crossref","unstructured":"Pu, J., Zhou, W., Hu, H., et\u00a0al.: Boosting continuous sign language recognition via cross modality augmentation. In: Proceedings of the 28th ACM international conference on multimedia 1497\u20131505 (2020)","DOI":"10.1145\/3394171.3413931"},{"issue":"11","key":"2094_CR47","doi-asserted-by":"publisher","first-page":"7845","DOI":"10.1007\/s00371-023-03211-3","volume":"40","author":"F Xiao","year":"2024","unstructured":"Xiao, F., Zhu, Y., Liu, R., et al.: KSRB-Net: a continuous sign language recognition deep learning strategy based on motion perception mechanism. Vis. Comput. 40(11), 7845\u20137858 (2024)","journal-title":"Vis. Comput."},{"issue":"2","key":"2094_CR48","doi-asserted-by":"publisher","first-page":"023059","DOI":"10.1117\/1.JEI.33.2.023059","volume":"33","author":"Q Zhu","year":"2024","unstructured":"Zhu, Q., Li, J., Yuan, F., et al.: Multiscale temporal network for continuous sign language recognition. J. Electron. Imaging 33(2), 023059\u2013023059 (2024)","journal-title":"J. Electron. Imaging"},{"issue":"2","key":"2094_CR49","doi-asserted-by":"publisher","first-page":"141","DOI":"10.1007\/s11760-024-03718-9","volume":"19","author":"S Xiong","year":"2025","unstructured":"Xiong, S., Zou, C., Yun, J., et al.: Continuous sign language recognition enhanced by dynamic attention and maximum backtracking probability decoding. SIViP 19(2), 141 (2025)","journal-title":"SIViP"},{"key":"2094_CR50","doi-asserted-by":"crossref","unstructured":"Wang, Z., Li, D., Jiang, R., et\u00a0al.: Continuous sign language recognition with multi-scale spatial-temporal feature enhancement. IEEE Access (2025)","DOI":"10.1109\/ACCESS.2025.3526330"},{"issue":"6","key":"2094_CR51","doi-asserted-by":"publisher","first-page":"4017","DOI":"10.1007\/s00371-024-03643-5","volume":"41","author":"K Liu","year":"2025","unstructured":"Liu, K., Hou, Y., Guo, Z., et al.: Visual context learning based on cross-modal knowledge for continuous sign language recognition. Vis. Comput. 41(6), 4017\u20134031 (2025)","journal-title":"Vis. Comput."},{"key":"2094_CR52","doi-asserted-by":"crossref","unstructured":"Hu, L., Gao, L., Liu, Z., et\u00a0al.: Spatial temporal aggregation for efficient continuous sign language recognition. IEEE Transactions on Emerging Topics in Computational Intelligence (2024)","DOI":"10.1109\/TETCI.2024.3378649"},{"issue":"6","key":"2094_CR53","doi-asserted-by":"publisher","first-page":"313","DOI":"10.1007\/s00530-024-01505-7","volume":"30","author":"S Wang","year":"2024","unstructured":"Wang, S., Guo, L., Xue, W.: Dynamical semantic enhancement network for continuous sign language recognition. Multimedia Syst. 30(6), 313 (2024)","journal-title":"Multimedia Syst."}],"container-title":["Multimedia Systems"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-025-02094-9.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s00530-025-02094-9","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-025-02094-9.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,2,11]],"date-time":"2026-02-11T04:19:06Z","timestamp":1770783546000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s00530-025-02094-9"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,12,4]]},"references-count":53,"journal-issue":{"issue":"1","published-print":{"date-parts":[[2026,2]]}},"alternative-id":["2094"],"URL":"https:\/\/doi.org\/10.1007\/s00530-025-02094-9","relation":{},"ISSN":["0942-4962","1432-1882"],"issn-type":[{"value":"0942-4962","type":"print"},{"value":"1432-1882","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025,12,4]]},"assertion":[{"value":"25 July 2025","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"10 November 2025","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"4 December 2025","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare no conflict of interest.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}],"article-number":"24"}}