{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,7,8]],"date-time":"2026-07-08T03:26:10Z","timestamp":1783481170206,"version":"3.55.0"},"reference-count":42,"publisher":"Springer Science and Business Media LLC","issue":"5","license":[{"start":{"date-parts":[[2022,12,25]],"date-time":"2022-12-25T00:00:00Z","timestamp":1671926400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2022,12,25]],"date-time":"2022-12-25T00:00:00Z","timestamp":1671926400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"DOI":"10.13039\/501100007129","name":"Natural Science Foundation of Shandong Province","doi-asserted-by":"publisher","award":["ZR2020LZH008"],"award-info":[{"award-number":["ZR2020LZH008"]}],"id":[{"id":"10.13039\/501100007129","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100007129","name":"Natural Science Foundation of Shandong Province","doi-asserted-by":"publisher","award":["ZR2020QF112"],"award-info":[{"award-number":["ZR2020QF112"]}],"id":[{"id":"10.13039\/501100007129","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100007129","name":"Natural Science Foundation of Shandong Province","doi-asserted-by":"publisher","award":["ZR2019MF071"],"award-info":[{"award-number":["ZR2019MF071"]}],"id":[{"id":"10.13039\/501100007129","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Neural Process Lett"],"published-print":{"date-parts":[[2023,10]]},"DOI":"10.1007\/s11063-022-11129-5","type":"journal-article","created":{"date-parts":[[2022,12,25]],"date-time":"2022-12-25T02:02:25Z","timestamp":1671933745000},"page":"6109-6124","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":9,"title":["Facial Expression Recognition Based on Spatial-Temporal Fusion with Attention Mechanism"],"prefix":"10.1007","volume":"55","author":[{"given":"Lifeng","family":"Zhang","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Xiangwei","family":"Zheng","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Xuanchi","family":"Chen","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Xiuxiu","family":"Ren","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Cun","family":"Ji","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2022,12,25]]},"reference":[{"issue":"4","key":"11129_CR1","first-page":"1084","volume":"24","author":"A Mehrabian","year":"1968","unstructured":"Mehrabian A (1968) Communication without words. Univer East Lond 24(4):1084\u20131085","journal-title":"Univer East Lond"},{"issue":"2","key":"11129_CR2","doi-asserted-by":"publisher","first-page":"124","DOI":"10.1037\/h0030377","volume":"17","author":"P Ekman","year":"1971","unstructured":"Ekman P, Friesen W (1971) Constants across cultures in the face and emotion. J Pers Soc Psychol 17(2):124\u2013129","journal-title":"J Pers Soc Psychol"},{"issue":"4","key":"11129_CR3","doi-asserted-by":"publisher","first-page":"363","DOI":"10.1007\/BF00992972","volume":"16","author":"D Matsumoto","year":"1992","unstructured":"Matsumoto D (1992) More evidence for the universality of a contempt expression. Motiv Emot 16(4):363\u2013368","journal-title":"Motiv Emot"},{"key":"11129_CR4","doi-asserted-by":"publisher","unstructured":"Li S, Deng W (2020) Deep facial expression recognition: a survey. IEEE Trans Affect Comput. https:\/\/doi.org\/10.1109\/TAFFC.2020.2981446","DOI":"10.1109\/TAFFC.2020.2981446"},{"issue":"6","key":"11129_CR5","doi-asserted-by":"publisher","first-page":"803","DOI":"10.1016\/j.imavis.2008.08.005","volume":"27","author":"C Shan","year":"2009","unstructured":"Shan C, Gong S, McOwan PW (2009) Facial expression recognition based on local binary patterns: a comprehensive study. Image Vis Comput 27(6):803\u2013816","journal-title":"Image Vis Comput"},{"issue":"6","key":"11129_CR6","doi-asserted-by":"publisher","first-page":"915","DOI":"10.1109\/TPAMI.2007.1110","volume":"29","author":"G Zhao","year":"2007","unstructured":"Zhao G, Pietikainen M (2007) Dynamic texture recognition using local binary patterns with an application to facial expressions. IEEE Trans Pattern Anal Mach Intell 29(6):915\u2013928","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"1","key":"11129_CR7","doi-asserted-by":"publisher","first-page":"38","DOI":"10.1109\/TSMCB.2010.2044788","volume":"41","author":"R Zhi","year":"2011","unstructured":"Zhi R, Flierl M, Ruan Q, Kleijn WB (2011) Graph-preserving sparse nonnegative matrix factorization with application to facial expression recognition. IEEE Trans Syst, Man, Cybern, Part B (Cybern) 41(1):38\u201352","journal-title":"IEEE Trans Syst, Man, Cybern, Part B (Cybern)"},{"key":"11129_CR8","doi-asserted-by":"crossref","unstructured":"Zhong L, Liu Q, Yang P, Liu B, Huang J, Metaxas DN (2012) Learning active facial patches for expression analysis. In: 2012 IEEE conference on computer vision and pattern recognition (CVPR 2012). IEEE, pp 2562\u20132569","DOI":"10.1109\/CVPR.2012.6247974"},{"issue":"5","key":"11129_CR9","doi-asserted-by":"publisher","first-page":"3117","DOI":"10.1002\/int.22814","volume":"37","author":"J Zhang","year":"2022","unstructured":"Zhang J, Yang J, Yu J, Fan J (2022) Semisupervised image classification by mutual learning of multiple self-supervised models. Int J Intell Syst 37(5):3117\u20133141","journal-title":"Int J Intell Syst"},{"key":"11129_CR10","doi-asserted-by":"crossref","unstructured":"Yu Z, Yu J, Fan J, Tao D (2017) Multi-modal factorized bilinear pooling with co-attention learning for visual question answering. In: 2017 IEEE international conference on computer vision (ICCV), pp 1839\u20131848","DOI":"10.1109\/ICCV.2017.202"},{"key":"11129_CR11","doi-asserted-by":"publisher","first-page":"107952","DOI":"10.1016\/j.patcog.2021.107952","volume":"116","author":"J Zhang","year":"2021","unstructured":"Zhang J, Cao Y, Wu Q (2021) Vector of locally and adaptively aggregated descriptors for image feature representation. Pattern Recogn 116:107952. https:\/\/doi.org\/10.1016\/j.patcog.2021.107952","journal-title":"Pattern Recogn"},{"issue":"2","key":"11129_CR12","doi-asserted-by":"publisher","first-page":"563","DOI":"10.1109\/TPAMI.2019.2932058","volume":"44","author":"J Yu","year":"2022","unstructured":"Yu J, Tan M, Zhang H, Rui Y, Tao D (2022) Hierarchical deep click feature prediction for fine-grained image recognition. IEEE Trans Pattern Anal Mach Intell 44(2):563\u2013578","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"5","key":"11129_CR13","doi-asserted-by":"publisher","first-page":"2019","DOI":"10.1109\/TIP.2014.2311377","volume":"23","author":"J Yu","year":"2014","unstructured":"Yu J, Rui Y, Tao D (2014) Click prediction for web image reranking using multimodal sparse coding. IEEE Trans Image Process 23(5):2019\u20132032","journal-title":"IEEE Trans Image Process"},{"issue":"7","key":"11129_CR14","doi-asserted-by":"publisher","first-page":"3952","DOI":"10.1109\/TII.2018.2884211","volume":"15","author":"C Hong","year":"2019","unstructured":"Hong C, Yu J, Zhang J, Jin X, Lee K-H (2019) Multimodal face-pose estimation with multitask manifold deep learning. IEEE Trans Ind Inf 15(7):3952\u20133961","journal-title":"IEEE Trans Ind Inf"},{"issue":"12","key":"11129_CR15","doi-asserted-by":"publisher","first-page":"5659","DOI":"10.1109\/TIP.2015.2487860","volume":"24","author":"C Hong","year":"2015","unstructured":"Hong C, Yu J, Wan J, Tao D, Wang M (2015) Multimodal deep autoencoder for human pose recovery. IEEE Trans Image Process 24(12):5659\u20135670","journal-title":"IEEE Trans Image Process"},{"issue":"6","key":"11129_CR16","first-page":"3742","volume":"62","author":"C Hong","year":"2015","unstructured":"Hong C, Yu J, Tao D, Wang M (2015) Image-based three-dimensional human pose recovery by multiview locality-sensitive sparse retrieval. IEEE Trans Ind Electron 62(6):3742\u20133751","journal-title":"IEEE Trans Ind Electron"},{"key":"11129_CR17","doi-asserted-by":"crossref","unstructured":"Liu S, Johns E, Davison AJ (2019) End-to-end multi-task learning with attention. In: 2019 IEEE\/CVF conference on computer vision and pattern recognition (CVPR), pp 1871\u20131880","DOI":"10.1109\/CVPR.2019.00197"},{"key":"11129_CR18","unstructured":"Ouellet S (2014) Real-time emotion recognition for gaming using deep convolutional network features. Preprint at http:\/\/arxiv.org\/abs\/1408.3750"},{"key":"11129_CR19","doi-asserted-by":"crossref","unstructured":"Ding H, Zhou SK, Chellappa R (2017) Facenet2expnet: regularizing a deep face recognition net for expression recognition. In: 2017 12th IEEE international conference on automatic face and gesture recognition (FG 2017). IEEE, pp 118\u2013126","DOI":"10.1109\/FG.2017.23"},{"key":"11129_CR20","doi-asserted-by":"crossref","unstructured":"Acharya D, Huang Z, Pani\u00a0Paudel D, Van\u00a0Gool L (2018) Covariance pooling for facial expression recognition. In: 2018 IEEE\/CVF conference on computer vision and pattern recognition workshops (CVPRW). IEEE, pp 480\u2013487","DOI":"10.1109\/CVPRW.2018.00077"},{"key":"11129_CR21","doi-asserted-by":"crossref","unstructured":"Yang H, Ciftci U, Yin L (2018) Facial expression recognition by de-expression residue learning. In: 2018 IEEE\/CVF conference on computer vision and pattern recognition. IEEE, pp 2168\u20132177","DOI":"10.1109\/CVPR.2018.00231"},{"key":"11129_CR22","doi-asserted-by":"publisher","first-page":"126","DOI":"10.1016\/j.neucom.2015.02.011","volume":"159","author":"M Liu","year":"2015","unstructured":"Liu M, Li S, Shan S, Chen X (2015) Au-inspired deep networks for facial expression feature learning. Neurocomputing 159:126\u2013136. https:\/\/doi.org\/10.1016\/j.neucom.2015.02.011","journal-title":"Neurocomputing"},{"key":"11129_CR23","unstructured":"Ming Z, Xia J, Luqman MM, Burie J-C, Zhao K (2019) Dynamic multi-task learning for face recognition with facial expression. Preprint at http:\/\/arxiv.org\/abs\/1911.03281"},{"key":"11129_CR24","doi-asserted-by":"crossref","unstructured":"Meng Z, Liu P, Cai J, Han S, Tong Y (2017) Identity-aware convolutional neural network for facial expression recognition. In: 2017 12th IEEE international conference on automatic face and gesture recognition (FG 2017). IEEE, pp 558\u2013565","DOI":"10.1109\/FG.2017.140"},{"key":"11129_CR25","unstructured":"Pons G, Masip D (2018) Multi-task, multi-label and multi-domain learning with residual convolutional networks for emotion recognition. Preprint at http:\/\/arxiv.org\/abs\/1802.06664"},{"key":"11129_CR26","doi-asserted-by":"crossref","unstructured":"Fernandez PDM, Pe\u00f1a FAG, Ren TI, Cunha A (2019) FERAtt: facial expression recognition with attention net. In: 2019 IEEE\/CVF conference on computer vision and pattern recognition Workshops (CVPRW). IEEE, pp 837\u2013846","DOI":"10.1109\/CVPRW.2019.00112"},{"issue":"6","key":"11129_CR27","doi-asserted-by":"publisher","first-page":"4189","DOI":"10.1007\/s11063-021-10591-x","volume":"53","author":"Z Han","year":"2021","unstructured":"Han Z, Huang H (2021) GAN based three-stage-training algorithm for multi-view facial expression recognition. Neural Process Lett 53(6):4189\u20134205","journal-title":"Neural Process Lett"},{"key":"11129_CR28","doi-asserted-by":"crossref","unstructured":"Liu M, Li S, Shan S, Wang R, Chen X (2015) Deeply learning deformable facial action parts model for dynamic expression analysis. In: Asian conference on computer vision (ACCV 2014). Springer, pp 143\u2013157","DOI":"10.1007\/978-3-319-16817-3_10"},{"key":"11129_CR29","doi-asserted-by":"crossref","unstructured":"Bargal SA, Barsoum E, Ferrer CC, Zhang C (2016) Emotion recognition in the wild from videos using images. In: Proceedings of the 18th ACM international conference on multimodal interaction (ICMI 2016), pp 433\u2013436","DOI":"10.1145\/2993148.2997627"},{"key":"11129_CR30","doi-asserted-by":"crossref","unstructured":"Zhao X, Liang X, Liu L, Li T, Han Y, Vasconcelos N, Yan S (2016) Peak-piloted deep network for facial expression recognition. In: European conference on computer vision (ECCV 2016). Springer, pp 425\u2013442","DOI":"10.1007\/978-3-319-46475-6_27"},{"key":"11129_CR31","doi-asserted-by":"crossref","unstructured":"Kankanamge S, Fookes C, Sridharan S (2017) Facial analysis in the wild with LSTM networks. In: 2017 IEEE international conference on image processing (ICIP). IEEE, pp 1052\u20131056","DOI":"10.1109\/ICIP.2017.8296442"},{"key":"11129_CR32","doi-asserted-by":"publisher","first-page":"49","DOI":"10.1016\/j.patrec.2017.10.022","volume":"119","author":"N Sun","year":"2019","unstructured":"Sun N, Li Q, Huan R, Liu J, Han G (2019) Deep spatial-temporal feature fusion for facial expression recognition in static images. Pattern Recogn Lett 119:49\u201361. https:\/\/doi.org\/10.1016\/j.patrec.2017.10.022","journal-title":"Pattern Recogn Lett"},{"key":"11129_CR33","doi-asserted-by":"crossref","unstructured":"Vielzeuf V, Pateux S, Jurie F (2017) Temporal multimodal fusion for video emotion classification in the wild. In: Proceedings of the 19th ACM international conference on multimodal interaction (ICMI 2017), pp 569\u2013576","DOI":"10.1145\/3136755.3143011"},{"issue":"3","key":"11129_CR34","doi-asserted-by":"publisher","first-page":"2918","DOI":"10.1007\/s10489-021-02575-0","volume":"52","author":"W Zou","year":"2022","unstructured":"Zou W, Zhang D, Lee D (2022) A new multi-feature fusion based convolutional neural network for facial expression recognition. Appl Intell 52(3):2918\u20132929","journal-title":"Appl Intell"},{"key":"11129_CR35","doi-asserted-by":"crossref","unstructured":"Deng J, Dong W, Socher R, Li L-J, Li K, Fei-Fei L (2009) Imagenet: a large-scale hierarchical image database. In: 2009 IEEE computer society conference on computer vision and pattern recognition (CVPR 2009). IEEE, pp 248\u2013255","DOI":"10.1109\/CVPR.2009.5206848"},{"key":"11129_CR36","doi-asserted-by":"crossref","unstructured":"Lucey P, Cohn JF, Kanade T, Saragih J, Ambadar Z, Matthews I (2010) The extended Cohn\u2013Kanade dataset (CK+): a complete dataset for action unit and emotion-specified expression. In: 2010 IEEE computer society conference on computer vision and pattern recognition\u2014workshops. IEEE, pp 94\u2013101","DOI":"10.1109\/CVPRW.2010.5543262"},{"issue":"9","key":"11129_CR37","doi-asserted-by":"publisher","first-page":"607","DOI":"10.1016\/j.imavis.2011.07.002","volume":"29","author":"G Zhao","year":"2011","unstructured":"Zhao G, Huang X, Taini M, Li SZ, Pietik\u00e4Inen M (2011) Facial expression recognition from near-infrared videos. Image Vis Comput 29(9):607\u2013619","journal-title":"Image Vis Comput"},{"key":"11129_CR38","doi-asserted-by":"publisher","first-page":"1755","DOI":"10.5555\/1577069.1755843","volume":"10","author":"DE King","year":"2009","unstructured":"King DE (2009) Dlib-ml: a machine learning toolkit. J Mach Learn Res 10:1755\u20131758. https:\/\/doi.org\/10.5555\/1577069.1755843","journal-title":"J Mach Learn Res"},{"key":"11129_CR39","doi-asserted-by":"crossref","unstructured":"Jung H, Lee S, Yim J, Park S, Kim J (2015) Joint fine-tuning in deep neural networks for facial expression recognition. In: 2015 IEEE international conference on computer vision (ICCV 2015), pp 2983\u20132991","DOI":"10.1109\/ICCV.2015.341"},{"key":"11129_CR40","doi-asserted-by":"publisher","first-page":"4630","DOI":"10.1109\/ACCESS.2017.2784096","volume":"6","author":"B Yang","year":"2018","unstructured":"Yang B, Cao J, Ni R, Zhang Y (2018) Facial expression recognition using weighted mixture deep neural network based on double-channel facial images. IEEE Access 6:4630\u20134640. https:\/\/doi.org\/10.1109\/ACCESS.2017.2784096","journal-title":"IEEE Access"},{"issue":"3","key":"11129_CR41","doi-asserted-by":"publisher","first-page":"839","DOI":"10.1109\/TCYB.2017.2788081","volume":"49","author":"T Zhang","year":"2019","unstructured":"Zhang T, Zheng W, Cui Z, Zong Y, Li Y (2019) Spatial-temporal recurrent neural network for emotion recognition. IEEE Trans Cybern 49(3):839\u2013847","journal-title":"IEEE Trans Cybern"},{"issue":"9","key":"11129_CR42","doi-asserted-by":"publisher","first-page":"4193","DOI":"10.1109\/TIP.2017.2689999","volume":"26","author":"K Zhang","year":"2017","unstructured":"Zhang K, Huang Y, Du Y, Wang L (2017) Facial expression recognition based on deep evolutional spatial-temporal networks. IEEE Trans Image Process 26(9):4193\u20134203","journal-title":"IEEE Trans Image Process"}],"container-title":["Neural Processing Letters"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11063-022-11129-5.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11063-022-11129-5\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11063-022-11129-5.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,9,29]],"date-time":"2023-09-29T16:16:25Z","timestamp":1696004185000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11063-022-11129-5"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,12,25]]},"references-count":42,"journal-issue":{"issue":"5","published-print":{"date-parts":[[2023,10]]}},"alternative-id":["11129"],"URL":"https:\/\/doi.org\/10.1007\/s11063-022-11129-5","relation":{},"ISSN":["1370-4621","1573-773X"],"issn-type":[{"value":"1370-4621","type":"print"},{"value":"1573-773X","type":"electronic"}],"subject":[],"published":{"date-parts":[[2022,12,25]]},"assertion":[{"value":"11 December 2022","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"25 December 2022","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}