{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,1]],"date-time":"2026-05-01T22:21:18Z","timestamp":1777674078721,"version":"3.51.4"},"reference-count":42,"publisher":"Elsevier BV","license":[{"start":{"date-parts":[[2026,10,1]],"date-time":"2026-10-01T00:00:00Z","timestamp":1790812800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.elsevier.com\/tdm\/userlicense\/1.0\/"},{"start":{"date-parts":[[2026,10,1]],"date-time":"2026-10-01T00:00:00Z","timestamp":1790812800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.elsevier.com\/legal\/tdmrep-license"},{"start":{"date-parts":[[2026,10,1]],"date-time":"2026-10-01T00:00:00Z","timestamp":1790812800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-017"},{"start":{"date-parts":[[2026,10,1]],"date-time":"2026-10-01T00:00:00Z","timestamp":1790812800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"},{"start":{"date-parts":[[2026,10,1]],"date-time":"2026-10-01T00:00:00Z","timestamp":1790812800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-012"},{"start":{"date-parts":[[2026,10,1]],"date-time":"2026-10-01T00:00:00Z","timestamp":1790812800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2026,10,1]],"date-time":"2026-10-01T00:00:00Z","timestamp":1790812800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-004"}],"funder":[{"DOI":"10.13039\/100022976","name":"National Institute of Natural Hazards","doi-asserted-by":"publisher","id":[{"id":"10.13039\/100022976","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100002858","name":"China Postdoctoral Science Foundation","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100002858","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["elsevier.com","sciencedirect.com"],"crossmark-restriction":true},"short-container-title":["Pattern Recognition"],"published-print":{"date-parts":[[2026,10]]},"DOI":"10.1016\/j.patcog.2026.113419","type":"journal-article","created":{"date-parts":[[2026,3,3]],"date-time":"2026-03-03T16:24:03Z","timestamp":1772555043000},"page":"113419","update-policy":"https:\/\/doi.org\/10.1016\/elsevier_cm_policy","source":"Crossref","is-referenced-by-count":0,"special_numbering":"C","title":["Speaker-independent speech emotion recognition using group sparse-based adversarial local fisher discriminant analysis"],"prefix":"10.1016","volume":"178","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-1477-1020","authenticated-orcid":false,"given":"Cheng","family":"Lu","sequence":"first","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0009-0002-8373-2735","authenticated-orcid":false,"given":"Kaifei","family":"Zhang","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-1355-9503","authenticated-orcid":false,"given":"Hailun","family":"Lian","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0003-1494-4873","authenticated-orcid":false,"given":"Sunan","family":"Li","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0009-0005-5780-9374","authenticated-orcid":false,"given":"Tianhua","family":"Qi","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-0839-8792","authenticated-orcid":false,"given":"Yuan","family":"Zong","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-7764-5179","authenticated-orcid":false,"given":"Wenming","family":"Zheng","sequence":"additional","affiliation":[]}],"member":"78","reference":[{"issue":"3","key":"10.1016\/j.patcog.2026.113419_bib0001","doi-asserted-by":"crossref","first-page":"572","DOI":"10.1016\/j.patcog.2010.09.020","article-title":"Survey on speech emotion recognition: features, classification schemes, and databases","volume":"44","author":"Ayadi","year":"2011","journal-title":"Pattern Recognit."},{"key":"10.1016\/j.patcog.2026.113419_bib0002","article-title":"A systematic review of interpretability and explainability for speech emotion features in automatic speech emotion recognition","author":"Jayasinghe","year":"2025","journal-title":"Pattern Recognit."},{"issue":"2","key":"10.1016\/j.patcog.2026.113419_bib0003","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1145\/3737456","article-title":"Facial expression analysis and its potentials in IoT systems: a contemporary survey","volume":"58","author":"Shangguan","year":"2025","journal-title":"ACM Comput. Surv."},{"key":"10.1016\/j.patcog.2026.113419_bib0004","doi-asserted-by":"crossref","DOI":"10.1016\/j.patcog.2025.111493","article-title":"Auxiliary action unit model for facial expression adversarial training","volume":"164","author":"Sun","year":"2025","journal-title":"Pattern Recognit."},{"key":"10.1016\/j.patcog.2026.113419_bib0005","doi-asserted-by":"crossref","DOI":"10.1016\/j.patcog.2024.110847","article-title":"Sentiment analysis based on text information enhancement and multimodal feature fusion","volume":"156","author":"Liu","year":"2024","journal-title":"Pattern Recognit."},{"key":"10.1016\/j.patcog.2026.113419_bib0006","doi-asserted-by":"crossref","DOI":"10.1016\/j.patcog.2024.110311","article-title":"Pose-Robust personalized facial expression recognition through unsupervised multi-Source domain adaptation","volume":"150","author":"Wang","year":"2024","journal-title":"Pattern Recognit."},{"issue":"7","key":"10.1016\/j.patcog.2026.113419_bib0007","doi-asserted-by":"crossref","first-page":"711","DOI":"10.1109\/34.598228","article-title":"Eigenfaces vs. fisherfaces: recognition using class specific linear projection","volume":"19","author":"Belhumeur","year":"1997","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"10.1016\/j.patcog.2026.113419_bib0008","doi-asserted-by":"crossref","DOI":"10.1016\/j.patcog.2024.110794","article-title":"A survey of dialogic emotion analysis: developments, approaches and perspectives","volume":"156","author":"Gan","year":"2024","journal-title":"Pattern Recognit."},{"issue":"5","key":"10.1016\/j.patcog.2026.113419_bib0009","first-page":"1","article-title":"Dimensionality reduction of multimodal labeled data by local fisher discriminant analysis","volume":"8","author":"Sugiyama","year":"2007","journal-title":"J. Mach. Learn. Res."},{"key":"10.1016\/j.patcog.2026.113419_bib0010","doi-asserted-by":"crossref","DOI":"10.1016\/j.patcog.2024.110512","article-title":"Towards robust and sparse linear discriminant analysis for image classification","volume":"153","author":"Liu","year":"2024","journal-title":"Pattern Recognit."},{"issue":"3","key":"10.1016\/j.patcog.2026.113419_bib0011","doi-asserted-by":"crossref","first-page":"2886","DOI":"10.1109\/TII.2022.3185077","article-title":"Sparse local fisher discriminant analysis for gas-Water two-Phase flow status monitoring with multisensor signals","volume":"19","author":"Wu","year":"2022","journal-title":"IEEE Trans. Ind. Inform."},{"issue":"2","key":"10.1016\/j.patcog.2026.113419_bib0012","doi-asserted-by":"crossref","DOI":"10.1088\/1361-6501\/ad9f8a","article-title":"Modified kernel global-Local marginal fisher analysis for rolling bearing feature extraction","volume":"36","author":"Tian","year":"2025","journal-title":"Meas. Sci. Technol."},{"key":"10.1016\/j.patcog.2026.113419_bib0013","series-title":"IEEE International Conference on Signal Processing Proceedings","first-page":"538","article-title":"Spoken emotion recognition using local fisher discriminant analysis","author":"Zhang","year":"2010"},{"issue":"3","key":"10.1016\/j.patcog.2026.113419_bib0014","doi-asserted-by":"crossref","first-page":"317","DOI":"10.1109\/TMECH.2008.2008644","article-title":"Improved emotion recognition with a novel speaker-Independent feature","volume":"14","author":"Kim","year":"2009","journal-title":"IEEE\/ASME Trans. Mechatronics"},{"key":"10.1016\/j.patcog.2026.113419_bib0015","series-title":"Proceedings of 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)","first-page":"4808","article-title":"A feature selection and feature fusion combination method for speaker-Independent speech emotion recognition","author":"Jin","year":"2014"},{"issue":"7","key":"10.1016\/j.patcog.2026.113419_bib0016","doi-asserted-by":"crossref","first-page":"1436","DOI":"10.1109\/TASLP.2017.2694704","article-title":"A two-Dimensional framework of multiple kernel subspace learning for recognizing emotion in speech","volume":"25","author":"Xu","year":"2017","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"issue":"6","key":"10.1016\/j.patcog.2026.113419_bib0017","doi-asserted-by":"crossref","first-page":"3159","DOI":"10.1109\/TCSS.2022.3219825","article-title":"Speech emotion recognition via an attentive time\u2013Frequency neural network","volume":"10","author":"Lu","year":"2022","journal-title":"IEEE Trans. Comput. Soc. Syst."},{"key":"10.1016\/j.patcog.2026.113419_bib0018","first-page":"2672","article-title":"Generative adversarial nets","volume":"27","author":"Goodfellow","year":"2014","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"10.1016\/j.patcog.2026.113419_bib0019","article-title":"AT-PMF: Progressive multi-Modal fusion with adversarial training for physiological emotion recognition","author":"Li","year":"2025","journal-title":"Pattern Recognit."},{"key":"10.1016\/j.patcog.2026.113419_bib0020","series-title":"Proceedings of INTERSPEECH","first-page":"4089","article-title":"Adaptive domain-Aware representation learning for speech emotion recognition","author":"Fan","year":"2020"},{"key":"10.1016\/j.patcog.2026.113419_bib0021","doi-asserted-by":"crossref","first-page":"2217","DOI":"10.1109\/TASLP.2022.3178232","article-title":"Domain invariant feature learning for speaker-Independent speech emotion recognition","volume":"30","author":"Lu","year":"2022","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"key":"10.1016\/j.patcog.2026.113419_bib0022","doi-asserted-by":"crossref","first-page":"230","DOI":"10.1109\/TASLPRO.2025.3636055","article-title":"Generalizable dynamic domain adaptation for speaker-Independent speech emotion recognition","volume":"34","author":"Lu","year":"2025","journal-title":"IEEE Trans. Audio Speech Lang. Process."},{"issue":"3","key":"10.1016\/j.patcog.2026.113419_bib0023","doi-asserted-by":"crossref","first-page":"373","DOI":"10.1109\/TAFFC.2018.2800046","article-title":"Feature selection based transfer subspace learning for speech emotion recognition","volume":"11","author":"Song","year":"2020","journal-title":"IEEE Trans. Affect. Comput."},{"key":"10.1016\/j.patcog.2026.113419_bib0024","first-page":"153","article-title":"Locality preserving projections","volume":"16","author":"He","year":"2003","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"10.1016\/j.patcog.2026.113419_bib0025","article-title":"The augmented lagrange multiplier method for exact recovery of corrupted low-Rank matrices","author":"Lin","year":"2009","journal-title":"Coordinated Sci. Lab. Rep. no. UILU-ENG-09-2215, DC-247"},{"issue":"1","key":"10.1016\/j.patcog.2026.113419_bib0026","first-page":"1435","article-title":"Structured sparsity via alternating direction methods","volume":"13","author":"Qin","year":"2012","journal-title":"J. Mach. Learn. Res."},{"issue":"4","key":"10.1016\/j.patcog.2026.113419_bib0027","doi-asserted-by":"crossref","first-page":"335","DOI":"10.1007\/s10579-008-9076-6","article-title":"IEMOCAP: Interactive emotional dyadic motion capture database","volume":"42","author":"Busso","year":"2008","journal-title":"Lang. Resour. Eval."},{"key":"10.1016\/j.patcog.2026.113419_bib0028","series-title":"Proc. Interspeech","first-page":"1517","article-title":"A database of german emotional speech","volume":"5","author":"Burkhardt","year":"2005"},{"key":"10.1016\/j.patcog.2026.113419_bib0029","series-title":"The Blizzard Challenge 2008 Workshop","article-title":"Design of speech corpus for mandarin text to speech","author":"Zhang","year":"2008"},{"key":"10.1016\/j.patcog.2026.113419_bib0030","series-title":"Proceedings of 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)","first-page":"5688","article-title":"Deep neural networks for acoustic emotion recognition: raising the benchmarks","author":"Stuhlsatz","year":"2011"},{"key":"10.1016\/j.patcog.2026.113419_bib0031","series-title":"Proceedings of INTERSPEECH","first-page":"312","article-title":"The INTERSPEECH 2009 emotion challenge","author":"Schuller","year":"2009"},{"key":"10.1016\/j.patcog.2026.113419_bib0032","first-page":"2794","article-title":"The INTERSPEECH 2010 paralinguistic challenge","author":"Schuller","year":"2010","journal-title":"Proc. INTERSPEECH"},{"issue":"6","key":"10.1016\/j.patcog.2026.113419_bib0033","doi-asserted-by":"crossref","first-page":"1505","DOI":"10.1109\/JSTSP.2022.3188113","article-title":"WavLM: large-Scale self-Supervised pre-Training for full stack speech processing","volume":"16","author":"Chen","year":"2022","journal-title":"IEEE J. Sel. Top. Signal Process."},{"key":"10.1016\/j.patcog.2026.113419_bib0034","series-title":"Proceedings of 2023 International Conference on Machine Learning","first-page":"28492","article-title":"Robust speech recognition via large-Scale weak supervision","author":"Radford","year":"2023"},{"key":"10.1016\/j.patcog.2026.113419_bib0035","series-title":"Proceedings of INTERSPEECH","first-page":"1089","article-title":"Efficient emotion recognition from speech using deep learning on spectrograms","author":"Satt","year":"2017"},{"key":"10.1016\/j.patcog.2026.113419_bib0036","series-title":"Proceedings of 2018 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)","first-page":"1771","article-title":"Attention based fully convolutional network for speech emotion recognition","author":"Zhang","year":"2018"},{"key":"10.1016\/j.patcog.2026.113419_bib0037","series-title":"Proc. INTERSPEECH","first-page":"1908","article-title":"Learning local to global feature aggregation for speech emotion recognition","author":"Lu","year":"2023"},{"key":"10.1016\/j.patcog.2026.113419_bib0038","series-title":"Proceedings of INTERSPEECH","first-page":"1580","article-title":"Emobox: multilingual multi-Corpus speech emotion recognition toolkit and benchmark","author":"Ma","year":"2024"},{"key":"10.1016\/j.patcog.2026.113419_bib0039","series-title":"Proceedings of INTERSPEECH","first-page":"223","article-title":"Speech emotion recognition using deep neural network and extreme learning machine","author":"Han","year":"2014"},{"issue":"6","key":"10.1016\/j.patcog.2026.113419_bib0040","doi-asserted-by":"crossref","first-page":"1576","DOI":"10.1109\/TMM.2017.2766843","article-title":"Speech emotion recognition using deep convolutional neural network and discriminant temporal pyramid matching","volume":"20","author":"Zhang","year":"2017","journal-title":"IEEE Trans. Multimed."},{"issue":"59","key":"10.1016\/j.patcog.2026.113419_bib0041","first-page":"1","article-title":"Domain-Adversarial training of neural networks","volume":"17","author":"Ganin","year":"2016","journal-title":"J. Mach. Learn. Res."},{"key":"10.1016\/j.patcog.2026.113419_bib0042","series-title":"Proceedings of 2015 International Conference on Machine Learning","first-page":"97","article-title":"Learning transferable features with deep adaptation networks","author":"Long","year":"2015"}],"container-title":["Pattern Recognition"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/api.elsevier.com\/content\/article\/PII:S0031320326003845?httpAccept=text\/xml","content-type":"text\/xml","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/api.elsevier.com\/content\/article\/PII:S0031320326003845?httpAccept=text\/plain","content-type":"text\/plain","content-version":"vor","intended-application":"text-mining"}],"deposited":{"date-parts":[[2026,4,29]],"date-time":"2026-04-29T08:10:35Z","timestamp":1777450235000},"score":1,"resource":{"primary":{"URL":"https:\/\/linkinghub.elsevier.com\/retrieve\/pii\/S0031320326003845"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,10]]},"references-count":42,"alternative-id":["S0031320326003845"],"URL":"https:\/\/doi.org\/10.1016\/j.patcog.2026.113419","relation":{},"ISSN":["0031-3203"],"issn-type":[{"value":"0031-3203","type":"print"}],"subject":[],"published":{"date-parts":[[2026,10]]},"assertion":[{"value":"Elsevier","name":"publisher","label":"This article is maintained by"},{"value":"Speaker-independent speech emotion recognition using group sparse-based adversarial local fisher discriminant analysis","name":"articletitle","label":"Article Title"},{"value":"Pattern Recognition","name":"journaltitle","label":"Journal Title"},{"value":"https:\/\/doi.org\/10.1016\/j.patcog.2026.113419","name":"articlelink","label":"CrossRef DOI link to publisher maintained version"},{"value":"article","name":"content_type","label":"Content Type"},{"value":"\u00a9 2026 Elsevier Ltd. All rights are reserved, including those for text and data mining, AI training, and similar technologies.","name":"copyright","label":"Copyright"}],"article-number":"113419"}}