{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,16]],"date-time":"2026-06-16T06:56:07Z","timestamp":1781592967218,"version":"3.54.5"},"reference-count":37,"publisher":"Elsevier BV","license":[{"start":{"date-parts":[[2026,9,1]],"date-time":"2026-09-01T00:00:00Z","timestamp":1788220800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.elsevier.com\/tdm\/userlicense\/1.0\/"},{"start":{"date-parts":[[2026,9,1]],"date-time":"2026-09-01T00:00:00Z","timestamp":1788220800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.elsevier.com\/legal\/tdmrep-license"},{"start":{"date-parts":[[2026,9,1]],"date-time":"2026-09-01T00:00:00Z","timestamp":1788220800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-017"},{"start":{"date-parts":[[2026,9,1]],"date-time":"2026-09-01T00:00:00Z","timestamp":1788220800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"},{"start":{"date-parts":[[2026,9,1]],"date-time":"2026-09-01T00:00:00Z","timestamp":1788220800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-012"},{"start":{"date-parts":[[2026,9,1]],"date-time":"2026-09-01T00:00:00Z","timestamp":1788220800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2026,9,1]],"date-time":"2026-09-01T00:00:00Z","timestamp":1788220800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-004"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["elsevier.com","sciencedirect.com"],"crossmark-restriction":true},"short-container-title":["Engineering Applications of Artificial Intelligence"],"published-print":{"date-parts":[[2026,9]]},"DOI":"10.1016\/j.engappai.2026.115184","type":"journal-article","created":{"date-parts":[[2026,5,28]],"date-time":"2026-05-28T20:47:34Z","timestamp":1780001254000},"page":"115184","update-policy":"https:\/\/doi.org\/10.1016\/elsevier_cm_policy","source":"Crossref","is-referenced-by-count":0,"special_numbering":"P1","title":["Improving speech emotion recognition through self-attention and extremely randomized trees based weighted fuzzy concept-cognitive learning"],"prefix":"10.1016","volume":"179","author":[{"given":"Weihua","family":"Xu","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Kaiping","family":"Hu","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"78","reference":[{"key":"10.1016\/j.engappai.2026.115184_b1","article-title":"An ensemble 1D-CNN-LSTM-GRU model with data augmentation for speech emotion recognition","volume":"218","author":"Ahmed","year":"2023","journal-title":"Expert Syst. Appl."},{"key":"10.1016\/j.engappai.2026.115184_b2","doi-asserted-by":"crossref","first-page":"56","DOI":"10.1016\/j.specom.2019.12.001","article-title":"Speech emotion recognition: Emotional models, databases, features, preprocessing methods, supporting modalities, and classifiers","volume":"116","author":"Ak\u00e7ay","year":"2020","journal-title":"Speech Commun."},{"key":"10.1016\/j.engappai.2026.115184_b3","first-page":"12449","article-title":"Wav2vec 2.0: A framework for self-supervised learning of speech representations","volume":"33","author":"Baevski","year":"2020","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"10.1016\/j.engappai.2026.115184_b4","series-title":"Proceedings of Interspeech 2005","first-page":"1517","article-title":"A database of German emotional speech","author":"Burkhardt","year":"2005"},{"key":"10.1016\/j.engappai.2026.115184_b5","doi-asserted-by":"crossref","first-page":"10","DOI":"10.1016\/j.specom.2015.03.004","article-title":"A review of depression and suicide risk assessment using speech analysis","volume":"71","author":"Cummins","year":"2015","journal-title":"Speech Commun."},{"key":"10.1016\/j.engappai.2026.115184_b6","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1016\/j.neucom.2023.01.002","article-title":"An ongoing review of speech emotion recognition","volume":"528","author":"de Lope","year":"2023","journal-title":"Neurocomputing"},{"issue":"3","key":"10.1016\/j.engappai.2026.115184_b7","doi-asserted-by":"crossref","first-page":"572","DOI":"10.1016\/j.patcog.2010.09.020","article-title":"Survey on speech emotion recognition: Features, classification schemes, and databases","volume":"44","author":"El Ayadi","year":"2011","journal-title":"Pattern Recognit."},{"key":"10.1016\/j.engappai.2026.115184_b8","doi-asserted-by":"crossref","first-page":"3","DOI":"10.1007\/s10994-006-6226-1","article-title":"Extremely randomized trees","volume":"63","author":"Geurts","year":"2006","journal-title":"Mach. Learn."},{"key":"10.1016\/j.engappai.2026.115184_b9","doi-asserted-by":"crossref","DOI":"10.1016\/j.ins.2023.118998","article-title":"Fuzzy-based concept-cognitive learning: An investigation of novel approach to tumor diagnosis analysis","volume":"639","author":"Guo","year":"2023","journal-title":"Inform. Sci."},{"key":"10.1016\/j.engappai.2026.115184_b10","doi-asserted-by":"crossref","DOI":"10.1016\/j.inffus.2024.102426","article-title":"Concept-cognitive learning survey: Mining and fusing knowledge from data","volume":"109","author":"Guo","year":"2024","journal-title":"Inf. Fusion"},{"issue":"3","key":"10.1016\/j.engappai.2026.115184_b11","doi-asserted-by":"crossref","first-page":"1409","DOI":"10.1109\/TFUZZ.2023.3325952","article-title":"Fuzzy-granular concept-cognitive learning via three-way decision: performance evaluation on dynamic knowledge discovery","volume":"32","author":"Guo","year":"2023","journal-title":"IEEE Trans. Fuzzy Syst."},{"key":"10.1016\/j.engappai.2026.115184_b12","doi-asserted-by":"crossref","DOI":"10.1016\/j.inffus.2023.101962","article-title":"M-FCCL: Memory-based concept-cognitive learning for dynamic fuzzy data classification and knowledge fusion","volume":"100","author":"Guo","year":"2023","journal-title":"Inf. Fusion"},{"key":"10.1016\/j.engappai.2026.115184_b13","doi-asserted-by":"crossref","DOI":"10.1016\/j.specom.2023.102974","article-title":"Speech emotion recognition approaches: A systematic review","volume":"154","author":"Hashem","year":"2023","journal-title":"Speech Commun."},{"key":"10.1016\/j.engappai.2026.115184_b14","doi-asserted-by":"crossref","first-page":"3451","DOI":"10.1109\/TASLP.2021.3122291","article-title":"Hubert: Self-supervised speech representation learning by masked prediction of hidden units","volume":"29","author":"Hsu","year":"2021","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"key":"10.1016\/j.engappai.2026.115184_b15","series-title":"Surrey audio-visual expressed emotion (SAVEE) database","author":"Jackson","year":"2014"},{"key":"10.1016\/j.engappai.2026.115184_b16","doi-asserted-by":"crossref","DOI":"10.1016\/j.csl.2024.101713","article-title":"Significance of chirp MFCC as a feature in speech and audio applications","volume":"89","author":"Joysingh","year":"2025","journal-title":"Comput. Speech Lang."},{"key":"10.1016\/j.engappai.2026.115184_b17","doi-asserted-by":"crossref","DOI":"10.1016\/j.inffus.2023.102019","article-title":"Emotion recognition and artificial intelligence: A systematic review (2014\u20132023) and research recommendations","volume":"102","author":"Khare","year":"2024","journal-title":"Inf. Fusion"},{"issue":"2","key":"10.1016\/j.engappai.2026.115184_b18","doi-asserted-by":"crossref","first-page":"1634","DOI":"10.1109\/TAFFC.2021.3114365","article-title":"Survey of deep representation learning for speech emotion recognition","volume":"14","author":"Latif","year":"2021","journal-title":"IEEE Trans. Affect. Comput."},{"key":"10.1016\/j.engappai.2026.115184_b19","doi-asserted-by":"crossref","first-page":"244","DOI":"10.1016\/j.ins.2016.04.051","article-title":"Three-way cognitive concept learning via multi-granularity","volume":"378","author":"Li","year":"2017","journal-title":"Inform. Sci."},{"key":"10.1016\/j.engappai.2026.115184_b20","doi-asserted-by":"crossref","DOI":"10.1016\/j.eswa.2021.114683","article-title":"Speech emotion recognition using recurrent neural networks with directional self-attention","volume":"173","author":"Li","year":"2021","journal-title":"Expert Syst. Appl."},{"key":"10.1016\/j.engappai.2026.115184_b21","doi-asserted-by":"crossref","first-page":"913","DOI":"10.1007\/s12652-016-0406-z","article-title":"CHEAVD: a Chinese natural emotional audio\u2013visual database","volume":"8","author":"Li","year":"2017","journal-title":"J. Ambient. Intell. Humaniz. Comput."},{"key":"10.1016\/j.engappai.2026.115184_b22","doi-asserted-by":"crossref","DOI":"10.1016\/j.specom.2023.103010","article-title":"Multiscale-multichannel feature extraction and classification through one-dimensional convolutional neural network for speech emotion recognition","volume":"156","author":"Liu","year":"2024","journal-title":"Speech Commun."},{"issue":"5","key":"10.1016\/j.engappai.2026.115184_b23","doi-asserted-by":"crossref","DOI":"10.1371\/journal.pone.0196391","article-title":"The Ryerson Audio-Visual Database of Emotional speech and song (RAVDESS): A dynamic, multimodal set of facial and vocal expressions in North American English","volume":"13","author":"Livingstone","year":"2018","journal-title":"PLoS One"},{"key":"10.1016\/j.engappai.2026.115184_b24","series-title":"Interspeech","first-page":"493","article-title":"Automatic emotion recognition using prosodic parameters","author":"Luengo","year":"2005"},{"issue":"5","key":"10.1016\/j.engappai.2026.115184_b25","doi-asserted-by":"crossref","first-page":"2429","DOI":"10.1109\/TKDE.2020.3010918","article-title":"Semi-supervised concept learning by concept-cognitive learning and concept space","volume":"34","author":"Mi","year":"2022","journal-title":"IEEE Trans. Knowl. Data Eng."},{"issue":"1","key":"10.1016\/j.engappai.2026.115184_b26","doi-asserted-by":"crossref","first-page":"582","DOI":"10.1109\/TCYB.2020.2980794","article-title":"Fuzzy-based concept learning method: Exploiting data with fuzzy conceptual clustering","volume":"52","author":"Mi","year":"2020","journal-title":"IEEE Trans. Cybern."},{"issue":"4","key":"10.1016\/j.engappai.2026.115184_b27","doi-asserted-by":"crossref","first-page":"603","DOI":"10.1016\/S0167-6393(03)00099-2","article-title":"Speech emotion recognition using hidden Markov models","volume":"41","author":"Nwe","year":"2003","journal-title":"Speech Commun."},{"key":"10.1016\/j.engappai.2026.115184_b28","doi-asserted-by":"crossref","first-page":"179","DOI":"10.1007\/s13042-014-0313-6","article-title":"Concepts reduction in formal concept analysis with fuzzy setting using Shannon entropy","volume":"8","author":"Singh","year":"2017","journal-title":"Int. J. Mach. Learn. Cybern."},{"key":"10.1016\/j.engappai.2026.115184_b29","article-title":"Attention is all you need","volume":"30","author":"Vaswani","year":"2017","journal-title":"Adv. Neural Inf. Process. Syst."},{"issue":"9","key":"10.1016\/j.engappai.2026.115184_b30","doi-asserted-by":"crossref","first-page":"10745","DOI":"10.1109\/TPAMI.2023.3263585","article-title":"Dawn of the transformer era in speech emotion recognition: closing the valence gap","volume":"45","author":"Wagner","year":"2023","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"issue":"10","key":"10.1016\/j.engappai.2026.115184_b31","doi-asserted-by":"crossref","first-page":"6798","DOI":"10.1109\/TNNLS.2023.3235800","article-title":"Two-way concept-cognitive learning via concept movement viewpoint","volume":"34","author":"Xu","year":"2023","journal-title":"IEEE Trans. Neural Netw. Learn. Syst."},{"key":"10.1016\/j.engappai.2026.115184_b32","article-title":"RF-WFCCL: A random forest-driven weighted fuzzy concept cognitive learning","author":"Xu","year":"2025","journal-title":"Fuzzy Sets and Systems"},{"issue":"3","key":"10.1016\/j.engappai.2026.115184_b33","first-page":"497","article-title":"Discovery of compact rules in relational databases","volume":"4","author":"Yahia","year":"2000","journal-title":"Inf. Sci. J."},{"key":"10.1016\/j.engappai.2026.115184_b34","doi-asserted-by":"crossref","first-page":"104","DOI":"10.1016\/j.datak.2012.08.002","article-title":"A completeness analysis of frequent weighted concept lattices and their algebraic properties","volume":"81","author":"Zhang","year":"2012","journal-title":"Data Knowl. Eng."},{"key":"10.1016\/j.engappai.2026.115184_b35","doi-asserted-by":"crossref","DOI":"10.1016\/j.knosys.2022.110093","article-title":"Incremental concept-cognitive learning approach for concept classification oriented to weighted fuzzy concepts","volume":"260","author":"Zhang","year":"2023","journal-title":"Knowl.-Based Syst."},{"key":"10.1016\/j.engappai.2026.115184_b36","doi-asserted-by":"crossref","DOI":"10.1016\/j.eswa.2023.121692","article-title":"Deep learning-based multimodal emotion recognition from audio, visual, and text modalities: A systematic review of recent advancements and future prospects","volume":"237","author":"Zhang","year":"2024","journal-title":"Expert Syst. Appl."},{"key":"10.1016\/j.engappai.2026.115184_b37","doi-asserted-by":"crossref","first-page":"312","DOI":"10.1016\/j.bspc.2018.08.035","article-title":"Speech emotion recognition using deep 1D & 2D CNN LSTM networks","volume":"47","author":"Zhao","year":"2019","journal-title":"Biomed. Signal Process. Control."}],"container-title":["Engineering Applications of Artificial Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/api.elsevier.com\/content\/article\/PII:S0952197626014685?httpAccept=text\/xml","content-type":"text\/xml","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/api.elsevier.com\/content\/article\/PII:S0952197626014685?httpAccept=text\/plain","content-type":"text\/plain","content-version":"vor","intended-application":"text-mining"}],"deposited":{"date-parts":[[2026,6,16]],"date-time":"2026-06-16T06:46:42Z","timestamp":1781592402000},"score":1,"resource":{"primary":{"URL":"https:\/\/linkinghub.elsevier.com\/retrieve\/pii\/S0952197626014685"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,9]]},"references-count":37,"alternative-id":["S0952197626014685"],"URL":"https:\/\/doi.org\/10.1016\/j.engappai.2026.115184","relation":{},"ISSN":["0952-1976"],"issn-type":[{"value":"0952-1976","type":"print"}],"subject":[],"published":{"date-parts":[[2026,9]]},"assertion":[{"value":"Elsevier","name":"publisher","label":"This article is maintained by"},{"value":"Improving speech emotion recognition through self-attention and extremely randomized trees based weighted fuzzy concept-cognitive learning","name":"articletitle","label":"Article Title"},{"value":"Engineering Applications of Artificial Intelligence","name":"journaltitle","label":"Journal Title"},{"value":"https:\/\/doi.org\/10.1016\/j.engappai.2026.115184","name":"articlelink","label":"CrossRef DOI link to publisher maintained version"},{"value":"article","name":"content_type","label":"Content Type"},{"value":"\u00a9 2026 Elsevier Ltd. All rights are reserved, including those for text and data mining, AI training, and similar technologies.","name":"copyright","label":"Copyright"}],"article-number":"115184"}}