{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,28]],"date-time":"2026-04-28T12:10:44Z","timestamp":1777378244464,"version":"3.51.4"},"reference-count":37,"publisher":"Elsevier BV","license":[{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.elsevier.com\/tdm\/userlicense\/1.0\/"},{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.elsevier.com\/legal\/tdmrep-license"},{"start":{"date-parts":[[2026,3,16]],"date-time":"2026-03-16T00:00:00Z","timestamp":1773619200000},"content-version":"vor","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by-nc-nd\/4.0\/"}],"content-domain":{"domain":["elsevier.com","sciencedirect.com"],"crossmark-restriction":true},"short-container-title":["Array"],"published-print":{"date-parts":[[2026,7]]},"DOI":"10.1016\/j.array.2026.100760","type":"journal-article","created":{"date-parts":[[2026,3,20]],"date-time":"2026-03-20T20:33:03Z","timestamp":1774038783000},"page":"100760","update-policy":"https:\/\/doi.org\/10.1016\/elsevier_cm_policy","source":"Crossref","is-referenced-by-count":0,"special_numbering":"C","title":["Enhanced multimodal deep learning framework for emotion classification with Aquila optimizer based ensemble fusion"],"prefix":"10.1016","volume":"30","author":[{"given":"Vansh Kumar","family":"Payala","sequence":"first","affiliation":[]},{"given":"Avi Aaryan","family":"Jeet","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7957-7934","authenticated-orcid":false,"given":"Abinaya","family":"S","sequence":"additional","affiliation":[]}],"member":"78","reference":[{"key":"10.1016\/j.array.2026.100760_bib1","doi-asserted-by":"crossref","first-page":"47795","DOI":"10.1109\/ACCESS.2021.3068045","article-title":"A comprehensive review of speech emotion recognition systems","volume":"9","author":"Wani","year":"2021","journal-title":"IEEE Access"},{"issue":"1","key":"10.1016\/j.array.2026.100760_bib8","doi-asserted-by":"crossref","first-page":"49","DOI":"10.1007\/s10462-024-11065-x","article-title":"Real-time speech emotion recognition using deep learning and data augmentation","volume":"58","author":"Barhoumi","year":"2024","journal-title":"Artif Intell Rev"},{"issue":"198","key":"10.1016\/j.array.2026.100760_bib10","article-title":"Speech emotion recognition in conversations using artificial intelligence: a systematic review and meta-analysis","volume":"58","author":"Alhussein","year":"2025","journal-title":"Artif Intell Rev"},{"key":"10.1016\/j.array.2026.100760_bib5","doi-asserted-by":"crossref","first-page":"151122","DOI":"10.1109\/ACCESS.2024.3476960","article-title":"Speech databases, speech features, and classifiers in speech emotion recognition: a review","volume":"12","author":"Mohmad Dar","year":"2024","journal-title":"IEEE Access"},{"key":"10.1016\/j.array.2026.100760_bib17","doi-asserted-by":"crossref","DOI":"10.3389\/fnhum.2023.1292010","article-title":"Improving sentiment classification using a ROBERTa-based hybrid model","volume":"17","author":"Semary","year":"2023","journal-title":"Front Hum Neurosci"},{"issue":"1","key":"10.1016\/j.array.2026.100760_bib19","doi-asserted-by":"crossref","DOI":"10.32604\/iasc.2023.035352","article-title":"Text sentiment analysis based on multi-layer Bi-Directional LSTM with a trapezoidal structure","volume":"37","author":"He","year":"2023","journal-title":"Intell Autom Soft Comput"},{"key":"10.1016\/j.array.2026.100760_bib11","series-title":"International conference on soft computing: theories and applications","first-page":"61","article-title":"Enhanced recognition of human emotion via multimodal inputs using fusion LSTM++ model","author":"Abinaya","year":"2024"},{"issue":"9s","key":"10.1016\/j.array.2026.100760_bib12","article-title":"A unified framework for multimodal emotion recognition: leveraging text, audio, and visual data for enhanced emotional understanding","volume":"32","author":"Sanku","year":"2025","journal-title":"Commun Appl Nonlinear Anal"},{"key":"10.1016\/j.array.2026.100760_bib23","doi-asserted-by":"crossref","DOI":"10.1016\/j.eswa.2024.126236","article-title":"MIST: multimodal emotion recognition using DeBERTa for text, Semi-CNN for speech, ResNet-50 for facial, and 3D-CNN for motion analysis","volume":"270","author":"Boitel","year":"2025","journal-title":"Expert Syst Appl"},{"issue":"2","key":"10.1016\/j.array.2026.100760_bib24","article-title":"Video sentiment analysis using deep learning","volume":"12","author":"Taware","year":"2025","journal-title":"International Journal of Computer Techniques"},{"key":"10.1016\/j.array.2026.100760_bib2","doi-asserted-by":"crossref","first-page":"49265","DOI":"10.1109\/ACCESS.2022.3172954","article-title":"Robust speech emotion recognition using CNN+LSTM based on stochastic fractal search optimization algorithm","volume":"10","author":"Abdelhamid","year":"2022","journal-title":"IEEE Access"},{"issue":"6","key":"10.1016\/j.array.2026.100760_bib4","doi-asserted-by":"crossref","first-page":"2378","DOI":"10.3390\/s22062378","article-title":"Two-way feature extraction for speech emotion recognition using deep learning","volume":"22","author":"Aggarwal","year":"2022","journal-title":"Sensors"},{"key":"10.1016\/j.array.2026.100760_bib14","doi-asserted-by":"crossref","unstructured":"Jayakody, Dineth & A.V.A, Malkith & Isuranda, Koshila & Thenuwara, Vishal & de Silva, Nisansa & Ponnamperuma, Sachintha & Sandamali, G & Sudheera, Kushan. (2024). Instruct-DeBERTa: A Hybrid Approach for Aspect-based Sentiment Analysis on Textual Reviews. 10.48550\/arXiv.2408.13202.","DOI":"10.4038\/icter.v18i2.7290"},{"issue":"12","key":"10.1016\/j.array.2026.100760_bib15","doi-asserted-by":"crossref","first-page":"199","DOI":"10.3390\/bdcc8120199","article-title":"Sentiment analysis of product reviews using machine learning and pre-trained LLM","volume":"8","author":"Ghatora","year":"2024","journal-title":"Big Data and Cognitive Computing"},{"issue":"12","key":"10.1016\/j.array.2026.100760_bib22","doi-asserted-by":"crossref","first-page":"340","DOI":"10.3390\/computers13120340","article-title":"A comparative study of sentiment analysis on customer reviews using machine learning and deep learning","volume":"13","author":"Ashbaugh","year":"2024","journal-title":"Computers"},{"issue":"14","key":"10.1016\/j.array.2026.100760_bib3","doi-asserted-by":"crossref","first-page":"2373","DOI":"10.3390\/math10142373","article-title":"Automatic speech emotion recognition of younger school age children","volume":"10","author":"Matveev","year":"2022","journal-title":"Mathematics"},{"issue":"1","key":"10.1016\/j.array.2026.100760_bib6","doi-asserted-by":"crossref","first-page":"1709","DOI":"10.32604\/cmc.2023.031177","article-title":"The efficacy of deep learning-based mixed model for speech emotion recognition","volume":"74","author":"Uddin","year":"2023","journal-title":"Comput Mater Continua (CMC)"},{"issue":"13","key":"10.1016\/j.array.2026.100760_bib7","doi-asserted-by":"crossref","first-page":"6212","DOI":"10.3390\/s23136212","article-title":"Speech emotion recognition using convolution neural networks and multi-head convolutional transformer","volume":"23","author":"Ullah","year":"2023","journal-title":"Sensors"},{"issue":"3","key":"10.1016\/j.array.2026.100760_bib18","first-page":"101","article-title":"Sentiment analysis using BLSTM-ResNet on textual images","volume":"4","author":"Singh","year":"2022","journal-title":"Journal of Computer and Human-System Interaction"},{"issue":"9","key":"10.1016\/j.array.2026.100760_bib21","article-title":"A deep features based approach using modified ResNet50 and gradient boosting for visual sentiments classification","volume":"51","author":"Arslan","year":"2023","journal-title":"IEEE Trans Cybern"},{"key":"10.1016\/j.array.2026.100760_bib16","unstructured":"Ren, JiaLe. (2024). Multimodal Sentiment Analysis Based on BERT and ResNet. 10.48550\/arXiv.2412.03625."},{"issue":"1","key":"10.1016\/j.array.2026.100760_bib9","doi-asserted-by":"crossref","DOI":"10.1038\/s41598-024-63776-4","article-title":"An enhanced speech emotion recognition using vision transformer","volume":"14","author":"Akinpelu","year":"2024","journal-title":"Sci Rep"},{"key":"10.1016\/j.array.2026.100760_bib25","unstructured":"Kounades-Bastian, Dionyssos & Schr\u00fcfer, Oliver & Derington, Anna & Wierstorf, Hagen & Eyben, Florian & Burkhardt, Felix & Schuller, Bj\u00f6rn. (2024). Wav2Small: Distilling Wav2Vec2 to 72K parameters for Low-Resource Speech emotion recognition. 10.48550\/arXiv.2408.13920."},{"issue":"1","key":"10.1016\/j.array.2026.100760_bib20","first-page":"36","article-title":"Enhanced recognition of human activity using hybrid deep learning techniques","volume":"12","author":"Abinaya","year":"2024","journal-title":"Int J Electron Eng Res"},{"key":"10.1016\/j.array.2026.100760_bib13","unstructured":"Farhadipour, Aref & Ranjbar, Hossein & Chapariniya, Masoumeh & Vukovic, Teodora & Ebling, Sarah & Dellwo, Volker. (2025). Multimodal Emotion Recognition and Sentiment Analysis in Multi-Party Conversation Contexts. 10.48550\/arXiv.2503.06805."},{"issue":"9","key":"10.1016\/j.array.2026.100760_bib27","doi-asserted-by":"crossref","first-page":"3883","DOI":"10.3390\/app11093883","article-title":"Examining attention mechanisms in deep learning models for sentiment analysis","volume":"11","author":"Kardakis","year":"2021","journal-title":"Applied Sciences"},{"key":"10.1016\/j.array.2026.100760_bib28","doi-asserted-by":"crossref","unstructured":"Abinaya S, Ashwin KS, Alphonse AS. Enhanced emotion-aware conversational agent: Analyzing user behavioral status for tailored reponses in chatbot interactions. IEEE Access. 2025 Jan 27;13:19770-87.","DOI":"10.1109\/ACCESS.2025.3534197"},{"issue":"2","key":"10.1016\/j.array.2026.100760_bib37","first-page":"93","article-title":"Enhanced visual analytics technique for content-based medical image retrieval","volume":"10","author":"Abinaya","year":"2022","journal-title":"Int J Electron Eng Res"},{"issue":"1","key":"10.1016\/j.array.2026.100760_bib26","article-title":"Cross-model implementation of emotion recognition systems on Indian datasets","volume":"1","author":"Sharma","year":"2025","journal-title":"Cureus Journal of Computer Science"},{"key":"10.1016\/j.array.2026.100760_bib34","doi-asserted-by":"crossref","first-page":"100991","DOI":"10.1109\/ACCESS.2024.3431091","article-title":"Enhanced image captioning using bahdanau attention mechanism and heuristic beam search algorithm","volume":"12","author":"Abinaya","year":"2024","journal-title":"IEEE Access"},{"key":"10.1016\/j.array.2026.100760_bib29","article-title":"Joyful: joint modality fusion and graph contrastive learning for multimodal emotion recognition","author":"Li","year":"2023","journal-title":"arXiv, arXiv:2311 11009"},{"key":"10.1016\/j.array.2026.100760_bib30","article-title":"Active learning based fine-tuning framework for speech emotion recognition","author":"Li","year":"2023","journal-title":"arXiv, arXiv:2310 00283"},{"key":"10.1016\/j.array.2026.100760_bib35","doi-asserted-by":"crossref","first-page":"46","DOI":"10.1016\/j.advengsoft.2013.12.007","article-title":"Grey wolf optimizer","volume":"69","year":"2014","journal-title":"Adv Eng Software"},{"issue":"3","key":"10.1016\/j.array.2026.100760_bib36","doi-asserted-by":"crossref","first-page":"349","DOI":"10.1162\/EVCO_a_00049","article-title":"Quantum-behaved particle swarm optimization: analysis of individual particle behavior and parameter selection","volume":"20","year":"2012","journal-title":"Evol Comput"},{"issue":"1","key":"10.1016\/j.array.2026.100760_bib31","doi-asserted-by":"crossref","first-page":"462","DOI":"10.1109\/TKDE.2024.3485108","article-title":"PURE: personality-coupled multi task learning framework for aspect-based multimodal sentiment analysis","volume":"37","author":"Zhang","year":"2025","journal-title":"IEEE Trans Knowl Data Eng"},{"key":"10.1016\/j.array.2026.100760_bib32","article-title":"Multi-modal encrypted retrieval method with semantic feature fusion towards internet of medical things","volume":"8","author":"Zhang","year":"2025","journal-title":"IEEE J Biomed Health Inform"},{"key":"10.1016\/j.array.2026.100760_bib33","doi-asserted-by":"crossref","unstructured":"P. Zhang, M. Hu, H. Zhang, C. Wu and Z. Yang, \"Personality-aware multimodal driver emotion recognition towards intelligent connected vehicles\" in IEEE Trans Affect Comput, vol. , no. 1, pp. 1-16, PrePrints 5555, doi: 10.1109\/TAFFC.2025.3634565.","DOI":"10.1109\/TAFFC.2025.3634565"}],"container-title":["Array"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/api.elsevier.com\/content\/article\/PII:S2590005626000834?httpAccept=text\/xml","content-type":"text\/xml","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/api.elsevier.com\/content\/article\/PII:S2590005626000834?httpAccept=text\/plain","content-type":"text\/plain","content-version":"vor","intended-application":"text-mining"}],"deposited":{"date-parts":[[2026,4,28]],"date-time":"2026-04-28T09:10:30Z","timestamp":1777367430000},"score":1,"resource":{"primary":{"URL":"https:\/\/linkinghub.elsevier.com\/retrieve\/pii\/S2590005626000834"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,7]]},"references-count":37,"alternative-id":["S2590005626000834"],"URL":"https:\/\/doi.org\/10.1016\/j.array.2026.100760","relation":{},"ISSN":["2590-0056"],"issn-type":[{"value":"2590-0056","type":"print"}],"subject":[],"published":{"date-parts":[[2026,7]]},"assertion":[{"value":"Elsevier","name":"publisher","label":"This article is maintained by"},{"value":"Enhanced multimodal deep learning framework for emotion classification with Aquila optimizer based ensemble fusion","name":"articletitle","label":"Article Title"},{"value":"Array","name":"journaltitle","label":"Journal Title"},{"value":"https:\/\/doi.org\/10.1016\/j.array.2026.100760","name":"articlelink","label":"CrossRef DOI link to publisher maintained version"},{"value":"article","name":"content_type","label":"Content Type"},{"value":"\u00a9 2026 The Author(s). Published by Elsevier Inc.","name":"copyright","label":"Copyright"}],"article-number":"100760"}}