{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,19]],"date-time":"2026-05-19T15:59:53Z","timestamp":1779206393185,"version":"3.51.4"},"reference-count":27,"publisher":"Springer Science and Business Media LLC","issue":"27","license":[{"start":{"date-parts":[[2023,4,21]],"date-time":"2023-04-21T00:00:00Z","timestamp":1682035200000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2023,4,21]],"date-time":"2023-04-21T00:00:00Z","timestamp":1682035200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"published-print":{"date-parts":[[2023,11]]},"DOI":"10.1007\/s11042-023-15275-3","type":"journal-article","created":{"date-parts":[[2023,4,21]],"date-time":"2023-04-21T05:03:02Z","timestamp":1682053382000},"page":"42763-42781","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":27,"title":["Speech emotion recognition using multimodal feature fusion with machine learning approach"],"prefix":"10.1007","volume":"82","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-0752-4267","authenticated-orcid":false,"given":"Sandeep Kumar","family":"Panda","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ajay Kumar","family":"Jena","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mohit Ranjan","family":"Panda","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Susmita","family":"Panda","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2023,4,21]]},"reference":[{"key":"15275_CR1","unstructured":"Saikat B, Jaybrata C, Arnab B\u00a0 et al (2017) A review on emotion recognition using speech.\u00a0Int Conf Inventive Commun Comput Technol (ICICCT) (2017):109\u2013114"},{"key":"15275_CR2","first-page":"6","volume":"1","author":"Y Chavhan","year":"2010","unstructured":"Chavhan Y, Dhore M, Yesaware P (2010) Speech emotion recognition using support vector machine. Int J Comput Appl 1:6\u20139","journal-title":"Int J Comput Appl"},{"key":"15275_CR3","doi-asserted-by":"publisher","first-page":"1154","DOI":"10.1016\/j.dsp.2012.05.007","volume":"22","author":"L Chen","year":"2012","unstructured":"Chen L, Mao X, Xue Y et al (2012) Speech emotion recognition: Features and classification models. Digit Signal Process 22:1154\u20131160","journal-title":"Digit Signal Process"},{"key":"15275_CR4","unstructured":"Akash RC, Anik G, Rahul P,\u00a0et al.\u00a0 (2018) Emotion Recognition from Speech Signals using Excitation Source and Spectral Features.\u00a0IEEE Applied Signal Proc\u00a0(ASPCON)\u00a0257\u2013261"},{"key":"15275_CR5","doi-asserted-by":"publisher","unstructured":"Prashengit D, Sunanda G\u00a0 (2021) A System to Predict Emotion from Bengali Speech. Int J Math Sci Comput.\u00a0https:\/\/doi.org\/10.5815\/IJMSC.2021.01.04","DOI":"10.5815\/IJMSC.2021.01.04"},{"issue":"1","key":"15275_CR6","doi-asserted-by":"publisher","first-page":"37","DOI":"10.1109\/MMUL.2019.2960219","volume":"27","author":"E Ghaleb","year":"2020","unstructured":"Ghaleb E, Popa M, Asteriadis S (2020) Metric Learning-Based Multimodal Audio-Visual Emotion Recognition. IEEE Multi Med 27(1):37\u201348. https:\/\/doi.org\/10.1109\/MMUL.2019.2960219","journal-title":"IEEE Multi Med"},{"key":"15275_CR7","first-page":"79","volume":"27","author":"A Harimi","year":"2014","unstructured":"Harimi A, Esmaileyan Z (2014) A database for automatic Persian speech emotion recognition: collection, processing and evaluation. Int J Eng 27:79\u201390","journal-title":"Int J Eng"},{"key":"15275_CR8","doi-asserted-by":"crossref","unstructured":"Ngoc-Huynh H, Hyung-Jeong Y, Soo-Hyung K\u00a0et al\u00a0 (2020) Multimodal Approach of Speech Emotion Recognition Using Multi-Level Multi-Head Fusion Attention-Based Recurrent Neural Network. IEEE Access 8:61672-61686","DOI":"10.1109\/ACCESS.2020.2984368"},{"key":"15275_CR9","first-page":"235","volume":"2","author":"AB Ingale","year":"2012","unstructured":"Ingale AB, Chaudhari D (2012) Speech emotion recognition. Int J Soft Comput Eng (IJSCE) 2:235\u2013238","journal-title":"Int J Soft Comput Eng (IJSCE)"},{"key":"15275_CR10","doi-asserted-by":"publisher","first-page":"125830","DOI":"10.1109\/ACCESS.2021.3111659","volume":"9","author":"S Kanwal","year":"2021","unstructured":"Kanwal S, Asghar S (2021) Speech Emotion Recognition Using Clustering Based GA- Optimized Feature Set. IEEE Access 9:125830\u2013125842. https:\/\/doi.org\/10.1109\/ACCESS.2021.3111659","journal-title":"IEEE Access"},{"key":"15275_CR11","doi-asserted-by":"crossref","unstructured":"Ko T, Peddinti V, Povey D, Khudanpur S (2015) Audio Augmentation for Speech Recognition","DOI":"10.21437\/Interspeech.2015-711"},{"key":"15275_CR12","doi-asserted-by":"publisher","first-page":"45","DOI":"10.1007\/s10772-020-09672-4","volume":"23","author":"A Koduru","year":"2020","unstructured":"Koduru A, Valiveti HB, Budati AK (2020) Feature extraction algorithms to improve the speech emotion recognition rate. Int J Speech Technol 23:45\u201355","journal-title":"Int J Speech Technol"},{"key":"15275_CR13","doi-asserted-by":"publisher","first-page":"265","DOI":"10.1007\/s10772-012-9139-3","volume":"15","author":"SG Koolagudi","year":"2012","unstructured":"Koolagudi SG, Rao KS (2012) Emotion recognition from speech using source, system, and prosodic features. Int J Speech Technol 15:265\u2013289","journal-title":"Int J Speech Technol"},{"key":"15275_CR14","doi-asserted-by":"publisher","first-page":"657","DOI":"10.1007\/s10772-016-9358-0","volume":"19","author":"S Kuchibhotla","year":"2016","unstructured":"Kuchibhotla S, Vankayalapati HD, Anne KR (2016) An optimal two stage feature selection for speech emotion recognition using acoustic features. Int J Speech Technol 19:657\u2013667","journal-title":"Int J Speech Technol"},{"key":"15275_CR15","doi-asserted-by":"crossref","unstructured":"Kumbhar H, Bhandari S (2019) Speech Emotion Recognition using MFCC features and LSTM network, IEEE International Conference On Computing, Communication, Control And Automation, pp. 1\u20133","DOI":"10.1109\/ICCUBEA47591.2019.9129067"},{"issue":"8","key":"15275_CR16","doi-asserted-by":"publisher","first-page":"2297","DOI":"10.3390\/s20082297","volume":"20","author":"Zhen-Tao Liu","year":"2020","unstructured":"Liu Zhen-Tao, Bao-Han Wu, Li Dan-Yun, Xiao Peng, Mao Jun-Wei (2020) Speech Emotion Recognition Based on Selective Interpolation Synthetic Minority Over-Sampling Technique in Small Sample Environment. Sens 20(8):2297","journal-title":"Sens"},{"key":"15275_CR17","doi-asserted-by":"publisher","first-page":"603","DOI":"10.1016\/S0167-6393(03)00099-2","volume":"41","author":"TL Nwe","year":"2003","unstructured":"Nwe TL, Foo SW, De Silva LC (2003) Speech emotion recognition using hidden Markov models. Speech Commun 41:603\u2013623","journal-title":"Speech Commun"},{"key":"15275_CR18","doi-asserted-by":"publisher","first-page":"5858","DOI":"10.1016\/j.eswa.2014.03.026","volume":"41","author":"CS Ooi","year":"2014","unstructured":"Ooi CS, Seng KP, Ang L-M et al (2014) A new approach of audio emotion recognition. Expert Syst Appl 41:5858\u20135869","journal-title":"Expert Syst Appl"},{"key":"15275_CR19","first-page":"111","volume":"7","author":"HK Palo","year":"2018","unstructured":"Palo HK, Mohanty MN (2018) Comparative analysis of neural networks for speech emotion recognition. Int J Eng Technol 7:111\u2013126","journal-title":"Int J Eng Technol"},{"key":"15275_CR20","unstructured":"Yixiong P, Peipei S, Liping S\u00a0et al\u00a0 (2012) Speech Emotion Recognition Using Support Vector Machine."},{"key":"15275_CR21","doi-asserted-by":"crossref","unstructured":"Pappagari, R. et al\u00a0\u00a0 (2020) X-Vectors Meet Emotions: A Study On Dependencies Between Emotion and Speaker Recognition. \u00a0Int Conf Acoust Speech Signal Process (ICASSP)\u00a07169\u20137173","DOI":"10.1109\/ICASSP40776.2020.9054317"},{"key":"15275_CR22","first-page":"3603","volume":"3","author":"KS Rao","year":"2012","unstructured":"Rao KS, Kumar TP, Anusha K et al (2012) Emotion recognition from speech. Int J Comput Sci Inf Technol 3:3603\u20133607","journal-title":"Int J Comput Sci Inf Technol"},{"key":"15275_CR23","unstructured":"Shah RD, Anil D, Suthar C (2016) Speech emotion recognition based on SVM using MATLAB. Int J Innov Res Comput Commun Eng 4"},{"key":"15275_CR24","first-page":"1067","volume":"4","author":"S Shambhavi","year":"2015","unstructured":"Shambhavi S, Nitnaware V (2015) Emotion speech recognition using MFCC and SVM. Int J Eng Res Technol 4:1067\u20131070","journal-title":"Int J Eng Res Technol"},{"key":"15275_CR25","unstructured":"Anwer S, Mohamed H, Mounir Z\u00a0et al. Emotion recognition from speech using spectrograms and shallow neural networks. Proceedings of the 18th International Conference on Advances in Mobile Computing & Multimedia (2020): n. pag."},{"key":"15275_CR26","doi-asserted-by":"publisher","first-page":"69","DOI":"10.1109\/TAFFC.2015.2392101","volume":"6","author":"K Wang","year":"2015","unstructured":"Wang K, An N, Li BN et al (2015) Speech emotion recognition using Fourier parameters. IEEE Trans Affect Comput 6:69\u201375","journal-title":"IEEE Trans Affect Comput"},{"key":"15275_CR27","doi-asserted-by":"publisher","first-page":"1415","DOI":"10.1016\/j.sigpro.2009.09.009","volume":"90","author":"B Yang","year":"2010","unstructured":"Yang B, Lugger M (2010) Emotion recognition from speech signals using new harmony features. Signal Process 90:1415\u20131423","journal-title":"Signal Process"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-023-15275-3.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11042-023-15275-3\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-023-15275-3.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,10,26]],"date-time":"2023-10-26T10:20:52Z","timestamp":1698315652000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11042-023-15275-3"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2023,4,21]]},"references-count":27,"journal-issue":{"issue":"27","published-print":{"date-parts":[[2023,11]]}},"alternative-id":["15275"],"URL":"https:\/\/doi.org\/10.1007\/s11042-023-15275-3","relation":{},"ISSN":["1380-7501","1573-7721"],"issn-type":[{"value":"1380-7501","type":"print"},{"value":"1573-7721","type":"electronic"}],"subject":[],"published":{"date-parts":[[2023,4,21]]},"assertion":[{"value":"17 May 2022","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"23 July 2022","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"6 April 2023","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"21 April 2023","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflicts of interest\/Competing interests"}}]}}