{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,13]],"date-time":"2026-03-13T10:29:12Z","timestamp":1773397752310,"version":"3.50.1"},"reference-count":30,"publisher":"IEEE","license":[{"start":{"date-parts":[[2021,8,9]],"date-time":"2021-08-09T00:00:00Z","timestamp":1628467200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2021,8,9]],"date-time":"2021-08-09T00:00:00Z","timestamp":1628467200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2021,8,9]],"date-time":"2021-08-09T00:00:00Z","timestamp":1628467200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2021,8,9]]},"DOI":"10.1109\/mwscas47672.2021.9531812","type":"proceedings-article","created":{"date-parts":[[2021,9,13]],"date-time":"2021-09-13T22:17:52Z","timestamp":1631571472000},"page":"611-616","source":"Crossref","is-referenced-by-count":11,"title":["Video-Audio Emotion Recognition Based on Feature Fusion Deep Learning Method"],"prefix":"10.1109","author":[{"given":"Yanan","family":"Song","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yuanyang","family":"Cai","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Lizhe","family":"Tan","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1016\/j.bspc.2020.101894"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2008.52"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1097\/ACM.0000000000001163"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2017.2784096"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.3390\/s111009573"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/ICUFN.2016.7536936"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1145\/2993148.2997632"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/TKDE.2009.191"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2009.5206848"},{"key":"ref18","article-title":"Neural machine translation by jointly learning to align and translate","author":"bahdanau","year":"2014"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.4103\/0256-4602.64604"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/ACII.2019.8925444"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/TCSVT.2015.2444731"},{"key":"ref27","article-title":"Batch normalization: Accelerating deep network training by reducing internal covariate shift","author":"ioffe","year":"2015","journal-title":"ICML"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1145\/2746285.2764928"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-39601-9_5"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2020.2990405"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1007\/s10772-009-9023-y"},{"key":"ref8","doi-asserted-by":"crossref","first-page":"6645","DOI":"10.1109\/ICASSP.2013.6638947","article-title":"Speech recognition with deep recurrent neural networks","author":"graves","year":"2013","journal-title":"2013 IEEE International Conference on Acoustics Speech and Signal Processing"},{"key":"ref7","article-title":"Design of an automatic speaker recognition system using MFCC vector quantization and LBG algorithm","volume":"3","author":"kumar","year":"2011","journal-title":"Int J Comput Sci Eng"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2017.2672829"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/MCI.2018.2840738"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1371\/journal.pone.0196391"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1145\/2661806.2661811"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/SAI.2014.6918213"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1007\/s12193-015-0195-2"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/SMC.2019.8914655"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-020-08836-3"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2017.2778011"},{"key":"ref25","article-title":"Very deep convolutional networks for large-scale image recognition","author":"simonyan","year":"2014"}],"event":{"name":"2021 IEEE International Midwest Symposium on Circuits and Systems (MWSCAS)","location":"Lansing, MI, USA","start":{"date-parts":[[2021,8,9]]},"end":{"date-parts":[[2021,8,11]]}},"container-title":["2021 IEEE International Midwest Symposium on Circuits and Systems (MWSCAS)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9531648\/9531647\/09531812.pdf?arnumber=9531812","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,5,10]],"date-time":"2022-05-10T15:45:39Z","timestamp":1652197539000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9531812\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,8,9]]},"references-count":30,"URL":"https:\/\/doi.org\/10.1109\/mwscas47672.2021.9531812","relation":{},"subject":[],"published":{"date-parts":[[2021,8,9]]}}}