{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,15]],"date-time":"2026-03-15T03:44:25Z","timestamp":1773546265484,"version":"3.50.1"},"reference-count":57,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2021,1,1]],"date-time":"2021-01-01T00:00:00Z","timestamp":1609459200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2021,1,1]],"date-time":"2021-01-01T00:00:00Z","timestamp":1609459200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2021,1,1]],"date-time":"2021-01-01T00:00:00Z","timestamp":1609459200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100004663","name":"Ministry of Science and Technology, Taiwan","doi-asserted-by":"publisher","award":["MOST 110-2636-E-011-003"],"award-info":[{"award-number":["MOST 110-2636-E-011-003"]}],"id":[{"id":"10.13039\/501100004663","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Young Scholar Fellowship Program"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE\/ACM Trans. Audio Speech Lang. Process."],"published-print":{"date-parts":[[2021]]},"DOI":"10.1109\/taslp.2021.3120638","type":"journal-article","created":{"date-parts":[[2021,10,16]],"date-time":"2021-10-16T00:01:07Z","timestamp":1634342467000},"page":"3170-3179","source":"Crossref","is-referenced-by-count":4,"title":["Audio-Aware Spoken Multiple-Choice Question Answering With Pre-Trained Language Models"],"prefix":"10.1109","volume":"29","author":[{"given":"Chia-Chih","family":"Kuo","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-9656-7551","authenticated-orcid":false,"given":"Kuan-Yu","family":"Chen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Shang-Bao","family":"Luo","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref39","article-title":"RiddleSense: Answering riddle questions as commonsense reasoning","author":"lin","year":"2021"},{"key":"ref38","first-page":"6077","article-title":"Hierarchical attention flow for multiple-choice reading comprehension","author":"zhu","year":"2018","journal-title":"Proc 32nd AAAI Conf Artif Intell"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.3115\/v1\/P15-1121"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.3115\/v1\/P15-1024"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P18-2044"},{"key":"ref30","article-title":"Query-based attention CNN for text similarity map","author":"liu","year":"2017"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P16-1041"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/W16-0103"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.3115\/v1\/P15-2115"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D15-1197"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.3115\/v1\/D14-1070"},{"key":"ref27","doi-asserted-by":"crossref","first-page":"467","DOI":"10.1145\/1367497.1367561","article-title":"Finding the right facts in the crowd: Factoid question answering over social media categories and subject descriptors","author":"bian","year":"2008","journal-title":"Proc 17th Int Conf World Wide Web"},{"key":"ref29","article-title":"LSTM-based deep learning models for non-factoid answer selection","author":"tan","year":"2015"},{"key":"ref2","first-page":"150","article-title":"Speech technology and information access","volume":"25","author":"ostendorf","year":"0","journal-title":"IEEE Signal Process Mag"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/MSP.2008.917992"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/N18-1202"},{"key":"ref22","article-title":"Language models are unsupervised multitask learners","volume":"1","author":"radford","year":"2019","journal-title":"OpenAIRE blog"},{"key":"ref21","article-title":"Improving language understanding by generative pre-training","author":"radford","year":"2018","journal-title":"OpenAir"},{"key":"ref24","article-title":"Exploring the limits of transfer learning with a unified text-to-text transformer","author":"raffel","year":"2020","journal-title":"JMLR"},{"key":"ref23","article-title":"Language models are few-shot learners","author":"brown","year":"2020"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/N19-1405"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1145\/2964284.2967246"},{"key":"ref50","doi-asserted-by":"crossref","first-page":"2345","DOI":"10.21437\/Interspeech.2013-548","article-title":"Sequence-discriminative training of deep neural networks","author":"vesel\u00fd","year":"2013","journal-title":"Proc INTERSPEECH"},{"key":"ref51","article-title":"SRILM: An extensible language modeling toolkit","author":"stolcke","year":"2002","journal-title":"Proc INTERSPEECH"},{"key":"ref57","doi-asserted-by":"publisher","DOI":"10.1162\/tacl_a_00051"},{"key":"ref56","article-title":"Decoupled weight decay regularization","author":"loshchilov","year":"2019","journal-title":"Proc Int Conf Learn Representations"},{"key":"ref55","first-page":"8024","article-title":"PyTorch: An imperative style, high-performance deep learning library","volume":"32","author":"paszke","year":"2019","journal-title":"Adv Neural Inf Process Syst"},{"key":"ref54","first-page":"38","article-title":"Transformers: State-of-the-Art Natural Language Processing","author":"wolf","year":"2020","journal-title":"Proc Conf Empirical Methods Natural Lang Process"},{"key":"ref53","author":"graff","year":"2003","journal-title":"Chinese Gigaword"},{"key":"ref52","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2018.8461974"},{"key":"ref10","article-title":"R-NET: Machine reading comprehension with self-matching networks","year":"2017","journal-title":"Proc Group 2017 R-Net"},{"key":"ref11","article-title":"Neural machine translation by jointly learning to align and translate","author":"bahdanau","year":"2015","journal-title":"Proc Int Conf Learn Representations"},{"key":"ref40","first-page":"386","article-title":"Spoken multiple-choice question answering using multi-turn audio-extracter BERT","author":"luo","year":"2020","journal-title":"Proc 2020 APSIPA Annu Summit Conf"},{"key":"ref12","article-title":"Attention is all you need","author":"vaswani","year":"2017","journal-title":"Adv Neural Inf Process Syst"},{"key":"ref13","first-page":"1137","article-title":"A neural probabilistic language model","volume":"3","author":"bengio","year":"2003","journal-title":"J Mach Learn Res"},{"key":"ref14","article-title":"Efficient estimation of word representations in vector space","author":"mikolov","year":"2013","journal-title":"Proc 1st Int Conf Learn Representations"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.3115\/v1\/D14-1162"},{"key":"ref16","first-page":"4171","article-title":"BERT: Pre-training of deep bidirectional transformers for language understanding","author":"devlin","year":"2019","journal-title":"Proc Conf North Amer Chapter Assoc Comput Linguistics Hum Lang Technol"},{"key":"ref17","first-page":"3111","article-title":"Distributed representations of words and phrases and their compositionality","volume":"26","author":"mikolov","year":"2013","journal-title":"Adv Neural Inf Process Syst"},{"key":"ref18","article-title":"Generalized autoregressive pretraining for language understanding","volume":"32","author":"yang","year":"2019","journal-title":"Adv Neural Inf Process Syst"},{"key":"ref19","article-title":"Roberta: A robustly optimized BERT pretraining approach","author":"liu","year":"2019"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2020-1763"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1561\/1500000020"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP40776.2020.9053979"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2019.8682580"},{"key":"ref8","doi-asserted-by":"crossref","first-page":"436","DOI":"10.1038\/nature14539","article-title":"Deep learning","volume":"521","author":"lecun","year":"2015","journal-title":"Nature"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1136\/amiajnl-2010-000071"},{"key":"ref49","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2016-595"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.90"},{"key":"ref46","first-page":"1571","article-title":"Bilinear attention networks","author":"kim","year":"2018","journal-title":"Adv Neural Inf Process Syst"},{"key":"ref45","article-title":"Understanding the behaviors of BERT in ranking","author":"qiao","year":"2019"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2018-1417"},{"key":"ref47","article-title":"The kaldi speech recognition toolkit","author":"povey","year":"2011","journal-title":"Proc Automatic Speech Recognition and Understanding"},{"key":"ref42","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2020-1570"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1109\/ASRU46091.2019.9003966"},{"key":"ref44","article-title":"Simple applications of BERT for Ad Hoc document retrieval","author":"yang","year":"2019"},{"key":"ref43","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D19-1387"}],"container-title":["IEEE\/ACM Transactions on Audio, Speech, and Language Processing"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/6570655\/9289074\/09576594.pdf?arnumber=9576594","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,9,10]],"date-time":"2024-09-10T01:14:10Z","timestamp":1725930850000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9576594\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021]]},"references-count":57,"URL":"https:\/\/doi.org\/10.1109\/taslp.2021.3120638","relation":{},"ISSN":["2329-9290","2329-9304"],"issn-type":[{"value":"2329-9290","type":"print"},{"value":"2329-9304","type":"electronic"}],"subject":[],"published":{"date-parts":[[2021]]}}}