{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,30]],"date-time":"2024-10-30T14:04:03Z","timestamp":1730297043990,"version":"3.28.0"},"reference-count":45,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2018,12]]},"DOI":"10.1109\/slt.2018.8639569","type":"proceedings-article","created":{"date-parts":[[2019,2,14]],"date-time":"2019-02-14T23:36:34Z","timestamp":1550187394000},"page":"258-265","source":"Crossref","is-referenced-by-count":9,"title":["Domain Robust Feature Extraction for Rapid Low Resource ASR Development"],"prefix":"10.1109","author":[{"given":"Siddharth","family":"Dalmia","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xinjian","family":"Li","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Florian","family":"Metze","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Alan W.","family":"Black","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref39","article-title":"Acoustical sound database in real environments for sound scene understanding and hands-free speech recognition","author":"nakamura","year":"2000","journal-title":"LREC"},{"key":"ref38","article-title":"A time delay neural network architecture for efficient modeling of long temporal contexts","author":"peddinti","year":"2015","journal-title":"Sixteenth Annual Conference of the International Speech Communication Association"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2018.8461802"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2015.2457612"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2010.2064307"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2006.1660022"},{"key":"ref37","article-title":"Epitran: Precision G2P for many languages","author":"mortensen","year":"2018","journal-title":"Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018)"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1109\/ASRU.2015.7404790"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2008.2012313"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2018-1990"},{"key":"ref10","first-page":"886","article-title":"Damped oscillator cepstral coefficients for robust speech recognition","author":"mitra","year":"2013","journal-title":"InterSpeech"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1109\/ICDSP.2009.5201259"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6638284"},{"key":"ref12","article-title":"Improved bottleneck features using pretrained deep neural networks","author":"yu","year":"2011","journal-title":"Twelfth Annual Conference of the International Speech Communication Association"},{"key":"ref13","article-title":"Three ways to adapt a CTS recognizer to unseen reverberated speech in BUT system for the ASpIRE challenge","author":"karafi\u00e1t","year":"2015","journal-title":"Sixteenth Annual Conference of the International Speech Communication Association"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/ASRU.2015.7404841"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/SLT.2014.7078569"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2015.7178783"},{"key":"ref17","article-title":"Unsupervised adaptation with domain separation networks for robust speech recognition","author":"meng","year":"2017","journal-title":"arXiv preprint arXiv 1711 03890"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1016\/j.neucom.2016.11.063"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2016-879"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6639081"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/ASRU.2015.7404837"},{"key":"ref27","article-title":"Distributed learning of multilingual DNN feature extractors using GPUs","author":"miao","year":"2014","journal-title":"Fifteenth Annual Conference of the International Speech Communication Association"},{"journal-title":"Low Resource Languages for Emergent Incidents (LORELEI)","year":"0","key":"ref3"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1186\/s13634-016-0306-6"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6639084"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/ASRU.2015.7404843"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/TENCON.2013.6718948"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2016-966"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ASRU.2015.7404842"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2012.6288824"},{"key":"ref1","article-title":"Audio augmentation for speech recognition","author":"ko","year":"2015","journal-title":"Sixteenth Annual Conference of the International Speech Communication Association"},{"key":"ref20","article-title":"Fast bootstrapping of LVCSR systems with multilingual phoneme sets","author":"schultz","year":"1997","journal-title":"Fifth European Conference on Speech Communication and Technology"},{"key":"ref45","doi-asserted-by":"publisher","DOI":"10.1007\/BF02108643"},{"key":"ref22","doi-asserted-by":"crossref","first-page":"1713","DOI":"10.1109\/TASLP.2014.2346313","article-title":"Fast adaptation of deep neural network based on discriminant codes for speech recognition","volume":"22","author":"xue","year":"2014","journal-title":"IEEE\/ACM Transactions on Audio Speech and Language Processing"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2015.7178862"},{"key":"ref42","article-title":"Openair: An interactive auralization web resource and database","author":"murphy","year":"2010","journal-title":"Audio Engineering Society Convention 129"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2012.6288862"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1109\/WASPAA.2013.6701894"},{"key":"ref23","article-title":"Multilingual bottle-neck features and its application for under-resourced languages","author":"vu","year":"2012","journal-title":"Proc Spoken Language Technologies for Under-resourced Languages"},{"key":"ref44","article-title":"An open dataset for research on audio field recording archives: freefield1010","author":"stowell","year":"2013","journal-title":"arXiv preprint arXiv 1309 5275"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2014.6855089"},{"key":"ref43","article-title":"Evaluation of speech dereverberation algorithms using the MARDY database","author":"wen","year":"2006","journal-title":"Proceedings of the Intl Workshop on Acoustic Echo and Noise Control"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/ASRU.2013.6707719"}],"event":{"name":"2018 IEEE Spoken Language Technology Workshop (SLT)","start":{"date-parts":[[2018,12,18]]},"location":"Athens, Greece","end":{"date-parts":[[2018,12,21]]}},"container-title":["2018 IEEE Spoken Language Technology Workshop (SLT)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8632666\/8639030\/08639569.pdf?arnumber=8639569","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,1,27]],"date-time":"2022-01-27T05:46:55Z","timestamp":1643262415000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/8639569\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,12]]},"references-count":45,"URL":"https:\/\/doi.org\/10.1109\/slt.2018.8639569","relation":{},"subject":[],"published":{"date-parts":[[2018,12]]}}}