{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,28]],"date-time":"2026-03-28T07:07:14Z","timestamp":1774681634735,"version":"3.50.1"},"reference-count":21,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2014,5]]},"DOI":"10.1109\/icassp.2014.6854672","type":"proceedings-article","created":{"date-parts":[[2014,7,29]],"date-time":"2014-07-29T19:23:23Z","timestamp":1406661803000},"page":"5587-5591","source":"Crossref","is-referenced-by-count":40,"title":["Asynchronous stochastic optimization for sequence training of deep neural networks"],"prefix":"10.1109","author":[{"given":"Georg","family":"Heigold","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Erik","family":"McDermott","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Vincent","family":"Vanhoucke","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Andrew","family":"Senior","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Michiel","family":"Bacchiani","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"19","doi-asserted-by":"publisher","DOI":"10.1007\/978-0-387-45528-0"},{"key":"17","article-title":"Large scale distributed deep networks","author":"dean","year":"2012","journal-title":"Advances in Neural Information Processing Systems (NIPS)"},{"key":"18","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6639348"},{"key":"15","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6639147"},{"key":"16","first-page":"81","article-title":"Building high-level features using large scale unsupervised learning","author":"le","year":"2012","journal-title":"International Conference on Machine Learning"},{"key":"13","doi-asserted-by":"crossref","DOI":"10.21437\/Interspeech.2013-548","article-title":"Sequencediscriminative training of deep neural networks","author":"vesely","year":"2013","journal-title":"InterSpeech"},{"key":"14","article-title":"Stochastic gradient learning in neural networks","author":"bottou","year":"1991","journal-title":"Neuro-Nimes"},{"key":"11","doi-asserted-by":"crossref","DOI":"10.21437\/Interspeech.2012-3","article-title":"Scalable minimum Bayes risk training of deep neural network acoustic models using distributed Hessian-free optimization","author":"kingsbury","year":"2012","journal-title":"InterSpeech"},{"key":"12","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6638951"},{"key":"21","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4419-5951-5_4"},{"key":"3","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2011.2134090"},{"key":"20","author":"heigold","year":"2010","journal-title":"A Log-linear discriminative modeling framework for speech recognition"},{"key":"2","article-title":"Context-dependent pretrained deep neural networks for large vocabulary speech recognition","author":"dahl","year":"2011","journal-title":"IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP)"},{"key":"1","doi-asserted-by":"crossref","first-page":"437","DOI":"10.21437\/Interspeech.2011-169","article-title":"Conversational speech transcription using context-dependent deep neural networks","author":"seide","year":"2011","journal-title":"InterSpeech"},{"key":"10","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2009.4960445"},{"key":"7","article-title":"Tandem connectionist feature extraction for conventional HMM systems","author":"hermansky","year":"2000","journal-title":"IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP)"},{"key":"6","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4615-3210-1"},{"key":"5","doi-asserted-by":"publisher","DOI":"10.1109\/MSP.2012.2205597"},{"key":"4","doi-asserted-by":"crossref","DOI":"10.21437\/Interspeech.2012-10","article-title":"Application of pretrained deep neural networks to large vocabulary speech recognition","author":"jaitly","year":"2012","journal-title":"InterSpeech"},{"key":"9","author":"povey","year":"2004","journal-title":"Discriminative training for large vocabulary speech recognition"},{"key":"8","author":"normandin","year":"1991","journal-title":"Hidden Markov models maximum mutual information and the speech recognition problem"}],"event":{"name":"ICASSP 2014 - 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)","location":"Florence, Italy","start":{"date-parts":[[2014,5,4]]},"end":{"date-parts":[[2014,5,9]]}},"container-title":["2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/6844297\/6853544\/06854672.pdf?arnumber=6854672","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,5,4]],"date-time":"2025-05-04T00:04:00Z","timestamp":1746317040000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/6854672\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2014,5]]},"references-count":21,"URL":"https:\/\/doi.org\/10.1109\/icassp.2014.6854672","relation":{},"subject":[],"published":{"date-parts":[[2014,5]]}}}