{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,5,5]],"date-time":"2025-05-05T03:40:10Z","timestamp":1746416410814,"version":"3.40.4"},"publisher-location":"Cham","reference-count":18,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783319115801"},{"type":"electronic","value":"9783319115818"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2014]]},"DOI":"10.1007\/978-3-319-11581-8_26","type":"book-chapter","created":{"date-parts":[[2014,10,10]],"date-time":"2014-10-10T14:29:54Z","timestamp":1412951394000},"page":"209-216","source":"Crossref","is-referenced-by-count":3,"title":["Extraction of Features for Lip-reading Using Autoencoders"],"prefix":"10.1007","author":[{"given":"Karel","family":"Pale\u010dek","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","reference":[{"issue":"9","key":"26_CR1","first-page":"1306","volume":"91","author":"G. Potamianos","year":"2003","unstructured":"Potamianos, G., Neti, C., Gravier, G., Garg, A., Senior, A.W.: Recent Advances in the Automatic Recognition of Audiovisual Speech. Proc.\u00a0of\u00a0the\u00a0IEEE\u00a091(9), 1306\u20131326 (2003)","journal-title":"Proc.\u00a0of\u00a0the\u00a0IEEE"},{"key":"26_CR2","doi-asserted-by":"crossref","unstructured":"Goecke, R.: Current Trends in Joint Audio-Video Signal Processing: A Review. In: Proc. of the Eighth International Symposium on Signal Processing and Its Applications, pp. 70\u201373 (2005)","DOI":"10.1109\/ISSPA.2005.1580198"},{"key":"26_CR3","doi-asserted-by":"crossref","unstructured":"Liew, A.W.Ch., W.S.: Visual Speech Recognition: Lip Segmentation and Mapping. Information Science Reference \u2013 Imprint. IGI Publishing, New York (2009)","DOI":"10.4018\/978-1-60566-186-5"},{"key":"26_CR4","unstructured":"Lan, Y., Theobald, B.J., Harvey, R., Bowden, R.: Comparing Visual Features for Lipreading. In: Proc. AVSP, pp. 102\u2013106 (2009)"},{"key":"26_CR5","doi-asserted-by":"crossref","unstructured":"Pale\u010dek, K., Chaloupka, J.: Audio-visual Speech Recognition in Noisy Audio Environments. In: 36th International Conference on Telecommunications and Signal Processing (TSP), pp. 484\u2013487 (2013)","DOI":"10.1109\/TSP.2013.6613979"},{"key":"26_CR6","unstructured":"Goecke, R., Millar, J.B., Zelinovsky, A., Ribes, R.J.: Stereo Vision Lip-Tracking for Audio-Video Speech Processing. In: Proceedings of the 2001 IEEE International Conference on Acoustics, Speech, Signal\u00a0Processing (2001)"},{"key":"26_CR7","doi-asserted-by":"crossref","unstructured":"C\u00edsa\u0159, P., Kr\u0148oul, Z., \u017delezn\u00fd, M.: 3D Lip-Tracking for Audio-Visual Speech Recognition in Real Applications. In: Proc. INTERSPEECH (2004)","DOI":"10.21437\/Interspeech.2004-432"},{"key":"26_CR8","doi-asserted-by":"crossref","unstructured":"Galatas, G., Potamianos, G., Makedon, F.: Audio-visual Speech Recognition Incorporating Facial Depth Information Captured by the Kinect. In: Proc. EUSIPCO, pp. 2714\u20132717 (2012)","DOI":"10.1145\/2413097.2413100"},{"key":"26_CR9","doi-asserted-by":"crossref","unstructured":"Pei, Y., Kim, T.-K., Zha, H.: Unsupervised Random Forest Manifold Alignment for Lipreading. In: Proc. ICCV, pp. 129\u2013136 (2013)","DOI":"10.1109\/ICCV.2013.23"},{"issue":"1","key":"26_CR10","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1561\/2200000006","volume":"2","author":"Y. Bengio","year":"2009","unstructured":"Bengio, Y.: Learning Deep Architectures for AI. Foundations and Trends in Machine Learning\u00a02(1), 1\u2013127 (2009)","journal-title":"Foundations and Trends in Machine Learning"},{"key":"26_CR11","unstructured":"Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., Ng, A.Y.: Multimodal Deep Learning. In: Proc. ICML, pp. 689\u2013696 (2011)"},{"key":"26_CR12","doi-asserted-by":"crossref","unstructured":"Huang, J., Kingsbury, B.: Audio-visual Deep Learning for Noise Robust Speech Recognition. In: Proc. ICASSP, pp.\u00a07596\u20137599 (2013)","DOI":"10.1109\/ICASSP.2013.6639140"},{"key":"26_CR13","doi-asserted-by":"publisher","first-page":"137","DOI":"10.1023\/B:VISI.0000013087.49260.fb","volume":"57","author":"P.A. Viola","year":"2004","unstructured":"Viola, P.A., Jones, M.J.: Robust Real-Time Face Detection. International Journal of Computer Vision\u00a057, 137\u2013154 (2004)","journal-title":"International Journal of Computer Vision"},{"key":"26_CR14","doi-asserted-by":"crossref","unstructured":"Cao, X., Wei, Y., Wen, F., Sun, J.: Face Alignment by Explicit Shape Regression. In: Proc. CVPR, pp. 2887\u20132894 (2012)","DOI":"10.1109\/CVPR.2012.6248015"},{"key":"26_CR15","volume-title":"The HTK Book, version 2.1.","author":"Y. Steve","year":"1997","unstructured":"Steve, Y., Odel, J., Ollason, D., Valtchev, V., Woodland, P.: The HTK Book, version 2.1. Cambridge University, United Kingdom (1997)"},{"key":"26_CR16","unstructured":"Varga, A.P., Steeneken, H.J.M., Tomlinson, M., Jones, D.: The NOISEX-92 Study on the Effect of Additive Noise on Automatic Speech Recognition. Technical Report, DRA Speech Research Unit (1992)"},{"key":"26_CR17","doi-asserted-by":"crossref","unstructured":"Kamath, S., Loizou, P.: A Multi-band Spectral Subtraction Method for Enhancing Speech Corrupted by Colored Noise. In: Proc. ICASSP, pp. IV-4164 (2002)","DOI":"10.1109\/ICASSP.2002.5745591"},{"key":"26_CR18","first-page":"2951","volume":"25","author":"J. Snoek","year":"2012","unstructured":"Snoek, J., Larochelle, H., Adams, R.P.: Practical Bayesian Optimization of Machine Learning Algorithms. Advances in Neural Information Processing Systems\u00a025, 2951\u20132959 (2012)","journal-title":"Advances in Neural Information Processing Systems"}],"container-title":["Lecture Notes in Computer Science","Speech and Computer"],"original-title":[],"link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-319-11581-8_26","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,5,5]],"date-time":"2025-05-05T03:12:03Z","timestamp":1746414723000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-319-11581-8_26"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2014]]},"ISBN":["9783319115801","9783319115818"],"references-count":18,"URL":"https:\/\/doi.org\/10.1007\/978-3-319-11581-8_26","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2014]]}}}