{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,5,19]],"date-time":"2025-05-19T10:44:55Z","timestamp":1747651495053,"version":"3.40.3"},"publisher-location":"Cham","reference-count":22,"publisher":"Springer Nature Switzerland","isbn-type":[{"type":"print","value":"9783031632181"},{"type":"electronic","value":"9783031632198"}],"license":[{"start":{"date-parts":[[2024,1,1]],"date-time":"2024-01-01T00:00:00Z","timestamp":1704067200000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,1,1]],"date-time":"2024-01-01T00:00:00Z","timestamp":1704067200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2024]]},"DOI":"10.1007\/978-3-031-63219-8_8","type":"book-chapter","created":{"date-parts":[[2024,6,21]],"date-time":"2024-06-21T11:02:34Z","timestamp":1718967754000},"page":"99-110","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":2,"title":["Lip Recognition Based on Bi-GRU with Multi-Head Self-Attention"],"prefix":"10.1007","author":[{"given":"Ran","family":"Ni","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Haiyang","family":"Jiang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Lu","family":"Zhou","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yuanyao","family":"Lu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2024,6,22]]},"reference":[{"key":"8_CR1","doi-asserted-by":"publisher","unstructured":"He, R., Wu, X., Sun, Z., Tan, T.: Wasserstein CNN: learning invariant features for NIR-VIS face recognition. IEEE Trans. Patt. Anal. Mach. Intell. 41(7), 1761\u20131773, 1 July 2019. https:\/\/doi.org\/10.1109\/TPAMI.2018.2842770","DOI":"10.1109\/TPAMI.2018.2842770"},{"key":"8_CR2","doi-asserted-by":"publisher","unstructured":"Song, N., Yang, H., Wu, P.: A gesture-to-emotional speech conversion by combining gesture recognition and facial expression recognition. In: 2018 First Asian Conference on Affective Computing and Intelligent Interaction (ACII Asia), Beijing, China, pp. 1\u20136 (2018). https:\/\/doi.org\/10.1109\/ACIIAsia.2018.8470350","DOI":"10.1109\/ACIIAsia.2018.8470350"},{"key":"8_CR3","unstructured":"Byun, K.-S., Park, C.-H., Sim, K.-B.: Emotion recognition from facial expression using hybrid-feature extraction. In: SICE 2004 Annual Conference, Sapporo, Japan, vol. 3, pp. 2483\u20132487 (2004)"},{"key":"8_CR4","doi-asserted-by":"publisher","unstructured":"Zhang, Z., Wu, B., Jiang, Y.: Gesture recognition system based on improved YOLO v3. In: 2022 7th International Conference on Intelligent Computing and Signal Processing (ICSP), Xi'an, China, pp. 1540\u20131543 (2022). https:\/\/doi.org\/10.1109\/ICSP54964.2022.9778394","DOI":"10.1109\/ICSP54964.2022.9778394"},{"issue":"8","key":"8_CR5","doi-asserted-by":"publisher","first-page":"3152","DOI":"10.1109\/TITS.2019.2929020","volume":"21","author":"M Veres","year":"2020","unstructured":"Veres, M., Moussa, M.: Deep learning for intelligent transportation systems: a survey of emerging trends. IEEE Trans. Intell. Transp. Syst. 21(8), 3152\u20133168 (2020). https:\/\/doi.org\/10.1109\/TITS.2019.2929020","journal-title":"IEEE Trans. Intell. Transp. Syst."},{"issue":"3","key":"8_CR6","doi-asserted-by":"publisher","first-page":"481","DOI":"10.1109\/TETCI.2019.2917039","volume":"5","author":"A Adeel","year":"2021","unstructured":"Adeel, A., Gogate, M., Hussain, A., Whitmer, W.M.: Lip-reading driven deep learning approach for speech enhancement. IEEE Trans. Emerg. Topics Comput. Intell. 5(3), 481\u2013490 (2021). https:\/\/doi.org\/10.1109\/TETCI.2019.2917039","journal-title":"IEEE Trans. Emerg. Topics Comput. Intell."},{"issue":"2","key":"8_CR7","doi-asserted-by":"publisher","first-page":"212","DOI":"10.1121\/1.1907309","volume":"26","author":"WH Sumby","year":"1954","unstructured":"Sumby, W.H., Pollack, I.: Visual contribution to speech intelligibility in noise. J. Acoust. Soc. Am. 26(2), 212\u2013215 (1954)","journal-title":"J. Acoust. Soc. Am."},{"key":"8_CR8","doi-asserted-by":"crossref","unstructured":"Goldschen, A.J., Garcia, O.N., Petajan, E.: Continuous optical automatic speech recognition by lipreading. In: Proceeding of 28th Annual Asilomar Conference on Signal Systems and Computer, vol. 1, no. 1, pp. 572\u2013577 (1994)","DOI":"10.1109\/ACSSC.1994.471517"},{"key":"8_CR9","doi-asserted-by":"publisher","unstructured":"Rahmani, M.H., Almasganj, F.: Lip-reading via a DNN-HMM hybrid system using combination of the image-based and model-based features. In: 2017 3rd International Conference on Pattern Recognition and Image Analysis (IPRIA), Shahrekord, Iran, pp. 195\u2013199 (2017). https:\/\/doi.org\/10.1109\/PRIA.2017.7983045","DOI":"10.1109\/PRIA.2017.7983045"},{"key":"8_CR10","doi-asserted-by":"publisher","unstructured":"Xue, S., Jiang, H., Dai, L.: Speaker adaptation of hybrid NN\/HMM model for speech recognition based on singular value decomposition. In: The 9th International Symposium on Chinese Spoken Language Processing, Singapore, pp. 1\u20135 (2014). https:\/\/doi.org\/10.1109\/ISCSLP.2014.6936583","DOI":"10.1109\/ISCSLP.2014.6936583"},{"key":"8_CR11","doi-asserted-by":"publisher","unstructured":"Martinez, B., Ma, P., Petridis, S., Pantic, M.: Lipreading using temporal convolutional networks. In: ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Barcelona, Spain, pp. 6319\u20136323 (2020). https:\/\/doi.org\/10.1109\/ICASSP40776.2020.9053841","DOI":"10.1109\/ICASSP40776.2020.9053841"},{"key":"8_CR12","doi-asserted-by":"publisher","unstructured":"Bi, C., Zhang, D., Yang, L., Chen, P.: An lipreading modle with DenseNet and E3D-LSTM. In: 2019 6th International Conference on Systems and Informatics (ICSAI), Shanghai, China, pp. 511\u2013515 (2019).https:\/\/doi.org\/10.1109\/ICSAI48974.2019.9010432","DOI":"10.1109\/ICSAI48974.2019.9010432"},{"key":"8_CR13","doi-asserted-by":"publisher","unstructured":"Wand, M., Koutn\u00edk, J., Schmidhuber, J.: Lipreading with long short-term memory. In: 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Shanghai, China, pp. 6115\u20136119 (2016). https:\/\/doi.org\/10.1109\/ICASSP.2016.7472852","DOI":"10.1109\/ICASSP.2016.7472852"},{"key":"8_CR14","unstructured":"Maeda, T., Tamura,S.: Multi-view convolution for lipreading. In: 2021 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Tokyo, Japan, pp. 1092\u20131096 (2021)"},{"key":"8_CR15","doi-asserted-by":"publisher","unstructured":"Maulana, M.R.A.R., Fanany, M. I.: Sentence-level Indonesian lip reading with spatiotemporal CNN and gated RNN. In: 2017 International Conference on Advanced Computer Science and Information Systems (ICACSIS), Bali, Indonesia, pp. 375\u2013380 (2017). https:\/\/doi.org\/10.1109\/ICACSIS.2017.8355061","DOI":"10.1109\/ICACSIS.2017.8355061"},{"key":"8_CR16","doi-asserted-by":"publisher","unstructured":"Szegedy, C., et al.: Going deeper with convolutions. In: 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Boston, MA, USA, pp. 1\u20139 (2015). https:\/\/doi.org\/10.1109\/CVPR.2015.7298594","DOI":"10.1109\/CVPR.2015.7298594"},{"key":"8_CR17","unstructured":"Zeng, Q., Du, J., Wang,Z.: HMM-based lip reading with stingy residual 3D convolution. In: 2021 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Tokyo, Japan, pp. 1438\u20131443 (2021)"},{"key":"8_CR18","doi-asserted-by":"publisher","unstructured":"Stergiou, A., Poppe,R.: Spatio-temporal FAST 3D convolutions for human action recognition. In: 2019 18th IEEE International Conference on Machine Learning and Applications (ICMLA), Boca Raton, FL, USA, pp. 183\u2013190 (2019). https:\/\/doi.org\/10.1109\/ICMLA.2019.00036","DOI":"10.1109\/ICMLA.2019.00036"},{"key":"8_CR19","doi-asserted-by":"publisher","unstructured":"Tao, X., et al.: A new 3D convolution network for hyperspectral Unmixing. In: IGARSS 2022 - 2022 IEEE International Geoscience and Remote Sensing Symposium, Kuala Lumpur, Malaysia, pp. 1620\u20131623 (2022). https:\/\/doi.org\/10.1109\/IGARSS46834.2022.9883506","DOI":"10.1109\/IGARSS46834.2022.9883506"},{"key":"8_CR20","doi-asserted-by":"publisher","unstructured":"Xie, J., et al.: Advanced dropout: a model-free methodology for Bayesian dropout optimization. IEEE Trans. Patt. Anal. Mach. Intell. 44(9), 4605\u20134625, 1 September 2022. https:\/\/doi.org\/10.1109\/TPAMI.2021.3083089","DOI":"10.1109\/TPAMI.2021.3083089"},{"key":"8_CR21","doi-asserted-by":"publisher","unstructured":"Prajwal, K.R., Afouras, T., Zisserman, A.: Sub-word level lip reading with visual attention. In: 2022 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, LA, USA, pp. 5152\u20135162 (2022). https:\/\/doi.org\/10.1109\/CVPR52688.2022.00510","DOI":"10.1109\/CVPR52688.2022.00510"},{"key":"8_CR22","doi-asserted-by":"publisher","first-page":"77205","DOI":"10.1109\/ACCESS.2022.3193231","volume":"10","author":"H Wang","year":"2022","unstructured":"Wang, H., Pu, G., Chen, T.: A lip reading method based on 3d convolutional vision transformer. IEEE Access 10, 77205\u201377212 (2022). https:\/\/doi.org\/10.1109\/ACCESS.2022.3193231","journal-title":"IEEE Access"}],"container-title":["IFIP Advances in Information and Communication Technology","Artificial Intelligence Applications and Innovations"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-031-63219-8_8","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,11,22]],"date-time":"2024-11-22T10:39:48Z","timestamp":1732271988000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-031-63219-8_8"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024]]},"ISBN":["9783031632181","9783031632198"],"references-count":22,"URL":"https:\/\/doi.org\/10.1007\/978-3-031-63219-8_8","relation":{},"ISSN":["1868-4238","1868-422X"],"issn-type":[{"type":"print","value":"1868-4238"},{"type":"electronic","value":"1868-422X"}],"subject":[],"published":{"date-parts":[[2024]]},"assertion":[{"value":"22 June 2024","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"The authors declare that they have no conflict of interest.","order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Disclosure of Interests"}},{"value":"AIAI","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"IFIP International Conference on Artificial Intelligence Applications and Innovations","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Corfu","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Greece","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2024","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"27 June 2024","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"30 June 2024","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"20","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"aiai2024","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/ifipaiai.org\/2024\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}