{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,8,15]],"date-time":"2025-08-15T01:56:48Z","timestamp":1755223008069,"version":"3.43.0"},"reference-count":18,"publisher":"Springer Science and Business Media LLC","issue":"1-2","license":[{"start":{"date-parts":[[2001,8,1]],"date-time":"2001-08-01T00:00:00Z","timestamp":996624000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2001,8,1]],"date-time":"2001-08-01T00:00:00Z","timestamp":996624000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["The Journal of VLSI Signal Processing-Systems for Signal, Image, and Video Technology"],"published-print":{"date-parts":[[2001,8]]},"DOI":"10.1023\/a:1011171430700","type":"journal-article","created":{"date-parts":[[2002,12,23]],"date-time":"2002-12-23T03:43:03Z","timestamp":1040614983000},"page":"51-61","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":38,"title":["Hidden Markov Model Inversion for Audio-to-Visual Conversion in an MPEG-4 Facial Animation System"],"prefix":"10.1007","volume":"29","author":[{"given":"Kyoungho","family":"Choi","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ying","family":"Luo","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jenq-Neng","family":"Hwang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2001,8,1]]},"reference":[{"key":"338490_CR1","doi-asserted-by":"publisher","first-page":"447","DOI":"10.1109\/MMCS.1999.778493","volume":"2","author":"K. Kiyokawa","year":"1999","unstructured":"K. Kiyokawa, H. Takemura, and N. Yokoya, \u201cSeamlessDesign: A Face-to-Face Collaborative Virtual\/Augmented Environment for Rapid Prototyping of Geometrically Constrained 3-D Ob-jects, \u201d IEEE International Conference on Multimedia Comput-ing and Systems, vol. 2, 1999, pp. 447\u2013453.","journal-title":"IEEE International Conference on Multimedia Comput-ing and Systems"},{"key":"338490_CR2","doi-asserted-by":"crossref","unstructured":"Yao-Jen Chang, Chih-Chung Chen, Jen-Chung Chou, and Yung-Chang Chen, \u201cImplementation of a Virtual Chat Room for Mul-timedia Communications, \u201d 1999 IEEE 3rd Workshop on Multi-media Signal Processing, 1999, pp. 599\u2013604.","DOI":"10.1109\/MMSP.1999.793925"},{"key":"338490_CR3","doi-asserted-by":"publisher","first-page":"433","DOI":"10.1109\/MMCS.1999.778485","volume":"2","author":"S. Yura","year":"1999","unstructured":"S. Yura, T. Usaka, and K. Sakamura, \u201cVideo Avatar: Embed-ded Video for Collaborative Virtual Environment, \u201d IEEE Inter-national Conference on Multimedia Computing and Systems, vol. 2, 1999, pp. 433\u2013438.","journal-title":"IEEE Inter-national Conference on Multimedia Computing and Systems"},{"issue":"4","key":"338490_CR4","doi-asserted-by":"publisher","first-page":"594","DOI":"10.1109\/49.81953","volume":"9","author":"S. Morishima","year":"1991","unstructured":"S. Morishima and H. Harashima, \u201cA Media Conversion from Speech to Facial Image for Intelligent Man-Machine Interface, \u201d IEEE Journal on Sel. Areas in Communications, vol. 9, no. 4, 1991, pp. 594\u2013600.","journal-title":"IEEE Journal on Sel. Areas in Communications"},{"issue":"1","key":"338490_CR5","doi-asserted-by":"publisher","first-page":"90","DOI":"10.1109\/86.372898","volume":"3","author":"F. Lavagetto","year":"1995","unstructured":"Fabio Lavagetto, \u201cConverting Speech into Lip Movement: A Multimedia Telephone for Hard of Hearing People, \u201d IEEE Transaction on Rehabilitation Engineering, vol. 3, no. 1, 1995, pp. 90\u2013102.","journal-title":"IEEE Transaction on Rehabilitation Engineering"},{"issue":"1","key":"338490_CR6","doi-asserted-by":"publisher","first-page":"15","DOI":"10.1109\/41.661300","volume":"45","author":"R. R. Rao","year":"1998","unstructured":"Ram R. Rao, Tsuhan Chen, and Russell M. Mersereau, \u201cAudio-to-Visual Conversion for Multimedia Communication, \u201d IEEE. Transactions on Industrial Electronics, vol. 45, no. 1, 1998, pp. 15\u201322.","journal-title":"IEEE. Transactions on Industrial Electronics"},{"key":"338490_CR7","doi-asserted-by":"crossref","unstructured":"S. Nakamura, E. Yamamoto, and K. Shikano, \u201cSpeech-Lip Movement Synthesis Maximizing Audio-Visual Joint Probability Based on EM Algorithm, \u201d IEEE International Workshop on Multimedia Signal Processing, 1998, pp. 53\u201358.","DOI":"10.1109\/MMSP.1998.738912"},{"key":"338490_CR8","doi-asserted-by":"crossref","unstructured":"KyoungHo Choi and J.N. Hwang, \u201cBaum\u2013Welch HMM Inversion for Audio-to-Visual Conversion, \u201d IEEE International Workshop on Multimedia Signal Processing, 1999, pp. 175\u2013180.","DOI":"10.1109\/MMSP.1999.793816"},{"key":"338490_CR9","unstructured":"S.Y. Moon and J.N. Hwang, \u201cNoisy Speech Recognition Using Robust Inversion of Hidden Markov Models, \u201d IEEE International Conf. Acoust., Speech, Signal Processing, 1995, pp. 145\u2013148."},{"issue":"2","key":"338490_CR10","doi-asserted-by":"publisher","first-page":"194","DOI":"10.1109\/72.557656","volume":"8","author":"S.Y. Moon","year":"1997","unstructured":"S.Y. Moon and J.N. Hwang, \u201cRobust Speech Recognition Based on Joint Model and Feature Space Optimization of Hidden Markov Models, \u201d IEEE Transactions on Neural Networks, vol. 8, no. 2, 1997, pp. 194\u2013204.","journal-title":"IEEE Transactions on Neural Networks"},{"key":"338490_CR11","unstructured":"L.R. Rabiner and B.H. Juang, Fundamentals of Speech Recognition, Prentice-Hall Inc., 1993."},{"issue":"5","key":"338490_CR12","doi-asserted-by":"publisher","first-page":"870","DOI":"10.1109\/5.664277","volume":"86","author":"N. M. Thalmann","year":"1998","unstructured":"Nadia Magnenat Thalmann, Prem Kalra, and Marc Escher, \u201cFace to Virtual Face, \u201d Proceedings of the IEEE, vol. 86, no. 5, 1998, pp. 870\u2013883.","journal-title":"Proceedings of the IEEE"},{"issue":"5","key":"338490_CR13","doi-asserted-by":"publisher","first-page":"786","DOI":"10.1109\/76.633499","volume":"7","author":"F. Lavagetto","year":"1997","unstructured":"Fabio Lavagetto, \u201cTime-Delay Neural Networks for Estimating Lip Movements From Speech Analysis: A Useful Tool in Audio-Video Synchronization, \u201d IEEE Transactions on Circuits and Systems for Video Technology, vol. 7, no. 5, 1997, pp. 786\u2013800.","journal-title":"IEEE Transactions on Circuits and Systems for Video Technology"},{"key":"338490_CR14","doi-asserted-by":"crossref","unstructured":"Won-Sook Lee, Marc Escher, Gael Sannier, and Nadia Magnenat-Thalmann, \u201cMPEG-4 Compatible Faces from Orthogonal Photos, \u201d International Conference on Computer An-imation, 1999, pp. 186\u2013194.","DOI":"10.1109\/CA.1999.781211"},{"issue":"4","key":"338490_CR15","doi-asserted-by":"publisher","first-page":"355","DOI":"10.1016\/S0262-8856(99)00057-8","volume":"18","author":"W. Lee","year":"2000","unstructured":"Won-Sook Lee and N. Magnenat-Thalmann, \u201cFast Head Modeling for Animation, \u201d Journal of Image and Vision Computing, vol. 18, no 4, 2000, pp. 355\u2013364.","journal-title":"Journal of Image and Vision Computing"},{"key":"338490_CR16","doi-asserted-by":"crossref","unstructured":"L. Moccozet and N. Magnenat-Thalmann, \u201cDirichlet Free-Form Deformations and Their Application to Hand Simulation, \u201d The Proceedings of Computer Animation, 1997, pp. 93\u2013102.","DOI":"10.1109\/CA.1997.601047"},{"key":"338490_CR17","doi-asserted-by":"publisher","first-page":"143","DOI":"10.1109\/ICCV.1999.791210","volume":"1","author":"F. Pighin","year":"1999","unstructured":"Frederic Pighin, Richard Szeliski, and David H. Salesin, \u201cResynthesizing Facial Animation Through 3D Model-Based Tracking, \u201d The Proceedings of the Seventh IEEE Internation Conference on Computer Vision, vol. 1, 1999, pp. 143\u2013150.","journal-title":"The Proceedings of the Seventh IEEE Internation Conference on Computer Vision"},{"key":"338490_CR18","doi-asserted-by":"crossref","unstructured":"J. Strom, T. Jebara, S. Basu, and A. Pentland, \u201cReal Time Tracking and Modeling of Faces: An EKF-based Analysis by Synthesis Approach, \u201d Proceedings IEEE International Workshop on Modeling People, 1999, pp. 55\u201361.","DOI":"10.1109\/PEOPLE.1999.798346"}],"container-title":["Journal of VLSI signal processing systems for signal, image and video technology"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1023\/A:1011171430700.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1023\/A:1011171430700\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1023\/A:1011171430700.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,8,11]],"date-time":"2025-08-11T09:44:27Z","timestamp":1754905467000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1023\/A:1011171430700"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2001,8]]},"references-count":18,"journal-issue":{"issue":"1-2","published-print":{"date-parts":[[2001,8]]}},"alternative-id":["338490"],"URL":"https:\/\/doi.org\/10.1023\/a:1011171430700","relation":{},"ISSN":["0922-5773"],"issn-type":[{"type":"print","value":"0922-5773"}],"subject":[],"published":{"date-parts":[[2001,8]]},"assertion":[{"value":"1 August 2001","order":1,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}