{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,8]],"date-time":"2026-02-08T01:14:48Z","timestamp":1770513288038,"version":"3.49.0"},"reference-count":31,"publisher":"IEEE","license":[{"start":{"date-parts":[[2021,1,10]],"date-time":"2021-01-10T00:00:00Z","timestamp":1610236800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2021,1,10]],"date-time":"2021-01-10T00:00:00Z","timestamp":1610236800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2021,1,10]],"date-time":"2021-01-10T00:00:00Z","timestamp":1610236800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2021,1,10]]},"DOI":"10.1109\/icpr48806.2021.9412884","type":"proceedings-article","created":{"date-parts":[[2021,5,5]],"date-time":"2021-05-05T22:15:54Z","timestamp":1620252954000},"page":"4851-4856","source":"Crossref","is-referenced-by-count":11,"title":["Learning Visual Voice Activity Detection with an Automatically Annotated Dataset"],"prefix":"10.1109","author":[{"given":"Sylvain","family":"Guy","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Stephane","family":"Lathuiliere","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Pablo","family":"Mesejo","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Radu","family":"Horaud","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1016\/j.patrec.2018.05.023"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2019.2910523"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/ICIP.2019.8803248"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2002.1006168"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2011.07.011"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2014.2305632"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1121\/1.2229005"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2017.116"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1016\/j.neunet.2005.06.042"},{"key":"ref17","article-title":"Batch normalization: Accelerating deep network training by reducing internal covariate shift","author":"ioffe","year":"0","journal-title":"ICML"},{"key":"ref18","article-title":"P-cnn: Pose-based cnn features for action recognition","author":"ch\u00e9ron","year":"0","journal-title":"IEEE ICCV"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1007\/s11263-015-0816-y"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2011.5995407"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2016.2535357"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1007\/s11263-005-1838-7"},{"key":"ref3","article-title":"Voice activity detection using visual information","author":"liu","year":"0","journal-title":"ICASSP"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2014.2322824"},{"key":"ref29","article-title":"Adam: A method for stochastic optimization","author":"kingma","year":"0","journal-title":"ICLRE"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/TCSVT.2008.2009262"},{"key":"ref8","article-title":"Two novel visual voice activity detectors based on appearance models and retinal filtering","author":"aubrey","year":"2007","journal-title":"EUSIPCO"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2006.1660092"},{"key":"ref2","author":"potamianos","year":"2004","journal-title":"Audio-Visual Automatic Speech Recognition An Overview"},{"key":"ref9","article-title":"A visual voice activity detection method with adaboosting","author":"liu","year":"2011","journal-title":"IET SSPD"},{"key":"ref1","article-title":"Voice Activity Detection","author":"ramirez","year":"2007","journal-title":"Fundamentals and Speech Recognition System Robustness"},{"key":"ref20","author":"simonyan","year":"2014","journal-title":"Very Deep Convolutional Networks for Large-scale Image Recognition"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-45510-5_40"},{"key":"ref21","author":"abu-el-haija","year":"2016","journal-title":"Youtube-8m A large-scale video classification benchmark"},{"key":"ref24","article-title":"Visual speech detection using mouth region intensities","author":"siatras","year":"0","journal-title":"EUSIPCO"},{"key":"ref23","article-title":"Dlib-ml: A machine learning toolkit","author":"king","year":"2009","journal-title":"JMLR"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/DICTA.2011.29"},{"key":"ref25","article-title":"Dynamic visual features for visual-speech activity detection","author":"navarathna","year":"0","journal-title":"InterSpeech"}],"event":{"name":"2020 25th International Conference on Pattern Recognition (ICPR)","location":"Milan, Italy","start":{"date-parts":[[2021,1,10]]},"end":{"date-parts":[[2021,1,15]]}},"container-title":["2020 25th International Conference on Pattern Recognition (ICPR)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9411940\/9411911\/09412884.pdf?arnumber=9412884","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,5,10]],"date-time":"2022-05-10T11:40:56Z","timestamp":1652182856000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9412884\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,1,10]]},"references-count":31,"URL":"https:\/\/doi.org\/10.1109\/icpr48806.2021.9412884","relation":{},"subject":[],"published":{"date-parts":[[2021,1,10]]}}}