{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,2,21]],"date-time":"2025-02-21T21:13:53Z","timestamp":1740172433787,"version":"3.37.3"},"reference-count":73,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2020,1,1]],"date-time":"2020-01-01T00:00:00Z","timestamp":1577836800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2020,1,1]],"date-time":"2020-01-01T00:00:00Z","timestamp":1577836800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2020,1,1]],"date-time":"2020-01-01T00:00:00Z","timestamp":1577836800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE\/ACM Trans. Audio Speech Lang. Process."],"published-print":{"date-parts":[[2020]]},"DOI":"10.1109\/taslp.2020.2980974","type":"journal-article","created":{"date-parts":[[2020,3,17]],"date-time":"2020-03-17T02:44:11Z","timestamp":1584413051000},"page":"1065-1078","source":"Crossref","is-referenced-by-count":5,"title":["Audiovisual Speaker Tracking Using Nonlinear Dynamical Systems With Dynamic Stream Weights"],"prefix":"10.1109","volume":"28","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-6128-3556","authenticated-orcid":false,"given":"Christopher","family":"Schymura","sequence":"first","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0003-0678-3053","authenticated-orcid":false,"given":"Dorothea","family":"Kolossa","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref73","doi-asserted-by":"publisher","DOI":"10.1080\/03081080500055072"},{"key":"ref72","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2014.6855047"},{"article-title":"Keras","year":"2015","author":"chollet","key":"ref71"},{"key":"ref70","doi-asserted-by":"publisher","DOI":"10.1109\/IGARSS.2008.4779947"},{"key":"ref39","doi-asserted-by":"publisher","DOI":"10.1155\/S1110865702206058"},{"key":"ref38","first-page":"1","article-title":"2D audio-visual localization in home environments using a particle filter","author":"gerlach","year":"0","journal-title":"Proc 10th ITG Symp Speech Commun"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/MICC.2013.6805827"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/CDC.2005.1583486"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/MCS.2012.2225929"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1177\/027836499301200102"},{"key":"ref37","first-page":"898","article-title":"Audiovisual person tracking with a mobile robot","author":"fritsch","year":"0","journal-title":"Proc Int Conf Intell Auton Syst"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1109\/ASPAA.2005.1540183"},{"key":"ref35","first-page":"433","article-title":"Distributed inference in dynamical systems","author":"funiak","year":"0","journal-title":"Advances in Neural Information Processing Systems 19"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1016\/j.sysconle.2010.06.014"},{"year":"2017","author":"veaux","key":"ref60"},{"key":"ref62","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2015.2463722"},{"key":"ref61","doi-asserted-by":"publisher","DOI":"10.1121\/1.2229005"},{"key":"ref63","doi-asserted-by":"publisher","DOI":"10.1080\/01621459.1961.10482090"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/SLT.2016.7846282"},{"key":"ref64","doi-asserted-by":"publisher","DOI":"10.1109\/97.736233"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/JPROC.2006.886017"},{"key":"ref65","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2011.2180896"},{"key":"ref66","doi-asserted-by":"publisher","DOI":"10.1109\/LSP.2010.2091502"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/TAC.1979.1101973"},{"key":"ref67","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2018.8461310"},{"key":"ref68","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.91"},{"key":"ref69","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2001.940294"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.23919\/ICIF.2018.8455667"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/IVS.2010.5548052"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2011.2172427"},{"key":"ref22","article-title":"Frame-dependent multi-stream reliability indicators for audio-visual speech recognition","author":"garg","year":"0","journal-title":"Proc IEEE Int Conf Acoust Speech Signal Process"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2015.2409785"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2007.367227"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2005.1415152"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2017.7953172"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2016-166"},{"journal-title":"Probabilistic Robotics","year":"2005","author":"thrun","key":"ref50"},{"key":"ref51","doi-asserted-by":"publisher","DOI":"10.1214\/aos\/1176343414"},{"key":"ref59","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2018.8462620"},{"article-title":"CVX: Matlab software for disciplined convex programming, version 2.1","year":"2014","author":"grant","key":"ref58"},{"key":"ref57","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-84800-155-8_7"},{"key":"ref56","doi-asserted-by":"publisher","DOI":"10.1017\/CBO9780511804441"},{"key":"ref55","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.1998.679695"},{"key":"ref54","first-page":"1","article-title":"Utilizing slow feature analysis for lipreading","author":"freiwald","year":"0","journal-title":"Proc 13th ITG-Symp Speech Commun"},{"journal-title":"Machine Learning A Probabilistic Perspective","year":"2013","author":"murphy","key":"ref53"},{"key":"ref52","volume":"42","author":"cormen","year":"2001","journal-title":"Introduction to Algorithms"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2017.2783545"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1016\/j.inffus.2011.08.001"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1145\/1088463.1088477"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/TSMCB.2005.859081"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1115\/1.3662552"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/JAS.2017.7510808"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TAES.1966.4501892"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1117\/12.280797"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/78.978374"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/TAC.1970.1099422"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/IWAENC.2018.8521384"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/METROI4.2018.8428330"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/NER.2013.6696173"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/FUZZY.2011.6007636"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/TITB.2009.2037317"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/ASRU.2009.5373530"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/ICMEW.2016.7574719"},{"key":"ref49","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2018.8462100"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2018.8461326"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2014.2377515"},{"key":"ref45","first-page":"1","article-title":"Audio-visual tracking of a variable number of speakers with a random finite set approach","author":"kili\u00e7","year":"0","journal-title":"Proc 17th Int Conf Inf Fusion"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2017.2648793"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1109\/HSCMA.2017.7895564"},{"key":"ref42","doi-asserted-by":"publisher","DOI":"10.1109\/ICMT.2011.6002028"},{"key":"ref41","first-page":"974","article-title":"A joint particle filter to track the position and head orientation of people using audio visual cues","author":"brutti","year":"0","journal-title":"Proc 18th Eur Signal Process Conf"},{"key":"ref44","doi-asserted-by":"publisher","DOI":"10.1109\/JSTSP.2013.2257162"},{"key":"ref43","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2017.7952686"}],"container-title":["IEEE\/ACM Transactions on Audio, Speech, and Language Processing"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/6570655\/8938144\/09037104.pdf?arnumber=9037104","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,4,27]],"date-time":"2022-04-27T17:31:24Z","timestamp":1651080684000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9037104\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020]]},"references-count":73,"URL":"https:\/\/doi.org\/10.1109\/taslp.2020.2980974","relation":{},"ISSN":["2329-9290","2329-9304"],"issn-type":[{"type":"print","value":"2329-9290"},{"type":"electronic","value":"2329-9304"}],"subject":[],"published":{"date-parts":[[2020]]}}}