{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,8]],"date-time":"2024-09-08T08:41:52Z","timestamp":1725784912972},"reference-count":34,"publisher":"IEEE","license":[{"start":{"date-parts":[[2022,12,11]],"date-time":"2022-12-11T00:00:00Z","timestamp":1670716800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2022,12,11]],"date-time":"2022-12-11T00:00:00Z","timestamp":1670716800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2022,12,11]]},"DOI":"10.1109\/iscslp57327.2022.10037995","type":"proceedings-article","created":{"date-parts":[[2023,2,8]],"date-time":"2023-02-08T18:53:24Z","timestamp":1675882404000},"page":"250-254","source":"Crossref","is-referenced-by-count":3,"title":["Deep Learning Based Audio-Visual Multi-Speaker DOA Estimation Using Permutation-Free Loss Function"],"prefix":"10.1109","author":[{"given":"Qing","family":"Wang","sequence":"first","affiliation":[{"name":"University of Science and Technology of China,Hefei,China"}]},{"given":"Hang","family":"Chen","sequence":"additional","affiliation":[{"name":"University of Science and Technology of China,Hefei,China"}]},{"given":"Ya","family":"Jiang","sequence":"additional","affiliation":[{"name":"University of Science and Technology of China,Hefei,China"}]},{"given":"Zhe","family":"Wang","sequence":"additional","affiliation":[{"name":"University of Science and Technology of China,Hefei,China"}]},{"given":"Yuyang","family":"Wang","sequence":"additional","affiliation":[{"name":"University of Science and Technology of China,Hefei,China"}]},{"given":"Jun","family":"Du","sequence":"additional","affiliation":[{"name":"University of Science and Technology of China,Hefei,China"}]},{"given":"Chin-Hui","family":"Lee","sequence":"additional","affiliation":[{"name":"Georgia Institute of Technology,Atlanta,GA,USA"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/LSP.2016.2583658"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2008.917406"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2003.1248813"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/TIM.2014.2308051"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2017.2651373"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/TASSP.1976.1162830"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2007.366631"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/29.32276"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/TAP.1986.1143830"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/TAP.2018.2874430"},{"key":"ref11","article-title":"A review of sound source localization with deep learning methods","author":"Grumiaux","year":"2021","journal-title":"arXiv preprint arXiv:2109.03465"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.23919\/EUSIPCO.2018.8553182"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/JSTSP.2019.2900164"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2021.3060257"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/taslp.2023.3256088"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2019-1111"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP39728.2021.9415085"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1016\/j.neunet.2021.06.003"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/iccv48922.2021.00123"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01216-8_16"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00458"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v35i3.16354"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP39728.2021.9413776"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/mmsp53017.2021.9733678"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-540-30568-2_16"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2018.8461267"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP43922.2022.9746683"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1017\/cbo9780511811685"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/ICIP.2017.8296962"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.90"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP40776.2020.9053841"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/icassp.2018.8461310"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.6028\/nist.ir.4930"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1002\/nav.3800020109"}],"event":{"name":"2022 13th International Symposium on Chinese Spoken Language Processing (ISCSLP)","start":{"date-parts":[[2022,12,11]]},"location":"Singapore, Singapore","end":{"date-parts":[[2022,12,14]]}},"container-title":["2022 13th International Symposium on Chinese Spoken Language Processing (ISCSLP)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/10037756\/10037573\/10037995.pdf?arnumber=10037995","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,2,13]],"date-time":"2024-02-13T13:59:47Z","timestamp":1707832787000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10037995\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,12,11]]},"references-count":34,"URL":"https:\/\/doi.org\/10.1109\/iscslp57327.2022.10037995","relation":{},"subject":[],"published":{"date-parts":[[2022,12,11]]}}}