{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,14]],"date-time":"2026-04-14T17:17:18Z","timestamp":1776187038275,"version":"3.50.1"},"reference-count":41,"publisher":"Springer Science and Business Media LLC","issue":"5","license":[{"start":{"date-parts":[[2024,1,18]],"date-time":"2024-01-18T00:00:00Z","timestamp":1705536000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,1,18]],"date-time":"2024-01-18T00:00:00Z","timestamp":1705536000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62031021"],"award-info":[{"award-number":["62031021"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Circuits Syst Signal Process"],"published-print":{"date-parts":[[2024,5]]},"DOI":"10.1007\/s00034-023-02586-x","type":"journal-article","created":{"date-parts":[[2024,1,18]],"date-time":"2024-01-18T16:02:26Z","timestamp":1705593746000},"page":"2961-2981","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":3,"title":["Time-Frequency Bins Selection for Direction of Arrival Estimation Based on Speech Presence Probability Learning"],"prefix":"10.1007","volume":"43","author":[{"given":"Qinzheng","family":"Zhang","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-4934-4790","authenticated-orcid":false,"given":"Haiyan","family":"Wang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jesper","family":"Rindom Jensen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Shuai","family":"Tao","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mads","family":"Gr\u00e6sb\u00f8ll Christensen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2024,1,18]]},"reference":[{"issue":"9","key":"2586_CR1","doi-asserted-by":"publisher","first-page":"3408","DOI":"10.1109\/JBHI.2021.3068481","volume":"25","author":"S Afshar","year":"2021","unstructured":"S. Afshar, R. Boostani, S. Sanei, A combinatorial deep learning structure for precise depth of anesthesia estimation from EEG signals. IEEE J. Biomed. Health Inform. 25(9), 3408\u20133415 (2021)","journal-title":"IEEE J. Biomed. Health Inform."},{"key":"2586_CR2","doi-asserted-by":"publisher","first-page":"4986","DOI":"10.1007\/s00034-021-01704-x","volume":"40","author":"J Basu","year":"2021","unstructured":"J. Basu, S. Khan, R. Roy et al., Multilingual speech corpus in low-resource eastern and northeastern Indian languages for speaker and language identification. Circuits Syst. Signal Process. 40, 4986\u20135013 (2021)","journal-title":"Circuits Syst. Signal Process."},{"issue":"6","key":"2586_CR3","doi-asserted-by":"publisher","first-page":"1279","DOI":"10.1109\/TSMC.2013.2244211","volume":"43","author":"BW Chen","year":"2013","unstructured":"B.W. Chen, C.Y. Chen, J.F. Wang, Smart homecare surveillance system: Behavior identification based on state-transition support vector machines and sound directivity pattern analysis. IEEE Trans. Syst. Man Cybern. Syst. 43(6), 1279\u20131289 (2013)","journal-title":"IEEE Trans. Syst. Man Cybern. Syst."},{"key":"2586_CR4","doi-asserted-by":"publisher","first-page":"573","DOI":"10.1007\/s00034-015-0077-6","volume":"35","author":"A Dehghan Firoozabadi","year":"2016","unstructured":"A. Dehghan Firoozabadi, H.R. Abutalebi, A novel nested circular microphone array and subband processing-based system for counting and DOA estimation of multiple simultaneous speakers. Circuits Syst. Signal Process. 35, 573\u2013601 (2016)","journal-title":"Circuits Syst. Signal Process."},{"key":"2586_CR5","volume-title":"A High-Accuracy, Low-Latency Technique for Talker Localization in Reverberant Environments Using Microphone Arrays","author":"JH DiBiase","year":"2000","unstructured":"J.H. DiBiase, A High-Accuracy, Low-Latency Technique for Talker Localization in Reverberant Environments Using Microphone Arrays (Brown University, Providence, 2000)"},{"key":"2586_CR6","doi-asserted-by":"crossref","unstructured":"W. Fang, D. Yu, W. Wang et\u00a0al., A deep learning based mutual coupling correction and DOA estimation algorithm. in 2021 13th international conference on wireless communications and signal processing (WCSP), IEEE, pp. 1\u20135 (2021)","DOI":"10.1109\/WCSP52459.2021.9613199"},{"key":"2586_CR7","first-page":"27403","volume":"93","author":"JS Garofolo","year":"1993","unstructured":"J.S. Garofolo, L.F. Lamel, W.M. Fisher et al., DARPA TIMIT acoustic-phonetic continous speech corpus CD-ROM. NIST speech disc 1-1.1. NASA STI\/Recon Technical Report n 93, 27403 (1993)","journal-title":"NASA STI\/Recon Technical Report n"},{"issue":"4","key":"2586_CR8","doi-asserted-by":"publisher","first-page":"1383","DOI":"10.1109\/TASL.2011.2180896","volume":"20","author":"T Gerkmann","year":"2011","unstructured":"T. Gerkmann, R.C. Hendriks, Unbiased MMSE-based noise power estimation with low complexity and low tracking delay. IEEE Trans. Audio Speech Lang. Process. 20(4), 1383\u20131393 (2011)","journal-title":"IEEE Trans. Audio Speech Lang. Process."},{"issue":"1","key":"2586_CR9","doi-asserted-by":"publisher","first-page":"107","DOI":"10.1121\/10.0011809","volume":"152","author":"PA Grumiaux","year":"2022","unstructured":"P.A. Grumiaux, S. Kiti\u0107, L. Girin et al., A survey of sound source localization with deep learning methods. J. Acoust. Soc. Am. 152(1), 107\u2013151 (2022)","journal-title":"J. Acoust. Soc. Am."},{"issue":"6","key":"2586_CR10","doi-asserted-by":"publisher","first-page":"791","DOI":"10.1109\/TSA.2003.818027","volume":"11","author":"T Gustafsson","year":"2003","unstructured":"T. Gustafsson, B.D. Rao, M. Trivedi, Source localization in reverberant environments: modeling and statistical analysis. IEEE Trans. Speech Audio Process. 11(6), 791\u2013803 (2003)","journal-title":"IEEE Trans. Speech Audio Process."},{"issue":"2.4","key":"2586_CR11","first-page":"1","volume":"2","author":"EA Habets","year":"2006","unstructured":"E.A. Habets, Room impulse response generator. Technische Universiteit Eindhoven Tech. Rep. 2(2.4), 1 (2006)","journal-title":"Technische Universiteit Eindhoven Tech. Rep."},{"key":"2586_CR12","doi-asserted-by":"crossref","unstructured":"E. Hadad, F. Heese, P. Vary et\u00a0al., Multichannel audio database in various acoustic environments. in 2014 14th international workshop on acoustic signal enhancement (IWAENC), IEEE, pp. 313\u2013317 (2014)","DOI":"10.1109\/IWAENC.2014.6954309"},{"key":"2586_CR13","doi-asserted-by":"crossref","unstructured":"J. Hu, Q. Mo, Z. Liu et\u00a0al., Multi-source classification: a DOA-based deep learning approach. in 2020 international conference on computer engineering and application (ICCEA), IEEE, pp. 463\u2013467 (2020)","DOI":"10.1109\/ICCEA50009.2020.00106"},{"issue":"5","key":"2586_CR14","doi-asserted-by":"publisher","first-page":"3053","DOI":"10.1121\/1.4934954","volume":"138","author":"G Huang","year":"2015","unstructured":"G. Huang, J. Chen, J. Benesty, Direction-of-arrival estimation of passive acoustic sources in reverberant environments based on the householder transformation. J. Acoust. Soc. Am. 138(5), 3053\u20133060 (2015)","journal-title":"J. Acoust. Soc. Am."},{"issue":"5","key":"2586_CR15","doi-asserted-by":"publisher","first-page":"1140","DOI":"10.1109\/TASLP.2017.2689681","volume":"25","author":"G Huang","year":"2017","unstructured":"G. Huang, J. Benesty, J. Chen, On the design of frequency-invariant beampatterns with uniform circular microphone arrays. IEEE\/ACM Trans. Audio Speech Lang. Process. 25(5), 1140\u20131153 (2017)","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"issue":"12","key":"2586_CR16","doi-asserted-by":"publisher","first-page":"2305","DOI":"10.1109\/TASLP.2018.2862826","volume":"26","author":"G Huang","year":"2018","unstructured":"G. Huang, J. Chen, J. Benesty, Insights into frequency-invariant beamforming with concentric circular microphone arrays. IEEE\/ACM Trans. Audio Speech Lang. Process. 26(12), 2305\u20132318 (2018)","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"key":"2586_CR17","doi-asserted-by":"crossref","unstructured":"G. Huang, J. Benesty, J. Chen et al., Robust and steerable Kronecker product differential beamforming with rectangular microphone arrays. in ICASSP 2020\u20132020 IEEE international conference on acoustics, speech and signal processing (ICASSP), IEEE, pp. 211\u2013215 (2020)","DOI":"10.1109\/ICASSP40776.2020.9052988"},{"key":"2586_CR18","doi-asserted-by":"publisher","first-page":"1079","DOI":"10.1109\/TASLP.2020.2980989","volume":"28","author":"G Huang","year":"2020","unstructured":"G. Huang, J. Benesty, I. Cohen et al., A simple theory and new method of differential beamforming with uniform linear microphone arrays. IEEE\/ACM Trans. Audio Speech Lang. Process. 28, 1079\u20131093 (2020)","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"issue":"5","key":"2586_CR19","doi-asserted-by":"publisher","first-page":"923","DOI":"10.1109\/TASL.2013.2239290","volume":"21","author":"JR Jensen","year":"2013","unstructured":"J.R. Jensen, M.G. Christensen, S.H. Jensen, Nonlinear least squares methods for joint DOA and pitch estimation. IEEE Trans. Audio Speech Lang. Process. 21(5), 923\u2013933 (2013)","journal-title":"IEEE Trans. Audio Speech Lang. Process."},{"key":"2586_CR20","doi-asserted-by":"crossref","unstructured":"J.R. Jensen, J.K. Nielsen, R. Heusdens et al., DOA estimation of audio sources in reverberant environments. in 2016 IEEE international conference on acoustics, speech and signal processing (ICASSP), IEEE, pp. 176\u2013180 (2016)","DOI":"10.1109\/ICASSP.2016.7471660"},{"key":"2586_CR21","unstructured":"S. Karimian-Azari, J.R Jensen, M.G Christensen, Robust DOA estimation of harmonic signals using constrained filters on phase estimates. in 2014 22nd European signal processing conference (EUSIPCO), IEEE, pp. 1930\u20131934 (2014)"},{"key":"2586_CR22","doi-asserted-by":"crossref","unstructured":"G. Lee, K. Tatara, N.Y Chong, Hardware-assisted direction estimation for mobile robot target tracking applications. in 2015 IEEE international conference on mechatronics (ICM), IEEE, pp 182\u2013187 (2015)","DOI":"10.1109\/ICMECH.2015.7083970"},{"issue":"9","key":"2586_CR23","doi-asserted-by":"publisher","first-page":"3266","DOI":"10.1007\/s00034-015-0203-5","volume":"35","author":"L Li","year":"2016","unstructured":"L. Li, T. Qiu, X. Shi, Parameter estimation based on fractional power spectrum density in bistatic MIMO radar system under impulsive noise environment. Circuits Syst. Signal Process. 35(9), 3266\u20133283 (2016)","journal-title":"Circuits Syst. Signal Process."},{"key":"2586_CR24","doi-asserted-by":"crossref","unstructured":"S.S. Mane, S.G. Mali, S. Mahajan, Localization of steady sound source and direction detection of moving sound source using CNN. in 2019 10th international conference on computing, communication and Networking Technologies (ICCCNT), IEEE, pp. 1\u20136 (2019)","DOI":"10.1109\/ICCCNT45670.2019.8944612"},{"key":"2586_CR25","doi-asserted-by":"publisher","first-page":"233","DOI":"10.1007\/s00034-015-0058-9","volume":"35","author":"Q Nguyen","year":"2016","unstructured":"Q. Nguyen, G. Shen, J. Choi, Sound detection and localization in windy conditions for intelligent outdoor security cameras. Circuits Syst. Signal Process. 35, 233\u2013251 (2016)","journal-title":"Circuits Syst. Signal Process."},{"key":"2586_CR26","doi-asserted-by":"publisher","first-page":"3714","DOI":"10.1109\/TSP.2021.3089927","volume":"69","author":"GK Papageorgiou","year":"2021","unstructured":"G.K. Papageorgiou, M. Sellathurai, Y.C. Eldar, Deep networks for direction-of-arrival estimation in low snr. IEEE Trans. Signal Process. 69, 3714\u20133729 (2021)","journal-title":"IEEE Trans. Signal Process."},{"key":"2586_CR27","doi-asserted-by":"crossref","unstructured":"A.S. Subramanian, S.J. Chen, Watanabe S Student-teacher learning for BLSTM mask-based speech enhancement. arXiv preprint arXiv:1803.10013 (2018)","DOI":"10.21437\/Interspeech.2018-2440"},{"key":"2586_CR28","doi-asserted-by":"crossref","unstructured":"S. Tao, H. Reddy, J.R. Jensen et al., Frequency bin-wise single channel speech presence probability estimation using multiple DNNS. in ICASSP 2023\u20132023 IEEE international conference on acoustics, speech and signal processing (ICASSP), IEEE, pp. 1\u20135 (2023)","DOI":"10.1109\/ICASSP49357.2023.10096321"},{"issue":"12","key":"2586_CR29","doi-asserted-by":"publisher","first-page":"2080","DOI":"10.1109\/TASLP.2019.2940662","volume":"27","author":"YH Tu","year":"2019","unstructured":"Y.H. Tu, J. Du, C.H. Lee, Speech enhancement based on teacher-student deep learning using improved speech presence probability for noise-robust speech recognition. IEEE\/ACM Trans. Audio Speech Lang. Process. 27(12), 2080\u20132091 (2019)","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"issue":"3","key":"2586_CR30","doi-asserted-by":"publisher","first-page":"247","DOI":"10.1016\/0167-6393(93)90095-3","volume":"12","author":"A Varga","year":"1993","unstructured":"A. Varga, H.J. Steeneken, Assessment for automatic speech recognition: II. NOISEX-92: a database and an experiment to study the effect of additive noise on speech recognition systems. Speech Commun. 12(3), 247\u2013251 (1993)","journal-title":"Speech Commun."},{"key":"2586_CR31","doi-asserted-by":"crossref","unstructured":"P. Vecchiotti, N. Ma, S. Squartini et al., End-to-end binaural sound localisation from the raw waveform, in ICASSP 2019\u20132019 IEEE international conference on acoustics, speech and signal processing (ICASSP), IEEE, pp. 451\u2013455 (2019)","DOI":"10.1109\/ICASSP.2019.8683732"},{"key":"2586_CR32","doi-asserted-by":"crossref","unstructured":"S. Wandale, K. Ichige, On the DOA estimation performance of optimum arrays based on deep learning. in 2020 IEEE 11th sensor array and multichannel signal processing workshop (SAM), IEEE, pp. 1\u20135 (2020)","DOI":"10.1109\/SAM48682.2020.9104365"},{"key":"2586_CR33","doi-asserted-by":"crossref","unstructured":"H. Wang, K. Chen, J. Lu, U-net based direct-path dominance test for robust direction-of-arrival estimation. arXiv preprint arXiv:2005.04376 (2020a)","DOI":"10.21437\/Interspeech.2020-2493"},{"key":"2586_CR34","doi-asserted-by":"publisher","first-page":"51","DOI":"10.1109\/LSP.2020.3044775","volume":"28","author":"X Wang","year":"2020","unstructured":"X. Wang, G. Huang, J. Benesty et al., Time difference of arrival estimation based on a Kronecker product decomposition. IEEE Signal Process. Lett. 28, 51\u201355 (2020)","journal-title":"IEEE Signal Process. Lett."},{"key":"2586_CR35","doi-asserted-by":"crossref","unstructured":"X. Xiao, S. Zhao, X. Zhong et al., A learning-based approach to direction of arrival estimation in noisy and reverberant environments, in 2015 IEEE international conference on acoustics, speech and signal processing (ICASSP), IEEE, pp. 2814\u20132818 (2015)","DOI":"10.1109\/ICASSP.2015.7178484"},{"issue":"6","key":"2586_CR36","doi-asserted-by":"publisher","first-page":"1354","DOI":"10.23919\/JSEE.2021.000115","volume":"32","author":"C Ying","year":"2021","unstructured":"C. Ying, W. Xiang, H. Zhitao, Underdetermined DOA estimation via multiple time-delay covariance matrices and deep residual network. J. Syst. Eng. Electron. 32(6), 1354\u20131363 (2021)","journal-title":"J. Syst. Eng. Electron."},{"issue":"1","key":"2586_CR37","doi-asserted-by":"publisher","first-page":"6386","DOI":"10.1038\/s41598-021-85864-5","volume":"11","author":"Y Yuan","year":"2021","unstructured":"Y. Yuan, S. Wu, Y. Yang et al., Multi-DOA estimation based on the KR image tensor and improved estimation network. Sci. Rep. 11(1), 6386 (2021)","journal-title":"Sci. Rep."},{"key":"2586_CR38","doi-asserted-by":"crossref","unstructured":"O.B Zaken, B. Rafaely, A. Kumar et\u00a0al. Direction of arrival estimation for reverberant speech based on neural networks and the direct-path dominance test. in 2022 international workshop on acoustic signal enhancement (IWAENC), IEEE, pp. 1\u20135 (2022)","DOI":"10.1109\/IWAENC53105.2022.9914696"},{"issue":"6","key":"2586_CR39","doi-asserted-by":"publisher","first-page":"3841","DOI":"10.1121\/10.0005127","volume":"149","author":"M Zhang","year":"2021","unstructured":"M. Zhang, X. Pan, Y. Shen et al., Deep learning-based direction-of-arrival estimation for multiple speech sources using a small scale array. J. Acoust. Soc. Am. 149(6), 3841\u20133850 (2021)","journal-title":"J. Acoust. Soc. Am."},{"key":"2586_CR40","doi-asserted-by":"publisher","first-page":"1312","DOI":"10.1109\/LSP.2022.3179336","volume":"29","author":"X Zhang","year":"2022","unstructured":"X. Zhang, Z. Zheng, W.Q. Wang et al., DOA estimation of coherent sources using coprime array via atomic norm minimization. IEEE Signal Process. Lett. 29, 1312\u20131316 (2022)","journal-title":"IEEE Signal Process. Lett."},{"issue":"2","key":"2586_CR41","doi-asserted-by":"publisher","first-page":"904","DOI":"10.1007\/s00034-018-0892-7","volume":"38","author":"Z Zhang","year":"2019","unstructured":"Z. Zhang, X. Wu, C. Li et al., An $$l$$ p-norm based method for off-grid DOA estimation. Circuits Syst. Signal Process. 38(2), 904\u2013917 (2019)","journal-title":"Circuits Syst. Signal Process."}],"container-title":["Circuits, Systems, and Signal Processing"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00034-023-02586-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s00034-023-02586-x\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00034-023-02586-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,3,30]],"date-time":"2024-03-30T12:02:47Z","timestamp":1711800167000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s00034-023-02586-x"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,1,18]]},"references-count":41,"journal-issue":{"issue":"5","published-print":{"date-parts":[[2024,5]]}},"alternative-id":["2586"],"URL":"https:\/\/doi.org\/10.1007\/s00034-023-02586-x","relation":{},"ISSN":["0278-081X","1531-5878"],"issn-type":[{"value":"0278-081X","type":"print"},{"value":"1531-5878","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024,1,18]]},"assertion":[{"value":"16 June 2023","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"11 December 2023","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"11 December 2023","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"18 January 2024","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}},{"value":"The work presented in the uploaded manuscript is an original one and the manuscript is not currently under consideration for publication elsewhere.","order":3,"name":"Ethics","group":{"name":"EthicsHeading","label":"Ethical approval"}}]}}