{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,2,21]],"date-time":"2025-02-21T07:27:56Z","timestamp":1740122876578,"version":"3.37.3"},"reference-count":32,"publisher":"Springer Science and Business Media LLC","issue":"4","license":[{"start":{"date-parts":[[2017,10,23]],"date-time":"2017-10-23T00:00:00Z","timestamp":1508716800000},"content-version":"unspecified","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Int J Speech Technol"],"published-print":{"date-parts":[[2017,12]]},"DOI":"10.1007\/s10772-017-9468-3","type":"journal-article","created":{"date-parts":[[2017,10,23]],"date-time":"2017-10-23T21:25:46Z","timestamp":1508793946000},"page":"1037-1047","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":9,"title":["Single-channel speech separation using combined EMD and speech-specific information"],"prefix":"10.1007","volume":"20","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-6502-7015","authenticated-orcid":false,"given":"M. K.","family":"Prasanna Kumar","sequence":"first","affiliation":[]},{"given":"R.","family":"Kumaraswamy","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2017,10,23]]},"reference":[{"key":"9468_CR1","volume-title":"Identifying single source data for mixing matrix estimation in instantaneous blind source separation Proceedings of the ICANN","author":"P Bofill","year":"2008","unstructured":"Bofill, P. (2008). Identifying single source data for mixing matrix estimation in instantaneous blind source separation Proceedings of the ICANN (pp.\u00a0759\u2013767). Berlin: Springer."},{"issue":"1","key":"9468_CR2","doi-asserted-by":"crossref","first-page":"92","DOI":"10.1109\/TSA.2004.838538","volume":"13","author":"SC Douglas","year":"2005","unstructured":"Douglas, S. C., & Sawada, H., & Makino S. (2005). Natural gradient Multichannel blind deconvolution and speech separation using causal FIR filters\u201d. IEEE Transactions on Speech Audio Processing, 13(1), 92\u2013104.","journal-title":"IEEE Transactions on Speech Audio Processing"},{"key":"9468_CR3","first-page":"115","volume":"4","author":"DP Ellis","year":"2006","unstructured":"Ellis, D. P. (2006). Model-based scene analysis. Computational auditory scene analysis: Principles, algorithms, and applications, 4, 115\u2013146.","journal-title":"Computational auditory scene analysis: Principles, algorithms, and applications"},{"issue":"6","key":"9468_CR4","doi-asserted-by":"crossref","first-page":"2174","DOI":"10.1109\/TSA.2005.858523","volume":"14","author":"C Fevotte","year":"2006","unstructured":"Fevotte, C., & Godsill, S. J. (2006). A Bayesian approach for blind separation of sparse sources. IEEE Transactions on Audio, Speech, and Language Processing, 14(6), 2174\u20132188.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"4","key":"9468_CR5","doi-asserted-by":"crossref","first-page":"961","DOI":"10.1109\/TASL.2010.2072500","volume":"19","author":"B Gao","year":"2011","unstructured":"Gao, B., Woo, W. L., & Dlay, S. S. (2011). Single-channel source separation using EMD-subband variable regularized sparse features. IEEE Transactions on Audio, Speech, and Language Processing, 19(4), 961\u2013976.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"3","key":"9468_CR6","doi-asserted-by":"crossref","first-page":"662","DOI":"10.1109\/TCSI.2012.2215735","volume":"60","author":"B Gao","year":"2013","unstructured":"Gao, B., Woo, W. L., & Dlay, S. S. (2013). Unsupervised single-channel separation of nonstationary signals using gammatone filterbank and itakura\u2013saito nonnegative matrix two-dimensional factorizations. IEEE Transactions on Circuits and Systems I: Regular Papers, 60(3), 662\u2013675.","journal-title":"IEEE Transactions on Circuits and Systems I: Regular Papers"},{"key":"9468_CR7","volume-title":"SUVing: Automatic silence\/unvoiced\/voiced classification of speech","author":"M Greenwood","year":"1999","unstructured":"Greenwood, M., & Kinghorn, A. (1999). SUVing: Automatic silence\/unvoiced\/voiced classification of speech. Sheffield: Undergraduate Coursework, Department of Computer Science, The University of Sheffield."},{"key":"9468_CR8","unstructured":"Hershey, J. R., Olsen, P. A., Rennie, S. J., & Aron, A. (2011) Audio Alchemy: Getting computers to understand overlapping speech. Scientific American Online. http:\/\/www.scientificamerican.com\/article\/speech-gettingcomputersunderstand-overlapping ."},{"key":"9468_CR9","doi-asserted-by":"crossref","first-page":"903","DOI":"10.1098\/rspa.1998.0193","volume":"454","author":"NE Huang","year":"1998","unstructured":"Huang, N. E., & Shen, Z., & Long S. R. (1998). The empirical mode decomposition and Hilbert spectrum for nonlinear and non-stationary time series analysis\u201d. Proceedings of the Royal Society of London A, 454, 903\u2013995.","journal-title":"Proceedings of the Royal Society of London A"},{"key":"9468_CR10","unstructured":"http:\/\/iitg.vlab.co.in\/?sub=59&brch=164&sim=616&cnt=1108 ."},{"key":"9468_CR11","first-page":"1365","volume":"4","author":"GJ Jang","year":"2003","unstructured":"Jang, G. J., & Lee, T. W. (2003). A maximum likelihood approach to single-channel source separation. Journal of Machine Learning Research, 4, 1365\u20131392.","journal-title":"Journal of Machine Learning Research"},{"key":"9468_CR12","volume-title":"Independent component analysis","author":"J Karhunen","year":"2001","unstructured":"Karhunen, J., & Oja, E. (2001). Independent component analysis. Hoboken: Wiley."},{"key":"9468_CR13","doi-asserted-by":"crossref","unstructured":"Kristjansson, T., Attias, H., & Hershey, J. (2004). Single microphone source separation using high resolution signal reconstruction. In IEEE Proceedings.(ICASSP\u201904). IEEE International Conference on Acoustics, Speech, and Signal Processing, 2004. (Vol.\u00a02, pp.\u00a0ii-817).","DOI":"10.1109\/ICASSP.2004.1326383"},{"issue":"6","key":"9468_CR14","doi-asserted-by":"crossref","first-page":"2014","DOI":"10.1109\/TASL.2006.883258","volume":"14","author":"P Li","year":"2006","unstructured":"Li, P., Guan, Y., Xu, B., & Liu, W. (2006). Monaural speech separation based on computational auditory scene analysis and objective quality assessment of speech. IEEE Transactions on Audio, Speech, and Language Processing, 14(6), 2014\u20132023.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"2","key":"9468_CR15","doi-asserted-by":"crossref","first-page":"423","DOI":"10.1109\/TSP.2005.861743","volume":"54","author":"Y Li","year":"2006","unstructured":"Li, Y., Amari, S.\u00a0I., Cichocki, A., Ho, D. W., & Xie, S. (2006). Underdetermined blind source separation based on sparse representation. IEEE Transactions on Signal Processing, 54(2), 423\u2013437.","journal-title":"IEEE Transactions on Signal Processing"},{"issue":"3","key":"9468_CR16","doi-asserted-by":"crossref","first-page":"339","DOI":"10.1007\/s11265-010-0510-9","volume":"65","author":"Y Litvin","year":"2011","unstructured":"Litvin, Y., & Cohen, I. (2011). Single-channel source separation of audio signals using bark scale wavelet packet decomposition. Journal of Signal Processing Systems, 65(3), 339\u2013350.","journal-title":"Journal of Signal Processing Systems"},{"issue":"9","key":"9468_CR17","doi-asserted-by":"crossref","first-page":"2188","DOI":"10.1109\/TBME.2010.2051440","volume":"57","author":"B Mijovic","year":"2010","unstructured":"Mijovic, B., De Vos, M., Gligorijevic, I., Taelman, J., & Van Huffel, S. (2010). Source separation from single-channel recordings by combining empirical-mode decomposition and independent component analysis. IEEE Transactions on Biomedical Engineering, 57(9), 2188\u20132196.","journal-title":"IEEE Transactions on Biomedical Engineering"},{"issue":"3","key":"9468_CR18","doi-asserted-by":"crossref","first-page":"893","DOI":"10.1109\/TASL.2006.885254","volume":"15","author":"MKI Molla","year":"2007","unstructured":"Molla, M. K. I., & Hirose, K. (2007). Single-mixture audio source separation by subspace decomposition of Hilbert spectrum. IEEE Transactions on Audio, Speech, and Language Processing, 15(3), 893\u2013900.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"3","key":"9468_CR19","doi-asserted-by":"crossref","first-page":"550","DOI":"10.1109\/TASL.2009.2031510","volume":"18","author":"A Ozerov","year":"2010","unstructured":"Ozerov, A., & F\u00e9votte, C. (2010). Multichannel nonnegative matrix factorization in convolutive mixtures for audio source separation. IEEE Transactions on Audio, Speech, and Language Processing, 18(3), 550\u2013563.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"key":"9468_CR20","doi-asserted-by":"crossref","unstructured":"Reyes-Gomez, M. J., Ellis, D. P., & Jojic, N. (2004). Multiband audio modeling for single-channel acoustic source separation. In IEEE International Conference on Acoustics, Speech, and Signal Processing, 2004. Proceedings. (ICASSP\u201904). (Vol.\u00a05, pp.\u00a0V-641).","DOI":"10.1109\/ICASSP.2004.1327192"},{"key":"9468_CR21","doi-asserted-by":"crossref","unstructured":"Schmidt, M. N., & Olsson, R. K. (2006). Single-channel speech separation using sparse non-negative matrix factorization. In Spoken Language Proceesing, ISCA International Conference on (INTERSPEECH).","DOI":"10.21437\/Interspeech.2006-655"},{"issue":"2","key":"9468_CR22","doi-asserted-by":"crossref","first-page":"129","DOI":"10.1109\/89.222882","volume":"1","author":"RC Snell","year":"1993","unstructured":"Snell, R. C., & Milinazzo, F. (1993). Formant location from LPC analysis data. IEEE Transactions on Speech and Audio Processing, 1(2), 129\u2013134.","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"issue":"2","key":"9468_CR23","doi-asserted-by":"crossref","first-page":"242","DOI":"10.1109\/TASL.2010.2047419","volume":"19","author":"M Stark","year":"2011","unstructured":"Stark, M., Wohlmayr, M., & Pernkopf, F. (2011). Source\u2013filter-based single-channel speech separation using pitch information. IEEE Transactions on Audio, Speech, and Language Processing, 19(2), 242\u2013255.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"11","key":"9468_CR24","doi-asserted-by":"crossref","first-page":"1722","DOI":"10.1109\/TNNLS.2013.2258680","volume":"24","author":"N Tengtrairat","year":"2013","unstructured":"Tengtrairat, N., Gao, B., Woo, W. L., & Dlay, S. S. (2013). Single-channel blind separation using pseudo-stereo mixture and complex 2-D histogram. IEEE Transactions on Neural Networks and Learning Systems, 24(11), 1722\u20131735.","journal-title":"IEEE Transactions on Neural Networks and Learning Systems"},{"issue":"3","key":"9468_CR25","doi-asserted-by":"crossref","first-page":"107","DOI":"10.1109\/MSP.2013.2297440","volume":"31","author":"E Vincent","year":"2014","unstructured":"Vincent, E., Bertin, N., Gribonval, R., & Bimbot, F. (2014). From blind to guided audio source separation: How models and side information can improve the separation of sound. IEEE Signal Processing Magazine, 31(3), 107\u2013115.","journal-title":"IEEE Signal Processing Magazine"},{"issue":"4","key":"9468_CR26","doi-asserted-by":"crossref","first-page":"1462","DOI":"10.1109\/TSA.2005.858005","volume":"14","author":"E Vincent","year":"2006","unstructured":"Vincent, E., Gribonval, R., & F\u00e9votte, C. (2006). Performance measurement in blind audio source separation. IEEE Transactions on Audio, Speech, and Language Processing, 14(4), 1462\u20131469.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"3","key":"9468_CR27","doi-asserted-by":"crossref","first-page":"1066","DOI":"10.1109\/TASL.2006.885253","volume":"15","author":"T Virtanen","year":"2007","unstructured":"Virtanen, T. (2007). Monaural sound source separation by nonnegative matrix factorization with temporal continuity and sparseness criteria. IEEE Transactions on Audio, Speech, and Language Processing, 15(3), 1066\u20131074.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"key":"9468_CR28","doi-asserted-by":"crossref","first-page":"159","DOI":"10.1016\/j.physa.2014.01.020","volume":"400","author":"YH Wang","year":"2014","unstructured":"Wang, Y. H., Yeh, C. H., Young, H. W. V., Hu, K., & Lo, M. T. (2014). On the computational complexity of the empirical mode decomposition algorithm. Physica A: Statistical Mechanics and its Applications, 400, 159\u2013167.","journal-title":"Physica A: Statistical Mechanics and its Applications"},{"issue":"01","key":"9468_CR29","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1142\/S1793536909000047","volume":"1","author":"Z Wu","year":"2009","unstructured":"Wu, Z., & Huang, N. E. (2009). Ensemble empirical mode decomposition: A noise-assisted data analysis method. Advances in Adaptive Data Analysis, 1(01), 1\u201341.","journal-title":"Advances in Adaptive Data Analysis"},{"issue":"6","key":"9468_CR30","doi-asserted-by":"crossref","first-page":"1196","DOI":"10.1109\/TASL.2009.2016230","volume":"17","author":"B Yegnanarayana","year":"2009","unstructured":"Yegnanarayana, B., Swamy, R. K., & Murty, K. S. R. (2009). Determining mixing parameters from multispeaker data using speech-specific information. IEEE Transactions on Audio, Speech, and Language Processing, 17(6), 1196\u20131207.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"02","key":"9468_CR31","doi-asserted-by":"crossref","first-page":"135","DOI":"10.1142\/S1793536910000422","volume":"2","author":"JR Yeh","year":"2010","unstructured":"Yeh, J. R., Shieh, J. S., & Huang, N. E. (2010). Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method. Advances in Adaptive Data Analysis, 2(02), 135\u2013156.","journal-title":"Advances in Adaptive Data Analysis"},{"issue":"7","key":"9468_CR32","doi-asserted-by":"crossref","first-page":"1830","DOI":"10.1109\/TSP.2004.828896","volume":"52","author":"O Yilmaz","year":"2004","unstructured":"Yilmaz, O., & Rickard, S. (2004). Blind separation of speech mixtures via time frequency masking. IEEE Transactions on Signal Processing, 52(7), 1830\u20131847.","journal-title":"IEEE Transactions on Signal Processing"}],"container-title":["International Journal of Speech Technology"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s10772-017-9468-3\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10772-017-9468-3.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10772-017-9468-3.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,8,5]],"date-time":"2022-08-05T02:41:17Z","timestamp":1659667277000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s10772-017-9468-3"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2017,10,23]]},"references-count":32,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2017,12]]}},"alternative-id":["9468"],"URL":"https:\/\/doi.org\/10.1007\/s10772-017-9468-3","relation":{},"ISSN":["1381-2416","1572-8110"],"issn-type":[{"type":"print","value":"1381-2416"},{"type":"electronic","value":"1572-8110"}],"subject":[],"published":{"date-parts":[[2017,10,23]]}}}