{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,1]],"date-time":"2025-10-01T15:20:51Z","timestamp":1759332051502,"version":"3.37.3"},"reference-count":43,"publisher":"Springer Science and Business Media LLC","issue":"4","license":[{"start":{"date-parts":[[2020,10,23]],"date-time":"2020-10-23T00:00:00Z","timestamp":1603411200000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2020,10,23]],"date-time":"2020-10-23T00:00:00Z","timestamp":1603411200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["61671418"],"award-info":[{"award-number":["61671418"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Circuits Syst Signal Process"],"published-print":{"date-parts":[[2021,4]]},"DOI":"10.1007\/s00034-020-01564-x","type":"journal-article","created":{"date-parts":[[2020,10,23]],"date-time":"2020-10-23T21:02:24Z","timestamp":1603486944000},"page":"1868-1891","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":8,"title":["Dual-Transform Source Separation Using Sparse Nonnegative Matrix Factorization"],"prefix":"10.1007","volume":"40","author":[{"given":"Md. Imran","family":"Hossain","sequence":"first","affiliation":[]},{"given":"Md. Shohidul","family":"Islam","sequence":"additional","affiliation":[]},{"given":"Mst. Titasa","family":"Khatun","sequence":"additional","affiliation":[]},{"given":"Rizwan","family":"Ullah","sequence":"additional","affiliation":[]},{"given":"Asim","family":"Masood","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-1383-7673","authenticated-orcid":false,"given":"Zhongfu","family":"Ye","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2020,10,23]]},"reference":[{"issue":"7","key":"1564_CR1","doi-asserted-by":"publisher","first-page":"1130","DOI":"10.1109\/TASLP.2014.2320575","volume":"22","author":"G Bao","year":"2014","unstructured":"G. Bao, Y. Xu, Z. Ye, Learning a discriminative dictionary for single-channel speech separation. IEEE Trans. Audio Speech Lang. Process. 22(7), 1130\u20131138 (2014)","journal-title":"IEEE Trans. Audio Speech Lang. Process."},{"issue":"5","key":"1564_CR2","doi-asserted-by":"publisher","first-page":"2421","DOI":"10.1121\/1.2229005","volume":"120","author":"M Cooke","year":"2006","unstructured":"M. Cooke, J. Barker, S. Cunningham, X. Shao, An audio-visual corpus for speech perception and automatic speech recognition. J. Acoust. Soc. Am. 120(5), 2421 (2006)","journal-title":"J. Acoust. Soc. Am."},{"key":"1564_CR3","doi-asserted-by":"publisher","first-page":"788","DOI":"10.1038\/44565","volume":"401","author":"DL Daniel","year":"1999","unstructured":"D.L. Daniel, H.S. Seung, Learning the pans of objects with non-negative matrix factorization. Nature 401, 788\u2013791 (1999)","journal-title":"Nature"},{"key":"1564_CR4","unstructured":"M.G. Emad, E. Hakan, Single channel speech music separation using nonnegative matrix factorization with sliding windows and spectral masks. Digital Signal Processing (DSP), in 17th International Conference in August (2011)"},{"key":"1564_CR5","unstructured":"G.G. Francois, J.M. Gautham, Stopping criteria for non-negative matrix factorization based supervised and semi-supervised source separation. IEEE Signal Processing Letters, November (2014)"},{"key":"1564_CR6","unstructured":"J. Garofolo, et al., TIMIT acoustic-phonetic continuous speech corpus. LDC93S1 (1993)"},{"key":"1564_CR7","doi-asserted-by":"crossref","unstructured":"E.M. Grais, H. Erdogan, Discriminative non-negative dictionary learning using cross-coherence penalties for single channel source separation, in Proceedings of the International Conference on Spoken Language Processing (INTERSPEECH). Lyon, France, 25\u201329 August (2013)","DOI":"10.21437\/Interspeech.2013-232"},{"key":"1564_CR8","doi-asserted-by":"crossref","unstructured":"R. Hidayat, A. Bejo, S. Sumaryono, A. Winursito, Denoising speech for MFCC feature extraction using wavelet transformation in speech recognition system, in 10th International Conference on Information Technology and Electrical Engineering (2018)","DOI":"10.1109\/ICITEED.2018.8534807"},{"key":"1564_CR9","unstructured":"P.O. Hoyer, Non-negative matrix factorization with sparseness constraint. J. Mach. Learn. Res. 1457\u20131469, November (2004)"},{"issue":"1","key":"1564_CR10","doi-asserted-by":"publisher","first-page":"229","DOI":"10.1109\/TASL.2007.911054","volume":"16","author":"Y Hu","year":"2008","unstructured":"Y. Hu, P.C. Loizou, Evaluation of objective quality measures for speech enhancement. IEEE Trans. Audio Speech Lang. Process. 16(1), 229\u2013238 (2008)","journal-title":"IEEE Trans. Audio Speech Lang. Process."},{"key":"1564_CR11","doi-asserted-by":"crossref","unstructured":"M.S. Islam, T.H. Al Mahmud, W.U. Khan, Z. Ye, Supervised single-channel speech enhancement based on stationary wavelet transforms and non-negative matrix factorization with concatenated framing process and subband smooth ratio mask. J. Sig. Process. Syst. Signal. Image Video Technol. 1\u201314 (2019)","DOI":"10.1007\/s11265-019-01480-7"},{"key":"1564_CR12","doi-asserted-by":"publisher","first-page":"353","DOI":"10.3390\/electronics8030353","volume":"8","author":"MS Islam","year":"2019","unstructured":"M.S. Islam, T.H. Al Mahmud, W.U. Khan, Z. Ye, Supervised single-channel speech enhancement based on dual-tree complex wavelet transforms and nonnegative matrix factorization using the joint learning process and subband smooth ratio mask. Electronics 8, 353 (2019)","journal-title":"Electronics"},{"key":"1564_CR13","first-page":"1365","volume":"4","author":"GJ Jang","year":"2003","unstructured":"G.J. Jang, T.W. Lee, A maximum likelihood approach to single-channel source separation. J. Mach. Learn. Res. 4, 1365\u20131392 (2003)","journal-title":"J. Mach. Learn. Res."},{"issue":"5","key":"1564_CR14","doi-asserted-by":"publisher","first-page":"2335","DOI":"10.1007\/s00034-013-9566-7","volume":"32","author":"DS Kapoor","year":"2013","unstructured":"D.S. Kapoor, A.K. Kohli, Gain adapted optimum mixture estimation scheme for single-channel speech separation. Circuits Syst. Signal Process. 32(5), 2335\u20132351 (2013)","journal-title":"Circuits Syst. Signal Process."},{"key":"1564_CR15","doi-asserted-by":"publisher","first-page":"75","DOI":"10.1016\/j.specom.2014.06.002","volume":"65","author":"JM Kates","year":"2014","unstructured":"J.M. Kates, K.H. Arehart, The hearing-aid speech perception index (HASPI). Speech Commun. 65, 75\u201393 (2014)","journal-title":"Speech Commun."},{"key":"1564_CR16","first-page":"5363","volume":"58","author":"JM Kates","year":"2010","unstructured":"J.M. Kates, K.H. Arehart, The hearing-aid speech quality index (HASQI). J. Audio Eng. Soc. 58, 5363\u20135381 (2010)","journal-title":"J. Audio Eng. Soc."},{"key":"1564_CR17","unstructured":"N.G. Kingsbury, The dual-tree complex wavelet transforms: a new efficient tool for image restoration and enhancement, in Proceedings of the 9th European Signal Process Conference. EUSIPCO, Rhodes, Greece. 8\u201311 Sept (1998)"},{"key":"1564_CR18","unstructured":"R.J. Le, F.J. Weninger, J.R. Hershey, Sparse NMF half-baked or well done? technical report TR2015\u2013023, Mitsubishi Electric Research Laboratories (MERL), Cambridge, MA, USA, March (2015)"},{"key":"1564_CR19","first-page":"556","volume":"13","author":"D Lee","year":"2001","unstructured":"D. Lee, H.S. Seung, Algorithms for non-negative matrix factorization. Adv. Neural Inf. Process. Syst. 13, 556\u2013562 (2001)","journal-title":"Adv. Neural Inf. Process. Syst."},{"issue":"5","key":"1564_CR20","doi-asserted-by":"publisher","first-page":"1970","DOI":"10.1007\/s00034-016-0388-2","volume":"36","author":"A Mahmoodzadeh","year":"2017","unstructured":"A. Mahmoodzadeh, H.R. Abutalebi, Hybrid approach to single-channel speech separation based on coherent incoherent modulation filtering. Circuits Syst. Signal Process. 36(5), 1970\u20131988 (2017)","journal-title":"Circuits Syst. Signal Process."},{"key":"1564_CR21","first-page":"2","volume":"15","author":"S Mavaddati","year":"2019","unstructured":"S. Mavaddati, A novel singing voice separation method based on sparse non-negative matrix factorization and low-rank modeling. Iran. J. Electr. Electron. Eng. 15, 2 (2019)","journal-title":"Iran. J. Electr. Electron. Eng."},{"key":"1564_CR22","doi-asserted-by":"publisher","first-page":"137","DOI":"10.1016\/j.ymssp.2012.09.001","volume":"35","author":"P Mercorelli","year":"2013","unstructured":"P. Mercorelli, A denoising procedure using wavelet packets for instantaneous detection of pantograph oscillations. Mech. Syst. Signal Process. 35, 137\u2013149 (2013)","journal-title":"Mech. Syst. Signal Process."},{"issue":"2","key":"1564_CR23","doi-asserted-by":"publisher","first-page":"111","DOI":"10.1002\/env.3170050203","volume":"5","author":"P Paatero","year":"1994","unstructured":"P. Paatero, U. Tapper, Positive matrix factorization: a non-negative factor model with optimal utilization of error estimates of data values. Environmetrics 5(2), 111\u2013126 (1994)","journal-title":"Environmetrics"},{"key":"1564_CR24","doi-asserted-by":"crossref","unstructured":"B.A. Pearlmutter, R.K. Olsson, Linear program differentiation for single-channel speech separation, in 16th IEEE Signal Processing Society Workshop in MLSP, Arlington, VA, USA (2006)","DOI":"10.1109\/MLSP.2006.275587"},{"key":"1564_CR25","first-page":"1","volume":"55","author":"T Pham","year":"2015","unstructured":"T. Pham, Y.S. Lee, Y.B. Lin, T.C. Tai, J.C. Wang, Single channel source separation using sparse nmf and graph regularization. ASE Big Data Soc. Inform. 55, 1\u20137 (2015)","journal-title":"ASE Big Data Soc. Inform."},{"issue":"3","key":"1564_CR26","doi-asserted-by":"publisher","first-page":"407","DOI":"10.3390\/a6030407","volume":"6","author":"B Premanode","year":"2013","unstructured":"B. Premanode, J. Vongprasert, C. Toumazou, Noise reduction for nonlinear nonstationary time series data using averaging intrinsic mode function. Algorithms 6(3), 407\u2013429 (2013)","journal-title":"Algorithms"},{"key":"1564_CR27","unstructured":"A.W. Rix, J.G. Beerends, M.P. Hollier, A.P. Hekstra, Perceptual evaluation of speech quality (PESQ)-a new method for speech quality assessment of telephone networks and codecs, in IEEE International Conference on Acoustics, Speech, Signal Processing. 6, 7\u201311 May (2001)"},{"key":"1564_CR28","unstructured":"S.T. Roweis, One microphone source separation. Advances in Neural Information Processing Systems. 793\u2013799 (2001)."},{"key":"1564_CR29","doi-asserted-by":"crossref","unstructured":"S.T. Roweis, Factorial models and refiltering for speech separation and denoising, in Eurospeech, Geneva, 1009\u20131012 (2003)","DOI":"10.21437\/Eurospeech.2003-345"},{"key":"1564_CR30","doi-asserted-by":"crossref","unstructured":"M.N. Schmidt, R.K. Olsson, Single-channel speech separation using sparse non-negative matrix factorization, in 9th International Conference on Spoken Language Processing. Pittsburgh, PA, USA (2006)","DOI":"10.21437\/Interspeech.2006-655"},{"key":"1564_CR31","doi-asserted-by":"publisher","first-page":"700","DOI":"10.1007\/11679363_87","volume":"3889","author":"MN Schmidt","year":"2006","unstructured":"M.N. Schmidt, M. Morup, Sparse non-negative matrix factor 2-D deconvolution for blind single-channel source separation. Indep. Compon. Anal. Blind Signal Sep. 3889, 700\u2013707 (2006)","journal-title":"Indep. Compon. Anal. Blind Signal Sep."},{"key":"1564_CR32","doi-asserted-by":"crossref","unstructured":"S.M. Seedahmed, A generalised wavelet packet\u2010based anonymization approach for ECG security application. 9, 18, 6137\u20136147 (2016)","DOI":"10.1002\/sec.1762"},{"issue":"1","key":"1564_CR33","doi-asserted-by":"publisher","first-page":"19","DOI":"10.1007\/s10772-017-9469-2","volume":"21","author":"L Sun","year":"2018","unstructured":"L. Sun, C. Zhao, M. Su, F. Wang, Single-channel blind source separation based on joint dictionary with common sub-dictionary. Int. J. Speech Technol. 21(1), 19\u201327 (2018)","journal-title":"Int. J. Speech Technol."},{"key":"1564_CR34","doi-asserted-by":"publisher","first-page":"85","DOI":"10.1016\/j.specom.2018.11.008","volume":"106","author":"L Sun","year":"2019","unstructured":"L. Sun, K. Xie, T. Gu, J. Chen, Z. Yang, Joint dictionary learning using a new optimization method for single-channel blind source separation. Speech Commun. 106, 85\u201394 (2019)","journal-title":"Speech Commun."},{"issue":"7","key":"1564_CR35","doi-asserted-by":"publisher","first-page":"2125","DOI":"10.1109\/TASL.2011.2114881","volume":"19","author":"CH Tall","year":"2011","unstructured":"C.H. Tall, R.C. Hendriks, R. Heusdens, J. Jensen, An algorithm for intelligibility prediction of time-frequency weighted noisy speech. IEEE Trans. Audio Speech Lang. Process. 19(7), 2125\u20132136 (2011)","journal-title":"IEEE Trans. Audio Speech Lang. Process."},{"issue":"12","key":"1564_CR36","doi-asserted-by":"publisher","first-page":"3883","DOI":"10.1007\/s00034-015-0035-3","volume":"34","author":"P Tianliang","year":"2015","unstructured":"P. Tianliang, C. Yang, L. Zengli, A time-frequency domain blind source separation method for underdetermined instantaneous mixtures. Circuits Syst. Signal Process. 34(12), 3883\u20133895 (2015)","journal-title":"Circuits Syst. Signal Process."},{"issue":"2","key":"1564_CR37","doi-asserted-by":"publisher","first-page":"287","DOI":"10.1515\/aoa-2017-0031","volume":"42","author":"YV Varshney","year":"2017","unstructured":"Y.V. Varshney, Z.A. Abbasi, M.R. Abidi, O. Farooq, Frequency selection based separation of speech signals with reduced computational time using sparse NMF. Arch. Acoust. 42(2), 287\u2013295 (2017)","journal-title":"Arch. Acoust."},{"issue":"4","key":"1564_CR38","doi-asserted-by":"publisher","first-page":"1462","DOI":"10.1109\/TSA.2005.858005","volume":"14","author":"E Vincent","year":"2006","unstructured":"E. Vincent, R. Gribonval, C. Fevote, Performance measurement in blind audio source separation. IEEE Trans. Audio Speech Lang. Process. 14(4), 1462\u20131469 (2006)","journal-title":"IEEE Trans. Audio Speech Lang. Process."},{"key":"1564_CR39","doi-asserted-by":"publisher","first-page":"1101","DOI":"10.1109\/LSP.2016.2571727","volume":"23","author":"S Wang","year":"2016","unstructured":"S. Wang, A. Chern, Y. Tsao, J. Hung, X. Lu, Y. Lai, B. Su, Wavelet speech enhancement based on non-negative matrix factorization. IEEE Signal Process. Lett. 23, 1101\u20131105 (2016)","journal-title":"IEEE Signal Process. Lett."},{"key":"1564_CR40","doi-asserted-by":"crossref","unstructured":"Y. Wang, Y. Li, K.C. Ho, A. Zare, M. Skubic, Sparsity promoted non-negative matrix factorization for source separation and detection, in Proceedings of the 19th International Conference on Digital Signal Processing. IEEE. 20\u201323 August (2014).","DOI":"10.1109\/ICDSP.2014.6900744"},{"key":"1564_CR41","doi-asserted-by":"crossref","unstructured":"Z. Wanng, F. Sha, Discriminative non-negative matrix factorization for single-channel speech separation, in IEEE International Conference on Acoustics, Speech, and Signal Processing (2014)","DOI":"10.1109\/ICASSP.2014.6854302"},{"key":"1564_CR42","doi-asserted-by":"publisher","first-page":"134","DOI":"10.1016\/j.sigpro.2014.07.012","volume":"106","author":"Y Xu","year":"2015","unstructured":"Y. Xu, G. Bao, X. Xu, Z. Ye, Single-channel speech separation using sequential discriminative dictionary learning. Signal Process. 106, 134\u2013140 (2015)","journal-title":"Signal Process."},{"key":"1564_CR43","unstructured":"V.V. Yash, A.A. Zia, R.A. Musiur, O. Farooq, Variable sparsity regularization factor based SNMF for monaural speech separation, in 40th International Conference on Telecommunications and Signal Processing (TSP). 5\u20137 July (2017)"}],"container-title":["Circuits, Systems, and Signal Processing"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00034-020-01564-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s00034-020-01564-x\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00034-020-01564-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,11,24]],"date-time":"2022-11-24T13:48:49Z","timestamp":1669297729000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s00034-020-01564-x"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,10,23]]},"references-count":43,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2021,4]]}},"alternative-id":["1564"],"URL":"https:\/\/doi.org\/10.1007\/s00034-020-01564-x","relation":{},"ISSN":["0278-081X","1531-5878"],"issn-type":[{"type":"print","value":"0278-081X"},{"type":"electronic","value":"1531-5878"}],"subject":[],"published":{"date-parts":[[2020,10,23]]},"assertion":[{"value":"2 December 2019","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"29 September 2020","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"6 October 2020","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"23 October 2020","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}