{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,31]],"date-time":"2025-12-31T12:14:40Z","timestamp":1767183280777,"version":"3.40.3"},"publisher-location":"Cham","reference-count":29,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783030630065"},{"type":"electronic","value":"9783030630072"}],"license":[{"start":{"date-parts":[[2020,1,1]],"date-time":"2020-01-01T00:00:00Z","timestamp":1577836800000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2020,1,1]],"date-time":"2020-01-01T00:00:00Z","timestamp":1577836800000},"content-version":"vor","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2020]]},"DOI":"10.1007\/978-3-030-63007-2_43","type":"book-chapter","created":{"date-parts":[[2020,11,23]],"date-time":"2020-11-23T00:02:39Z","timestamp":1606089759000},"page":"558-567","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":7,"title":["A Variational Autoencoder Approach for Speech Signal Separation"],"prefix":"10.1007","author":[{"given":"Hao D.","family":"Do","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Son T.","family":"Tran","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Duc T.","family":"Chau","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2020,11,23]]},"reference":[{"key":"43_CR1","unstructured":"Kingma, D.P., Welling, M.: Auto-encoding variational Bayes. In: International Conference on Learning Representations (2014)"},{"issue":"4","key":"43_CR2","doi-asserted-by":"publisher","first-page":"307","DOI":"10.1561\/2200000056","volume":"12","author":"P Diederik","year":"2019","unstructured":"Diederik, P.: Kingma and Max Welling: an introduction to variational autoencoders. Found. Trends Mach. Learn. 12(4), 307\u2013392 (2019)","journal-title":"Found. Trends Mach. Learn."},{"key":"43_CR3","volume-title":"Introduction to Digital Signal Processing and Filter Design","author":"BA Shenoi","year":"2006","unstructured":"Shenoi, B.A.: Introduction to Digital Signal Processing and Filter Design. Wiley, Hoboken (2006)"},{"issue":"7","key":"43_CR4","doi-asserted-by":"publisher","first-page":"1822","DOI":"10.1109\/TSP.2015.2508787","volume":"64","author":"G Wolf","year":"2016","unstructured":"Wolf, G., Mallat, S., Shamma, S.: Rigid motion model for audio source separation. IEEE Trans. Signal Process. 64(7), 1822\u20131831 (2016)","journal-title":"IEEE Trans. Signal Process."},{"key":"43_CR5","doi-asserted-by":"publisher","first-page":"27114","DOI":"10.1109\/ACCESS.2017.2761741","volume":"5","author":"N Yang","year":"2017","unstructured":"Yang, N., Usman, M., He, X., Jan, M.A., Zhang, L.: Time-frequency filter bank: a simple approach for audio and music separation. IEEE Access 5, 27114\u201327125 (2017)","journal-title":"IEEE Access"},{"key":"43_CR6","doi-asserted-by":"publisher","first-page":"1293","DOI":"10.1016\/j.ymssp.2005.08.001","volume":"19","author":"C Serviere","year":"2005","unstructured":"Serviere, C., Fabry, P.: Principal component analysis and blind source separation of modulated sources for electromechanical systems diagnostic. Mech. Syst. Signal Process. 19, 1293\u20131311 (2005)","journal-title":"Mech. Syst. Signal Process."},{"issue":"3","key":"43_CR7","doi-asserted-by":"publisher","first-page":"197","DOI":"10.1049\/el.2014.2616","volume":"51","author":"S Lee","year":"2015","unstructured":"Lee, S., Pang, H.-S.: Multichannel non-negative matrix factorisation based on alternating least squares for audio source separation system. Electron. Lett. 51(3), 197\u2013198 (2015)","journal-title":"Electron. Lett."},{"issue":"1","key":"43_CR8","doi-asserted-by":"publisher","first-page":"302","DOI":"10.1109\/TASL.2011.2161080","volume":"20","author":"J Chien","year":"2012","unstructured":"Chien, J., Hsieh, H.: Convex divergence ICA for blind source separation. IEEE Trans. Audio Speech Lang. Process. 20(1), 302\u2013313 (2012)","journal-title":"IEEE Trans. Audio Speech Lang. Process."},{"issue":"16","key":"43_CR9","doi-asserted-by":"publisher","first-page":"4245","DOI":"10.1109\/TSP.2014.2333563","volume":"62","author":"G-S Fu","year":"2014","unstructured":"Fu, G.-S., Phlypo, R., Anderson, M., Li, X.-L., Adal, T.: Blind source separation by entropy rate minimization. IEEE Trans. Signal Process. 62(16), 4245\u20134255 (2014)","journal-title":"IEEE Trans. Signal Process."},{"issue":"8","key":"43_CR10","doi-asserted-by":"publisher","first-page":"942","DOI":"10.1109\/LSP.2014.2317761","volume":"21","author":"B Liu","year":"2014","unstructured":"Liu, B., Reju, V.G., Khong, A.W.H., Reddy, V.V.: A GMM post-filter for residual crosstalk suppression in blind source separation. IEEE Signal Process. Lett. 21(8), 942\u2013946 (2014)","journal-title":"IEEE Signal Process. Lett."},{"issue":"24","key":"43_CR11","doi-asserted-by":"publisher","first-page":"6521","DOI":"10.1109\/TSP.2014.2367474","volume":"62","author":"S Hosseini","year":"2014","unstructured":"Hosseini, S., Deville, Y.: Blind separation of parametric nonlinear mixtures of possibly auto correlated and non-stationary sources. IEEE Trans. Signal Process. 62(24), 6521\u20136533 (2014)","journal-title":"IEEE Trans. Signal Process."},{"issue":"3","key":"43_CR12","doi-asserted-by":"publisher","first-page":"235","DOI":"10.1109\/TASSP.1977.1162950","volume":"25","author":"JB Allen","year":"1977","unstructured":"Allen, J.B.: Short time spectral analysis, synthesis, and modification by discrete Fourier transform. IEEE Trans. Acoust. Speech Signal Process. 25(3), 235\u2013238 (1977)","journal-title":"IEEE Trans. Acoust. Speech Signal Process."},{"issue":"11","key":"43_CR13","doi-asserted-by":"publisher","first-page":"1858","DOI":"10.1109\/TASLP.2015.2456426","volume":"23","author":"G Okopal","year":"2015","unstructured":"Okopal, G., Wisdom, S., Atlas, L.: Speech analysis with the strong uncorrelating transform. IEEE\/ACM Trans. Audio Speech Lang. Process. 23(11), 1858\u20131868 (2015)","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"key":"43_CR14","unstructured":"Kabal, P.: Time Windows for Linear Prediction of Speech. McGill University (2009)"},{"issue":"3","key":"43_CR15","doi-asserted-by":"publisher","first-page":"217","DOI":"10.1109\/LSP.2012.2225617","volume":"20","author":"J Le Roux","year":"2013","unstructured":"Le Roux, J., Vincent, E.: Consistent Wiener filtering for audio source separation. IEEE Signal Process. Lett. 20(3), 217\u2013220 (2013)","journal-title":"IEEE Signal Process. Lett."},{"issue":"4","key":"43_CR16","doi-asserted-by":"publisher","first-page":"670","DOI":"10.1109\/TASLP.2015.2401426","volume":"23","author":"V-K Mai","year":"2015","unstructured":"Mai, V.-K., Pastor, D., A\u00efssa-El-Bey, A., Le-Bidan, R.: Robust estimation of non-stationary noise power spectrum for speech enhancement. IEEE\/ACM Trans. Audio Speech Lang. Process. 23(4), 670\u2013682 (2015)","journal-title":"IEEE\/ACM Trans. Audio Speech Lang. Process."},{"key":"43_CR17","doi-asserted-by":"crossref","unstructured":"Parande, P.G., Thomas, T.G.: A study of the cocktail party problem. In: International Conference on Electrical and Computing Technologies and Applications (ICECTA), pp. 1\u20135 (2017)","DOI":"10.1109\/ICECTA.2017.8251979"},{"key":"43_CR18","volume-title":"Discrete-Time Signal Processing","author":"AV Oppenheim","year":"1999","unstructured":"Oppenheim, A.V., Schafer, R.W., Buck, J.A.: Discrete-Time Signal Processing. Prentice Hall, Upper Saddle River (1999)"},{"key":"43_CR19","volume-title":"The Measurement of Power Spectra from the Point of View of Communications Engineering","author":"RB Blackman","year":"1959","unstructured":"Blackman, R.B., Tukey, J.W.: The Measurement of Power Spectra from the Point of View of Communications Engineering. Dover Publications Publishing House, New York (1959)"},{"key":"43_CR20","volume-title":"Discrete-Time Speech Signal Processing: Principles and Practice","author":"TF Quatieri","year":"2001","unstructured":"Quatieri, T.F.: Discrete-Time Speech Signal Processing: Principles and Practice. Prentice Hall Publishing House, Upper Saddle River (2001)"},{"issue":"2","key":"43_CR21","doi-asserted-by":"publisher","first-page":"233","DOI":"10.1002\/aic.690370209","volume":"37","author":"MA Kramer","year":"1991","unstructured":"Kramer, M.A.: Nonlinear principal component analysis using autoassociative neural networks. AIChE J. 37(2), 233\u2013243 (1991)","journal-title":"AIChE J."},{"key":"43_CR22","unstructured":"Hinton, G.E., Zemel, R.S.: Autoencoders, minimum description length and Helmholtz free energy. In: Advances in Neural Information Processing Systems 6, pp. 3\u201310 (1994)"},{"key":"43_CR23","unstructured":"Doersch, C.: Tutorial on variational autoencoders. arXiv:1606.05908 (2016)"},{"issue":"1","key":"43_CR24","doi-asserted-by":"publisher","first-page":"79","DOI":"10.1214\/aoms\/1177729694","volume":"22","author":"S Kullback","year":"1951","unstructured":"Kullback, S., Leibler, R.A.: On information and sufficiency. Ann. Math. Stat. 22(1), 79\u201386 (1951)","journal-title":"Ann. Math. Stat."},{"key":"43_CR25","volume-title":"Information Theory and Statistics","author":"S Kullback","year":"1959","unstructured":"Kullback, S.: Information Theory and Statistics. Wiley, Hoboken (1959)"},{"issue":"6088","key":"43_CR26","doi-asserted-by":"publisher","first-page":"533","DOI":"10.1038\/323533a0","volume":"323","author":"E Rumelhart David","year":"1986","unstructured":"Rumelhart David, E., Hinton Geoffrey, E., Williams, R.J.: Learning representations by back-propagating errors. Nature 323(6088), 533\u2013536 (1986)","journal-title":"Nature"},{"key":"43_CR27","doi-asserted-by":"publisher","first-page":"156219","DOI":"10.1109\/ACCESS.2020.3019495","volume":"8","author":"HD Do","year":"2020","unstructured":"Do, H.D., Tran, S.T., Chau, D.T.: Speech source separation using variational autoencoder and bandpass filter. IEEE Access 8, 156219\u2013156231 (2020)","journal-title":"IEEE Access"},{"key":"43_CR28","unstructured":"Fisher William, M., Doddington George, R., Goudie-Marshall, K.M.: The DARPA speech recognition research database: specifications and status (1986)"},{"issue":"4","key":"43_CR29","doi-asserted-by":"publisher","first-page":"1462","DOI":"10.1109\/TSA.2005.858005","volume":"14","author":"E Vincent","year":"2006","unstructured":"Vincent, E., Gribonval, R., F\u00e9votte, C.: Performance measurement in blind audio source separation. IEEE Trans. Audio Speech Lang. Process. 14(4), 1462\u20131469 (2006)","journal-title":"IEEE Trans. Audio Speech Lang. Process."}],"container-title":["Lecture Notes in Computer Science","Computational Collective Intelligence"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-030-63007-2_43","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2020,11,23]],"date-time":"2020-11-23T00:21:54Z","timestamp":1606090914000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-030-63007-2_43"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020]]},"ISBN":["9783030630065","9783030630072"],"references-count":29,"URL":"https:\/\/doi.org\/10.1007\/978-3-030-63007-2_43","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2020]]},"assertion":[{"value":"23 November 2020","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"ICCCI","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Computational Collective Intelligence","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Da Nang","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Vietnam","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2020","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"30 November 2020","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"3 December 2020","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"12","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"iccci2020","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/iccci.pwr.edu.pl\/2020\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}