{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,12]],"date-time":"2025-10-12T04:57:21Z","timestamp":1760245041203,"version":"3.37.3"},"reference-count":26,"publisher":"Springer Science and Business Media LLC","issue":"1","license":[{"start":{"date-parts":[[2015,11,25]],"date-time":"2015-11-25T00:00:00Z","timestamp":1448409600000},"content-version":"unspecified","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["J AUDIO SPEECH MUSIC PROC."],"published-print":{"date-parts":[[2015,12]]},"DOI":"10.1186\/s13636-015-0075-4","type":"journal-article","created":{"date-parts":[[2015,11,25]],"date-time":"2015-11-25T12:41:51Z","timestamp":1448455311000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":5,"title":["Small-parallel exemplar-based voice conversion in noisy environments using affine non-negative matrix factorization"],"prefix":"10.1186","volume":"2015","author":[{"given":"Ryo","family":"Aihara","sequence":"first","affiliation":[]},{"given":"Takao","family":"Fujii","sequence":"additional","affiliation":[]},{"given":"Toru","family":"Nakashika","sequence":"additional","affiliation":[]},{"given":"Tetsuya","family":"Takiguchi","sequence":"additional","affiliation":[]},{"given":"Yasuo","family":"Ariki","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2015,11,25]]},"reference":[{"key":"75_CR1","unstructured":"DD Lee, HS Seung, in Proc. Neural. Inf. Process. Syst, 13. Algorithms for non-negative matrix factorization, (2001), pp. 556\u2013562."},{"issue":"3","key":"75_CR2","doi-asserted-by":"publisher","first-page":"1066","DOI":"10.1109\/TASL.2006.885253","volume":"15","author":"T Virtanen","year":"2007","unstructured":"T Virtanen, Monaural sound source separation by non-negative matrix factorization with temporal continuity and sparseness criteria. IEEE Trans. Audio, Speech and Lang. Process. 15(3), 1066\u20131074 (2007).","journal-title":"IEEE Trans. Audio, Speech and Lang. Process"},{"key":"75_CR3","unstructured":"MN Schmidt, RK Olsson, in Proc. INTERSPEECH. Single-channel speech separation using sparse non-negative matrix factorization, (2006), pp. 2614\u20132617."},{"issue":"7","key":"75_CR4","doi-asserted-by":"publisher","first-page":"2067","DOI":"10.1109\/TASL.2011.2112350","volume":"19","author":"JF Gemmeke","year":"2011","unstructured":"JF Gemmeke, T Viratnen, A Hurmalainen, Exemplar-based sparse representations for noise robust automatic speech recognition. IEEE Trans. Audio, Speech and Lang. Process. 19(7), 2067\u20132080 (2011).","journal-title":"IEEE Trans. Audio, Speech and Lang. Process"},{"key":"75_CR5","unstructured":"R Takashima, T Takiguchi, Y Ariki, in Proc. SLT. Exemplar-based voice conversion in noisy environment, (2012), pp. 313\u2013317."},{"issue":"5","key":"75_CR6","doi-asserted-by":"publisher","first-page":"912","DOI":"10.1109\/TASL.2010.2041699","volume":"18","author":"E Helander","year":"2010","unstructured":"E Helander, T Virtanen, J Nurminen, M Gabbouj, Voice conversion using partial least squares regression. IEEE Trans. On Audio, Speech, Lang. Process. 18(5), 912\u2013921 (2010).","journal-title":"IEEE Trans. On Audio, Speech, Lang. Process"},{"key":"75_CR7","unstructured":"CH Lee, CH Wu, in Proc. INTERSPEECH. MAP-based adaptation for speech conversion using adaptation data selection and non-parallel training, (2006), pp. 2254\u20132257."},{"issue":"3","key":"75_CR8","doi-asserted-by":"publisher","first-page":"952","DOI":"10.1109\/TSA.2005.857790","volume":"14","author":"A Mouchtaris","year":"2006","unstructured":"A Mouchtaris, JV der Spiegel, P Mueller, Nonparallel training for voice conversion based on a parameter adaptation approach. IEEE Trans. Audio, Speech, and Lang. Processing. 14(3), 952\u2013963 (2006).","journal-title":"IEEE Trans. Audio, Speech, and Lang. Processing"},{"key":"75_CR9","unstructured":"T Toda, Y Ohtani, K Shikano, in Proc. INTERSPEECH. Eigenvoice conversion based on Gaussian mixture model, (2006), pp. 2446\u20132449."},{"key":"75_CR10","unstructured":"D Saito, K Yamamoto, N Minematsu, K Hirose, in Proc. INTERSPEECH. One-to-many voice conversion based on tensor representation of speaker space, (2011), pp. 653\u2013656."},{"key":"75_CR11","unstructured":"EM Grais, H Erdogan, in Proc. INTERSPEECH. Adaptation of speaker-specic bases in non-negative matrix factorization for single channel speech-music separation, (2011), pp. 569\u2013572."},{"issue":"2","key":"75_CR12","doi-asserted-by":"publisher","first-page":"131","DOI":"10.1109\/89.661472","volume":"6","author":"Y Stylianou","year":"1998","unstructured":"Y Stylianou, O Cappe, E Moilines, Continuous probabilistic transform for voice conversion. IEEE. Trans. Speech and Audio Processing. 6(2), 131\u2013142 (1998).","journal-title":"IEEE. Trans. Speech and Audio Processing"},{"issue":"8","key":"75_CR13","doi-asserted-by":"publisher","first-page":"2222","DOI":"10.1109\/TASL.2007.907344","volume":"15","author":"T Toda","year":"2007","unstructured":"T Toda, A Black, K Tokuda, Voice conversion based on maximum likelihood estimation of spectral parameter trajectory. IEEE Trans. Audio, Speech and Lang. Process. 15(8), 2222\u20132235 (2007).","journal-title":"IEEE Trans. Audio, Speech and Lang. Process"},{"issue":"10","key":"75_CR14","doi-asserted-by":"publisher","first-page":"1946","DOI":"10.1587\/transfun.E96.A.1946","volume":"E96-A","author":"R Takashima","year":"2013","unstructured":"R Takashima, T Takiguchi, Y Ariki, Exemplar-based voice conversion using sparse representation in noisy environments. IEICE Trans. Fundam. Electron. Commun. Comp. Sci. E96-A(10), 1946\u20131953 (2013).","journal-title":"IEICE Trans. Fundam. Electron. Commun. Comp. Sci"},{"key":"75_CR15","unstructured":"K Masaka, R Aihara, T Takiguchi, Y Ariki, in Proc. INTERSPEECH. Multimodal exemplar-based voice conversion using lip features in noisy environments, (2014), pp. 1159\u20131163."},{"key":"75_CR16","unstructured":"R Aihara, T Nakashika, T Takiguchi, Y Ariki, in Proc. ICASSP. Voice conversion based on non-negative matrix factorization using phoneme-categorized dictionary, (2014), pp. 7894\u20137898."},{"issue":"10","key":"75_CR17","doi-asserted-by":"publisher","first-page":"1506","DOI":"10.1109\/TASLP.2014.2333242","volume":"22","author":"Z Wu","year":"2014","unstructured":"Z Wu, T Virtanen, ES Chng, H Li, Exemplar-based sparse representation with residual compensation for voice conversion. IEEE Trans. Audio, Speech and Lang. Process. 22(10), 1506\u20131521 (2014).","journal-title":"IEEE Trans. Audio, Speech and Lang. Process"},{"key":"75_CR18","doi-asserted-by":"publisher","unstructured":"R Aihara, R Takashima, T Takiguchi, Y Ariki, A preliminary demonstration of exemplar-based voice conversion for articulation disorders using an individuality-preserving dictionary. EURASIP J. Audio, Speech, and Music Process. 2014(5) (2014). doi:\n                    http:\/\/dx.doi.org\/10.1186\/1687-4722-2014-5\n                    \n                  .","DOI":"10.1186\/1687-4722-2014-5"},{"key":"75_CR19","unstructured":"R Aihara, T Takiguchi, Y Ariki, in Proc. ICASSP. Activity-mapping non-negative matrix factorization for exemplar-based voice conversion, (2015), pp. 4899\u20134903."},{"key":"75_CR20","doi-asserted-by":"publisher","first-page":"357","DOI":"10.1016\/0167-6393(90)90011-W","volume":"9","author":"A Kurematsu","year":"1990","unstructured":"A Kurematsu, K Takeda, Y Sagisaka, S Katagiri, H Kuwabara, K Shikano, ATR Japanese speech database as a tool of speech recognition and synthesis. Speech Communication. 9:, 357\u2013363 (1990).","journal-title":"Speech Communication"},{"issue":"5","key":"75_CR21","doi-asserted-by":"publisher","first-page":"363","DOI":"10.1250\/ast.30.363","volume":"30","author":"N Kitaoka","year":"2009","unstructured":"N Kitaoka, T Yamada, S Tsuge, C Miyajima, K Yamamoto, T Nishiura, M Nakayama, Y Denda, M Fujimoto, T Takiguchi, S Tamura, S Matsuda, T Ogawa, S Kuroiwa, K Takeda, S Nakamura, CENSREC-1-C: An evaluation framework for voice activity detection under noisy environments. Acoustical Science and Technology. 30(5), 363\u2013371 (2009).","journal-title":"Acoustical Science and Technology"},{"key":"75_CR22","unstructured":"H Kawahara, H Matsui, in Proc. ICASSP, I. Auditory morphing based on an elastic perceptual distance metric in an interference-free time-frequency representation, (2003), pp. 256\u2013259."},{"key":"75_CR23","unstructured":"T En-Najjary, O Roec, T Chonavel, in Proc. ICSLP. A voice conversion method based on joint pitch and spectral envelope transformation, (2004), pp. 199\u2013203."},{"key":"75_CR24","unstructured":"INTERNATIONAL TELECOMMUNICATION UNION, Methods for objective and subjective assessment of quality. ITU-T Recommendation, 800 (2003)."},{"issue":"6","key":"75_CR25","doi-asserted-by":"publisher","first-page":"1411","DOI":"10.1587\/transinf.E97.D.1411","volume":"E97-D","author":"R Aihara","year":"2014","unstructured":"R Aihara, R Takashima, T Takiguchi, Y Ariki, Noise-robust voice conversion based on sparse spectral mapping using non-negative matrix factorization. IEICE Trans. Inf. Syst. E97-D(6), 1411\u20131418 (2014).","journal-title":"IEICE Trans. Inf. Syst"},{"key":"75_CR26","unstructured":"C Veaux, X Robet, in Proc. INTERSPEECH. Intonation conversion from neutral to expressive speech, (2011), pp. 2765\u20132768."}],"container-title":["EURASIP Journal on Audio, Speech, and Music Processing"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1186\/s13636-015-0075-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1186\/s13636-015-0075-4\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1186\/s13636-015-0075-4","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1186\/s13636-015-0075-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,3,26]],"date-time":"2019-03-26T12:07:31Z","timestamp":1553602051000},"score":1,"resource":{"primary":{"URL":"https:\/\/asmp-eurasipjournals.springeropen.com\/articles\/10.1186\/s13636-015-0075-4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2015,11,25]]},"references-count":26,"journal-issue":{"issue":"1","published-print":{"date-parts":[[2015,12]]}},"alternative-id":["75"],"URL":"https:\/\/doi.org\/10.1186\/s13636-015-0075-4","relation":{},"ISSN":["1687-4722"],"issn-type":[{"type":"electronic","value":"1687-4722"}],"subject":[],"published":{"date-parts":[[2015,11,25]]},"article-number":"32"}}