{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,22]],"date-time":"2024-10-22T22:07:36Z","timestamp":1729634856724,"version":"3.28.0"},"reference-count":28,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2014,5]]},"DOI":"10.1109\/icassp.2014.6853856","type":"proceedings-article","created":{"date-parts":[[2014,7,29]],"date-time":"2014-07-29T19:23:23Z","timestamp":1406661803000},"page":"1542-1546","source":"Crossref","is-referenced-by-count":7,"title":["Multimodal voice conversion using non-negative matrix factorization in noisy environments"],"prefix":"10.1109","author":[{"given":"Kenta","family":"Masaka","sequence":"first","affiliation":[]},{"given":"Ryo","family":"Aihara","sequence":"additional","affiliation":[]},{"given":"Tetsuya","family":"Takiguchi","sequence":"additional","affiliation":[]},{"given":"Yasuo","family":"Ariki","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"doi-asserted-by":"publisher","key":"19","DOI":"10.1109\/TASL.2010.2041699"},{"doi-asserted-by":"publisher","key":"17","DOI":"10.1016\/0167-6393(92)90012-V"},{"doi-asserted-by":"publisher","key":"18","DOI":"10.1109\/TASL.2007.907344"},{"doi-asserted-by":"publisher","key":"15","DOI":"10.1109\/ICASSP.1998.674423"},{"key":"16","first-page":"655","article-title":"Esophageal speech enhancement based on statistical voice conversion with Gaussian mixture models","author":"abe","year":"1988","journal-title":"ICASSP"},{"doi-asserted-by":"publisher","key":"13","DOI":"10.1109\/ICASSP.2013.6639230"},{"key":"14","first-page":"148","article-title":"Speaking aid system for total laryngectomees using voice conversion of body transmitted artificial speech","author":"nakamura","year":"2006","journal-title":"InterSpeech"},{"doi-asserted-by":"publisher","key":"11","DOI":"10.5923\/j.ajsp.20120205.06"},{"doi-asserted-by":"publisher","key":"12","DOI":"10.1016\/j.specom.2011.07.007"},{"key":"21","first-page":"2446","article-title":"Eigenvoice conversion based on Gaussian mixture model","author":"toda","year":"2006","journal-title":"InterSpeech"},{"key":"20","first-page":"2254","article-title":"Map-based adaptation for speech conversion using adaptation data selection and non-parallel training","author":"lee","year":"2006","journal-title":"InterSpeech"},{"key":"22","doi-asserted-by":"crossref","first-page":"653","DOI":"10.21437\/Interspeech.2011-268","article-title":"Oneto-many voice conversion based on tensor representation of speaker space","author":"saito","year":"2011","journal-title":"InterSpeech"},{"doi-asserted-by":"publisher","key":"23","DOI":"10.1016\/S0167-6393(98)00085-5"},{"doi-asserted-by":"publisher","key":"24","DOI":"10.1016\/0167-6393(90)90011-W"},{"key":"25","first-page":"25","article-title":"HMM-based text-to-audio-visual speech synthesis-image-based approach","volume":"3","author":"sako","year":"2000","journal-title":"ICSLP"},{"doi-asserted-by":"publisher","key":"26","DOI":"10.1250\/ast.30.363"},{"key":"27","first-page":"800","article-title":"Methods for objective and subjective assessment of quality","year":"2003","journal-title":"ITU-T Recommendation"},{"key":"28","first-page":"71","article-title":"Noiserobust voice conversion based on spectral mapping on sparse space","author":"takashima","year":"2013","journal-title":"5th ISCA Speech Synthesis Workshop"},{"key":"3","doi-asserted-by":"crossref","DOI":"10.21437\/Interspeech.2006-655","article-title":"Single-channel speech separation using sparse non-negative matrix factorization","author":"schmidt","year":"2006","journal-title":"InterSpeech"},{"doi-asserted-by":"publisher","key":"2","DOI":"10.1109\/TASL.2006.885253"},{"key":"10","doi-asserted-by":"crossref","first-page":"2765","DOI":"10.21437\/Interspeech.2011-692","article-title":"Intonation conversion from neutral to expressive speech","author":"veaux","year":"2011","journal-title":"InterSpeech"},{"key":"1","first-page":"556","article-title":"Algorithms for non-negative matrix factorization","author":"lee","year":"2001","journal-title":"Neural Information Processing System"},{"doi-asserted-by":"publisher","key":"7","DOI":"10.1109\/ICASSP.1998.679695"},{"doi-asserted-by":"publisher","key":"6","DOI":"10.1109\/89.661472"},{"doi-asserted-by":"publisher","key":"5","DOI":"10.1109\/SLT.2012.6424242"},{"doi-asserted-by":"publisher","key":"4","DOI":"10.1109\/TASL.2011.2112350"},{"doi-asserted-by":"publisher","key":"9","DOI":"10.1109\/ICASSP.1996.543247"},{"key":"8","article-title":"Late integration in audio-visual continuous speech recognition","author":"verma","year":"1999","journal-title":"ASRU"}],"event":{"name":"ICASSP 2014 - 2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)","start":{"date-parts":[[2014,5,4]]},"location":"Florence, Italy","end":{"date-parts":[[2014,5,9]]}},"container-title":["2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/6844297\/6853544\/06853856.pdf?arnumber=6853856","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,4,13]],"date-time":"2022-04-13T00:36:56Z","timestamp":1649810216000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/6853856\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2014,5]]},"references-count":28,"URL":"https:\/\/doi.org\/10.1109\/icassp.2014.6853856","relation":{},"subject":[],"published":{"date-parts":[[2014,5]]}}}