{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,4,17]],"date-time":"2025-04-17T14:50:15Z","timestamp":1744901415454},"reference-count":33,"publisher":"Springer Science and Business Media LLC","issue":"3","license":[{"start":{"date-parts":[[2018,10,26]],"date-time":"2018-10-26T00:00:00Z","timestamp":1540512000000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Wireless Pers Commun"],"published-print":{"date-parts":[[2019,2]]},"DOI":"10.1007\/s11277-018-6057-y","type":"journal-article","created":{"date-parts":[[2018,10,26]],"date-time":"2018-10-26T15:54:01Z","timestamp":1540569241000},"page":"895-905","update-policy":"http:\/\/dx.doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":5,"title":["Fusion Multistyle Training for Speaker Identification of Disguised Speech"],"prefix":"10.1007","volume":"104","author":[{"given":"Swati","family":"Prasad","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ramjee","family":"Prasad","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2018,10,26]]},"reference":[{"issue":"4","key":"6057_CR1","doi-asserted-by":"publisher","first-page":"460","DOI":"10.1109\/PROC.1976.10155","volume":"64","author":"BS Atal","year":"1976","unstructured":"Atal, B. S. (1976). Automatic recognition of speakers from their voices. Proceedings of the IEEE, 64(4), 460\u2013475.","journal-title":"Proceedings of the IEEE"},{"issue":"11","key":"6057_CR2","doi-asserted-by":"publisher","first-page":"1651","DOI":"10.1109\/PROC.1985.13345","volume":"73","author":"GR Doddington","year":"1985","unstructured":"Doddington, G. R. (1985). Speaker recognition\u2014Identifying people by their voices. Proceedings of the IEEE, 73(11), 1651\u20131664.","journal-title":"Proceedings of the IEEE"},{"issue":"4","key":"6057_CR3","doi-asserted-by":"publisher","first-page":"18","DOI":"10.1109\/79.317924","volume":"11","author":"H Gish","year":"1994","unstructured":"Gish, H., & Schmidt, M. (1994). Text-independent speaker identification. IEEE Signal Processing Magazine, 11(4), 18\u201332.","journal-title":"IEEE Signal Processing Magazine"},{"issue":"9","key":"6057_CR4","doi-asserted-by":"publisher","first-page":"1437","DOI":"10.1109\/5.628714","volume":"85","author":"J Campbell","year":"1997","unstructured":"Campbell, J. (1997). Speaker recognition: A tutorial. Proceedings of the IEEE, 85(9), 1437\u20131462.","journal-title":"Proceedings of the IEEE"},{"issue":"1","key":"6057_CR5","doi-asserted-by":"publisher","first-page":"12","DOI":"10.1016\/j.specom.2009.08.009","volume":"52","author":"T Kinnunen","year":"2010","unstructured":"Kinnunen, T., & Li, H. (2010). An overview of text-independent speaker recognition: From features to supervectors. Speech Communications, 52(1), 12\u201340.","journal-title":"Speech Communications"},{"issue":"2","key":"6057_CR6","doi-asserted-by":"publisher","first-page":"23","DOI":"10.1109\/MCAS.2011.941079","volume":"11","author":"R Togneri","year":"2011","unstructured":"Togneri, R., & Pullella, D. (2011). An overview of speaker identification: Accuracy and robustness issues. IEEE Circuits and Systems Magazine, 11(2), 23\u201361.","journal-title":"IEEE Circuits and Systems Magazine"},{"issue":"1","key":"6057_CR7","doi-asserted-by":"publisher","first-page":"4","DOI":"10.1109\/TCSVT.2003.818349","volume":"14","author":"AK Jain","year":"2004","unstructured":"Jain, A. K., Ross, A., & Prabhakar, S. (2004). An introduction to biometric recognition. IEEE Transactions on Circuits and Systems for Video Technology, 14(1), 4\u201320.","journal-title":"IEEE Transactions on Circuits and Systems for Video Technology"},{"key":"6057_CR8","doi-asserted-by":"publisher","first-page":"74","DOI":"10.1109\/MSP.2015.2462851","volume":"36","author":"JHL Hansen","year":"2015","unstructured":"Hansen, J. H. L., & Hasan, T. (2015). Speaker recognition by machines and humans. IEEE Signal Processing Magazine, 36, 74\u201399.","journal-title":"IEEE Signal Processing Magazine"},{"key":"6057_CR9","doi-asserted-by":"publisher","DOI":"10.1007\/978-981-10-3238-7","volume-title":"Robustness-related issues in speaker recognition","author":"TF Zheng","year":"2017","unstructured":"Zheng, T. F., & Li, L. (2017). Robustness-related issues in speaker recognition. Berlin: Springer."},{"issue":"1","key":"6057_CR10","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s11277-017-4375-0","volume":"97","author":"S Prasad","year":"2017","unstructured":"Prasad, S., Tan, Z.-H., & Prasad, R. (2017). Feature frame selection for robust speaker identification: A hybrid approach. Wireless Personal Communications, 97(1), 1\u201318.","journal-title":"Wireless Personal Communications"},{"issue":"3","key":"6057_CR11","doi-asserted-by":"publisher","first-page":"1684","DOI":"10.1109\/TCE.2010.5606313","volume":"56","author":"K Kim","year":"2010","unstructured":"Kim, K., & Kim, M. Y. (2010). Robust speaker recognition against background noise in an enhanced multicondition domain. IEEE Transactions on Consumer Electronics, 56(3), 1684\u20131688.","journal-title":"IEEE Transactions on Consumer Electronics"},{"issue":"11","key":"6057_CR12","doi-asserted-by":"publisher","first-page":"675","DOI":"10.1109\/LSP.2011.2169453","volume":"18","author":"L Zao","year":"2011","unstructured":"Zao, L., & Coelho, R. (2011). Colored noise based multicondition training for robust speaker identification. IEEE Signal Processing Letters, 18(11), 675\u2013678.","journal-title":"IEEE Signal Processing Letters"},{"key":"6057_CR13","doi-asserted-by":"publisher","first-page":"180","DOI":"10.1016\/j.dsp.2014.06.007","volume":"33","author":"SM Govindan","year":"2014","unstructured":"Govindan, S. M., Duraisamy, P., & Yuan, X. (2014). Adaptive wavelet shrinkage for noise robust speaker recognition. Digital Signal Processing, 33, 180\u2013190.","journal-title":"Digital Signal Processing"},{"issue":"12","key":"6057_CR14","doi-asserted-by":"publisher","first-page":"1951","DOI":"10.1109\/TASLP.2014.2355821","volume":"22","author":"A Venturini","year":"2014","unstructured":"Venturini, A., Zao, L., & Coelho, R. (2014). On speech features fusion, integration Gaussian modeling and multi-style training for noise robust speaker classification. IEEE\/ACM Transactions on Audio, Speech and Language Processing, 22(12), 1951\u20131964.","journal-title":"IEEE\/ACM Transactions on Audio, Speech and Language Processing"},{"key":"6057_CR15","doi-asserted-by":"crossref","unstructured":"Ghiurcau, M. V., Rusu, C. & Astola, J. (2011). A study of the effect of emotional state upon text-independent speaker identification. In Proceedings of ICASSP, Prague, Czech Republic.","DOI":"10.1109\/ICASSP.2011.5947465"},{"key":"6057_CR16","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6639177","volume-title":"Human speaker identification of known voices transmitted through different user interfaces and transmission channels","author":"LF Gallardo","year":"2013","unstructured":"Gallardo, L. F., Mller, S., & Wagner, M. (2013). Human speaker identification of known voices transmitted through different user interfaces and transmission channels. Vancouver, BC: ICASSP."},{"key":"6057_CR17","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6638973","volume-title":"Improving speaker identification robustness to highly channel-degraded speech through multiple system fusion","author":"M McLaren","year":"2013","unstructured":"McLaren, M., Scheffer, N., Graciarena, M., Ferrer, L., & Lei, Y. (2013). Improving speaker identification robustness to highly channel-degraded speech through multiple system fusion. Vancouver, BC: ICASSP."},{"key":"6057_CR18","doi-asserted-by":"crossref","unstructured":"Kelly, F., Drygajlo, A. & Harte, N. (2012). Speaker verification with long-term ageing data. In Proceedings of International Conference on Biometrics, New Delhi, India.","DOI":"10.1109\/ICB.2012.6199796"},{"key":"6057_CR19","doi-asserted-by":"crossref","unstructured":"Perrot, P., Aversano, G., & Chollet, G. (2007). Voice disguise and automatic detection: Review and perspectives. InProgress in nonlinear speech processing, p. 101117.","DOI":"10.1007\/978-3-540-71505-4_7"},{"issue":"2","key":"6057_CR20","doi-asserted-by":"crossref","first-page":"1043","DOI":"10.21437\/Eurospeech.1997-363","volume":"97","author":"A Eriksson","year":"1997","unstructured":"Eriksson, A., & Wretling, P. (1997). How flexible is the human voice?\u2014A case study of mimicry. Eurospeech, 97(2), 1043\u20131046.","journal-title":"Eurospeech"},{"key":"6057_CR21","unstructured":"Rodman, R. D. (1998). Speaker recognition of disguised voices: A program for research. In Proceedings of consortium on speech technology in conjunction with the conference on speaker recognition by man and machine: Directions for Forensic Applications COST250, Ankara, Turkey."},{"issue":"4","key":"6057_CR22","doi-asserted-by":"publisher","first-page":"1023","DOI":"10.1121\/1.383321","volume":"66","author":"AR Reich","year":"1979","unstructured":"Reich, A. R., & Duke, J. E. (1979). Effects of selected vocal disguises upon speaker identification by listening. The Journal of the Acoustical Society of America, 66(4), 1023\u20131028.","journal-title":"The Journal of the Acoustical Society of America"},{"issue":"4","key":"6057_CR23","doi-asserted-by":"publisher","first-page":"919","DOI":"10.1121\/1.381173","volume":"60","author":"AR Reich","year":"1976","unstructured":"Reich, A. R., Kenneth, L. M., & Curtis, J. F. (1976). Effects of selected vocal disguises upon spectrographic speaker identification. The Journal of the Acoustical Society of America, 60(4), 919\u2013925.","journal-title":"The Journal of the Acoustical Society of America"},{"issue":"2","key":"6057_CR24","doi-asserted-by":"publisher","first-page":"118","DOI":"10.1016\/j.forsciint.2007.05.019","volume":"175","author":"C Zhang","year":"2008","unstructured":"Zhang, C., & Tan, T. (2008). Voice disguise and automatic speaker recognition. Forensic Science International, 175(2), 118\u2013122.","journal-title":"Forensic Science International"},{"key":"6057_CR25","unstructured":"Dilda, G. S. & Hollien, H. (2015). Voice disguise in speaker identification. In Proceedings of meetings on acoustics, Vol. 25, no. 1."},{"key":"6057_CR26","doi-asserted-by":"crossref","unstructured":"Grimaldi, M., & Cummins, F. (2009). Speech style and speaker recognition: a case study. In INTERSPEECH, Bighton, UK.","DOI":"10.21437\/Interspeech.2009-276"},{"key":"6057_CR27","unstructured":"Lippmann, R., Martin, E., & Paul, D. B. (1987). Multi-style training for robust isolated-word speech recognition. In: Proceedings of IEEE international conference on acoustics, speech, and signal processing, Dallas, Texas, USA."},{"issue":"11","key":"6057_CR28","doi-asserted-by":"publisher","first-page":"675","DOI":"10.1109\/LSP.2011.2169453","volume":"18","author":"L Zao","year":"2011","unstructured":"Zao, L., & Coelho, R. (2011). Colored noise based multicondition training for robust speaker identification. IEEE Signal Processing Letters, 18(11), 675\u2013678.","journal-title":"IEEE Signal Processing Letters"},{"key":"6057_CR29","doi-asserted-by":"crossref","unstructured":"Xu, H., Tan, Z.-H., Dalsgaard, P., & Lindberg, B. (2005). Robust speech recognition based on noise and SNR classification\u2014A multiple-model framework. In INTERSPEECH, Lisbon, Portugal.","DOI":"10.21437\/Interspeech.2005-233"},{"key":"6057_CR30","unstructured":"Prasad, S., Tan, Z.-H. & Prasad, R. (2013). Multistyle training and fusion for speaker identification of disguised voice. In 1st international conference on communications, connectivity, convergence, content and cooperation (IC5), Mumbai, India."},{"key":"6057_CR31","doi-asserted-by":"crossref","unstructured":"Reynolds, D. A., & Rose, R. C. (1995). Robust text-independent speaker identification using Gaussian mixture speaker models. In IEEE transactions on speech and audio processing, Dallas.","DOI":"10.1109\/89.365379"},{"key":"6057_CR32","unstructured":"Cummins, F., & Grimaldi, M. (2006). The chains corpus: Characterizing individual speakers. In Proceedings of SPECOM, St. Petersburg, Russia."},{"key":"6057_CR33","unstructured":"Young, S., Evermann, G., Gales, M., Hain, T., Kershaw, D., Liu, X., et al. The HTK book version 3.4, Cambridge University Engineering Department. http:\/\/htk.eng.cam.ac.uk . Accessed on 29 November 2017."}],"container-title":["Wireless Personal Communications"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s11277-018-6057-y\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s11277-018-6057-y.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s11277-018-6057-y.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,9,4]],"date-time":"2022-09-04T19:16:08Z","timestamp":1662318968000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s11277-018-6057-y"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,10,26]]},"references-count":33,"journal-issue":{"issue":"3","published-print":{"date-parts":[[2019,2]]}},"alternative-id":["6057"],"URL":"https:\/\/doi.org\/10.1007\/s11277-018-6057-y","relation":{},"ISSN":["0929-6212","1572-834X"],"issn-type":[{"value":"0929-6212","type":"print"},{"value":"1572-834X","type":"electronic"}],"subject":[],"published":{"date-parts":[[2018,10,26]]},"assertion":[{"value":"26 October 2018","order":1,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}