{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,10]],"date-time":"2025-11-10T21:04:38Z","timestamp":1762808678165,"version":"3.37.3"},"reference-count":40,"publisher":"Springer Science and Business Media LLC","issue":"4","license":[{"start":{"date-parts":[[2018,10,29]],"date-time":"2018-10-29T00:00:00Z","timestamp":1540771200000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"funder":[{"DOI":"10.13039\/501100002183","name":"Department of Electronics and Information Technology, Ministry of Communications and Information Technology","doi-asserted-by":"publisher","award":["No. 12(5)\/2015-ESD"],"award-info":[{"award-number":["No. 12(5)\/2015-ESD"]}],"id":[{"id":"10.13039\/501100002183","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Int J Speech Technol"],"published-print":{"date-parts":[[2018,12]]},"DOI":"10.1007\/s10772-018-09568-4","type":"journal-article","created":{"date-parts":[[2018,10,29]],"date-time":"2018-10-29T15:18:15Z","timestamp":1540826295000},"page":"1057-1070","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":4,"title":["Effective use of combined excitation source and vocal-tract information for speaker recognition tasks"],"prefix":"10.1007","volume":"21","author":[{"ORCID":"https:\/\/orcid.org\/0000-0001-9740-6987","authenticated-orcid":false,"given":"Krishna","family":"Dutta","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jagabandhu","family":"Mishra","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Debadatta","family":"Pati","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2018,10,29]]},"reference":[{"issue":"4","key":"9568_CR1","doi-asserted-by":"publisher","first-page":"255","DOI":"10.1016\/S0167-6393(99)00054-0","volume":"30","author":"H Altnccay","year":"2000","unstructured":"Altnccay, H., & Demirekler, M. (2000). An information theoretic framework for weight estimation in the combination of probabilistic classifiers for speaker identification. Speech Communication, 30(4), 255\u2013272.","journal-title":"Speech Communication"},{"issue":"4","key":"9568_CR2","doi-asserted-by":"publisher","first-page":"531","DOI":"10.1016\/S0167-6393(03)00032-3","volume":"41","author":"H Altnccay","year":"2003","unstructured":"Altnccay, H., & Demirekler, M. (2003). Speaker identification by combining multiple classifiers using dempster-shafer theory of evidence. Speech Communication, 41(4), 531\u2013547.","journal-title":"Speech Communication"},{"issue":"4","key":"9568_CR3","doi-asserted-by":"publisher","first-page":"460","DOI":"10.1109\/PROC.1976.10155","volume":"64","author":"BS Atal","year":"1976","unstructured":"Atal, B. S. (1976). Automatic recognition of speakers from their voices. Proceedings of the IEEE, 64(4), 460\u2013475.","journal-title":"Proceedings of the IEEE"},{"key":"9568_CR4","doi-asserted-by":"publisher","DOI":"10.1007\/978-0-387-77592-0","volume-title":"Fundamentals of speaker recognition","author":"H Beigi","year":"2011","unstructured":"Beigi, H. (2011). Fundamentals of speaker recognition. Berlin: Springer."},{"issue":"9","key":"9568_CR5","doi-asserted-by":"publisher","first-page":"1437","DOI":"10.1109\/5.628714","volume":"85","author":"JP Campbell","year":"1997","unstructured":"Campbell, J. P. (1997). Speaker recognition: A tutorial. Proceedings of IEEE, 85(9), 1437\u20131462.","journal-title":"Proceedings of IEEE"},{"issue":"5","key":"9568_CR6","doi-asserted-by":"publisher","first-page":"308","DOI":"10.1109\/LSP.2006.870086","volume":"13","author":"WM Campbell","year":"2006","unstructured":"Campbell, W. M., Sturim, D. E., & Reynolds, D. A. (2006). Support vector machines using GMM supervectors for speaker verification. IEEE Signal Processing Letters, 13(5), 308\u2013311.","journal-title":"IEEE Signal Processing Letters"},{"issue":"1","key":"9568_CR7","doi-asserted-by":"publisher","first-page":"184","DOI":"10.1121\/1.4954653","volume":"140","author":"RK Das","year":"2016","unstructured":"Das, R. K., & Prasanna, S. R. M. (2016). Exploring different attributes of source information for speaker verification with limited test data. The Journal of the Acoustical Society of America, 140(1), 184\u2013190.","journal-title":"The Journal of the Acoustical Society of America"},{"issue":"4","key":"9568_CR8","doi-asserted-by":"publisher","first-page":"788","DOI":"10.1109\/TASL.2010.2064307","volume":"19","author":"N Dehak","year":"2011","unstructured":"Dehak, N., Kenny, P. J., Dehak, R., Dumouchel, P., & Ouellet, P. (2011). Front-end factor analysis for speaker verification. IEEE Transactions on Audio, Speech, and Language Processing, 19(4), 788\u2013798.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"key":"9568_CR9","unstructured":"Djemili, R., Bedda, M., & Bourouba, H. (2007). A hybrid gmm\/svm system for text independent speaker identification. International Journal of Computer and Information Science & Engineering, 1(1)."},{"key":"9568_CR10","volume-title":"Pattern classification and scene analysis","author":"RO Duda","year":"1973","unstructured":"Duda, R. O., Hart, P. E., & Stork, D. G. (1973). Pattern classification and scene analysis. New York: Wiley."},{"key":"9568_CR11","doi-asserted-by":"crossref","unstructured":"Farrell, K., Kosonocky, S., & Mammone, R. (1994). Neural tree network\/vector quantization probability estimators for speaker recognition. In Proceedings of the 1994 IEEE workshop on neural networks for signal processing, pp. 279\u2013288.","DOI":"10.1109\/NNSP.1994.366039"},{"issue":"S1","key":"9568_CR12","doi-asserted-by":"publisher","first-page":"S55","DOI":"10.1121\/1.2025411","volume":"83","author":"TC Feustel","year":"1988","unstructured":"Feustel, T. C., Logan, R. J., & Velius, G. A. (1988). Human and machine performance on speaker identity verification. The Journal of the Acoustical Society of America, 83(S1), S55\u2013S55.","journal-title":"The Journal of the Acoustical Society of America"},{"key":"9568_CR13","doi-asserted-by":"publisher","first-page":"254","DOI":"10.1109\/TASSP.1981.1163530","volume":"29","author":"S Furui","year":"1981","unstructured":"Furui, S. (1981). Cepstral analysis technique for automatic speaker verification. IEEE Transactions on Acoustic, Speech, and Signal Processing, 29, 254\u2013272.","journal-title":"IEEE Transactions on Acoustic, Speech, and Signal Processing"},{"key":"9568_CR14","volume-title":"Timit acoustic-phonetic continuous speech corpus","author":"JS Garofolo","year":"1993","unstructured":"Garofolo, J. S., Lamel, L. F., Fisher, W. M., Fiscus, J. G., Pallett, D. S., Dahlgren, N. L., et al. (1993). Timit acoustic-phonetic continuous speech corpus. Philadelphia: Linguistic data consortium."},{"issue":"4","key":"9568_CR15","doi-asserted-by":"publisher","first-page":"441","DOI":"10.1007\/s10772-012-9140-x","volume":"15","author":"BC Haris","year":"2012","unstructured":"Haris, B. C., Pradhan, G., Misra, A., Prasanna, S. R. M., Das, R. K., & Sinha, R. (2012). Multi-variability speaker recognition database in Indian scenario. International Journal of Speech Technology, 15(4), 441\u2013453.","journal-title":"International Journal of Speech Technology"},{"issue":"4","key":"9568_CR16","doi-asserted-by":"publisher","first-page":"578","DOI":"10.1109\/89.326616","volume":"2","author":"H Hermansky","year":"1994","unstructured":"Hermansky, H., & Morgan, N. (1994). Rasta processing of speech. IEEE Transactions on Speech and Audio Processing, 2(4), 578\u2013589.","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"key":"9568_CR17","doi-asserted-by":"crossref","unstructured":"Hosseinzadeh, D., & Krishnan, S. (2007). Combining vocal source and mfcc features for enhanced speaker recognition performance using gmms. In IEEE 9th Workshop on Multimedia Signal Processing, pp. 365\u2013368.","DOI":"10.1109\/MMSP.2007.4412892"},{"issue":"4","key":"9568_CR18","doi-asserted-by":"publisher","first-page":"1448","DOI":"10.1109\/TASL.2007.894527","volume":"15","author":"P Kenny","year":"2007","unstructured":"Kenny, P., Boulianne, G., Ouellet, P., & Dumouchel, P. (2007). Speaker and session variability in gmm-based speaker verification. IEEE Transactions on Audio Speech and Language Processing, 15(4), 1448.","journal-title":"IEEE Transactions on Audio Speech and Language Processing"},{"issue":"4","key":"9568_CR19","doi-asserted-by":"publisher","first-page":"1435","DOI":"10.1109\/TASL.2006.881693","volume":"15","author":"P Kenny","year":"2007","unstructured":"Kenny, P., Boulianne, G., Ouellet, P., & Dumouchel, P. (2007). Joint factor analysis versus eigenchannels in speaker recognition. IEEE Transactions on Audio, Speech, and Language Processing, 15(4), 1435\u20131447.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"key":"9568_CR20","unstructured":"Linguistic data consortium, switchboard cellular part 2 audio. (2004). Retrieved from, http:\/\/www.ldc.upenn.edu\/Catalog\/CatalogEntry.jspcatalogId=LDC2004S07 ."},{"key":"9568_CR21","doi-asserted-by":"crossref","unstructured":"Martin, A., Doddington, G., Kamm, T., Ordowski, M., & Przybocki, M. (1997). The det curve in assessment of detection task performance. In Technical Report, National Institute of Standards and Technology Gaithersburg MD.","DOI":"10.21437\/Eurospeech.1997-504"},{"issue":"1","key":"9568_CR22","doi-asserted-by":"publisher","first-page":"147","DOI":"10.1016\/j.patcog.2005.08.004","volume":"39","author":"DJ Mashao","year":"2006","unstructured":"Mashao, D. J., & Skosan, M. (2006). Combining classifier decisions for robust speaker identification. Pattern Recognition, 39(1), 147\u2013155.","journal-title":"Pattern Recognition"},{"issue":"1","key":"9568_CR23","doi-asserted-by":"publisher","first-page":"52","DOI":"10.1109\/LSP.2005.860538","volume":"13","author":"KSR Murty","year":"2006","unstructured":"Murty, K. S. R., & Yegnanarayana, B. (2006). Combining evidence from residual phase and mfcc features for speaker recognition. IEEE Signal Processing Letters, 13(1), 52\u201355.","journal-title":"IEEE Signal Processing Letters"},{"issue":"4","key":"9568_CR24","doi-asserted-by":"publisher","first-page":"1085","DOI":"10.1109\/TASL.2011.2172422","volume":"20","author":"S Nakagawa","year":"2012","unstructured":"Nakagawa, S., Wang, L., & Ohtsuka, S. (2012). Speaker identification and verification by combining mfcc and phase information. IEEE Transactions on Audio, Speech, and Language Processing, 20(4), 1085\u20131095.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"767","key":"9568_CR25","doi-asserted-by":"publisher","first-page":"333","DOI":"10.1098\/rsta.1937.0005","volume":"236","author":"J Neyman","year":"1937","unstructured":"Neyman, J. (1937). Outline of a theory of statistical estimation based on the classical theory of probability. Philosophical Transactions of the Royal Society of London A, 236(767), 333\u2013380.","journal-title":"Philosophical Transactions of the Royal Society of London A"},{"issue":"2","key":"9568_CR26","doi-asserted-by":"publisher","first-page":"138","DOI":"10.4103\/0256-4602.60167","volume":"27","author":"D Pati","year":"2010","unstructured":"Pati, D., & Prasanna, S. R. M. (2010). Speaker recognition from excitation source perspective. IETE Technical Review, 27(2), 138\u2013157.","journal-title":"IETE Technical Review"},{"issue":"1","key":"9568_CR27","doi-asserted-by":"publisher","first-page":"49","DOI":"10.1007\/s10772-010-9087-8","volume":"14","author":"D Pati","year":"2011","unstructured":"Pati, D., & Prasanna, S. R. M. (2011). Subsegmental, segmental and suprasegmental processing of linear prediction residual for speaker information. International Journal of Speech Technology, 14(1), 49\u201364.","journal-title":"International Journal of Speech Technology"},{"issue":"4","key":"9568_CR28","doi-asserted-by":"publisher","first-page":"591","DOI":"10.1007\/s12046-013-0163-z","volume":"38","author":"D Pati","year":"2013","unstructured":"Pati, D., & Prasanna, S. R. M. (2013). A comparative study of explicit and implicit modelling of subsegmental speaker-specific excitation source information. Sadhana, 38(4), 591\u2013620.","journal-title":"Sadhana"},{"issue":"3","key":"9568_CR29","doi-asserted-by":"publisher","first-page":"594","DOI":"10.1109\/TASL.2008.916525","volume":"16","author":"N Poh","year":"2008","unstructured":"Poh, N., & Kittler, J. (2008). Incorporating model-specific score distribution in speaker verification systems. IEEE Transactions on Audio, Speech, and Language Processing, 16(3), 594\u2013606.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"10","key":"9568_CR30","doi-asserted-by":"publisher","first-page":"1243","DOI":"10.1016\/j.specom.2006.06.002","volume":"48","author":"SRM Prasanna","year":"2006","unstructured":"Prasanna, S. R. M., Gupta, C. S., & Yegnanarayana, B. (2006). Extraction of speaker-specific excitation information from linear prediction residual of speech. Speech Communication, 48(10), 1243\u20131261.","journal-title":"Speech Communication"},{"issue":"12","key":"9568_CR31","doi-asserted-by":"publisher","first-page":"2801","DOI":"10.1016\/S0031-3203(01)00235-7","volume":"35","author":"RP Ramachandran","year":"2002","unstructured":"Ramachandran, R. P., Farrell, K. R., Ramachandran, R., & Mammone, R. J. (2002). Speaker recognition-general classifier approaches and data fusion methods. Pattern Recognition, 35(12), 2801\u20132821.","journal-title":"Pattern Recognition"},{"issue":"6","key":"9568_CR32","doi-asserted-by":"publisher","first-page":"EL469","DOI":"10.1121\/1.4921679","volume":"137","author":"A Ramakrishnan","year":"2015","unstructured":"Ramakrishnan, A., Abhiram, B., & Prasanna, S. R. M. (2015). Voice source characterization using pitch synchronous discrete cosine transform for speaker identification. The Journal of the Acoustical Society of America, 137(6), EL469\u2013EL475.","journal-title":"The Journal of the Acoustical Society of America"},{"key":"9568_CR33","doi-asserted-by":"publisher","first-page":"91","DOI":"10.1016\/0167-6393(95)00009-D","volume":"17","author":"D Reynolds","year":"1995","unstructured":"Reynolds, D. (1995). Speaker identification and verification using Gaussian mixture speaker models. Speech Communication, 17, 91\u2013108.","journal-title":"Speech Communication"},{"issue":"3","key":"9568_CR34","doi-asserted-by":"publisher","first-page":"46","DOI":"10.1109\/97.372913","volume":"2","author":"DA Reynolds","year":"1995","unstructured":"Reynolds, D. A. (1995). Large population speaker identification using clean and telephone speech. IEEE Signal Processing Letters, 2(3), 46\u201348.","journal-title":"IEEE Signal Processing Letters"},{"issue":"1\u20133","key":"9568_CR35","doi-asserted-by":"publisher","first-page":"19","DOI":"10.1006\/dspr.1999.0361","volume":"10","author":"DA Reynolds","year":"2000","unstructured":"Reynolds, D. A., Quatieri, T. F., & Dunn, R. B. (2000). Speaker verification using adapted Gaussian mixture models. Digital Signal Processing, 10(1\u20133), 19\u201341.","journal-title":"Digital Signal Processing"},{"key":"9568_CR36","unstructured":"The 2003 Nist speaker recognition evaluation plan (2003). In Proceedings of NIST Speaker Recognition Workshop, College Park, MD."},{"issue":"12","key":"9568_CR37","doi-asserted-by":"publisher","first-page":"1951","DOI":"10.1109\/TASLP.2014.2355821","volume":"22","author":"A Venturini","year":"2014","unstructured":"Venturini, A., Zao, L., & Coelho, R. (2014). On speech features fusion, \u03b1-integration Gaussian modeling and multi-style training for noise robust speaker classification. IEEE\/ACM Transactions on Audio, Speech, and Language Processing, 22(12), 1951\u20131964.","journal-title":"IEEE\/ACM Transactions on Audio, Speech, and Language Processing"},{"key":"9568_CR38","unstructured":"Wong, L. P., & Russell, M. (2001). Text-dependent speaker verification under noisy conditions using parallel model combination. In Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing(ICASSP01), 1, 457-460."},{"issue":"4","key":"9568_CR39","doi-asserted-by":"publisher","first-page":"575","DOI":"10.1109\/TSA.2005.848892","volume":"13","author":"B Yegnanarayana","year":"2005","unstructured":"Yegnanarayana, B., Prasanna, S. R. M., Zachariah, J. M., & Gupta, C. S. (2005). Combining evidence from source, suprasegmental and spectral features for a fixed-text speaker verification system. IEEE Transactions on Speech and Audio Processing, 13(4), 575\u2013582.","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"key":"9568_CR40","unstructured":"Yegnanarayana, B., Reddy, K. S., & Kishore, S. P. (2001). Source and system features for speaker recognition using ANNN models. In Proceedings of Acoustics, Speech, and Signal Processing (ICASSP-01) (Vol. 1, pp. 409\u2013412)."}],"container-title":["International Journal of Speech Technology"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s10772-018-09568-4\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10772-018-09568-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10772-018-09568-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,9,4]],"date-time":"2022-09-04T21:15:27Z","timestamp":1662326127000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s10772-018-09568-4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,10,29]]},"references-count":40,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2018,12]]}},"alternative-id":["9568"],"URL":"https:\/\/doi.org\/10.1007\/s10772-018-09568-4","relation":{},"ISSN":["1381-2416","1572-8110"],"issn-type":[{"type":"print","value":"1381-2416"},{"type":"electronic","value":"1572-8110"}],"subject":[],"published":{"date-parts":[[2018,10,29]]},"assertion":[{"value":"11 August 2018","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"13 October 2018","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"29 October 2018","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}