{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,25]],"date-time":"2025-10-25T18:59:45Z","timestamp":1761418785409},"reference-count":48,"publisher":"Springer Science and Business Media LLC","issue":"2","license":[{"start":{"date-parts":[[2012,3,8]],"date-time":"2012-03-08T00:00:00Z","timestamp":1331164800000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["Int J Speech Technol"],"published-print":{"date-parts":[[2012,6]]},"DOI":"10.1007\/s10772-012-9137-5","type":"journal-article","created":{"date-parts":[[2012,3,7]],"date-time":"2012-03-07T16:53:52Z","timestamp":1331139232000},"page":"241-257","source":"Crossref","is-referenced-by-count":17,"title":["Speaker verification using excitation source information"],"prefix":"10.1007","volume":"15","author":[{"given":"Debadatta","family":"Pati","sequence":"first","affiliation":[]},{"given":"S. R.","family":"Mahadeva Prasanna","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2012,3,8]]},"reference":[{"key":"9137_CR1","doi-asserted-by":"crossref","first-page":"309","DOI":"10.1109\/TASSP.1979.1163267","volume":"ASSP-27","author":"T. V. Ananthapadmanabha","year":"1979","unstructured":"Ananthapadmanabha, T. V., & Yegnanarayana, B. (1979). Epoch extraction from linear prediction residual for identification of closed glottis interval. IEEE Transactions on Acoustics, Speech, and Signal Processing, ASSP-27, 309\u2013319.","journal-title":"IEEE Transactions on Acoustics, Speech, and Signal Processing"},{"issue":"6","key":"9137_CR2","doi-asserted-by":"crossref","first-page":"1304","DOI":"10.1121\/1.1914702","volume":"55","author":"B. S. Atal","year":"1974","unstructured":"Atal, B. S. (1974). Effectiveness of linear prediction characteristics of the speech wave for automatic speaker identification and verification. The Journal of the Acoustical Society of America, 55(6), 1304\u20131312.","journal-title":"The Journal of the Acoustical Society of America"},{"issue":"4","key":"9137_CR3","doi-asserted-by":"crossref","first-page":"460","DOI":"10.1109\/PROC.1976.10155","volume":"64","author":"B. S. Atal","year":"1976","unstructured":"Atal, B. S. (1976). Automatic recognition of speakers from their voices. Proceedings of the IEEE, 64(4), 460\u2013475.","journal-title":"Proceedings of the IEEE"},{"issue":"9","key":"9137_CR4","doi-asserted-by":"crossref","first-page":"1437","DOI":"10.1109\/5.628714","volume":"85","author":"J. P. Campbell Jr.","year":"1997","unstructured":"Campbell, J. P. Jr. (1997). Speaker recognition: a tutorial. Proceedings of the IEEE, 85(9), 1437\u20131462.","journal-title":"Proceedings of the IEEE"},{"issue":"6","key":"9137_CR5","doi-asserted-by":"crossref","first-page":"1884","DOI":"10.1109\/TASL.2007.900103","volume":"15","author":"W. N. Chan","year":"2007","unstructured":"Chan, W. N., Zheng, N., & Lee, T. (2007). Discrimination power of vocal source and vocal tract related features for speaker segmentations. IEEE Transactions on Audio, Speech and Signal Processing, 15(6), 1884\u20131892.","journal-title":"IEEE Transactions on Audio, Speech and Signal Processing"},{"issue":"28","key":"9137_CR6","doi-asserted-by":"crossref","first-page":"357","DOI":"10.1109\/TASSP.1980.1163420","volume":"28","author":"S. B. Davis","year":"1980","unstructured":"Davis, S. B., & Mermelstein, P. (1980). Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech, and Signal Processing, 28(28), 357\u2013366.","journal-title":"IEEE Transactions on Acoustics, Speech, and Signal Processing"},{"key":"9137_CR7","volume-title":"Discrete-Time Processing of Speech Signal","author":"J. R. Deller Jr.","year":"2000","unstructured":"Deller, J. R. Jr., Hansen, J. H. L., & Proakis, J. G. (2000). Discrete-Time Processing of Speech Signal (2nd edn.). New York: IEEE Press.","edition":"2"},{"issue":"1","key":"9137_CR8","doi-asserted-by":"crossref","first-page":"90","DOI":"10.1109\/TASL.2009.2023679","volume":"18","author":"T. H. Falk","year":"2010","unstructured":"Falk, T. H., & Chan, W.-Y. (2010). Modulation spectral features for robust far-field speaker identification. IEEE Transactions on Audio, Speech, and Language Processing, 18(1), 90\u2013100.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"2","key":"9137_CR9","doi-asserted-by":"crossref","first-page":"254","DOI":"10.1109\/TASSP.1981.1163530","volume":"29","author":"S. Furui","year":"1981","unstructured":"Furui, S. (1981). Cepstral analysis technique for automatic speaker verification. IEEE Transactions on Acoustics, Speech, and Signal Processing, 29(2), 254\u2013272.","journal-title":"IEEE Transactions on Acoustics, Speech, and Signal Processing"},{"key":"9137_CR10","doi-asserted-by":"crossref","first-page":"18","DOI":"10.1109\/79.317924","volume":"11","author":"H. Gish","year":"1994","unstructured":"Gish, H., & Schmidt, M. (1994). Text- independent speaker identification. IEEE Signal Processing Magazine, 11, 18\u201332.","journal-title":"IEEE Signal Processing Magazine"},{"key":"9137_CR11","doi-asserted-by":"crossref","first-page":"66","DOI":"10.1109\/34.273716","volume":"16","author":"J. J. Hall","year":"1994","unstructured":"Hall, J. J., & Srihari, S. N. (1994). Decision combination in multiple classifier systems. IEEE Transactions on Pattern Analysis and Machine Intelligence, 16, 66\u201375.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"key":"9137_CR12","series-title":"Lecture notes","doi-asserted-by":"crossref","first-page":"253","DOI":"10.1007\/BFb0016002","volume-title":"Biometric personal Authentification","author":"S. Hayakawa","year":"1997","unstructured":"Hayakawa, S., Takeda, K., & Itakura, F. (1997). Speaker identification using harmonic structure of lp-residual spectrum. In Lecture notes: Vol.\u00a01206. Biometric personal Authentification (pp.\u00a0253\u2013260). Berlin: Springer."},{"key":"9137_CR13","volume-title":"Int. conf. on spoken language processing (ICSLP, 2000)","author":"M. R. Iseli","year":"2000","unstructured":"Iseli, M. R., & Alwan, A. (2000). Inter- and intra-speaker variability of glottal flow derivative. In Int. conf. on spoken language processing (ICSLP, 2000), Beijing, China."},{"key":"9137_CR14","doi-asserted-by":"crossref","first-page":"12","DOI":"10.1016\/j.specom.2009.08.009","volume":"52","author":"T. Kinnunen","year":"2009","unstructured":"Kinnunen, T., & Li, H. (2009). An overview of text-independent speaker recognition: from features to supervectors. Speech Communication, 52, 12\u201340.","journal-title":"Speech Communication"},{"issue":"3","key":"9137_CR15","doi-asserted-by":"crossref","first-page":"226","DOI":"10.1109\/34.667881","volume":"20","author":"J. Kittler","year":"1998","unstructured":"Kittler, J., Hatef, M., Duin, R. P. W., & Matas, J. (1998). On combining classifiers. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(3), 226\u2013239.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"key":"9137_CR16","unstructured":"Linguistic Data Consortium (2004). Switchboard cellular part 2 audio. http:\/\/www.ldc.upenn.edu\/Catalog\/CatalogEntry.jsp?catalogId=LDC2004S07 ."},{"issue":"4","key":"9137_CR17","doi-asserted-by":"crossref","first-page":"561","DOI":"10.1109\/PROC.1975.9792","volume":"63","author":"J. Makhoul","year":"1975","unstructured":"Makhoul, J. (1975). Linear prediction: a\u00a0tutorial review. Proceedings of the IEEE, 63(4), 561\u2013580.","journal-title":"Proceedings of the IEEE"},{"key":"9137_CR18","first-page":"1895","volume-title":"Proc. Eur. conf. on speech communication technology","author":"A. Martin","year":"1997","unstructured":"Martin, A., Doddington, G., Kamm, T., Ordowski, M., & Przybocki,\u00a0M. (1997). The DET curve in assessment of detection task performance. In Proc. Eur. conf. on speech communication technology, Rhodes, Greece (Vol.\u00a04, pp.\u00a01895\u20131898)."},{"key":"9137_CR19","doi-asserted-by":"crossref","first-page":"782","DOI":"10.1016\/j.specom.2008.04.010","volume":"50","author":"L. Mary","year":"2008","unstructured":"Mary, L., & Yegnanarayana, B. (2008). Extraction and representation of prosodic features for language and speaker recognition. Speech Communication, 50, 782\u2013796.","journal-title":"Speech Communication"},{"key":"9137_CR20","doi-asserted-by":"crossref","first-page":"147","DOI":"10.1016\/j.patcog.2005.08.004","volume":"39","author":"D. J. Mashao","year":"2006","unstructured":"Mashao, D. J., & Skosan, M. (2006). Combining classifier decisions for robust speaker identification. Pattern Recognition, 39, 147\u2013155.","journal-title":"Pattern Recognition"},{"issue":"8","key":"9137_CR21","doi-asserted-by":"crossref","first-page":"1602","DOI":"10.1109\/TASL.2008.2004526","volume":"16","author":"K. S. R. Murthy","year":"2008","unstructured":"Murthy, K. S. R., & Yegnanarayana, B. (2008). Epoch extraction from speech signal. IEEE Transactions on Audio, Speech, and Language Processing, 16(8), 1602\u20131613.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"1","key":"9137_CR22","doi-asserted-by":"crossref","first-page":"52","DOI":"10.1109\/LSP.2005.860538","volume":"13","author":"K. S. R. Murty","year":"2006","unstructured":"Murty, K. S. R., & Yegnanarayana, B. (2006). Combining evidence from residual phase and MFCC features for speaker recognition. IEEE Signal Processing Letters, 13(1), 52\u201355.","journal-title":"IEEE Signal Processing Letters"},{"key":"9137_CR23","volume-title":"Int. conf. on signal proces. and comm. (SPCOM)","author":"K. S. R. Murty","year":"2004","unstructured":"Murty, K. S. R., Prasanna, S. R. M., & Yegnanarayana, B. (2004). Speaker specific information from residual phase. In Int. conf. on signal proces. and comm. (SPCOM)."},{"issue":"1","key":"9137_CR24","doi-asserted-by":"crossref","first-page":"34","DOI":"10.1109\/TASL.2006.876878","volume":"15","author":"P. A. Naylor","year":"2007","unstructured":"Naylor, P. A., Kounoudes, A., Gudnason, J., & Brookes, M. (2007). Estimation of glottal closure instants in voiced speech using the dypsa algorithm. IEEE Transactions on Audio, Speech, and Language Processing, 15(1), 34\u201343.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"key":"9137_CR25","volume-title":"Proc. NIST speaker recognition workshop","author":"Nist speaker recognition evaluation plan","year":"2003","unstructured":"Nist speaker recognition evaluation plan (2003). In Proc. NIST speaker recognition workshop, College Park, MD."},{"key":"9137_CR26","first-page":"2010","volume-title":"INTERSPEECH 2010","author":"R. Padmanabhan","year":"2010","unstructured":"Padmanabhan, R., & Murthy, H. A. (2010). Acoustic feature diversity and speaker verification. In INTERSPEECH 2010, Sept., Makuhari, Chiba, Japan (pp.\u00a02010\u20132013)."},{"key":"9137_CR27","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1109\/TENCON.2008.4766743","volume-title":"Proc. IEEE TENCON, 2008","author":"D. Pati","year":"2008","unstructured":"Pati, D., & Prasanna, S. R. M. (2008). Non-parametric vector quantization of excitation source information for speaker recognition. In Proc. IEEE TENCON, 2008 (pp.\u00a01\u20134)."},{"key":"9137_CR28","first-page":"1","volume-title":"Proc. NCC 2010","author":"D. Pati","year":"2010","unstructured":"Pati, D., & Prasanna, S. R. M. (2010). Speaker information from subband energies of linear prediction residual. In Proc. NCC 2010 (pp.\u00a01\u20134)."},{"issue":"1","key":"9137_CR29","doi-asserted-by":"crossref","first-page":"49","DOI":"10.1007\/s10772-010-9087-8","volume":"14","author":"D. Pati","year":"2011","unstructured":"Pati, D., & Prasanna, S. R. M. (2011a). Subsegmental, segmental and suprasegmental processing of linear prediction residual for speaker information. International Journal of Speech Technology, 14(1), 49\u201363.","journal-title":"International Journal of Speech Technology"},{"key":"9137_CR30","unstructured":"Pati, D., & Prasanna, S. R. M. (2011b, accepted). Speaker recognition using suprasegmental level excitation information. International Journal of Information and Communication Technology (IJICT)."},{"key":"9137_CR31","unstructured":"Pati, D., & Prasanna, S. R. M. (2012a, in press). Processing of linear prediction residual in spectral and cepstral domains for speaker information. In Communicated to SADHANA (Springer)."},{"key":"9137_CR32","doi-asserted-by":"crossref","unstructured":"Pati, D., & Prasanna, S. R. M. (2012b, in press). A comparative study of explicit and implicit modeling of subsegmental speaker-specific excitation source information. In Communicated to SADHANA (Springer).","DOI":"10.1007\/s12046-013-0163-z"},{"issue":"5","key":"9137_CR33","doi-asserted-by":"crossref","first-page":"569","DOI":"10.1109\/89.784109","volume":"7","author":"M. D. Plumpe","year":"1999","unstructured":"Plumpe, M. D., Quatieri, T. F., & Reynolds, D. A. (1999). Modelling of glottal flow derivative waveform with application to speaker identification. IEEE Transactions on Speech and Audio Processing, 7(5), 569\u2013586.","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"key":"9137_CR34","doi-asserted-by":"crossref","first-page":"1243","DOI":"10.1016\/j.specom.2006.06.002","volume":"48","author":"S. R. M. Prasanna","year":"2006","unstructured":"Prasanna, S. R. M., Gupta, C. S., & Yegnanarayana, B. (2006). Extraction of speaker-specific excitation information from linear prediction residual of speech. Speech Communication, 48, 1243\u20131261.","journal-title":"Speech Communication"},{"key":"9137_CR35","volume-title":"Digital processing of speech signals","author":"L. R. Rabiner","year":"1978","unstructured":"Rabiner, L. R., & Schafer, R. W. (1978). Digital processing of speech signals. Englewood Cliffs: Prentice-Hall."},{"issue":"4","key":"9137_CR36","doi-asserted-by":"crossref","first-page":"639","DOI":"10.1109\/89.326623","volume":"2","author":"D. A. Reynolds","year":"1994","unstructured":"Reynolds, D. A. (1994). Experimental evaluation of features for robust speaker identification. IEEE Transactions on Speech and Audio Processing, 2(4), 639\u2013643.","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"key":"9137_CR37","doi-asserted-by":"crossref","first-page":"91","DOI":"10.1016\/0167-6393(95)00009-D","volume":"17","author":"D. A. Reynolds","year":"1995","unstructured":"Reynolds, D. A. (1995). Speaker identification and verification using Gaussian mixture speaker models. Speech Communication, 17, 91\u2013108.","journal-title":"Speech Communication"},{"issue":"1","key":"9137_CR38","doi-asserted-by":"crossref","first-page":"72","DOI":"10.1109\/89.365379","volume":"3","author":"D. A. Reynolds","year":"1995","unstructured":"Reynolds, D. A., & Rose, R. C. (1995a). Robust text-independent speaker identification using Gaussian mixture speaker models. IEEE Transactions on Speech and Audio Processing, 3(1), 72\u201383.","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"issue":"1","key":"9137_CR39","doi-asserted-by":"crossref","first-page":"4","DOI":"10.1109\/89.365379","volume":"3","author":"D. A. Reynolds","year":"1995","unstructured":"Reynolds, D. A., & Rose, R. C. (1995b). Robust text-independent speaker identification using Gaussian mixture speaker models. IEEE Transactions on Speech and Audio Processing, 3(1), 4\u201317.","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"key":"9137_CR40","doi-asserted-by":"crossref","first-page":"19","DOI":"10.1006\/dspr.1999.0361","volume":"10","author":"D. A. Reynolds","year":"2000","unstructured":"Reynolds, D. A., Quatieri, T. F., & Dunn, R. (2000). Speaker verification using adapted Gaussian mixture models. Digital Signal Processing, 10, 19\u201341.","journal-title":"Digital Signal Processing"},{"key":"9137_CR41","doi-asserted-by":"crossref","first-page":"145","DOI":"10.1016\/0167-6393(95)00010-L","volume":"17","author":"P. Thevenaz","year":"1995","unstructured":"Thevenaz, P., & Hugli, H. (1995). Usefulness of the LPC-residue in text-independent speaker verification. Speech Communication, 17, 145\u2013157.","journal-title":"Speech Communication"},{"issue":"1","key":"9137_CR42","doi-asserted-by":"crossref","first-page":"566","DOI":"10.1121\/1.421103","volume":"103","author":"R. Veldhuish","year":"1998","unstructured":"Veldhuish, R. (1998). A computationally efficient alternative for the Liljencrants-Fant model and its perceptual evaluation. The Journal of the Acoustical Society of America, 103(1), 566\u2013571.","journal-title":"The Journal of the Acoustical Society of America"},{"key":"9137_CR43","doi-asserted-by":"crossref","first-page":"892","DOI":"10.21437\/Interspeech.2009-269","volume-title":"Proc. INTERSPEECH-09","author":"N. Wang","year":"2009","unstructured":"Wang, N., Ching, P. C., & Lee, T. (2009). Exploration of vocal excitation modulation features for speaker recognition. In Proc. INTERSPEECH-09, Brighton, UK (pp.\u00a0892\u2013895)."},{"issue":"3","key":"9137_CR44","first-page":"412","volume":"22","author":"L. Xu","year":"1992","unstructured":"Xu, L., Krzyzak, A., & Suen, C. Y. (1992). Methods of combining multiple classifiers and their applications to handwriting. IEEE Transactions on Systems, Man, and Cybernetics, 22(3), 412\u2013435.","journal-title":"IEEE Transactions on Systems, Man, and Cybernetics"},{"issue":"4","key":"9137_CR45","doi-asserted-by":"crossref","first-page":"313","DOI":"10.1109\/89.701359","volume":"6","author":"B. Yegnanarayana","year":"1998","unstructured":"Yegnanarayana, B., & Veldhuis, R. N. J. (1998). Extraction of vocal-tract system characteristics from speech signals. IEEE Transactions on Speech and Audio Processing, 6(4), 313\u2013327.","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"key":"9137_CR46","first-page":"409","volume-title":"Proc. IEEE int. con. acoust. speech and signal process","author":"B. Yegnanarayana","year":"2001","unstructured":"Yegnanarayana, B., Reddy, K. S., & Kishore, S. P. (2001). Source and systsem feature for speaker recognition using AANN Models. In Proc. IEEE int. con. acoust. speech and signal process, Salt Lake City, UT, USA, May (pp.\u00a0409\u2013412)."},{"issue":"4","key":"9137_CR47","doi-asserted-by":"crossref","first-page":"614","DOI":"10.1109\/TASL.2008.2012194","volume":"17","author":"B. Yegnenarayana","year":"2009","unstructured":"Yegnenarayana, B., & Murthy, K. S. R. (2009). Event based instantaneous fundamental frequency estimation from speech signals. IEEE Transactions on Audio, Speech, and Language Processing, 17(4), 614\u2013624.","journal-title":"IEEE Transactions on Audio, Speech, and Language Processing"},{"issue":"3","key":"9137_CR48","doi-asserted-by":"crossref","first-page":"181","DOI":"10.1109\/LSP.2006.884031","volume":"14","author":"N. Zheng","year":"2007","unstructured":"Zheng, N., Lee, T., & Ching, P. C. (2007). Integration of complimentary acoustic features for speaker recognition. IEEE Signal Processing Letters, 14(3), 181\u2013184.","journal-title":"IEEE Signal Processing Letters"}],"container-title":["International Journal of Speech Technology"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10772-012-9137-5.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s10772-012-9137-5\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10772-012-9137-5","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,1,1]],"date-time":"2022-01-01T20:51:24Z","timestamp":1641070284000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s10772-012-9137-5"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2012,3,8]]},"references-count":48,"journal-issue":{"issue":"2","published-print":{"date-parts":[[2012,6]]}},"alternative-id":["9137"],"URL":"https:\/\/doi.org\/10.1007\/s10772-012-9137-5","relation":{},"ISSN":["1381-2416","1572-8110"],"issn-type":[{"value":"1381-2416","type":"print"},{"value":"1572-8110","type":"electronic"}],"subject":[],"published":{"date-parts":[[2012,3,8]]}}}