{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,10]],"date-time":"2026-06-10T16:13:58Z","timestamp":1781108038237,"version":"3.54.1"},"reference-count":35,"publisher":"IGI Global Scientific Publishing","issue":"4","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2009,10,1]]},"abstract":"<p>This article describes a new Speaker Discrimination System (SDS), which is a part of an overall project called Audio Documents Indexing based on a Speaker Discrimination System (ADISDS). Speaker discrimination consists in checking whether two speech segments come from the same speaker or not. This research domain presents an important field in biometry, since the voice remains an important feature used at distance (via telephone). However, although some discriminative classifiers do exist nowadays, their performances are not enough sufficient for short speech segments. This issue led us to propose an efficient fusion between such classifiers in order to enhance the discriminative performance. This fusion is obtained, by using three different techniques: a serial fusion, parallel fusion and serial-parallel fusion. Also, two classifiers have been chosen for the evaluation: a mono-gaussian statistical classifier and a Multi Layer Perceptron (MLP). Several experiments of speaker discrimination are conducted on different databases: Hub4 Broadcast-News and telephonic calls. Results show that the fusion has efficiently improved the scores obtained by each approach alone. So, for instance, we got an Equal Error Rate (EER) of about 7% on a subset of Hub4 Broadcast-News database, with short segments of 4 seconds, and an EER of about 4% on telephonic speech, with medium segments of 10 seconds.<\/p>","DOI":"10.4018\/jmcmc.2009072804","type":"journal-article","created":{"date-parts":[[2010,4,30]],"date-time":"2010-04-30T09:10:00Z","timestamp":1272618600000},"page":"47-63","source":"Crossref","is-referenced-by-count":2,"title":["Speaker Discrimination on Broadcast News and Telephonic Calls Using a Fusion of Neural and Statistical Classifiers"],"prefix":"10.4018","volume":"1","author":[{"given":"Siham","family":"Ouamour","sequence":"first","affiliation":[{"name":"USTHB University, Algeria"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Halim","family":"Sayoud","sequence":"additional","affiliation":[{"name":"USTHB University, Algeria"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"2432","reference":[{"key":"jmcmc.2009072804-0","doi-asserted-by":"crossref","unstructured":"Bennani, Y., & Gallinari, P. (1995). Neural Networks for discrimination and modelization of speakers. Journal of Speech Communication, 17(1-2), 159\u2013175. doi:10.1016\/0167-6393(95)00014-F","DOI":"10.1016\/0167-6393(95)00014-F"},{"key":"jmcmc.2009072804-1","unstructured":"Bennani, Y. (1992). Approches connexionnistes pour la reconnaissance du locuteur: mod\u00e9lisation et identification. Phd thesis, Paris XI University, France."},{"key":"jmcmc.2009072804-2","doi-asserted-by":"crossref","unstructured":"Bimbot, F., Magrin-Chagnolleau, I., & Mathan, L. (1995). Second-Order Statistical Measures for text-independent Broadcaster Identification. Journal of Speech Communication, 17(1-2), 177\u2013192. doi:10.1016\/0167-6393(95)00013-E","DOI":"10.1016\/0167-6393(95)00013-E"},{"key":"jmcmc.2009072804-3","unstructured":"Bonastre, F., & Besacier, L. (1997). Traitement Ind\u00e9pendant de Sous-bandes Fr\u00e9quentielles par des m\u00e9thodes Statistiques du Second Ordre pour la Reconnaissance du Locuteur. In Proceedings of the 4th \u00ab Congr\u00e8s Fran\u00e7ais d'Acoustique \u00bb, Marseille April 14-18, 357-360."},{"key":"jmcmc.2009072804-4","unstructured":"Bonastre, J. F. (2005). L\u2019authentification biom\u00e9trique vocal. Tutorial PARISTIC Bordeaux, Bordeaux, France."},{"key":"jmcmc.2009072804-5","unstructured":"Chen, W. C., Hsieh, C. T., & Lai, E. (2004). Multiband Approach to Robust Text-Independent Speaker Identification. Journal of Computational Linguistics and Chinese Language Processing, 9(2), 63\u201376."},{"key":"jmcmc.2009072804-6","unstructured":"Dasarathy, B. V. (1994). Decision Fusion. In proceedings of IEEE Computer Society Press, Los Alamitos, CA."},{"key":"jmcmc.2009072804-7","doi-asserted-by":"crossref","unstructured":"Daugman, J. (2007). New Methods in Iris Recognition. Journal of the IEEE Transactions on Systems, Man. Cybernetics, 3(5), 1167\u20131175.","DOI":"10.1109\/TSMCB.2007.903540"},{"key":"jmcmc.2009072804-8","doi-asserted-by":"crossref","unstructured":"Falavigna, D. (1995, September 18-21). Comparison of Different HMM Based Methods For Speaker Verification. In proceedings of Eurospeech\u201995- Fourth European Conference on Speech Communication and Technology, Madrid, Spain.","DOI":"10.21437\/Eurospeech.1995-98"},{"key":"jmcmc.2009072804-9","doi-asserted-by":"crossref","unstructured":"Furui, S. (1981). Cepstral analysis technique for automatic speaker verification. Journal of IEEE Transactions on Acoustics, Speech, and Signal Processing, 29(2), 254\u2013272. doi:10.1109\/TASSP.1981.1163530","DOI":"10.1109\/TASSP.1981.1163530"},{"key":"jmcmc.2009072804-10","doi-asserted-by":"crossref","unstructured":"Furui, S. (1981). Comparison of speaker recognition methods using statistical features and dynamic features. Journal of IEEE Transactions on Acoustics, Speech, and Signal Processing, 29(3), 342\u2013350. doi:10.1109\/TASSP.1981.1163605","DOI":"10.1109\/TASSP.1981.1163605"},{"key":"jmcmc.2009072804-11","doi-asserted-by":"crossref","unstructured":"Furui, S. (1991, November 4-6). Vector-quantization-based speech recognition and speaker recognition techniques. In Proceedings of Conference Record of the Twenty-Fifth Asilomar Conference on Signals, Systems and Computers (pp. 954-958).","DOI":"10.1109\/ACSSC.1991.186588"},{"key":"jmcmc.2009072804-12","doi-asserted-by":"crossref","unstructured":"Ganchev, T., Tsopanoglou, A., Fakotakis, N., & Kokkinakis, G. (2002, July 1- 3). Probabilistic Neural Networks Combined with GMMs for Speaker Recognition Over Telephone Channels. 14th International Conference on Digital Signal Processing (DSP2002), (Vol. 2) (pp. 1081-1084), Santorini, Greece.","DOI":"10.1109\/ICDSP.2002.1028278"},{"key":"jmcmc.2009072804-13","doi-asserted-by":"crossref","unstructured":"Gish, H. (1990). Robust discrimination in automatic speaker identification. In Proceedings of IEEE International Conference on Acoustics Speech and Signal Processing, New Mexico, (pp. 289-292).","DOI":"10.1109\/ICASSP.1990.115635"},{"key":"jmcmc.2009072804-14","doi-asserted-by":"crossref","unstructured":"Jain, A. K., Ross, A., & Prabhakar, S. (2004). An Introduction to Biometric Recognition. Journal of IEEE Transactions on Circuits and Systems for Video Technology, 14(1), 4\u201320. doi:10.1109\/TCSVT.2003.818349","DOI":"10.1109\/TCSVT.2003.818349"},{"key":"jmcmc.2009072804-15","unstructured":"Kittler, J. (2005, August). Multiple classifier systems in decision-level fusion of multimodal biometric experts. 1st BioSecure residential workshop, (pp. 1-26), Paris, France."},{"key":"jmcmc.2009072804-16","doi-asserted-by":"crossref","unstructured":"Koreman, J., Wu, D., & Morris, A. C. (2007). Enhancing Speaker Discrimination at the Feature Level. [Berlin\/Heidelberg: Springer.]. Journal of Lecture Notes In Artificial Intelligence, 4343, 260\u2013277.","DOI":"10.1007\/978-3-540-74200-5_15"},{"key":"jmcmc.2009072804-17","doi-asserted-by":"crossref","unstructured":"Lee, H. S., & Tsoi, A. C. (1995). Application of multi-layer perceptron in estimating speech \/ noise characteristics for speech recognition in noisy environment. Journal of Speech Communication, 17(1-2), 59\u201376. doi:10.1016\/0167-6393(95)00018-J","DOI":"10.1016\/0167-6393(95)00018-J"},{"key":"jmcmc.2009072804-18","unstructured":"Master, J. (1992). Pratical Neural Network Recipes in C++. Academic press."},{"key":"jmcmc.2009072804-19","doi-asserted-by":"crossref","unstructured":"Matsui, T., & Furui, S. (1993). Concatenated Phoneme Models for Text-Variable Speaker Recognition. In Proceedings of ICASSP, (Vol. 2) (pp. 391-394). Minneapolis.","DOI":"10.1109\/ICASSP.1993.319321"},{"key":"jmcmc.2009072804-20","unstructured":"Meignier, S. (2002). Indexation en locuteurs de documents sonores: Segmentation d'un document et Appariement d'une collection. PhD thesis, LIA Avignon, France."},{"key":"jmcmc.2009072804-21","unstructured":"Miyajima, C., Hattori, Y., Tokuda, K., Masuko, T., Kobayashi, T., & Kitamura, T. (2001). Text-independent speaker identification using Gaussian mixture models based on multi-space probability distribution. Journal of IEICE Transactions on Information and Systems. E (Norwalk, Conn.), 84-D(7), 847\u2013855."},{"key":"jmcmc.2009072804-22","unstructured":"Morris, A., Wu, D., & Koreman, J. (2005). GMM based clustering and speaker separability in the Timit speech database. Journal of IEICE Transactions Fundamentals\/ Commun.\/ Electron.\/ Inf. & Syst., Vol. E85- A\/ B\/ C\/ D, No. 1."},{"key":"jmcmc.2009072804-23","doi-asserted-by":"crossref","unstructured":"Reynolds, D. A., & Rose, R. C. (1995). Robust test-independent speaker identification using Gaussian mixture speaker models. Journal of IEEE Transactions on Speech and Audio Processing, 3(1), 72\u201383. doi:10.1109\/89.365379","DOI":"10.1109\/89.365379"},{"key":"jmcmc.2009072804-24","doi-asserted-by":"crossref","unstructured":"Reynolds, D. A. (1995). Speaker identification and verification using Gaussian mixture speaker models. Journal of Speech Communication, 17(1-2), 91\u2013108. doi:10.1016\/0167-6393(95)00009-D","DOI":"10.1016\/0167-6393(95)00009-D"},{"key":"jmcmc.2009072804-25","unstructured":"Sayoud, H., & Ouamour, S. (2000). Reconnaissance Automatique du Locuteur en Milieu Bruit\u00e9. In [Aussois, France.]. Proceedings of JEP, 00, 345\u2013348."},{"key":"jmcmc.2009072804-26","unstructured":"Sayoud, H. (2003). Automatic speaker recognition using neural approaches. PhD thesis, USTHB University, Algiers, Algeria."},{"key":"jmcmc.2009072804-27","unstructured":"Sayoud, H., Ouamour, S., & Boudraa, M. (2003). \u2018ASTRA\u2019 An Automatic Speaker Tracking System based on SOSM measures and an Interlaced Indexation. Journal of Acta Acustica, 89(4), 702\u2013710."},{"key":"jmcmc.2009072804-28","unstructured":"Strathmeyer, J. (2005). Automatic Text Categorization. Internal Project Report, Pittsburgh FLAC_Projects Computer Science Department, Carnegie Mellon University, USA."},{"key":"jmcmc.2009072804-29","unstructured":"Stylianou, Y., Pantazis, Y., Calderero, F., Larroy, P., Severin, F., Schimke, S., Bonal, R., Matta, F., & Valsamakis, A. (2005, July 18-August 12). GMM- Based Multimodal Biometric Verification. Final Project Report 1, Enterface\u201905, Mons, Belgium,."},{"key":"jmcmc.2009072804-30","doi-asserted-by":"crossref","unstructured":"Tishby, N. Z. (1991). On the application of mixture AR hidden Markov models to text independent speaker recognition. Journal of IEEE Transactions on Signal Processing, 39(3), 563\u2013570. doi:10.1109\/78.80876","DOI":"10.1109\/78.80876"},{"key":"jmcmc.2009072804-31","unstructured":"Verlinde, P. (1999). Contribution \u00e0 la v\u00e9rification multimodale d'identit\u00e9 en utilisant la fusion de d\u00e9cisions. PhD thesis, Ecole Nationale Sup\u00e9rieure des T\u00e9l\u00e9communications, Paris, France, September 17th."},{"key":"jmcmc.2009072804-32","doi-asserted-by":"crossref","unstructured":"Vivaracho, C. E. Ortega- Garcia, J., Alonso, L., & Moro, Q. I. (2001, September). A Comparative Study of MLP- based Artificial Neural Networks in Text- Independent Speaker Verification against GMM- based Systems. In Proceedings of Eurospeech 2001- Scandinavia, 3, 1753-1756, Aalborg-Denmark.","DOI":"10.21437\/Eurospeech.2001-410"},{"key":"jmcmc.2009072804-33","unstructured":"Woodland, P. C., Gales, M. J. F., Pye, D., & Young, S. J. (1997). The Development of the 1996 HTK broadcast news transcription system. In: DARPA Speech Recognition Workshop (pp. 97-99)."},{"key":"jmcmc.2009072804-34","doi-asserted-by":"crossref","unstructured":"Youssif, A. A. A., Chowdhury, M. U., Ray, S., & Nafaa, H. Y. (2007, July 11-13). Fingerprint Recognition System Using Hybrid Matching Techniques. In Proceedings of International Computer and Information Science (ICIS 2007). 6th IEEE\/ACIS International Conference (pp. 234-240).","DOI":"10.1109\/ICIS.2007.101"}],"container-title":["International Journal of Mobile Computing and Multimedia Communications"],"original-title":[],"language":"ng","link":[{"URL":"https:\/\/www.igi-global.com\/viewtitle.aspx?TitleId=37455","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,2,20]],"date-time":"2025-02-20T07:30:50Z","timestamp":1740036650000},"score":1,"resource":{"primary":{"URL":"https:\/\/services.igi-global.com\/resolvedoi\/resolve.aspx?doi=10.4018\/jmcmc.2009072804"}},"subtitle":[""],"short-title":[],"issued":{"date-parts":[[2009,10,1]]},"references-count":35,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2009,10]]}},"URL":"https:\/\/doi.org\/10.4018\/jmcmc.2009072804","relation":{},"ISSN":["1937-9412","1937-9404"],"issn-type":[{"value":"1937-9412","type":"print"},{"value":"1937-9404","type":"electronic"}],"subject":[],"published":{"date-parts":[[2009,10,1]]}}}