{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,30]],"date-time":"2026-04-30T04:56:58Z","timestamp":1777525018993,"version":"3.51.4"},"reference-count":27,"publisher":"Springer Science and Business Media LLC","issue":"15","license":[{"start":{"date-parts":[[2021,6,1]],"date-time":"2021-06-01T00:00:00Z","timestamp":1622505600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0"},{"start":{"date-parts":[[2021,6,19]],"date-time":"2021-06-19T00:00:00Z","timestamp":1624060800000},"content-version":"vor","delay-in-days":18,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0"}],"funder":[{"name":"Zentrale der Fraunhofer-Gesellschaft"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"published-print":{"date-parts":[[2021,6]]},"abstract":"<jats:title>Abstract<\/jats:title><jats:p>In this paper, we describe various application scenarios for archive management, broadcast\/stream analysis, media search and media forensics which require the detection and accurate localization of unknown partial audio matches within items and datasets. We explain why they cannot be addressed with state-of-the-art matching approaches based on fingerprinting, and propose a new partial matching algorithm which can satisfy the relevant requirements. We propose two distinct requirement sets and hence two variants \/ settings for our proposed approach: One focusing on lower time granularity and hence lower computational complexity, to be able to deal with large datasets, and one focusing on fine-grain analysis for small datasets and individual items. Both variants are tested using distinct evaluation sets and methodologies and compared with a popular audio matching algorithm, thereby demonstrating that the proposed algorithm achieves convincing performance for the relevant application scenarios beyond the current state-of-the-art.<\/jats:p>","DOI":"10.1007\/s11042-020-09912-4","type":"journal-article","created":{"date-parts":[[2021,6,19]],"date-time":"2021-06-19T05:02:31Z","timestamp":1624078951000},"page":"22619-22641","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":3,"title":["Detection and localization of partial audio matches in various application scenarios"],"prefix":"10.1007","volume":"80","author":[{"ORCID":"https:\/\/orcid.org\/0000-0003-0017-9656","authenticated-orcid":false,"given":"Milica","family":"Maksimovi\u0107","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Patrick","family":"Aichroth","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Luca","family":"Cuccovillo","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2021,6,19]]},"reference":[{"key":"9912_CR1","unstructured":"Allamanche E, Herre J, Hellmuth O, Fr\u00f6ba B (2001) Content-based identification of audio material using mpeg-7 low level description. In: International symposium on music information retrieval (ISMIR), Bloomington, IN, USA, pp 197\u2013204"},{"key":"9912_CR2","doi-asserted-by":"crossref","unstructured":"Anguera X, Garzon A, Adamek T (2012) Mask: Robust local features for audio fingerprinting. In: IEEE international conference on multimedia and expo (ICME), Melbourne, Australia, pp 455\u2013460","DOI":"10.1109\/ICME.2012.137"},{"issue":"1","key":"9912_CR3","doi-asserted-by":"publisher","first-page":"14","DOI":"10.1109\/TMC.2013.79","volume":"14","author":"I Bisio","year":"2015","unstructured":"Bisio I, Delfino A, Lavagetto F, Marchese M (2015) A television channel real-time detector using smartphones. IEEE Trans Mob Comput 14(1):14\u201327","journal-title":"IEEE Trans Mob Comput"},{"issue":"3","key":"9912_CR4","doi-asserted-by":"publisher","first-page":"271","DOI":"10.1007\/s11265-005-4151-3","volume":"41","author":"P Cano","year":"2005","unstructured":"Cano P, Batlle E, Kalker T, Haitsma J (2005) A review of audio fingerprinting. Journal of VLSI Signal Processing Systems for Signal, Image and Video Technology 41(3):271\u2013284","journal-title":"Journal of VLSI Signal Processing Systems for Signal, Image and Video Technology"},{"key":"9912_CR5","unstructured":"Chandrasekhar V, Sharifi M, Ross DA (2011) Survey and evaluation of audio fingerprinting schemes for mobile query-by-example applications. In: ISMIR international conference on music information retrieval, Miami, FL, USA, pp 801\u2013806"},{"key":"9912_CR6","unstructured":"Covell M, Baluja S Known-audio detection using waveprint: spectrogram fingerprinting by wavelet hashing. In: IEEE international conference on acoustics, speech, and signal processing, ICASSP, Honolulu, HI, USA, pp I-237\u2013I-240"},{"key":"9912_CR7","unstructured":"Ellis D (2014) Audfprint: Landmark-based audio fingerprinting. https:\/\/github.com\/dpwe\/audfprint"},{"issue":"6","key":"9912_CR8","doi-asserted-by":"publisher","first-page":"381","DOI":"10.1145\/358669.358692","volume":"24","author":"MA Fischler","year":"1981","unstructured":"Fischler MA, Bolles RC (1981) Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography. Commun ACM 24(6):381\u2013395","journal-title":"Commun ACM"},{"key":"9912_CR9","doi-asserted-by":"crossref","unstructured":"Gomez E, Cano P, Gomes LCT, Batlle E, Bonnet M (2002) Mixed watermarking-fingerprinting approach for integrity verification of audio recordings. In: Proceedings of the international telecommunications symposium, Natal, Brasil","DOI":"10.14209\/its.2002.303"},{"key":"9912_CR10","unstructured":"Haitsma J, Kalker T (2002) A highly robust audio fingerprinting system. In: ISMIR International conference on music information retrieval, Paris, France, pp 107\u2013115"},{"key":"9912_CR11","unstructured":"H\u00e9ritier M, Gupta V, Gagnon L, Boulianne G, Foucher PCS (2009) Crim \u2019 s content-based copy detection system for trecvid. In: NIST TREC video retrieval evaluation (trecvid) conference, Gaithersburg, MD, USA"},{"key":"9912_CR12","doi-asserted-by":"publisher","first-page":"12843","DOI":"10.1109\/ACCESS.2017.2717842","volume":"5","author":"M Imran","year":"2017","unstructured":"Imran M, Ali Z, Bakhsh ST, Akram S (2017) Blind detection of copy-move forgery in digital audio forensics. IEEE Access 5:12843\u201312855","journal-title":"IEEE Access"},{"key":"9912_CR13","unstructured":"Jackson Z, C\u00e9sar S, Flaks J, Pan Y, Nicolas H, Thite A (2018) Free spoken digit dataset (FSDD) v1.0.8. https:\/\/github.com\/Jakobovski\/free-spoken-digit-dataset\/tree\/v1.0.8"},{"key":"9912_CR14","doi-asserted-by":"crossref","unstructured":"J\u00e9gou H, Delhumeau J, Yuan J, Gravier G, Gros P (2012) BABAZ: A large scale audio search system for video copy detection. In: IEEE international conference on acoustics, speech and signal processing (ICASSP), Kyoto, Japan, pp 2369\u20132372","DOI":"10.1109\/ICASSP.2012.6288391"},{"key":"9912_CR15","unstructured":"Ke Y, Hoiem D, Sukthankar R (2005) Computer vision for music identification. In: IEEE computer society conference on computer vision and pattern recognition (CVPR), San Diego, CA, USA, pp 597\u2013604"},{"key":"9912_CR16","doi-asserted-by":"crossref","unstructured":"Liu Z, Lu W (2017) Fast copy-move detection of digital audio. In: IEEE international conference on data science in cyberspace (DSC), Shenzhen, China, pp 625\u2013629","DOI":"10.1109\/DSC.2017.11"},{"key":"9912_CR17","doi-asserted-by":"crossref","unstructured":"Maksimovic M, Aichroth P, Cuccovillo L (2018) Detection and localization of partial audio matches. In: International conference on content-based multimedia indexing (CBMI), La Rochelle, France, pp 1\u20136","DOI":"10.1109\/CBMI.2018.8516477"},{"key":"9912_CR18","doi-asserted-by":"crossref","unstructured":"Maksimovic M, Cuccovillo L, Aichroth P (2017) Phylogeny analysis for MP3 and AAC coding transformations. In: IEEE international conference on multimedia and expo (ICME), Hong Kong, China, pp 1165\u20131170","DOI":"10.1109\/ICME.2017.8019547"},{"key":"9912_CR19","doi-asserted-by":"crossref","unstructured":"Malekesmaeili M, Ward RK (2012) A novel local audio fingerprinting algorithm. In: IEEE international workshop on multimedia signal processing (MMSP), Banff, AB, Canada, pp 136\u2013140","DOI":"10.1109\/MMSP.2012.6343429"},{"key":"9912_CR20","doi-asserted-by":"crossref","unstructured":"Mih\u00e7ak MK, Venkatesan R (2001) A perceptual audio hashing algorithm: a tool for robust audio identification and information hiding. In: ACM international workshop on information hiding (IHW), Pittsburgh, PA, USA, pp 51\u201365","DOI":"10.1007\/3-540-45496-9_5"},{"key":"9912_CR21","unstructured":"NIST (2020) Trec video retrieval evaluation: TRECVID. https:\/\/www-nlpir.nist.gov\/projects\/trecvid\/"},{"key":"9912_CR22","doi-asserted-by":"crossref","unstructured":"Nucci M, Tagliasacchi M, Tubaro S (2013) A phylogenetic analysis of near-duplicate audio tracks. In: IEEE international workshop on multimedia signal processing (MMSP), Pula, Italy, pp 99\u2013104","DOI":"10.1109\/MMSP.2013.6659271"},{"key":"9912_CR23","doi-asserted-by":"crossref","unstructured":"Ouali C, Dumouchel P, Gupta V (2014) A robust audio fingerprinting method for content-based copy detection. In: International workshop on content-based multimedia indexing (CBMI), Klagenfurt, Austria, pp 1\u20136","DOI":"10.1109\/CBMI.2014.6849814"},{"issue":"6","key":"9912_CR24","doi-asserted-by":"publisher","first-page":"1106","DOI":"10.1109\/TASLP.2016.2541303","volume":"24","author":"C Ouali","year":"2016","unstructured":"Ouali C, Dumouchel P, Gupta V (2016) Fast audio fingerprinting system using GPU and a clustering-based technique. IEEE\/ACM Trans Audio, Speech & Language Processing 24(6):1106\u20131118","journal-title":"IEEE\/ACM Trans Audio, Speech & Language Processing"},{"key":"9912_CR25","doi-asserted-by":"crossref","unstructured":"Qi Y, Yang R, Huang J (2015) Copy-move detection of audio recording with pitch similarity. In: IEEE international conference on acoustics, speech and signal processing (ICASSP), South Brisbane, QLD, Australia, pp 1782\u20131786","DOI":"10.1109\/ICASSP.2015.7178277"},{"issue":"3","key":"9912_CR26","doi-asserted-by":"publisher","first-page":"409","DOI":"10.1109\/TASLP.2015.2509248","volume":"24","author":"R Sonnleitner","year":"2016","unstructured":"Sonnleitner R, Widmer G (2016) Robust quad-based audio fingerprinting. IEEE\/ACM Trans Audio, Speech & Language Processing 24(3):409\u2013421","journal-title":"IEEE\/ACM Trans Audio, Speech & Language Processing"},{"key":"9912_CR27","unstructured":"Wang A (2003) An industrial strength audio search algorithm. In: ISMIR international conference on music information retrieval, Washington, D.C., USA"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-020-09912-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11042-020-09912-4\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-020-09912-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,12,31]],"date-time":"2022-12-31T18:44:16Z","timestamp":1672512256000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11042-020-09912-4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,6]]},"references-count":27,"journal-issue":{"issue":"15","published-print":{"date-parts":[[2021,6]]}},"alternative-id":["9912"],"URL":"https:\/\/doi.org\/10.1007\/s11042-020-09912-4","relation":{},"ISSN":["1380-7501","1573-7721"],"issn-type":[{"value":"1380-7501","type":"print"},{"value":"1573-7721","type":"electronic"}],"subject":[],"published":{"date-parts":[[2021,6]]},"assertion":[{"value":"21 March 2019","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"17 July 2020","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"16 September 2020","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"19 June 2021","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}