{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,23]],"date-time":"2026-04-23T13:49:55Z","timestamp":1776952195090,"version":"3.51.4"},"reference-count":36,"publisher":"IEEE","funder":[{"DOI":"10.13039\/501100000781","name":"European Research Council","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100000781","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2021,1,24]]},"DOI":"10.23919\/eusipco47968.2020.9287625","type":"proceedings-article","created":{"date-parts":[[2020,12,18]],"date-time":"2020-12-18T21:54:18Z","timestamp":1608328458000},"page":"141-145","source":"Crossref","is-referenced-by-count":11,"title":["Learning Frame Similarity using Siamese networks for Audio-to-Score Alignment"],"prefix":"10.23919","author":[{"given":"Ruchit","family":"Agrawal","sequence":"first","affiliation":[],"role":[{"role":"author","vocab":"crossref"}]},{"given":"Simon","family":"Dixon","sequence":"additional","affiliation":[],"role":[{"role":"author","vocab":"crossref"}]}],"member":"263","reference":[{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2009.2038819"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.18637\/jss.v031.i07"},{"key":"ref31","first-page":"859","article-title":"Multi-source transformer with combined losses for automatic post editing","author":"amirhossein","year":"2018","journal-title":"Third Conference on Machine Translation"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/ICIP.2017.8296803"},{"key":"ref36","first-page":"243","article-title":"Handling repeats and jumps in score-performance synchronization","author":"fremerey","year":"2010","journal-title":"The International Society for Music Information Retrieval (ISMIR)"},{"key":"ref35","doi-asserted-by":"crossref","first-page":"18","DOI":"10.25080\/Majora-7b98e3ed-003","article-title":"librosa: Audio and music signal analysis in python","author":"mcfee","year":"2015","journal-title":"Proceedings of the 14th Python in Science Conference"},{"key":"ref34","article-title":"Saarland music data (smd)","author":"m\u00fcller","year":"2011","journal-title":"International Society for Music Information Retrieval late breaking session"},{"key":"ref10","first-page":"737","article-title":"Signature verification using a siamese time delay neural network","author":"bromley","year":"1994","journal-title":"Advances in neural information processing systems"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1007\/3-540-46805-6_19"},{"key":"ref12","first-page":"497","article-title":"Comparative analysis of multiple musical performances","author":"sapp","year":"2007","journal-title":"The International Society for Music Information Retrieval (ISMIR)"},{"key":"ref13","first-page":"492","article-title":"Match: A music alignment tool chest","author":"dixon","year":"2005","journal-title":"International Society for Music Information Retrieval"},{"key":"ref14","first-page":"63","article-title":"Deep salience representations for f0 estimation in polyphonic music","author":"bittner","year":"2017","journal-title":"The International Society for Music Information Retrieval (ISMIR)"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2013.2266794"},{"key":"ref16","first-page":"325","article-title":"Feature learning in dynamic environments: Modeling the acoustic structure of musical emotion","author":"schmidt","year":"2012","journal-title":"The International Society for Music Information Retrieval (ISMIR)"},{"key":"ref17","article-title":"Learning features of music from scratch","author":"thickstun","year":"2016"},{"key":"ref18","doi-asserted-by":"crossref","first-page":"409","DOI":"10.1109\/ICASSP.2010.5495784","article-title":"A comparative study of tonal acoustic features for a symbolic level music-to-score alignment","author":"joder","year":"2010","journal-title":"IEEE International Conference on Acoustics Speech and Signal Processing"},{"key":"ref19","first-page":"411","article-title":"Understanding features and distance functions for music sequence alignment","author":"izmirli","year":"2010","journal-title":"The International Society for Music Information Retrieval (ISMIR)"},{"key":"ref28","first-page":"123","article-title":"Fluidsynth real-time and thread safety challenges","author":"henningsson","year":"2011","journal-title":"Proceedings of the 9th International Linux Audio Conference"},{"key":"ref4","article-title":"Onsets and frames: Dual-objective piano transcription","author":"hawthorne","year":"2018"},{"key":"ref27","article-title":"A hybrid approach to audio-to-score alignment","author":"agrawal","year":"0"},{"key":"ref3","article-title":"A first look at music composition using lstm recurrent neural networks","author":"eck","year":"2002"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/TASSP.1978.1163055"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2006.100"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.5334\/tismir.12"},{"key":"ref8","doi-asserted-by":"crossref","first-page":"1869","DOI":"10.1109\/ICASSP.2009.4959972","article-title":"High resolution audio synchronization using chroma onset features","author":"ewert","year":"2009","journal-title":"IEEE International Conference on Acoustics Speech and Signal Processing"},{"key":"ref7","first-page":"1727","article-title":"An on-line time warping algorithm for tracking musical performances","author":"dixon","year":"2005","journal-title":"International Joint Conference on Artificial Intelligence"},{"key":"ref2","article-title":"Applied neural networks for signal processing","author":"luo","year":"1999"},{"key":"ref9","first-page":"2689","article-title":"Adaptive distance normalization for real-time music tracking","author":"arzt","year":"2012","journal-title":"Proceedings of the 20th European Signal Processing Conference (EUSIPCO)"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/79.637299"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/ASPAA.2011.6082330"},{"key":"ref22","article-title":"Learning to listen, read, and follow: Score following as a reinforcement learning game","author":"dorfer","year":"2018","journal-title":"International Society for Music Information Retrieval"},{"key":"ref21","article-title":"Audio-to-score alignment using transposition-invariant features","author":"arzt","year":"2018"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2019.8683492"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2014.6853679"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2004.840597"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2018.8461524"}],"event":{"name":"2020 28th European Signal Processing Conference (EUSIPCO)","location":"Amsterdam, Netherlands","start":{"date-parts":[[2021,1,18]]},"end":{"date-parts":[[2021,1,21]]}},"container-title":["2020 28th European Signal Processing Conference (EUSIPCO)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9287308\/9287310\/09287625.pdf?arnumber=9287625","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,12,6]],"date-time":"2022-12-06T23:04:22Z","timestamp":1670367862000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9287625\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,1,24]]},"references-count":36,"URL":"https:\/\/doi.org\/10.23919\/eusipco47968.2020.9287625","relation":{},"subject":[],"published":{"date-parts":[[2021,1,24]]}}}