{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,31]],"date-time":"2026-03-31T20:57:29Z","timestamp":1774990649315,"version":"3.50.1"},"reference-count":27,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2016,3]]},"DOI":"10.1109\/icassp.2016.7472917","type":"proceedings-article","created":{"date-parts":[[2016,6,24]],"date-time":"2016-06-24T01:58:30Z","timestamp":1466733510000},"page":"6440-6444","source":"Crossref","is-referenced-by-count":230,"title":["Recurrent neural networks for polyphonic sound event detection in real life recordings"],"prefix":"10.1109","author":[{"given":"Giambattista","family":"Parascandolo","sequence":"first","affiliation":[]},{"given":"Heikki","family":"Huttunen","sequence":"additional","affiliation":[]},{"given":"Tuomas","family":"Virtanen","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref1","article-title":"Automatic surveillance of the acoustic activity in our living environment","volume-title":"IEEE International Conference on Multimedia and Expo (ICME)","author":"H\u00e4rm\u00e4"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2009.2017438"},{"issue":"2","key":"ref3","first-page":"11","article-title":"Audio keywords generation for sports video analysis","volume":"4","author":"Min","year":"2008","journal-title":"ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM)"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1186\/1687-4722-2013-1"},{"key":"ref5","first-page":"1267","article-title":"Acoustic event detection in real life recordings","volume-title":"18th European Signal Processing Conference","author":"Mesaros"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6639360"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1016\/j.camwa.2012.03.077"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-642-30232-9_14"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/WASPAA.2013.6701861"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2015.7177950"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1016\/j.patrec.2013.02.015"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/IJCNN.2015.7280624"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1162\/neco.1997.9.8.1735"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1016\/j.neunet.2005.06.042"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6638947"},{"key":"ref16","first-page":"589","article-title":"Universal onset detection with bidirectional long short-term memory neural networks","volume-title":"International Society for Music Information Retrieval Conference (ISMIR)","author":"Eyben"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2012.6287832"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/78.650093"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/72.279181"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2008.137"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/29.35387"},{"key":"ref22","article-title":"Exploring data augmentation for improved singing voice detection with neural networks","volume-title":"International Society for Music Information Retrieval Conference (ISMIR)","author":"Schl\u00fcter"},{"key":"ref23","article-title":"A software framework for musical data augmentation","volume-title":"International Society for Music Information Retrieval Conference (ISMIR)","author":"Brian"},{"key":"ref24","first-page":"1272","article-title":"Audio context recognition using audio event histograms","volume-title":"Proc. of the 18th European Signal Processing Conference (EUSIPCO)","author":"Heittola"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/5.58337"},{"key":"ref26","article-title":"Lecture 6.5-rmsprop: Divide the gradient by a running average of its recent magnitude","volume":"4","author":"Tieleman","year":"2012","journal-title":"COURSERA: Neural Networks for Machine Learning"},{"key":"ref27","first-page":"547","article-title":"Introducing currennt: The Munich open-source CUDA recurrent neural network toolkit","volume":"16","author":"Weninger","year":"2015","journal-title":"Journal of Machine Learning Research"}],"event":{"name":"2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)","location":"Shanghai","start":{"date-parts":[[2016,3,20]]},"end":{"date-parts":[[2016,3,25]]}},"container-title":["2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/7465907\/7471614\/07472917.pdf?arnumber=7472917","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,1,24]],"date-time":"2024-01-24T00:03:31Z","timestamp":1706054611000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/7472917\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2016,3]]},"references-count":27,"URL":"https:\/\/doi.org\/10.1109\/icassp.2016.7472917","relation":{},"subject":[],"published":{"date-parts":[[2016,3]]}}}