{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,29]],"date-time":"2026-05-29T16:11:39Z","timestamp":1780071099702,"version":"3.54.0"},"reference-count":28,"publisher":"Springer Science and Business Media LLC","issue":"3","license":[{"start":{"date-parts":[[2019,3,26]],"date-time":"2019-03-26T00:00:00Z","timestamp":1553558400000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"funder":[{"name":"Technological Innovation Major Project of Hubei Province","award":["2017AAA123"],"award-info":[{"award-number":["2017AAA123"]}]},{"DOI":"10.13039\/501100001809","name":"National Nature Science Foundation of China","doi-asserted-by":"crossref","award":["61671335"],"award-info":[{"award-number":["61671335"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"crossref"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Computing"],"published-print":{"date-parts":[[2020,3]]},"DOI":"10.1007\/s00607-019-00713-8","type":"journal-article","created":{"date-parts":[[2019,3,26]],"date-time":"2019-03-26T12:07:52Z","timestamp":1553602072000},"page":"813-827","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":6,"title":["RNN-based signal classification for hybrid audio data compression"],"prefix":"10.1007","volume":"102","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-6933-3298","authenticated-orcid":false,"given":"Weiping","family":"Tu","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Yuhong","family":"Yang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Bo","family":"Du","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Wanzhao","family":"Yang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Xiong","family":"Zhang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jiaxi","family":"Zheng","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2019,3,26]]},"reference":[{"key":"713_CR1","unstructured":"GPP (2005) Recommendation ETSI TS 126 290. Extended adaptive multi-rate-wideband (AMR-WB+) codec"},{"key":"713_CR2","unstructured":"GPP (2014) Recommendation TS 26.441. Codec for enhanced voice services (EVS)"},{"key":"713_CR3","unstructured":"MPEG (2011) Recommendation ISO\/IEC 23003-3, information technology\u2013MPEG audio technologies\u2014part 3: unified speech and audio coding"},{"key":"713_CR4","unstructured":"J\u00e9r\u00e9mie L, Roch L, Guy R (2007) An improved low complexity AMR-WB+ encoder using neural networks for mode selection. In: 123rd convention of audio engineering society"},{"issue":"6","key":"713_CR5","first-page":"1830","volume":"91-D","author":"K Jong-Kyu","year":"2008","unstructured":"Jong-Kyu K, Nam-Soo K (2008) Improved frame mode selection for AMR-WB+ based on decision tree. IEICE Trans INF Syst E 91-D(6):1830\u20131833","journal-title":"IEICE Trans INF Syst E"},{"key":"713_CR6","doi-asserted-by":"crossref","unstructured":"Mu-Liang W, Mn-Ta L (2010) A neural network-based coding mode selection scheme of hybrid audio coder. In: IEEE international conference on wireless communications, pp 107\u2013110","DOI":"10.1109\/WCINS.2010.5541899"},{"key":"713_CR7","first-page":"372","volume":"4","author":"B Alessandro","year":"2002","unstructured":"Alessandro B, Alessandra F, Pierangelo M (2002) Audio classification in speech and music: a comparison between a statistical and a neural approach. Eur J Appl Sign Process 4:372\u2013378","journal-title":"Eur J Appl Sign Process"},{"key":"713_CR8","unstructured":"Zhonghua F, JhingFa W, Lei X (2009) Noise robust features for speech\/music discrimination in real-time telecommunication. In: IEEE international conference on multimedia and expo, pp 574\u2013577"},{"issue":"1","key":"713_CR9","doi-asserted-by":"publisher","first-page":"155","DOI":"10.1109\/TMM.2004.840604","volume":"7","author":"P Costas","year":"2005","unstructured":"Costas P, George T (2005) A speech\/music discriminator based on RMS and zero-crossing. IEEE Trans Multimed 7(1):155\u2013166","journal-title":"IEEE Trans Multimed"},{"key":"713_CR10","unstructured":"Michael JC, Eluned SP, Harvey L (1999) A comparison of features for speech, music discrimination. In: IEEE international conference in acoustic, speech, and signal processing, pp 149\u2013152"},{"key":"713_CR11","unstructured":"Jun W, Qiong W, Haojiang D, Qin Y (2008) Real-time speech\/music classification with a hierarchical oblique decision tree. In: International conference on acoustic, speech, and signal processing, pp 2033\u20132036"},{"issue":"6","key":"713_CR12","doi-asserted-by":"publisher","first-page":"482","DOI":"10.1007\/s00530-002-0065-0","volume":"8","author":"L Lie","year":"2003","unstructured":"Lie L, Stan ZL, Hong-Jiang Z (2003) Content-based audio classification and segmentation by using support vector machines. ACM J Multimed Syst 8(6):482\u2013492","journal-title":"ACM J Multimed Syst"},{"issue":"7","key":"713_CR13","first-page":"724","volume":"52","author":"B Juan Jose","year":"2004","unstructured":"Juan Jose B, Alexander L (2004) Hierarchical automatic audio signal classification. J. Audio Eng Soc 52(7):724\u2013739","journal-title":"J. Audio Eng Soc"},{"key":"713_CR14","unstructured":"Ewald W, Matthias H, Markus S (2014) Speech\/music discrimination in a large data base of radio broadcasts from the wild. In: IEEE international conference on acoustic, speech and signal processing, pp 2134\u20132138"},{"key":"713_CR15","unstructured":"Khaled E, Mark K, Grace P, Peter K (2000) Speech\/music discrimination for multimedia application. In: IEEE international conference on acoustics, speech, and signal processing, pp 2445\u20132448"},{"key":"713_CR16","unstructured":"Wu C, Liang G (2001) Robust singing detection in speech\/music discriminator design. In: IEEE international conference on acoustics, speech and signal processing, pp 865\u2013868"},{"key":"713_CR17","unstructured":"Kun-Ching W, Yung-Ming Y, Ying-Ru Y (2017) Speech\/music discrimination using hybrid-based feature extraction for audio data Indexing. In: IEEE international conference on system science and engineering, pp 515\u2013519"},{"key":"713_CR18","unstructured":"Eya M, Maha C, Chokri Ben A (2016) Multi-feature speech\/music discrimination based on mid-term level statistics and supervised classifiers. In: IEEE international conference on computer systems and applications"},{"key":"713_CR19","unstructured":"Arijit G, Bibhas Chandra D, Sanjoy Kumar S (2011) Speech\/music classification using empirical mode decomposition. In: IEEE international conference on emerging applications of information technology, pp 49\u201352"},{"issue":"1","key":"713_CR20","doi-asserted-by":"publisher","first-page":"55","DOI":"10.1007\/s00530-006-0034-0","volume":"12","author":"MKS Kashif","year":"2006","unstructured":"Kashif MKS, Wasfi G (2006) Machine-learning based classification of speech and music. J Multimed Syst 12(1):55\u201367","journal-title":"J Multimed Syst"},{"key":"713_CR21","unstructured":"Aggelos P, Sergios T (2014) Speech-music discrimination: a deep learning perspective. In: IEEE international conference on signal processing, pp 616\u2013620"},{"key":"713_CR22","first-page":"742","volume-title":"Knowledge-based intelligent information and engineering systems","author":"O Shinichi","year":"2006","unstructured":"Shinichi O, Ikusaburo K, Takumi I (2006) Time series data classification using recurrent neural network with ensemble learning. In: Gabrys B, Howlett RJ, Jain LC (eds) Knowledge-based intelligent information and engineering systems. Springer, Berlin, pp 742\u2013748"},{"key":"713_CR23","unstructured":"Alex G, Abdel-rahman M, Geoffrey H (2013) Speech recognition with deep recurrent neural networks. In: IEEE international conference on acoustics, speech and signal processing pp 6645\u20136649"},{"issue":"C","key":"713_CR24","first-page":"223","volume":"50","author":"H Michael","year":"2003","unstructured":"Michael H, Peter S (2003) Recurrent neural networks for time series classification. Neurocomputing 50(C):223\u2013235","journal-title":"Neurocomputing"},{"key":"713_CR25","unstructured":"Suman R, Andreas S (2016) A comparative study of recurrent neural network models for lexical domain classification. In: IEEE international conference on acoustics, speech and signal processing pp 6075\u20136079"},{"key":"713_CR26","unstructured":"Huy P, Philipp K, Fabrice K, Marco M, Radoslaw M, Alfred M (2017) Audio scene classification with deep recurrent neural networks. In: Interspeech, pp 3043\u20133047"},{"key":"713_CR27","unstructured":"Zhibin Y, Rammohan M, Minho L (2013) Supervised multiple timescale recurrent neuron network model for human action classification. In: International conference on neural information processing pp 196\u2013203"},{"issue":"9","key":"713_CR28","doi-asserted-by":"publisher","first-page":"4962","DOI":"10.1109\/TGRS.2017.2697453","volume":"55","author":"M Emmanuel","year":"2017","unstructured":"Emmanuel M, Guillaume C, Yuliya T, Pierre A (2017) Recurrent neural networks to correct satellite image classification maps. IEEE Trans Geosci Remote Sens 55(9):4962\u20134971","journal-title":"IEEE Trans Geosci Remote Sens"}],"container-title":["Computing"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s00607-019-00713-8.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s00607-019-00713-8\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s00607-019-00713-8.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2020,3,25]],"date-time":"2020-03-25T00:15:33Z","timestamp":1585095333000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s00607-019-00713-8"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2019,3,26]]},"references-count":28,"journal-issue":{"issue":"3","published-print":{"date-parts":[[2020,3]]}},"alternative-id":["713"],"URL":"https:\/\/doi.org\/10.1007\/s00607-019-00713-8","relation":{},"ISSN":["0010-485X","1436-5057"],"issn-type":[{"value":"0010-485X","type":"print"},{"value":"1436-5057","type":"electronic"}],"subject":[],"published":{"date-parts":[[2019,3,26]]},"assertion":[{"value":"13 November 2018","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"16 March 2019","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"26 March 2019","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}