{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,30]],"date-time":"2025-10-30T06:21:20Z","timestamp":1761805280440},"reference-count":40,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"5","license":[{"start":{"date-parts":[[2010,10,1]],"date-time":"2010-10-01T00:00:00Z","timestamp":1285891200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE J. Sel. Top. Signal Process."],"published-print":{"date-parts":[[2010,10]]},"DOI":"10.1109\/jstsp.2010.2057192","type":"journal-article","created":{"date-parts":[[2010,7,20]],"date-time":"2010-07-20T20:19:46Z","timestamp":1279657186000},"page":"798-807","source":"Crossref","is-referenced-by-count":69,"title":["Low-Complexity Variable Frame Rate Analysis for Speech Recognition and Voice Activity Detection"],"prefix":"10.1109","volume":"4","author":[{"given":"Zheng-Hua","family":"Tan","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"B\u00f8rge","family":"Lindberg","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref39","first-page":"4441","article-title":"a voice activity detection based on the adaptive integration of multiple speech features and a signal decision scheme","author":"fujimoto","year":"2008","journal-title":"Proc ICASSP'08"},{"key":"ref38","year":"1996","journal-title":"ITU ITU Recommendation G 723 1"},{"key":"ref33","article-title":"applying support vector machines to voice activity detection","author":"dong","year":"2002","journal-title":"Proc ICSLP'02"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1155\/ASP.2005.487"},{"key":"ref31","doi-asserted-by":"crossref","DOI":"10.21437\/Eurospeech.2001-446","article-title":"entropy based voice activity detection in very noisy conditions","author":"renevey","year":"2001","journal-title":"Proc Eurospeech'01"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/LSP.2003.821762"},{"key":"ref37","year":"1996","journal-title":"Coding of speech at 8 kbit\/s using conjugate structure algebraic code-excited linear-prediction (CS-ACELP) Annex B A silence compression scheme"},{"key":"ref36","year":"2002","journal-title":"Speech processing transmission and quality aspects (STQ) Distributed speech recognition Advanced front-end feature extraction algorithm Compression algorithms"},{"key":"ref35","first-page":"1399","article-title":"speech\/non-speech classification using multiple features for robust endpoint detection","author":"shin","year":"2002","journal-title":"Proc ICASSP'02"},{"key":"ref34","article-title":"robust voiced\/unvoiced classification using novel features and gaussian mixture model","author":"shah","year":"2004","journal-title":"Proc ICASSP'04"},{"key":"ref10","article-title":"an energy search approach to variable frame rate front-end processing for robust asr","author":"epps","year":"2005","journal-title":"Proc EUROSPEECH'05"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1016\/j.csl.2009.02.003"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.1992.225862"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1016\/j.csl.2006.08.001"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.1998.675363"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1049\/el:20031026"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2006.889799"},{"key":"ref16","article-title":"the aurora experimental framework for the performance evaluation of speech recognition systems under noisy conditions","author":"hirsch","year":"2000","journal-title":"Proc ISCA ITRW ASR"},{"key":"ref17","author":"young","year":"2004","journal-title":"HTK Hidden Markov Model Toolkit V3 2 1 Reference Manual"},{"key":"ref18","doi-asserted-by":"crossref","DOI":"10.21437\/Eurospeech.2003-499","article-title":"revisiting scenarios and methods for variable frame rate analysis in automatic speech recognition","author":"macias-guarasa","year":"2003","journal-title":"Proc Eurospeech'03"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/TASSP.1979.1163209"},{"key":"ref28","first-page":"69","article-title":"efficient and robust distributed speech recognition (dsr) over wireless fading channels: 2d-dct compression, iterative bit allocation, short bch code and interleaving","author":"hsu","year":"2004","journal-title":"Proc IEEE ICASSP'04"},{"key":"ref4","first-page":"3264","article-title":"on the use of variable frame rate analysis in speech recognition","author":"zhu","year":"2000","journal-title":"Proc IEEE ICASSP"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.1992.225984"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/9780470544402"},{"key":"ref6","article-title":"optimal frame rate analysis for speech recognition","author":"young","year":"1990","journal-title":"Proc IEE Colloquium on Techniques for Speech Process"},{"key":"ref29","article-title":"a packetization and variable bitrate interframe compression scheme for vector quantizer-based distributed speech recognition","author":"borgstrom","year":"2007","journal-title":"Proc Interspeech'07"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/97.338746"},{"key":"ref8","article-title":"singing voice recognition considering high-pitched and prolonged sounds","author":"sasou","year":"2006","journal-title":"Proc EUSIPCO"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1016\/0885-2308(91)90023-J"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2008.4518869"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2004.1326044"},{"key":"ref1","year":"2008","journal-title":"Automatic Speech Recognition on Mobile Devices and over Communication Networks"},{"key":"ref20","doi-asserted-by":"crossref","DOI":"10.21437\/Eurospeech.2003-295","article-title":"a comparison of three non-linear observation models for noisy speech features","author":"droppo","year":"2003","journal-title":"Proc Eurospeech'03"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1016\/S0167-6393(98)00033-8"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/TASSP.1981.1163530"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/89.928915"},{"key":"ref23","doi-asserted-by":"crossref","DOI":"10.21437\/Eurospeech.2001-194","article-title":"analysis of the root-cepstrum for acoustic modeling and fast decoding in speech recognition","author":"sarikaya","year":"2001","journal-title":"Proc Eurospeech'01"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1016\/S0885-2308(03)00026-3"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/TASL.2006.876717"}],"container-title":["IEEE Journal of Selected Topics in Signal Processing"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx5\/4200690\/5571767\/05504823.pdf?arnumber=5504823","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,6,2]],"date-time":"2023-06-02T06:25:07Z","timestamp":1685687107000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/5504823\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2010,10]]},"references-count":40,"journal-issue":{"issue":"5"},"URL":"https:\/\/doi.org\/10.1109\/jstsp.2010.2057192","relation":{},"ISSN":["1932-4553","1941-0484"],"issn-type":[{"value":"1932-4553","type":"print"},{"value":"1941-0484","type":"electronic"}],"subject":[],"published":{"date-parts":[[2010,10]]}}}