{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,4,17]],"date-time":"2025-04-17T14:08:43Z","timestamp":1744898923578,"version":"3.40.3"},"reference-count":55,"publisher":"Springer Science and Business Media LLC","issue":"1","license":[{"start":{"date-parts":[[2012,9,2]],"date-time":"2012-09-02T00:00:00Z","timestamp":1346544000000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["Pattern Anal Applic"],"published-print":{"date-parts":[[2014,2]]},"DOI":"10.1007\/s10044-012-0292-8","type":"journal-article","created":{"date-parts":[[2012,9,1]],"date-time":"2012-09-01T21:29:08Z","timestamp":1346534948000},"page":"17-36","source":"Crossref","is-referenced-by-count":11,"title":["Human action recognition from simple feature pooling"],"prefix":"10.1007","volume":"17","author":[{"given":"Manuel J.","family":"Mar\u00edn-Jim\u00e9nez","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Nicol\u00e1s","family":"P\u00e9rez de la Blanca","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"M. \u00c1ngeles","family":"Mendoza","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2012,9,2]]},"reference":[{"key":"292_CR1","doi-asserted-by":"crossref","first-page":"373","DOI":"10.1007\/s10044-004-0237-y","volume":"7","author":"M Balcells","year":"2004","unstructured":"Balcells M, DeMenthon D, Doermann D (2004) An appearance-based approach for consistent labeling of humans and objects in video. Pattern Anal Appl 7:373\u2013385","journal-title":"Pattern Anal Appl"},{"key":"292_CR2","doi-asserted-by":"crossref","unstructured":"Ballan L, Bertini M, Del Bimbo A, Seidenari L, Serra G (2009) Recognizing human actions by fusing spatio-temporal appearance and motion descriptors. In: Proceedings of the IEEE international conference on image processing, pp 3569\u20133572","DOI":"10.1109\/ICIP.2009.5414332"},{"key":"292_CR3","doi-asserted-by":"crossref","unstructured":"Blank M, Gorelick L, Shechtman E, Irani M, Basri R (2005) Actions as space\u2013time shapes. In: International conference on computer vision, vol 2, pp 1395\u20131402","DOI":"10.1109\/ICCV.2005.28"},{"key":"292_CR4","first-page":"993","volume":"3","author":"D Blei","year":"2003","unstructured":"Blei D, Ng A, Jordan M (2003) Latent Dirichlet allocation. J Mach Learn Res 3:993\u20131022","journal-title":"J Mach Learn Res"},{"key":"292_CR5","doi-asserted-by":"crossref","unstructured":"Bosch A, Zisserman A, Mu\u00f1oz X (2007) Representing shape with a spatial pyramid kernel. In: Proceedings of CIVR","DOI":"10.1145\/1282280.1282340"},{"key":"292_CR6","doi-asserted-by":"crossref","first-page":"308","DOI":"10.1007\/s10044-004-0228-z","volume":"7","author":"S Boukir","year":"2004","unstructured":"Boukir S, CheneviFre F (2004) Compression and recognition of dance gestures using a deformable model. Pattern Anal Appl 7:308\u2013316","journal-title":"Pattern Anal Appl"},{"key":"292_CR7","doi-asserted-by":"crossref","unstructured":"Breitenstein MD, Reichlin F, Leibe B, Koller-Meier E, Gool LV (2009) Robust tracking-by-detection using a detector confidence particle filter. In: IEEE international conference on computer vision (ICCV\u201909)","DOI":"10.1109\/ICCV.2009.5459278"},{"key":"292_CR8","unstructured":"Chang CC, Lin CJ (2001) LIBSVM: a library for support vector machines. Software available at http:\/\/www.csie.ntu.edu.tw\/~cjlin\/libsvm\/ . Accessed 1 Aug 2012"},{"key":"292_CR9","doi-asserted-by":"crossref","unstructured":"Dalal N, Triggs B, Schmid C (2006) Human detection using oriented histograms of flow and appearance. In: European conference on computer vision","DOI":"10.1007\/11744047_33"},{"key":"292_CR10","doi-asserted-by":"crossref","unstructured":"Dollar P, Rabaud V, Cottrell G, Belongie S (2005) Behavior recognition via sparse spatio-temporal features. In: 2nd IEEE workshop VS-PETS, pp 65\u201372","DOI":"10.1109\/VSPETS.2005.1570899"},{"key":"292_CR11","doi-asserted-by":"crossref","unstructured":"Duchenne O, Laptev I, Sivic J, Bach F, Ponce J (2009) Automatic annotation of human actions in video. In: International conference on computer vision","DOI":"10.1109\/ICCV.2009.5459279"},{"key":"292_CR12","doi-asserted-by":"crossref","unstructured":"Efros A, Berg A, Mori G, Malik J (2003) Recognizing action at a distance. In: International conference on computer vision, vol 2, pp 726\u2013733","DOI":"10.1109\/ICCV.2003.1238420"},{"key":"292_CR13","doi-asserted-by":"crossref","unstructured":"Farneb\u00e4ck G (2003) Two-frame motion estimation based on polynomial expansion. In: Proceedings of the 13th Scandinavian conference on image analysis, LNCS, vol 2749, pp 363\u2013370","DOI":"10.1007\/3-540-45103-X_50"},{"key":"292_CR14","doi-asserted-by":"crossref","unstructured":"Fathi A, Mori G (2008) Action recognition by learning mid-level motion features. In: CVPR","DOI":"10.1109\/CVPR.2008.4587735"},{"key":"292_CR15","doi-asserted-by":"crossref","unstructured":"Felzenszwalb P, McAllester D, Ramanan D (2008) A discriminatively trained, multiscale, deformable part model. In: IEEE conference on computer vision and pattern recognition","DOI":"10.1109\/CVPR.2008.4587597"},{"key":"292_CR16","doi-asserted-by":"crossref","unstructured":"Ferrari V, Marin-Jimenez M, Zisserman A (2008) Progressive search space reduction for human pose estimation. In: IEEE conference on computer vision and pattern recognition","DOI":"10.1109\/CVPR.2008.4587468"},{"key":"292_CR17","volume-title":"Additive logistic regression: a statistical view of boosting: technical report","author":"J Friedman","year":"1998","unstructured":"Friedman J, Hastie T, Tibshirani R (1998) Additive logistic regression: a statistical view of boosting: technical report. Department of Statistics, Stanford University, California"},{"key":"292_CR18","doi-asserted-by":"crossref","unstructured":"Grauman K, Darrell T (2005) The pyramid match kernel: discriminative classification with sets of image features. In: Proceedings of the IEEE ICCV","DOI":"10.1109\/ICCV.2005.239"},{"key":"292_CR19","doi-asserted-by":"crossref","unstructured":"Jarrett K, Kavukcuoglu K, Ranzato M, LeCun Y (2009) What is the best multi-stage architecture for object recognition? In: International conference on computer vision","DOI":"10.1109\/ICCV.2009.5459469"},{"key":"292_CR20","doi-asserted-by":"crossref","unstructured":"Jhuang H, Serre T, Wolf L, Poggio T (2007) A biologically inspired system for action recognition. In: Proceedings of ICCV\u201907, pp 1\u20138","DOI":"10.1109\/ICCV.2007.4408988"},{"key":"292_CR21","unstructured":"Ke Y, Sukthankar R, Hebert M (2005) Efficient visual event detection using volumetric features. In: Proceedings of IEEE international conference on computer vision (ICCV \u201905), pp 166\u2013173"},{"key":"292_CR22","doi-asserted-by":"crossref","unstructured":"Kovashka A, Grauman K (2010) Learning a hierarchy of discriminative space\u2013time neighborhood features for human action recognition. In: IEEE conference on computer vision and pattern recognition","DOI":"10.1109\/CVPR.2010.5539881"},{"issue":"2\/3","key":"292_CR23","doi-asserted-by":"crossref","first-page":"107","DOI":"10.1007\/s11263-005-1838-7","volume":"64","author":"I Laptev","year":"2005","unstructured":"Laptev I (2005) On space\u2013time interest points. Int J Comput Vis 64(2\/3):107\u2013123","journal-title":"Int J Comput Vis"},{"key":"292_CR24","doi-asserted-by":"crossref","unstructured":"Laptev I, Marszalek M, Schmid C, Rozenfeld B (2008a) Learning realistic human actions from movies. In: Proceedings on CVPR","DOI":"10.1109\/CVPR.2008.4587756"},{"key":"292_CR25","doi-asserted-by":"crossref","unstructured":"Laptev I, Marszalek M, Schmid C, Rozenfeld B (2008b) Learning realistic human actions from movies. In: International conference on computer vision and pattern recognition","DOI":"10.1109\/CVPR.2008.4587756"},{"key":"292_CR26","first-page":"2169","volume":"2","author":"S Lazebnik","year":"2006","unstructured":"Lazebnik S, Schmid C, Ponce J (2006) Beyond bags of features: spatial pyramid matching for recognizing natural scene categories. CVPR 2:2169\u20132178","journal-title":"CVPR"},{"key":"292_CR27","unstructured":"Lin Z, Jiang Z, Davis LS (2009) Recognizing actions by shape-motion prototype trees. In: International conference on computer vision"},{"key":"292_CR28","doi-asserted-by":"crossref","unstructured":"Lucena M, de la Blanca NP, Fuertes J (2012) Human action recognition based on aggregated local motion estimates. Mach Vis Appl 23:135\u2013150","DOI":"10.1007\/s00138-010-0305-9"},{"key":"292_CR29","doi-asserted-by":"crossref","unstructured":"Lui YM, Beveridge J, Kirby M (2010) Action classification on product manifolds. In: IEEE conference on computer vision and pattern recognition, pp 833\u2013839","DOI":"10.1109\/CVPR.2010.5540131"},{"key":"292_CR30","doi-asserted-by":"crossref","unstructured":"Mar\u00edn-Jim\u00e9nez M, de la Blanca NP, Mendoza M, Lucena M, Fuertes J (2009) Learning action descriptors for recognition. In: IEEE (ed) WIAMIS 2009, London, UK. IEEE Computer Society, New York, pp 5\u20138","DOI":"10.1109\/WIAMIS.2009.5031418"},{"key":"292_CR31","volume-title":"Machine learning","author":"TM Mitchell","year":"1997","unstructured":"Mitchell TM (1997) Machine learning. McGraw-Hill, New York"},{"key":"292_CR32","doi-asserted-by":"crossref","first-page":"90","DOI":"10.1016\/j.cviu.2006.08.002","volume":"104","author":"TB Moeslund","year":"2006","unstructured":"Moeslund TB, Hilton A, Kruger V (2006) A survey of advances in vision-based human motion capture and analysis. Comput Vis Image Underst 104:90\u2013126","journal-title":"Comput Vis Image Underst"},{"key":"292_CR33","first-page":"290","volume":"2","author":"JC Nebel","year":"2011","unstructured":"Nebel JC, Lewandowski M, Th\u00e9venon J, Mart\u00ednez-Contreras F, Velastin S (2011) Are current monocular computer vision systems for human action recognition suitable for visual surveillance applications? ISVC 2:290\u2013299","journal-title":"ISVC"},{"key":"292_CR34","doi-asserted-by":"crossref","unstructured":"Norouzi M, Ranjbar M, Mori G (2009) Stacks of convolutional restricted Boltzmann machines for shift-invariant feature learning. In: IEEE conference on computer vision and pattern recognition","DOI":"10.1109\/CVPR.2009.5206577"},{"key":"292_CR35","doi-asserted-by":"crossref","first-page":"62","DOI":"10.1109\/TSMC.1979.4310076","volume":"9","author":"N Otsu","year":"1979","unstructured":"Otsu N (1979) A threshold selection method from gray level histograms. IEEE Trans Syst Man Cybern 9:62\u201366","journal-title":"IEEE Trans Syst Man Cybern"},{"key":"292_CR36","doi-asserted-by":"crossref","unstructured":"Pantic M, Pentland A, Nijholt A, Huang T (2007) Human computing and machine understanding of human behavior: a survey. Artif Intell Human Comput 4451:47\u201371","DOI":"10.1007\/978-3-540-72348-6_3"},{"issue":"1","key":"292_CR37","doi-asserted-by":"crossref","first-page":"e27","DOI":"10.1371\/journal.pcbi.0040027","volume":"4","author":"N Pinto","year":"2008","unstructured":"Pinto N, Cox DD, Dicarlo JJ (2008) Why is real-world visual object recognition hard? PLoS Comput Biol 4(1):e27","journal-title":"PLoS Comput Biol"},{"issue":"1","key":"292_CR38","doi-asserted-by":"crossref","first-page":"65","DOI":"10.1109\/TPAMI.2007.250600","volume":"29","author":"D Ramanan","year":"2007","unstructured":"Ramanan D, Forsyth D, Zisserman A (2007) Tracking people by learning their appearance. IEEE Trans Pattern Anal Mach Intell 29(1):65\u201381","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"292_CR39","doi-asserted-by":"crossref","unstructured":"Reddy KK, Liu J, Shah M (2009) Incremental action recognition using feature-tree. In: International conference on computer vision","DOI":"10.1109\/ICCV.2009.5459374"},{"key":"292_CR40","doi-asserted-by":"crossref","unstructured":"Schindler K, van Gool L (2008) Action snippets: how many frames does human action recognition require? In: IEEE conference on computer vision and pattern recognition","DOI":"10.1109\/CVPR.2008.4587730"},{"key":"292_CR41","doi-asserted-by":"crossref","unstructured":"Schindler K, van Gool L (2008) Combining densely sampled form and motion for human action recognition. In: DAGM08, pp 122\u2013131","DOI":"10.1007\/978-3-540-69321-5_13"},{"key":"292_CR42","doi-asserted-by":"crossref","unstructured":"Sch\u00fcldt C, Laptev I, Caputo B: Recognizing human actions: a local SVM approach. In: International conference on pattern recognition, Cambridge, UK, vol 3, pp 32\u201336","DOI":"10.1109\/ICPR.2004.1334462"},{"key":"292_CR43","unstructured":"Seo HJ, Milanfar P (2009) Detection of human actions from a single example. In: International conference on computer vision"},{"issue":"3","key":"292_CR44","doi-asserted-by":"crossref","first-page":"411","DOI":"10.1109\/TPAMI.2007.56","volume":"29","author":"T Serre","year":"2007","unstructured":"Serre T, Wolf L, Bileschi S, Riesenhuber M, Poggio T (2007) Robust object recognition with cortex-like mechanisms. IEEE Trans Pattern Anal Mach Intell 29(3):411\u2013426","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"292_CR45","doi-asserted-by":"crossref","unstructured":"Sminchisescu C, Kanaujia A, Li Z, Metaxas D (2005) Conditional models for contextual human motion recognition. In: Proceedings of ICCV\u201905, IEEE","DOI":"10.1109\/ICCV.2005.59"},{"issue":"7","key":"292_CR46","first-page":"1","volume":"25","author":"Y Song","year":"2003","unstructured":"Song Y, Goncalves L, Perona P (2003) Unsupervised learning of human motion. IEEE Trans Patt Anal and Mach Intell 25(7):1\u201314","journal-title":"IEEE Trans Patt Anal and Mach Intell"},{"key":"292_CR47","unstructured":"Sun X, Chen MY, Hauptmann A (2009) Action recognition via local descriptors and holistic features. International workshop on human communicative behaviour analysis-CVPR"},{"issue":"11","key":"292_CR48","doi-asserted-by":"crossref","first-page":"1473","DOI":"10.1109\/TCSVT.2008.2005594","volume":"18","author":"P Turaga","year":"2008","unstructured":"Turaga P, Chellappa R, Subrahmanian VS, Udrea O (2008) Machine recognition of human activities: a survey. Circuits Syst Video Technol IEEE Trans 18(11):1473\u20131488","journal-title":"Circuits Syst Video Technol IEEE Trans"},{"issue":"3","key":"292_CR49","doi-asserted-by":"crossref","first-page":"480","DOI":"10.1109\/TPAMI.2011.153","volume":"34","author":"A Vedaldi","year":"2012","unstructured":"Vedaldi A, Zisserman A (2012) Efficient additive kernels via explicit feature maps. IEEE PAMI 34(3):480\u2013492","journal-title":"IEEE PAMI"},{"key":"292_CR50","doi-asserted-by":"crossref","unstructured":"Wang H, Ullah MM, KlSser A, Laptev I, Schmid C (2009) Evaluation of local spatio-temporal features for action cognition. In: Proeedings of BMVC","DOI":"10.5244\/C.23.124"},{"key":"292_CR51","doi-asserted-by":"crossref","first-page":"343","DOI":"10.1007\/s10044-004-0231-4","volume":"7","author":"RR Wang","year":"2004","unstructured":"Wang RR, Huang T (2004) A framework of joint object tracking and event detection. Pattern Anal Appl 7:343\u2013355","journal-title":"Pattern Anal Appl"},{"key":"292_CR52","doi-asserted-by":"crossref","unstructured":"Weinland D, Ronfard R, Boyer E (2006) Free viewpoint action recognition using motion history volumes. In: CVIU","DOI":"10.1016\/j.cviu.2006.07.013"},{"key":"292_CR53","doi-asserted-by":"crossref","unstructured":"Yu T, Kim T, Cipolla R (2010) Real-time action recognition by spatiotemporal semantic and structural forests. In: Proceedings of BMVC, pp 1\u201312","DOI":"10.5244\/C.24.52"},{"issue":"9","key":"292_CR54","doi-asserted-by":"crossref","first-page":"1530","DOI":"10.1109\/TPAMI.2006.194","volume":"28","author":"L Zelnik-Manor","year":"2006","unstructured":"Zelnik-Manor L, Irani Michal (2006) Statistical analysis of dynamic actions. IEEE Trans Pattern Anal Mach Intell 28(9):1530\u20131535","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"292_CR55","doi-asserted-by":"crossref","unstructured":"Zhang Z, Hu Y, Chan S, Chia L (2008) Motion context: a new representation for human action recognition. In: ECCV 2008, pp 817\u2013829","DOI":"10.1007\/978-3-540-88693-8_60"}],"container-title":["Pattern Analysis and Applications"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10044-012-0292-8.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s10044-012-0292-8\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10044-012-0292-8","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,4,7]],"date-time":"2025-04-07T18:13:45Z","timestamp":1744049625000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s10044-012-0292-8"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2012,9,2]]},"references-count":55,"journal-issue":{"issue":"1","published-print":{"date-parts":[[2014,2]]}},"alternative-id":["292"],"URL":"https:\/\/doi.org\/10.1007\/s10044-012-0292-8","relation":{},"ISSN":["1433-7541","1433-755X"],"issn-type":[{"type":"print","value":"1433-7541"},{"type":"electronic","value":"1433-755X"}],"subject":[],"published":{"date-parts":[[2012,9,2]]}}}