{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,30]],"date-time":"2026-03-30T14:24:23Z","timestamp":1774880663448,"version":"3.50.1"},"reference-count":164,"publisher":"Springer Science and Business Media LLC","issue":"3","license":[{"start":{"date-parts":[[2015,11,17]],"date-time":"2015-11-17T00:00:00Z","timestamp":1447718400000},"content-version":"unspecified","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Artif Intell Rev"],"published-print":{"date-parts":[[2016,3]]},"DOI":"10.1007\/s10462-015-9448-4","type":"journal-article","created":{"date-parts":[[2015,11,17]],"date-time":"2015-11-17T08:58:34Z","timestamp":1447750714000},"page":"333-368","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":15,"title":["Visual descriptors for scene categorization: experimental evaluation"],"prefix":"10.1007","volume":"45","author":[{"given":"Xue","family":"Wei","sequence":"first","affiliation":[]},{"given":"Son Lam","family":"Phung","sequence":"additional","affiliation":[]},{"given":"Abdesselam","family":"Bouzerdoum","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2015,11,17]]},"reference":[{"key":"9448_CR1","doi-asserted-by":"crossref","unstructured":"Abe Y, Shikano M, Fukuda T, Arai F, Tanaka Y (1999) Vision based navigation system for autonomous mobile robot with global matching. In: Proceedings of IEEE international conference on robotics and automation, pp 1299\u20131304","DOI":"10.1109\/ROBOT.1999.772540"},{"issue":"12","key":"9448_CR2","doi-asserted-by":"crossref","first-page":"2037","DOI":"10.1109\/TPAMI.2006.244","volume":"28","author":"T Ahonen","year":"2006","unstructured":"Ahonen T, Hadid A, Pietikainen M (2006) Face description with local binary patterns: application to face recognition. IEEE Trans Pattern Anal Mach Intell 28(12):2037\u20132041","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR3","doi-asserted-by":"crossref","unstructured":"Ahonen T, Matas J, He C, Pietikainen M (2009) Rotation invariant image description with local binary pattern histogram Fourier features. In: Proceedings of Scandinavian conference on image analysis, pp 61\u201370","DOI":"10.1007\/978-3-642-02230-2_7"},{"key":"9448_CR4","doi-asserted-by":"crossref","unstructured":"Alahi A, Ortiz R, Vandergheynst P (2012) FREAK: fast retina keypoint. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 510\u2013517","DOI":"10.1109\/CVPR.2012.6247715"},{"key":"9448_CR5","unstructured":"Bai Y, Guo L, Jin L, Huang Q (2009) A novel feature extraction method using pyramid histogram of orientation gradients for smile recognition. In: Proceedings of IEEE international conference on image processing, pp 3305\u20133308"},{"issue":"9","key":"9448_CR6","doi-asserted-by":"crossref","first-page":"569","DOI":"10.1016\/j.imavis.2011.08.001","volume":"29","author":"SY Bao","year":"2011","unstructured":"Bao SY, Sun M, Savarese S (2011) Toward coherent object detection and scene layout understanding. Image Vis Comput 29(9):569\u2013579","journal-title":"Image Vis Comput"},{"issue":"3","key":"9448_CR7","doi-asserted-by":"crossref","first-page":"346","DOI":"10.1016\/j.cviu.2007.09.014","volume":"110","author":"H Bay","year":"2008","unstructured":"Bay H, Ess A, Tuytelaars T, Van Gool L (2008) Speeded-up robust features (SURF). Comput Vis Image Underst 110(3):346\u2013359","journal-title":"Comput Vis Image Underst"},{"issue":"10","key":"9448_CR8","doi-asserted-by":"crossref","first-page":"1988","DOI":"10.1109\/TPAMI.2014.2313111","volume":"36","author":"A Bergamo","year":"2014","unstructured":"Bergamo A, Torresani L (2014) Classemes and other classifier-based features for efficient object categorization. IEEE Trans Pattern Anal Mach Intell 36(10):1988\u20132001","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR9","first-page":"993","volume":"3","author":"D Blei","year":"2003","unstructured":"Blei D, Ng A, Jordan M (2003) Latent Dirichlet allocation. J Mach Learn Res 3:993\u20131022","journal-title":"J Mach Learn Res"},{"key":"9448_CR10","unstructured":"Bo L, Ren X, Fox D (2010) Kernel descriptors for visual recognition. In: Lafferty J, Williams C, Shawe-Taylor J, Zemel RS, Culotta A (eds) Advances in neural information processing systems 23, Curran Associates, Inc., pp 244\u2013252"},{"key":"9448_CR11","doi-asserted-by":"crossref","unstructured":"Boiman O, Shechtman E, Irani M (2008) In defense of nearest-neighbor based image classification. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 1\u20138","DOI":"10.1109\/CVPR.2008.4587598"},{"key":"9448_CR12","doi-asserted-by":"crossref","unstructured":"Boutell MR, Jiebo L, Brown CM (2006) Factor graphs for region-based whole-scene classification. In: Proceedings of IEEE conference on computer vision and pattern recognition workshop, pp 104\u2013104","DOI":"10.1109\/CVPRW.2006.78"},{"key":"9448_CR13","doi-asserted-by":"crossref","unstructured":"Brown M, Susstrunk S (2011) Multi-spectral SIFT for scene category recognition. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 177\u2013184","DOI":"10.1109\/CVPR.2011.5995637"},{"key":"9448_CR14","doi-asserted-by":"crossref","unstructured":"Brumby SP, Kenyon G, Landecker W, Rasmussen C, Swaminarayan S, Bettencourt LMA (2009) Large-scale functional models of visual cortex for remote sensing. In: Proceedings of IEEE applied imagery pattern recognition workshop, pp 1\u20136","DOI":"10.1109\/AIPR.2009.5466323"},{"issue":"2","key":"9448_CR15","doi-asserted-by":"crossref","first-page":"121","DOI":"10.1023\/A:1009715923555","volume":"2","author":"CJC Burges","year":"1998","unstructured":"Burges CJC (1998) A tutorial on support vector machines for pattern recognition. Data Min Knowl Disc 2(2):121\u2013167","journal-title":"Data Min Knowl Disc"},{"issue":"11","key":"9448_CR16","doi-asserted-by":"crossref","first-page":"1483","DOI":"10.1016\/j.cviu.2011.07.007","volume":"115","author":"F Cakir","year":"2011","unstructured":"Cakir F, Gudukbay U, Ulusoy O (2011) Nearest-neighbor based metric functions for indoor scene recognition. Comput Vis Image Underst 115(11):1483\u20131492","journal-title":"Comput Vis Image Underst"},{"issue":"3","key":"9448_CR17","doi-asserted-by":"crossref","first-page":"660","DOI":"10.1037\/0096-1523.34.3.660","volume":"34","author":"MS Castelhano","year":"2008","unstructured":"Castelhano MS, Henderson JM (2008) The influence of color on the perception of scene gist. J Exp Psychol Hum Percept Perform 34(3):660\u2013675","journal-title":"J Exp Psychol Hum Percept Perform"},{"key":"9448_CR18","unstructured":"Chang CK, Siagian C, Itti L (2010) Mobile robot vision navigation and localization using gist and saliency. In: Proceedings of IEEE-RSJ international conference on intelligent robots and systems, pp 4147\u20134154"},{"issue":"2","key":"9448_CR19","doi-asserted-by":"crossref","first-page":"137","DOI":"10.1023\/A:1011658027344","volume":"16","author":"A Chella","year":"2001","unstructured":"Chella A, Frixione M, Gaglio S (2001) Conceptual spaces for computer vision representations. Artif Intell Rev 16(2):137\u2013152","journal-title":"Artif Intell Rev"},{"key":"9448_CR20","doi-asserted-by":"crossref","unstructured":"Cheng G, Han J, Guo L, Liu T (2015) Learning coarse-to-fine sparselets for efficient object detection and scene classification. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 1173\u20131181","DOI":"10.1109\/CVPR.2015.7298721"},{"issue":"4","key":"9448_CR21","doi-asserted-by":"crossref","first-page":"241","DOI":"10.1016\/j.imavis.2010.11.002","volume":"29","author":"T Chin","year":"2011","unstructured":"Chin T, Suter D, Wang H (2011) Boosting histograms of descriptor distances for scalable multiclass specific scene recognition. Image Vis Comput 29(4):241\u2013250","journal-title":"Image Vis Comput"},{"key":"9448_CR22","unstructured":"Clinchant S, Csurka G, Perronnin F, Renders J (2007) XRCEs participation to ImagEval. In: Proceedings of workshop at content visualization and intermedia representations, pp 1\u20138"},{"key":"9448_CR23","unstructured":"Dai Q, Zhao RW, Wu Z, Wang X, Gu Z, Wu W, Jiang YG (2015) Detecting violent scenes and affective impact in movies with deep learning. In: Proceedings of MediaEval workshop, pp 1\u20133"},{"key":"9448_CR24","doi-asserted-by":"crossref","unstructured":"Dalal N, Triggs B (2005) Histograms of oriented gradients for human detection. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 886\u2013893","DOI":"10.1109\/CVPR.2005.177"},{"key":"9448_CR25","doi-asserted-by":"crossref","unstructured":"De\u00a0Geest R, Tuytelaars T (2014) Dense interest features for video processing. In: Proceedings of IEEE international conference on image processing, pp 5771\u20135775","DOI":"10.1109\/ICIP.2014.7026167"},{"key":"9448_CR26","doi-asserted-by":"crossref","unstructured":"Derpanis KG, Lecce M, Daniilidis K, Wildes RP (2012) Dynamic scene understanding: the role of orientation features in space and time in scene classification. In: Proceedings of IEEE international conference on computer vision and pattern recognition, pp 1306\u20131313","DOI":"10.1109\/CVPR.2012.6247815"},{"key":"9448_CR27","doi-asserted-by":"crossref","unstructured":"Dixit M, Chen S, Gao D, Rasiwasia N, Vasconcelos N (2015) Scene classification with semantic fisher vectors. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 2974\u20132983","DOI":"10.1109\/CVPR.2015.7298916"},{"key":"9448_CR28","unstructured":"Doersch C, Gupta A, Efros AA (2013) Mid-level visual element discovery as discriminative mode seeking. In: Burges C, Bottou L, Welling M, Ghahramani Z, Weinberger K (eds) Advances in neural information processing systems 26, Curran Associates, Inc., pp 494\u2013502"},{"key":"9448_CR29","unstructured":"Donahue J, Jia Y, Vinyals O, Hoffman J, Zhang N, Tzeng E, Darrell T (2014) DeCAF: a deep convolutional activation feature for generic visual recognition. In: Proceedings of international conference on machine learning, pp 647\u2013655"},{"key":"9448_CR30","doi-asserted-by":"crossref","unstructured":"Douze M, Jegou H, Sandhawalia H, Amsaleg L, Schmid C (2009) Evaluation of gist descriptors for web-scale image search. In: Proceedings of international conference on image and video retrieval, pp 140\u2013147","DOI":"10.1145\/1646396.1646421"},{"key":"9448_CR31","unstructured":"Ebied HM (2012) Feature extraction using PCA and kernel-PCA for face recognition. In: Proceedings of international conference on informatics and systems, pp 72\u201377"},{"issue":"4","key":"9448_CR32","doi-asserted-by":"crossref","first-page":"1627","DOI":"10.1016\/j.patcog.2011.09.020","volume":"45","author":"NM Elfiky","year":"2012","unstructured":"Elfiky NM, Khan SF, Weijer J, Gonzalez J (2012) Discriminative compact pyramids for object and scene recognition. Pattern Recognit 45(4):1627\u20131636","journal-title":"Pattern Recognit"},{"issue":"8","key":"9448_CR33","doi-asserted-by":"crossref","first-page":"861","DOI":"10.1016\/j.patrec.2005.10.010","volume":"27","author":"T Fawcett","year":"2006","unstructured":"Fawcett T (2006) An introduction to ROC analysis. Pattern Recognit Lett 27(8):861\u2013874","journal-title":"Pattern Recognit Lett"},{"key":"9448_CR34","doi-asserted-by":"crossref","unstructured":"Fei-Fei L, Perona P (2005) A Bayesian hierarchical model for learning natural scene categories. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 524\u2013531","DOI":"10.1109\/CVPR.2005.16"},{"key":"9448_CR35","doi-asserted-by":"crossref","unstructured":"Fei-Fei L, Fergus R, Perona P (2007a) Learning generative visual models from few training examples: an incremental Bayesian approach tested on 101 object categories. J Comput Vis Image Underst 106(1):59\u201370","DOI":"10.1016\/j.cviu.2005.09.012"},{"issue":"1","key":"9448_CR36","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1167\/7.1.10","volume":"7","author":"L Fei-Fei","year":"2007","unstructured":"Fei-Fei L, Lyer A, Koch C, Perona P (2007b) What do we perceive in a glance of a real-world scene? J Vis 7(1):1\u201329","journal-title":"J Vis"},{"issue":"9","key":"9448_CR37","doi-asserted-by":"crossref","first-page":"1627","DOI":"10.1109\/TPAMI.2009.167","volume":"32","author":"P Felzenszwalb","year":"2010","unstructured":"Felzenszwalb P, Girshick R, McAllester D, Ramanan D (2010) Object detection with discriminatively trained part-based models. IEEE Trans Pattern Anal Mach Intell 32(9):1627\u20131645","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"1","key":"9448_CR38","doi-asserted-by":"crossref","first-page":"55","DOI":"10.1007\/s10462-012-9365-8","volume":"43","author":"J Fuentes-Pacheco","year":"2015","unstructured":"Fuentes-Pacheco J, Ruiz-Ascencio J, Rendon-Mancha JM (2015) Visual simultaneous localization and mapping: a survey. Artif Intell Rev 43(1):55\u201381","journal-title":"Artif Intell Rev"},{"issue":"5","key":"9448_CR39","doi-asserted-by":"crossref","first-page":"522","DOI":"10.1109\/34.391390","volume":"17","author":"BV Funt","year":"1995","unstructured":"Funt BV, Finlayson GD (1995) Color constant color indexing. IEEE Trans Pattern Anal Mach Intell 17(5):522\u2013529","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR40","doi-asserted-by":"crossref","unstructured":"Gemert JCV, Geusebroek JM, Veenman CJ, Smeulders AWM (2008) Kernel codebooks for scene categorization. In: Proceedings of European conference on computer vision, pp 696\u2013709","DOI":"10.1007\/978-3-540-88690-7_52"},{"issue":"12","key":"9448_CR41","doi-asserted-by":"crossref","first-page":"2212","DOI":"10.1109\/TNNLS.2014.2307532","volume":"25","author":"H Goh","year":"2014","unstructured":"Goh H, Thome N, Cord M, Lim JH (2014) Learning deep hierarchical visual feature coding. IEEE Trans Neural Netw Learn Syst 25(12):2212\u20132225","journal-title":"IEEE Trans Neural Netw Learn Syst"},{"key":"9448_CR42","doi-asserted-by":"crossref","unstructured":"Gokalp D, Aksoy S (2007) Scene classification using bag-of-regions representations. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 1\u20138","DOI":"10.1109\/CVPR.2007.383375"},{"key":"9448_CR43","doi-asserted-by":"crossref","DOI":"10.4135\/9781412972000","volume-title":"Encyclopedia of perception","author":"EB Goldstein","year":"2010","unstructured":"Goldstein EB (2010) Encyclopedia of perception. SAGE, Thousand Oaks"},{"issue":"4","key":"9448_CR44","doi-asserted-by":"crossref","first-page":"747","DOI":"10.1007\/s10462-012-9341-3","volume":"42","author":"D Gowsikhaa","year":"2014","unstructured":"Gowsikhaa D, Abirami S, Baskaran R (2014) Automated human behavior analysis from surveillance videos: a survey. Artif Intell Rev 42(4):747\u2013765","journal-title":"Artif Intell Rev"},{"issue":"4","key":"9448_CR45","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1167\/9.4.6","volume":"9","author":"S Grossberg","year":"2009","unstructured":"Grossberg S, Huang T (2009) ARTSCENE: a neural system for natural scene classification. J Vis 9(4):1\u201319","journal-title":"J Vis"},{"issue":"25","key":"9448_CR46","doi-asserted-by":"crossref","first-page":"1654","DOI":"10.1049\/el:20021033","volume":"38","author":"S Guangda","year":"2002","unstructured":"Guangda S, Cuiping Z, Rong D, Cheng D (2002) MMP-PCA face recognition method. Electron Lett 38(25):1654\u20131656","journal-title":"Electron Lett"},{"issue":"6","key":"9448_CR47","doi-asserted-by":"crossref","first-page":"1657","DOI":"10.1109\/TIP.2010.2044957","volume":"19","author":"Z Guo","year":"2010","unstructured":"Guo Z, Zhang D, Zhang D (2010) A completed modeling of local binary pattern operator for texture classification. IEEE Trans Image Process 19(6):1657\u20131663","journal-title":"IEEE Trans Image Process"},{"key":"9448_CR48","doi-asserted-by":"crossref","unstructured":"Gupta P, Arrabolu SS, Brown M, Savarese S (2009) Video scene categorization by 3D hierarchical histogram matching. In: Proceedings of IEEE international conference on computer vision, pp 1655\u20131662","DOI":"10.1109\/ICCV.2009.5459373"},{"issue":"7","key":"9448_CR49","doi-asserted-by":"crossref","first-page":"831","DOI":"10.1109\/TPAMI.2004.32","volume":"26","author":"E Hadjidemetriou","year":"2004","unstructured":"Hadjidemetriou E, Grossberg MD, Nayar SK (2004) Multiresolution histograms and their use for recognition. IEEE Trans Pattern Anal Mach Intell 26(7):831\u2013847","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR50","doi-asserted-by":"crossref","unstructured":"Han X, Chen Y (2009) Image categorization by learned PCA subspace of combined visual-words and low-level features. In: Proceedings of international conference on intelligent information hiding and multimedia signal processing, pp 1282\u20131285","DOI":"10.1109\/IIH-MSP.2009.31"},{"key":"9448_CR51","doi-asserted-by":"crossref","unstructured":"Han Y, Liu G (2010) A hierarchical GIST model embedding multiple biological feasibilities for scene classification. In: Proceedings of international conference on pattern recognition, pp 3109\u20133112","DOI":"10.1109\/ICPR.2010.761"},{"issue":"7","key":"9448_CR52","doi-asserted-by":"crossref","first-page":"1527","DOI":"10.1162\/neco.2006.18.7.1527","volume":"18","author":"GE Hinton","year":"2006","unstructured":"Hinton GE, Osindero S, Teh YW (2006) A fast learning algorithm for deep belief nets. Neural Comput 18(7):1527\u20131554","journal-title":"Neural Comput"},{"key":"9448_CR53","doi-asserted-by":"crossref","unstructured":"Hoiem D, Efros AA, Hebert M (2006) Putting objects in perspective. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 2137\u20132144","DOI":"10.1109\/CVPR.2006.232"},{"issue":"11","key":"9448_CR54","doi-asserted-by":"crossref","first-page":"4680","DOI":"10.1109\/TIP.2014.2353814","volume":"23","author":"D Huang","year":"2014","unstructured":"Huang D, Zhu C, Wang Y, Chen L (2014a) HSOG: a novel local image descriptor based on histograms of the second-order gradients. IEEE Trans Image Process 23(11):4680\u20134695","journal-title":"IEEE Trans Image Process"},{"issue":"3","key":"9448_CR55","doi-asserted-by":"crossref","first-page":"493","DOI":"10.1109\/TPAMI.2013.113","volume":"36","author":"Y Huang","year":"2014","unstructured":"Huang Y, Wu Z, Wang L, Tan T (2014b) Feature coding in image classification: a comprehensive study. IEEE Trans Pattern Anal Mach Intell 36(3):493\u2013506","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"2","key":"9448_CR56","first-page":"919","volume":"5","author":"Z Huang","year":"2008","unstructured":"Huang Z, Huang H, Zhang W, Hou L (2008) Face recognition using the global image features based on scene gist. J Inf Comput Sci 5(2):919\u2013928","journal-title":"J Inf Comput Sci"},{"issue":"195","key":"9448_CR57","doi-asserted-by":"crossref","first-page":"215","DOI":"10.1113\/jphysiol.1968.sp008455","volume":"1","author":"DH Hubel","year":"1968","unstructured":"Hubel DH, Wiesel TN (1968) Receptive fields and functional architecture of monkey striate cortex. J Physiol 1(195):215\u2013243","journal-title":"J Physiol"},{"key":"9448_CR58","doi-asserted-by":"crossref","unstructured":"Igarashi M, Mizuno A, Ikebe M (2013) Accuracy improvement of histogram-based image filtering. In: IEEE international conference on image processing, pp 1217\u20131221","DOI":"10.1109\/ICIP.2013.6738251"},{"key":"9448_CR59","unstructured":"INRIA Graffiti data set (2004) Viewpoint change sequences. http:\/\/kahlan.eps.surrey.ac.uk\/featurespace\/web\/data.htm"},{"key":"9448_CR60","doi-asserted-by":"crossref","unstructured":"Jeong S, Won CS, Gray RM (2003) Histogram-based image retrieval using Gauss mixture vector quantization. In: Proceedings of IEEE international conference on acoustics, speech, and signal processing, pp 677\u2013680","DOI":"10.1109\/ICASSP.2003.1199565"},{"key":"9448_CR61","unstructured":"Jia D, Wei D, Socher R, Li-Jia L, Kai L, Fei-Fei L (2009) ImageNet: A large-scale hierarchical image database. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 248\u2013255"},{"key":"9448_CR62","unstructured":"Jia X, Schwing AG, Urtasun R (2014) Tell me what you see and i will show you where it is. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 3190\u20133197"},{"key":"9448_CR63","doi-asserted-by":"crossref","unstructured":"Jiang A, Wang C, Xiao B, Dai R (2010) A new biologically inspired feature for scene image classification. In: Proceedings of international conference on pattern recognition, pp 758\u2013761","DOI":"10.1109\/ICPR.2010.191"},{"key":"9448_CR64","doi-asserted-by":"crossref","unstructured":"Juneja M, Vedaldi A, Jawahar C, Zisserman A (2013) Blocks that shout: distinctive parts for scene classification. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 923\u2013930","DOI":"10.1109\/CVPR.2013.124"},{"issue":"2","key":"9448_CR65","doi-asserted-by":"crossref","first-page":"83","DOI":"10.1023\/A:1012460413855","volume":"45","author":"T Kadir","year":"2001","unstructured":"Kadir T, Brady M (2001) Scale, saliency and image description. Int J Comput Vis 45(2):83\u2013105","journal-title":"Int J Comput Vis"},{"key":"9448_CR66","doi-asserted-by":"crossref","unstructured":"Karayev S, Fritz M, Darrell T (2014) Anytime recognition of objects and scenes. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 572\u2013579","DOI":"10.1109\/CVPR.2014.80"},{"issue":"4","key":"9448_CR67","doi-asserted-by":"crossref","first-page":"100:1","DOI":"10.1145\/1778765.1778837","volume":"29","author":"M Kass","year":"2010","unstructured":"Kass M, Solomon J (2010) Smoothed local histogram filters. ACM Trans Graph 29(4):100:1\u2013100:10","journal-title":"ACM Trans Graph"},{"issue":"4","key":"9448_CR68","doi-asserted-by":"crossref","first-page":"794","DOI":"10.1016\/j.patcog.2010.11.003","volume":"44","author":"H Kazuhiro","year":"2011","unstructured":"Kazuhiro H (2011) Local autocorrelation of similarities with subspaces for shift invariant scene classification. Pattern Recogn 44(4):794\u2013799","journal-title":"Pattern Recogn"},{"key":"9448_CR69","unstructured":"Ke Y, Sukthankar R (2004) PCA-SIFT: a more distinctive representation for local image descriptors. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 506\u2013513"},{"key":"9448_CR70","doi-asserted-by":"crossref","unstructured":"Khosla A, Byoungkwon A, Lim JJ, Torralba A (2014) Looking beyond the visible scene. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 3710\u20133717","DOI":"10.1109\/CVPR.2014.474"},{"key":"9448_CR71","doi-asserted-by":"crossref","unstructured":"Kikuchi H, Kataoka S, Muramatsu S, Huttunen H (2013) Color-tone similarity of digital images. In: Proceedings of IEEE international conference on image processing, pp 393\u2013397","DOI":"10.1109\/ICIP.2013.6738081"},{"issue":"2","key":"9448_CR72","doi-asserted-by":"crossref","first-page":"159","DOI":"10.1023\/A:1008065931878","volume":"31","author":"JJ Koenderink","year":"1999","unstructured":"Koenderink JJ, Van Doorn AJ (1999) The structure of locally orderless images. Int J Comput Vis 31(2):159\u2013168","journal-title":"Int J Comput Vis"},{"key":"9448_CR73","doi-asserted-by":"crossref","unstructured":"Krapac J, Verbeek J, Jurie F (2011) Modeling spatial layout with fisher vectors for image categorization. In: Proceedings of IEEE international conference on computer vision, pp 1487\u20131494","DOI":"10.1109\/ICCV.2011.6126406"},{"key":"9448_CR74","unstructured":"Krizhevsky A, Sutskever I, Geoffrey EH (2012) ImageNet classification with deep convolutional neural networks. In: Pereira F, Burges C, Bottou L,Weinberger K (eds) Advances in neural information processing systems 25, Curran Associates, Inc., pp 1097\u20131105"},{"key":"9448_CR75","doi-asserted-by":"crossref","unstructured":"Lazebnik S, Schmid C, Ponce J (2006) Beyond bags of features: spatial pyramid matching for recognizing natural scene categories. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 2169\u20132178","DOI":"10.1109\/CVPR.2006.68"},{"issue":"11","key":"9448_CR76","doi-asserted-by":"crossref","first-page":"2278","DOI":"10.1109\/5.726791","volume":"86","author":"Y LeCun","year":"1998","unstructured":"LeCun Y, Bottou L, Bengio Y, Haffner P (1998) Gradient-based learning applied to document recognition. Proc IEEE 86(11):2278\u20132324","journal-title":"Proc IEEE"},{"issue":"3","key":"9448_CR77","doi-asserted-by":"crossref","first-page":"358","DOI":"10.1109\/TMM.2003.814792","volume":"5","author":"HY Lee","year":"2003","unstructured":"Lee HY, Lee HK, Ha YH (2003) Spatial color descriptor for image retrieval and video segmentation. IEEE Trans Multimedia 5(3):358\u2013367","journal-title":"IEEE Trans Multimedia"},{"issue":"1","key":"9448_CR78","doi-asserted-by":"crossref","first-page":"27","DOI":"10.1007\/s10462-011-9278-y","volume":"40","author":"KW Lee","year":"2013","unstructured":"Lee KW, Choo H (2013) A critical review of selective attention: an interdisciplinary perspective. Artif Intell Rev 40(1):27\u201350","journal-title":"Artif Intell Rev"},{"issue":"7","key":"9448_CR79","doi-asserted-by":"crossref","first-page":"1434","DOI":"10.1364\/JOSAA.20.001434","volume":"20","author":"TS Lee","year":"2003","unstructured":"Lee TS, Mumford D (2003) Hierarchical Bayesian inference in the visual cortex. J Opt Soc Am 20(7):1434\u20131448","journal-title":"J Opt Soc Am"},{"key":"9448_CR80","unstructured":"Leibe B, Leonardis A, Schiele B (2004) Combined object categorization and segmentation with an implicit shape model. In: Proceedings of European conference on computer vision workshop, pp 17\u201332"},{"key":"9448_CR81","doi-asserted-by":"crossref","unstructured":"Leutenegger S, Chli M, Siegwart RY (2011) BRISK: binary robust invariant scalable keypoints. In: Proceedings of IEEE international conference on computer vision, pp 2548\u20132555","DOI":"10.1109\/ICCV.2011.6126542"},{"key":"9448_CR82","doi-asserted-by":"crossref","unstructured":"Li L, Fei-Fei L (2007) What, where and who? Classifying events by scene and object recognition. In: Proceedings of IEEE international conference on computer vision, pp 1\u20138","DOI":"10.1109\/ICCV.2007.4408872"},{"key":"9448_CR83","unstructured":"Li L, Su H, Lim Y, Fei-Fei L (2010) Object bank: a high-level image representation for scene classification and semantic feature sparsification. In: Lafferty J, Williams C, Shawe-Taylor J, Zemel R, Culotta A (eds) Advances in neural information processing systems 23, Curran Associates, Inc., pp 1378\u20131386"},{"key":"9448_CR84","doi-asserted-by":"crossref","unstructured":"Li T, Zhu S, Ogihara M (2003) Using discriminant analysis for multi-class classification. In: Proceedings of IEEE international conference on data mining, pp 589\u2013592","DOI":"10.1109\/ICDM.2003.1250984"},{"issue":"4","key":"9448_CR85","doi-asserted-by":"crossref","first-page":"2130","DOI":"10.1109\/TIP.2011.2173697","volume":"21","author":"Z Li","year":"2012","unstructured":"Li Z, Liu G, Yang Y, You J (2012) Scale- and rotation-invariant local binary pattern using scale-adaptive texton and subuniform-based circular shift. IEEE Trans Image Process 21(4):2130\u20132140","journal-title":"IEEE Trans Image Process"},{"key":"9448_CR86","doi-asserted-by":"crossref","unstructured":"Linsley D, MacEvoy SP (2014) Evidence for participation by object-selective visual cortex in scene category judgments. J Vis 14(9):1\u201317","DOI":"10.1167\/14.9.19"},{"issue":"5","key":"9448_CR87","doi-asserted-by":"crossref","first-page":"978","DOI":"10.1109\/TPAMI.2010.147","volume":"33","author":"C Liu","year":"2011","unstructured":"Liu C, Yuen J, Torralba A (2011) Sift flow: dense correspondence across scenes and its applications. IEEE Trans Pattern Anal Mach Intell 33(5):978\u2013994","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"1","key":"9448_CR88","doi-asserted-by":"crossref","first-page":"188","DOI":"10.1016\/j.patcog.2012.06.001","volume":"46","author":"GH Liu","year":"2013","unstructured":"Liu GH, Yang JY (2013) Content-based image retrieval using color difference histogram. Pattern Recogn 46(1):188\u2013198","journal-title":"Pattern Recogn"},{"issue":"6","key":"9448_CR89","doi-asserted-by":"crossref","first-page":"1431","DOI":"10.1037\/0096-1523.33.6.1431","volume":"33","author":"LC Loschky","year":"2007","unstructured":"Loschky LC, Sethi A, Simons DJ, Pydimarri TN, Ochs D, Corbeille JL (2007) The importance of information localization in scene gist recognition. J Exp Psychol Hum Percept Perform 33(6):1431\u20131450","journal-title":"J Exp Psychol Hum Percept Perform"},{"issue":"2","key":"9448_CR90","doi-asserted-by":"crossref","first-page":"91","DOI":"10.1023\/B:VISI.0000029664.99615.94","volume":"60","author":"DG Lowe","year":"2004","unstructured":"Lowe DG (2004) Distinctive image features from scale-invariant keypoints. Int J Comput Vis 60(2):91\u2013110","journal-title":"Int J Comput Vis"},{"issue":"8","key":"9448_CR91","doi-asserted-by":"crossref","first-page":"1873","DOI":"10.1109\/TIP.2009.2019934","volume":"18","author":"E Maggio","year":"2009","unstructured":"Maggio E, Cavallaro A (2009) Learning scene context for multiple object tracking. IEEE Trans Image Process 18(8):1873\u20131884","journal-title":"IEEE Trans Image Process"},{"key":"9448_CR92","doi-asserted-by":"crossref","unstructured":"Maji S, Berg AC, Malik J (2008) Classification using intersection kernel support vector machines is efficient. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 1\u20138","DOI":"10.1109\/CVPR.2008.4587630"},{"key":"9448_CR93","doi-asserted-by":"crossref","unstructured":"Malcolm GL, Nuthmann A, Schyns PG (2014) Beyond gist: strategic and incremental information accumulation for scene categorization. Psychol Sci 25(5):1087\u20131097","DOI":"10.1177\/0956797614522816"},{"issue":"6","key":"9448_CR94","doi-asserted-by":"crossref","first-page":"1517","DOI":"10.1109\/TIM.2004.834070","volume":"53","author":"A Malhi","year":"2004","unstructured":"Malhi A, Gao RX (2004) PCA-based feature selection scheme for machine defect classification. IEEE Trans Instrum Meas 53(6):1517\u20131525","journal-title":"IEEE Trans Instrum Meas"},{"issue":"1","key":"9448_CR95","doi-asserted-by":"crossref","first-page":"373","DOI":"10.1016\/j.patcog.2011.06.012","volume":"45","author":"X Meng","year":"2012","unstructured":"Meng X, Wang Z, Wu L (2012) Building global image features for scene recognition. Pattern Recogn 45(1):373\u2013380","journal-title":"Pattern Recogn"},{"issue":"10","key":"9448_CR96","doi-asserted-by":"crossref","first-page":"1615","DOI":"10.1109\/TPAMI.2005.188","volume":"27","author":"K Mikolajczyk","year":"2005","unstructured":"Mikolajczyk K, Schmid C (2005) A performance evaluation of local descriptors. IEEE Trans Pattern Anal Mach Intell 27(10):1615\u20131630","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR97","doi-asserted-by":"crossref","unstructured":"Morikawa S, Shibata T (2012) Scene image recognition based on the sequence of local image vectors represented by oriented edges. In: Proceedings of IEEE international conference on acoustics, speech, and signal processing, pp 1313\u20131316","DOI":"10.1109\/ICASSP.2012.6288131"},{"key":"9448_CR98","doi-asserted-by":"crossref","unstructured":"Mutch J, Lowe DG (2006) Multiclass object recognition with sparse, localized features. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 11\u201318","DOI":"10.1109\/CVPR.2006.200"},{"key":"9448_CR99","unstructured":"Ng JYH, Hausknecht M, Vijayanarasimhan S, Vinyals O, Monga R, Toderici G (2015) Beyond short snippets: deep networks for video classification. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 4694\u20134702"},{"issue":"1","key":"9448_CR100","doi-asserted-by":"crossref","first-page":"51","DOI":"10.1016\/0031-3203(95)00067-4","volume":"29","author":"T Ojala","year":"1996","unstructured":"Ojala T, Pietikainen M, Harwood D (1996) A comparative study of texture measures with classification based on featured distributions. Pattern Recognit 29(1):51\u201359","journal-title":"Pattern Recognit"},{"issue":"7","key":"9448_CR101","doi-asserted-by":"crossref","first-page":"971","DOI":"10.1109\/TPAMI.2002.1017623","volume":"24","author":"T Ojala","year":"2002","unstructured":"Ojala T, Pietikainen M, Maenpaa T (2002a) Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. IEEE Trans Pattern Anal Mach Intell 24(7):971\u2013987","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"7","key":"9448_CR102","doi-asserted-by":"crossref","first-page":"971","DOI":"10.1109\/TPAMI.2002.1017623","volume":"24","author":"T Ojala","year":"2002","unstructured":"Ojala T, Pietikainen M, Maenpaa T (2002b) Multiresolution grayscale and rotation invariant texture classification with local binary patterns. IEEE Trans Pattern Anal Mach Intell 24(7):971\u2013987","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR103","doi-asserted-by":"crossref","first-page":"176","DOI":"10.1006\/cogp.1999.0728","volume":"41","author":"A Oliva","year":"2000","unstructured":"Oliva A (2000) Diagnostic colors mediate scene recognition. Cogn Psychol 41:176\u2013210","journal-title":"Cogn Psychol"},{"issue":"3","key":"9448_CR104","doi-asserted-by":"crossref","first-page":"145","DOI":"10.1023\/A:1011139631724","volume":"42","author":"A Oliva","year":"2001","unstructured":"Oliva A, Torralba A (2001) Modeling the shape of the scene: a holistic representation of the spatial envelope. Int J Comput Vis 42(3):145\u2013175","journal-title":"Int J Comput Vis"},{"key":"9448_CR105","doi-asserted-by":"crossref","unstructured":"Pavlopoulou C, Yu SX (2010) Indoor\u2013outdoor classification with human accuracies: Image or edge gist? In: Proceedings of IEEE conference on computer vision and pattern recognition workshops, pp 41\u201347","DOI":"10.1109\/CVPRW.2010.5543428"},{"issue":"6","key":"9448_CR106","doi-asserted-by":"crossref","first-page":"927","DOI":"10.1016\/j.imavis.2009.11.007","volume":"28","author":"A Perina","year":"2010","unstructured":"Perina A, Cristani M, Murino V (2010) Learning natural scene categories by selective multi-scale feature extraction. Image Vis Comput 28(6):927\u2013939","journal-title":"Image Vis Comput"},{"key":"9448_CR107","doi-asserted-by":"crossref","unstructured":"Perronnin F, Liu Y, Sanchez J, Poirier H (2010) Large-scale image retrieval with compressed fisher vectors. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 3384\u20133391","DOI":"10.1109\/CVPR.2010.5540009"},{"key":"9448_CR108","doi-asserted-by":"crossref","unstructured":"Peters RJ, Itti L (2007) Beyond bottom-up: Incorporating task-dependent influences into a computational model of spatial attention. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 1\u20138","DOI":"10.1109\/CVPR.2007.383337"},{"issue":"10","key":"9448_CR109","doi-asserted-by":"crossref","first-page":"1090","DOI":"10.1109\/34.879790","volume":"22","author":"PJ Phillips","year":"2000","unstructured":"Phillips PJ, Hyeonjoon M, Rizvi SA, Rauss PJ (2000) The FERET evaluation methodology for face-recognition algorithms. IEEE Trans Pattern Anal Mach Intell 22(10):1090\u20131104","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"4180","key":"9448_CR110","doi-asserted-by":"crossref","first-page":"965","DOI":"10.1126\/science.1145183","volume":"187","author":"MC Potter","year":"1975","unstructured":"Potter MC (1975) Meaning in visual search. Science 187(4180):965\u2013966","journal-title":"Science"},{"issue":"1011","key":"9448_CR111","doi-asserted-by":"crossref","first-page":"2502","DOI":"10.1016\/j.patcog.2011.03.029","volume":"44","author":"X Qian","year":"2011","unstructured":"Qian X, Hua XS, Chen P, Ke L (2011) PLBP: an effective local binary patterns texture descriptor with pyramid representation. Pattern Recognit 44(1011):2502\u20132515","journal-title":"Pattern Recognit"},{"issue":"5","key":"9448_CR112","doi-asserted-by":"crossref","first-page":"1874","DOI":"10.1016\/j.patcog.2009.11.009","volume":"43","author":"J Qin","year":"2010","unstructured":"Qin J, Yung NHC (2010) Scene categorization via contextual visual words. Pattern Recognit 43(5):1874\u20131888","journal-title":"Pattern Recognit"},{"key":"9448_CR113","doi-asserted-by":"crossref","unstructured":"Quattoni A, Torralba A (2009) Recognizing indoor scenes. In: IEEE conference on computer vision and pattern recognition, pp 413\u2013420","DOI":"10.1109\/CVPR.2009.5206537"},{"key":"9448_CR114","doi-asserted-by":"crossref","unstructured":"Quelhas P, Monay F, Odobez JM, Gatica-Perez D, Tuytelaars T, Van\u00a0Gool L (2005) Modeling scenes with local descriptors and latent aspects. In: Proceedings of IEEE international conference on computer vision, pp 883\u2013890","DOI":"10.1109\/ICCV.2005.152"},{"key":"9448_CR115","doi-asserted-by":"crossref","first-page":"2301","DOI":"10.1016\/j.visres.2004.04.006","volume":"44","author":"LW Renninger","year":"2003","unstructured":"Renninger LW, Malik J (2003) When is scene recognition just texture recognition? Vis Res 44:2301\u20132311","journal-title":"Vis Res"},{"key":"9448_CR116","doi-asserted-by":"crossref","first-page":"1019","DOI":"10.1038\/14819","volume":"2","author":"M Riesenhuber","year":"1999","unstructured":"Riesenhuber M, Poggio T (1999) Hierarchical models of object recognition in cortex. Nat Neurosci 2:1019\u20131025","journal-title":"Nat Neurosci"},{"issue":"1","key":"9448_CR117","doi-asserted-by":"crossref","first-page":"157","DOI":"10.1007\/s11263-007-0090-8","volume":"77","author":"BC Russell","year":"2008","unstructured":"Russell BC, Torralba A, Murphy KP, Freeman WT (2008) LabelMe: a database and web-based tool for image annotation. Int J Comput Vis 77(1):157\u2013173","journal-title":"Int J Comput Vis"},{"key":"9448_CR118","doi-asserted-by":"crossref","unstructured":"Rybski P, Huber D, Morris D, Hoffman R (2010) Visual classification of coarse vehicle orientation using histogram of oriented gradients features. In: Proceedings of IEEE intelligent vehicles symposium, pp 921\u2013928","DOI":"10.1109\/IVS.2010.5547996"},{"issue":"3","key":"9448_CR119","doi-asserted-by":"crossref","first-page":"317","DOI":"10.1023\/A:1009752403260","volume":"1","author":"SL Salzberg","year":"1997","unstructured":"Salzberg SL (1997) On comparing classifiers: pitfalls to avoid and a recommended approach. Data Min Knowl Disc 1(3):317\u2013328","journal-title":"Data Min Knowl Disc"},{"issue":"3","key":"9448_CR120","doi-asserted-by":"crossref","first-page":"222","DOI":"10.1007\/s11263-013-0636-x","volume":"105","author":"J Sanchez","year":"2013","unstructured":"Sanchez J, Perronnin F, Mensink T, Verbeek J (2013) Image classification with the fisher vector: theory and practice. Int J Comput Vis 105(3):222\u2013245","journal-title":"Int J Comput Vis"},{"key":"9448_CR121","doi-asserted-by":"crossref","unstructured":"Schauerte B, Kuhn B, Kroschel K, Stiefelhagen R (2011) Multimodal saliency-based attention for object-based scene analysis. In: Proceedings of IEEE\/RSJ international conference on intelligent robots and systems, pp 1173\u20131179","DOI":"10.1109\/IROS.2011.6095124"},{"issue":"11","key":"9448_CR122","first-page":"2758","volume":"45","author":"B Scholkopf","year":"1997","unstructured":"Scholkopf B, Sung KK, Burges CJC, Girosi F, Niyogi P, Poggio T, Vapnik V (1997) Comparing support vector machines with Gaussian kernels to radial basis function classifiers. Comput Vis Image Underst 45(11):2758\u20132765","journal-title":"Comput Vis Image Underst"},{"issue":"5","key":"9448_CR123","doi-asserted-by":"crossref","first-page":"1299","DOI":"10.1162\/089976698300017467","volume":"10","author":"B Scholkopf","year":"1998","unstructured":"Scholkopf B, Smola A, Muller KR (1998) Nonlinear component analysis as a kernel eigenvalue problem. Neural Comput 10(5):1299\u20131319","journal-title":"Neural Comput"},{"key":"9448_CR124","unstructured":"Sermanet P, Eigen D, Zhang X, Mathieu M, Fergus R, LeCun Y (2014) OverFeat: integrated recognition, localization and detection using convolutional networks. In: Proceedings of international conference on learning representations, pp 1\u201315"},{"issue":"9","key":"9448_CR125","doi-asserted-by":"crossref","first-page":"1773","DOI":"10.1016\/j.patcog.2004.03.003","volume":"37","author":"N Serrano","year":"2004","unstructured":"Serrano N, Savakis A, Luo J (2004) Improved scene classification using efficient low-level features and semantic cues. Pattern Recognit 37(9):1773\u20131784","journal-title":"Pattern Recognit"},{"key":"9448_CR126","doi-asserted-by":"crossref","unstructured":"Serre T, Riesenhuber M (2004) Realistic modeling of simple and complex cell tuning in the hmax model, and implications for invariant object recognition in cortex. Tech. rep., Massachusetts Institute of Technology","DOI":"10.21236\/ADA459692"},{"key":"9448_CR127","doi-asserted-by":"crossref","unstructured":"Serre T, Wolf L, Poggio T (2005) Object recognition with features inspired by visual cortex. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 994\u20131000","DOI":"10.1109\/CVPR.2005.254"},{"issue":"3","key":"9448_CR128","doi-asserted-by":"crossref","first-page":"411","DOI":"10.1109\/TPAMI.2007.56","volume":"29","author":"T Serre","year":"2007","unstructured":"Serre T, Wolf L, Bileschi S, Riesenhuber M, Poggio T (2007) Robust object recognition with cortex-like mechanisms. IEEE Trans Pattern Anal Mach Intell 29(3):411\u2013426","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR129","doi-asserted-by":"crossref","unstructured":"Shroff N, Turaga P, Chellappa R (2010) Moving vistas: exploiting motion for describing scenes. In: Proceedings of IEEE international conference on computer vision and pattern recognition, pp 1911\u20131918","DOI":"10.1109\/CVPR.2010.5539864"},{"key":"9448_CR130","doi-asserted-by":"crossref","unstructured":"Siagian C, Itti L (2007) Biologically-inspired robotics vision Monte-Carlo localization in the outdoor environment. In: Proceedings of IEEE-RSJ international conference on intelligent robots and systems, pp 1723\u20131730","DOI":"10.1109\/IROS.2007.4399349"},{"key":"9448_CR131","volume-title":"Basic vision: an introduction to visual perception","author":"R Snowden","year":"2004","unstructured":"Snowden R, Thompson P, Troscianko T (2004) Basic vision: an introduction to visual perception. Oxford University Press, New York"},{"issue":"1","key":"9448_CR132","doi-asserted-by":"crossref","first-page":"174","DOI":"10.1109\/TIP.2009.2032939","volume":"19","author":"D Song","year":"2010","unstructured":"Song D, Tao D (2010) Biologically inspired feature manifold for scene classification. IEEE Trans Image Process 19(1):174\u2013184","journal-title":"IEEE Trans Image Process"},{"key":"9448_CR133","unstructured":"Song YJ, Park WB, Kim DW, Ahn JH (2004) Content-based image retrieval using new color histogram. In: Proceedings of international symposium on intelligent signal processing and communication systems, pp 609\u2013611"},{"key":"9448_CR134","doi-asserted-by":"crossref","unstructured":"Stricker M, Orengo M (1995) Similarity of color images. In: Proceedings of storage and retrieval for image and video databases, pp 381\u2013392","DOI":"10.1117\/12.205308"},{"key":"9448_CR135","doi-asserted-by":"crossref","unstructured":"Sun M, Huang W, Savarese S (2013) Find the best path: an efficient and accurate classifier for image hierarchies. In: Proceedings of IEEE international conference on computer vision, pp 265\u2013272","DOI":"10.1109\/ICCV.2013.40"},{"issue":"1","key":"9448_CR136","doi-asserted-by":"crossref","first-page":"11","DOI":"10.1007\/BF00130487","volume":"7","author":"MJ Swain","year":"1991","unstructured":"Swain MJ, Ballard DH (1991) Color indexing. Int J Comput Vis 7(1):11\u201332","journal-title":"Int J Comput Vis"},{"key":"9448_CR137","volume-title":"Machine learning: a Bayesian and optimization perspective","author":"S Theodoridis","year":"2015","unstructured":"Theodoridis S (2015) Machine learning: a Bayesian and optimization perspective. Academic Press, London"},{"key":"9448_CR138","doi-asserted-by":"crossref","unstructured":"Torralba A, Murphy KP, Freeman WT (2004) Sharing features: efficient boosting procedures for multiclass object detection. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 762\u2013769","DOI":"10.1109\/CVPR.2004.1315241"},{"issue":"4","key":"9448_CR139","doi-asserted-by":"crossref","first-page":"766","DOI":"10.1037\/0033-295X.113.4.766","volume":"113","author":"A Torralba","year":"2006","unstructured":"Torralba A, Oliva A, Castelhano M, Henderson J (2006) Contextual guidance of eye movements and attention in real-world scenes: the role of global features in object search. Psychol Rev 113(4):766\u2013786","journal-title":"Psychol Rev"},{"issue":"9","key":"9448_CR140","doi-asserted-by":"crossref","first-page":"1582","DOI":"10.1109\/TPAMI.2009.154","volume":"32","author":"KEA Sande Van de","year":"2010","unstructured":"Van de Sande KEA, Gevers T, Snoek CGM (2010) Evaluating color descriptors for object and scene recognition. IEEE Trans Pattern Anal Mach Intell 32(9):1582\u20131596","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR141","doi-asserted-by":"crossref","unstructured":"Viola P, Jones M (2001) Rapid object detection using a boosted cascade of simple features. In: Proceedings of IEEE Computer Society conference on computer vision and pattern recognition, pp 511\u2013518","DOI":"10.1109\/CVPR.2001.990517"},{"issue":"2","key":"9448_CR142","doi-asserted-by":"crossref","first-page":"137","DOI":"10.1023\/B:VISI.0000013087.49260.fb","volume":"57","author":"P Viola","year":"2004","unstructured":"Viola P, Jones M (2004) Robust real-time face detection. Int J Comput Vis 57(2):137\u2013154","journal-title":"Int J Comput Vis"},{"issue":"3","key":"9448_CR143","doi-asserted-by":"crossref","first-page":"19","DOI":"10.1145\/1278387.1278393","volume":"4","author":"J Vogel","year":"2007","unstructured":"Vogel J, Schwaninger A, Wallraven C, B\u00fclthoff HH (2007) Categorization of natural scenes: local versus global information. ACM Trans Appl Percept 4(3):19","journal-title":"ACM Trans Appl Percept"},{"issue":"6","key":"9448_CR144","doi-asserted-by":"crossref","first-page":"96","DOI":"10.1109\/MC.2006.196","volume":"39","author":"L Ahn Von","year":"2006","unstructured":"Von Ahn L (2006) Games with a purpose. Computer 39(6):96\u201398","journal-title":"Computer"},{"issue":"23","key":"9448_CR145","doi-asserted-by":"crossref","first-page":"9661","DOI":"10.1073\/pnas.1015666108","volume":"108","author":"DB Walther","year":"2011","unstructured":"Walther DB, Chai B, Caddigan E, Beck DM, Fei-Fei L (2011) Simple line drawings suffice for functional MRI decoding of natural scene categories. Proc Nat Acad Sci 108(23):9661\u20139666","journal-title":"Proc Nat Acad Sci"},{"key":"9448_CR146","doi-asserted-by":"crossref","unstructured":"Wang J, Yang J, Yu K, Lv F, Huang T, Gong Y (2010) Locality-constrained linear coding for image classification. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 3360\u20133367","DOI":"10.1109\/CVPR.2010.5540018"},{"issue":"2","key":"9448_CR147","doi-asserted-by":"crossref","first-page":"109","DOI":"10.1007\/s10462-010-9162-1","volume":"34","author":"L Wei","year":"2010","unstructured":"Wei L, Sang N, Wang Y (2010) A biologically inspired object-based visual attention model. Artif Intell Rev 34(2):109\u2013119","journal-title":"Artif Intell Rev"},{"issue":"8","key":"9448_CR148","doi-asserted-by":"crossref","first-page":"1489","DOI":"10.1109\/TPAMI.2010.224","volume":"33","author":"J Wu","year":"2011","unstructured":"Wu J, Rehg JM (2011) CENTRIST: a visual descriptor for scene categorization. IEEE Trans Pattern Anal Mach Intell 33(8):1489\u20131501","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9448_CR149","doi-asserted-by":"crossref","unstructured":"Xiao J, Ehinger KA, Hays J, Torralba A, Oliva A (2014a) SUN database: exploring a large collection of scene categories. Int J Comput Vis 1\u201320","DOI":"10.1007\/s11263-014-0748-y"},{"issue":"2","key":"9448_CR150","doi-asserted-by":"crossref","first-page":"823","DOI":"10.1109\/TIP.2013.2295756","volume":"23","author":"Y Xiao","year":"2014","unstructured":"Xiao Y, Wu J, Yuan J (2014b) mCENTRIST: a multi-channel feature generation mechanism for scene categorization. IEEE Trans Image Process 23(2):823\u2013836","journal-title":"IEEE Trans Image Process"},{"issue":"9","key":"9448_CR151","doi-asserted-by":"crossref","first-page":"2481","DOI":"10.1109\/TIP.2006.877435","volume":"15","author":"X Xie","year":"2006","unstructured":"Xie X, Lam KM (2006) Gabor-based kernel PCA with doubly nonlinear mapping for face recognition with a single face image. IEEE Trans Image Process 15(9):2481\u20132492","journal-title":"IEEE Trans Image Process"},{"key":"9448_CR152","unstructured":"Yahoo (2004) Flickr. https:\/\/www.flickr.com\/"},{"key":"9448_CR153","unstructured":"Yang J, Yu K, Gong Y, Huang T (2009) Linear spatial pyramid matching using sparse coding for image classification. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 1794\u20131801"},{"key":"9448_CR154","doi-asserted-by":"crossref","unstructured":"Yang JL, Li HX (2010) PCA based sequential feature space learning for gene selection. In: Proceedings of international conference on machine learning and cybernetics, pp 3079\u20133084","DOI":"10.1109\/ICMLC.2010.5580720"},{"key":"9448_CR155","unstructured":"Yao J, Fidler S, Urtasun R (2012) Describing the scene as a whole: joint object detection, scene classification and semantic segmentation. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 702\u2013709"},{"key":"9448_CR156","unstructured":"Yu K, Zhang T, Gong Y (2009a) Nonlinear learning using local coordinate coding. In: Bengio Y, Schuurmans D, Lafferty J, Williams C, Culotta A (eds) Advances in neural information processing systems 22, Curran Associates, Inc., pp 2223\u20132231"},{"key":"9448_CR157","doi-asserted-by":"crossref","unstructured":"Yu Y, Mann GKI, Gosine RG (2009b) A novel robotic visual perception method using object-based attention. In: Proceedings of IEEE international conference on robotics and biomimetics, pp 1467\u20131473","DOI":"10.1109\/ROBIO.2009.5420944"},{"key":"9448_CR158","doi-asserted-by":"crossref","unstructured":"Zhang H, Berg AC, Maire M, Malik J (2006) SVM-KNN: discriminative nearest neighbor classification for visual category recognition. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 2126\u20132136","DOI":"10.1109\/CVPR.2006.301"},{"issue":"8","key":"9448_CR159","doi-asserted-by":"crossref","first-page":"1622","DOI":"10.1109\/TNNLS.2014.2347398","volume":"26","author":"L Zhang","year":"2015","unstructured":"Zhang L, Ji R, Xia Y, Zhang Y, Li X (2015) Learning a probabilistic topology discovering model for scene categorization. IEEE Trans Neural Netw Learn Syst 26(8):1622\u20131634","journal-title":"IEEE Trans Neural Netw Learn Syst"},{"key":"9448_CR160","doi-asserted-by":"crossref","unstructured":"Zhang Z, Li M, Huang K, Tan T (2008) Robust automated ground plane rectification based on moving vehicles for traffic scene surveillance. In: Proceedings of IEEE international conference on image processing, pp 1364\u20131367","DOI":"10.1109\/ICIP.2008.4712017"},{"key":"9448_CR161","doi-asserted-by":"crossref","unstructured":"Zhao B, Xing E (2014) Hierarchical feature hashing for fast dimensionality reduction. In: Proceedings of IEEE conference on computer vision and pattern recognition, pp 2051\u20132058","DOI":"10.1109\/CVPR.2014.263"},{"key":"9448_CR162","doi-asserted-by":"crossref","unstructured":"Zheng Y, Shen C, Hartley R, Huang X (2011) Pyramid center-symmetric local binary\/trinary patterns for effective pedestrian detection. In: Proceedings of Asian conference on computer vision, pp 281\u2013292","DOI":"10.1007\/978-3-642-19282-1_23"},{"key":"9448_CR163","unstructured":"Zhou B, Lapedriza A, Xiao J, Torralba A, Oliva A (2014) Learning deep features for scene recognition using Places database. In: Ghahramani Z, Welling M, Cortes C, Lawrence N, Weinberger K (eds) Advances in neural information processing systems 27, Curran Associates, Inc., pp 487\u2013495"},{"key":"9448_CR164","doi-asserted-by":"crossref","unstructured":"Zhou H, Hermans T, Karandikar AV, Rehg JM (2010) Movie genre classification via scene categorization. In: Proceedings of the international conference on multimedia, pp 747\u2013750","DOI":"10.1145\/1873951.1874068"}],"container-title":["Artificial Intelligence Review"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10462-015-9448-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s10462-015-9448-4\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10462-015-9448-4","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,9,1]],"date-time":"2019-09-01T12:29:29Z","timestamp":1567340969000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s10462-015-9448-4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2015,11,17]]},"references-count":164,"journal-issue":{"issue":"3","published-print":{"date-parts":[[2016,3]]}},"alternative-id":["9448"],"URL":"https:\/\/doi.org\/10.1007\/s10462-015-9448-4","relation":{},"ISSN":["0269-2821","1573-7462"],"issn-type":[{"value":"0269-2821","type":"print"},{"value":"1573-7462","type":"electronic"}],"subject":[],"published":{"date-parts":[[2015,11,17]]}}}