{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,17]],"date-time":"2026-03-17T08:42:31Z","timestamp":1773736951641,"version":"3.50.1"},"reference-count":83,"publisher":"Springer Science and Business Media LLC","issue":"4","license":[{"start":{"date-parts":[[2020,6,26]],"date-time":"2020-06-26T00:00:00Z","timestamp":1593129600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0"},{"start":{"date-parts":[[2020,6,26]],"date-time":"2020-06-26T00:00:00Z","timestamp":1593129600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["J Sign Process Syst"],"published-print":{"date-parts":[[2021,4]]},"abstract":"<jats:title>Abstract<\/jats:title><jats:p>This paper studies vehicle attribute recognition by appearance. In the literature, image-based target recognition has been extensively investigated in many use cases, such as facial recognition, but less so in the field of vehicle attribute recognition. We survey a number of algorithms that identify vehicle properties ranging from coarse-grained level (vehicle type) to fine-grained level (vehicle make and model). Moreover, we discuss two alternative approaches for these tasks, including straightforward classification and a more flexible metric learning method. Furthermore, we design a simulated real-world scenario for vehicle attribute recognition and present an experimental comparison of the two approaches.<\/jats:p>","DOI":"10.1007\/s11265-020-01567-6","type":"journal-article","created":{"date-parts":[[2020,6,26]],"date-time":"2020-06-26T02:02:31Z","timestamp":1593136951000},"page":"357-368","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":21,"title":["Vehicle Attribute Recognition by Appearance: Computer Vision Methods for Vehicle Type, Make and Model Classification"],"prefix":"10.1007","volume":"93","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-6438-5179","authenticated-orcid":false,"given":"Xingyang","family":"Ni","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Heikki","family":"Huttunen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2020,6,26]]},"reference":[{"issue":"8","key":"1567_CR1","doi-asserted-by":"publisher","first-page":"1134","DOI":"10.1016\/j.imavis.2008.10.012","volume":"27","author":"V Abolghasemi","year":"2009","unstructured":"Abolghasemi, V., & Ahmadyfard, A. (2009). An edge-based color-aided method for license plate detection. Image and Vision Computing, 27(8), 1134\u20131142.","journal-title":"Image and Vision Computing"},{"issue":"3","key":"1567_CR2","doi-asserted-by":"publisher","first-page":"393","DOI":"10.1007\/s00138-017-0890-y","volume":"29","author":"S Bai","year":"2018","unstructured":"Bai, S., Liu, Z., & Yao, C. (2018). Classify vehicles in traffic scene images with deformable part-based models. Machine Vision and Applications, 29(3), 393\u2013403.","journal-title":"Machine Vision and Applications"},{"issue":"1","key":"1567_CR3","first-page":"281","volume":"13","author":"J Bergstra","year":"2012","unstructured":"Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization. The Journal of Machine Learning Research, 13(1), 281\u2013305.","journal-title":"The Journal of Machine Learning Research"},{"key":"1567_CR4","unstructured":"Cheng, Y., Wang, D., Zhou, P., & Zhang, T. (2017). A survey of model compression and acceleration for deep neural networks. arXiv:1710.09282."},{"key":"1567_CR5","doi-asserted-by":"crossref","unstructured":"Clady, X., Negri, P., Milgram, M., & Poulenard, R. (2008). Multi-class vehicle type recognition system. In IAPR workshop on artificial neural networks in pattern recognition (pp. 228\u2013239): Springer.","DOI":"10.1007\/978-3-540-69939-2_22"},{"issue":"3","key":"1567_CR6","first-page":"273","volume":"20","author":"C Cortes","year":"1995","unstructured":"Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine Learning, 20(3), 273\u2013297.","journal-title":"Machine Learning"},{"key":"1567_CR7","unstructured":"Dalal, N., & Triggs, B. (2005). Histograms of oriented gradients for human detection. In IEEE computer society conference on computer vision and pattern recognition, 2005. CVPR 2005, (Vol. 1 pp. 886\u2013893): IEEE."},{"issue":"8","key":"1567_CR8","doi-asserted-by":"publisher","first-page":"771","DOI":"10.4304\/jcp.4.8.771-777","volume":"4","author":"K Deb","year":"2009","unstructured":"Deb, K., Chae, H.U., & Jo, K.H. (2009). Vehicle license plate detection method based on sliding concentric windows and histogram. Journal of Computers, 4(8), 771\u2013777.","journal-title":"Journal of Computers"},{"key":"1567_CR9","doi-asserted-by":"crossref","unstructured":"Deng, J., Dong, W., Socher, R., Li, L.J., Li, K., & Fei-Fei, L. (2009). Imagenet: a large-scale hierarchical image database. In IEEE conference on computer vision and pattern recognition (pp. 248\u2013255): IEEE.","DOI":"10.1109\/CVPR.2009.5206848"},{"key":"1567_CR10","doi-asserted-by":"crossref","unstructured":"Deng, J., Guo, J., Xue, N., & Zafeiriou, S. (2019). Arcface: additive angular margin loss for deep face recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4690\u20134699).","DOI":"10.1109\/CVPR.2019.00482"},{"key":"1567_CR11","doi-asserted-by":"crossref","unstructured":"Deng, J., Krause, J., & Fei-Fei, L. (2013). Fine-grained crowdsourcing for fine-grained recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 580\u2013587).","DOI":"10.1109\/CVPR.2013.81"},{"key":"1567_CR12","doi-asserted-by":"crossref","unstructured":"Dong, Z., & Jia, Y. (2013). Vehicle type classification using distributions of structural and appearance-based features. In 2013 IEEE international conference on image processing (pp. 4321\u20134324): IEEE.","DOI":"10.1109\/ICIP.2013.6738890"},{"issue":"4","key":"1567_CR13","doi-asserted-by":"publisher","first-page":"2247","DOI":"10.1109\/TITS.2015.2402438","volume":"16","author":"Z Dong","year":"2015","unstructured":"Dong, Z., Wu, Y., Pei, M., & Jia, Y. (2015). Vehicle type classification using a semi-supervised convolutional neural network. IEEE Transactions on Intelligent Transportation Systems, 16(4), 2247\u20132256.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"issue":"9","key":"1567_CR14","doi-asserted-by":"publisher","first-page":"1627","DOI":"10.1109\/TPAMI.2009.167","volume":"32","author":"PF Felzenszwalb","year":"2009","unstructured":"Felzenszwalb, P.F., Girshick, R.B., McAllester, D., & Ramanan, D. (2009). Object detection with discriminatively trained part-based models. IEEE Transactions on Pattern Analysis and Machine Intelligence, 32(9), 1627\u20131645.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"key":"1567_CR15","volume-title":"Deep Learning with Python","author":"F Chollet","year":"2017","unstructured":"Chollet, F. (2017). Deep Learning with Python, 1st edn. USA: Manning Publications Co.","edition":"1st edn."},{"key":"1567_CR16","doi-asserted-by":"crossref","unstructured":"Fu, J., Zheng, H., & Mei, T. (2017). Look closer to see better: recurrent attention convolutional neural network for fine-grained image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4438\u20134446).","DOI":"10.1109\/CVPR.2017.476"},{"key":"1567_CR17","doi-asserted-by":"crossref","unstructured":"Gao, Y., Beijbom, O., Zhang, N., & Darrell, T. (2016). Compact bilinear pooling. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 317\u2013326).","DOI":"10.1109\/CVPR.2016.41"},{"issue":"11","key":"1567_CR18","doi-asserted-by":"publisher","first-page":"1231","DOI":"10.1177\/0278364913491297","volume":"32","author":"A Geiger","year":"2013","unstructured":"Geiger, A., Lenz, P., Stiller, C., & Urtasun, R. (2013). Vision meets robotics: the kitti dataset. The International Journal of Robotics Research, 32(11), 1231\u20131237.","journal-title":"The International Journal of Robotics Research"},{"key":"1567_CR19","volume-title":"Deep learning","author":"I Goodfellow","year":"2016","unstructured":"Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. Cambridge: MIT Press."},{"key":"1567_CR20","unstructured":"Goyal, P., Doll\u00e1r, P., Girshick, R., Noordhuis, P., Wesolowski, L., Kyrola, A., Tulloch, A., Jia, Y., & He, K. (2017). Accurate, large minibatch SGD: training ImageNet in 1 hour. arXiv:1706.02677."},{"key":"1567_CR21","doi-asserted-by":"crossref","unstructured":"Harris, C.G., & Stephens, M. (1988). A combined corner and edge detector. In Alvey vision conference, (Vol. 15 pp. 10\u20135244): Citeseer.","DOI":"10.5244\/C.2.23"},{"issue":"9","key":"1567_CR22","doi-asserted-by":"publisher","first-page":"1904","DOI":"10.1109\/TPAMI.2015.2389824","volume":"37","author":"K He","year":"2015","unstructured":"He, K., Zhang, X., Ren, S., & Sun, J. (2015). Spatial pyramid pooling in deep convolutional networks for visual recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 37(9), 1904\u20131916.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"key":"1567_CR23","doi-asserted-by":"crossref","unstructured":"He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 770\u2013778).","DOI":"10.1109\/CVPR.2016.90"},{"key":"1567_CR24","unstructured":"Howard, A.G. (2013). Some improvements on deep convolutional neural network based image classification. arXiv:1312.5402."},{"issue":"11","key":"1567_CR25","doi-asserted-by":"publisher","first-page":"3147","DOI":"10.1109\/TITS.2017.2679114","volume":"18","author":"Q Hu","year":"2017","unstructured":"Hu, Q., Wang, H., Li, T., & Shen, C. (2017). Deep CNNs with spatially weighted pooling for fine-grained car recognition. IEEE Transactions on Intelligent Transportation Systems, 18(11), 3147\u20133156.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"key":"1567_CR26","doi-asserted-by":"crossref","unstructured":"Huttunen, H. (2019). Deep neural networks: a signal processing perspective. In Handbook of signal processing systems (pp. 133\u2013163): Springer.","DOI":"10.1007\/978-3-319-91734-4_4"},{"key":"1567_CR27","doi-asserted-by":"crossref","unstructured":"Huttunen, H., Yancheshmeh, F.S., & Chen, K. (2016). Car type recognition with deep neural networks. In 2016 IEEE intelligent vehicles symposium (IV). https:\/\/doi.org\/1109\/IVS.2016.7535529 (pp. 1115\u20131120).","DOI":"10.1109\/IVS.2016.7535529"},{"key":"1567_CR28","unstructured":"Ioffe, S., & Szegedy, C. (2015). Batch normalization: accelerating deep network training by reducing internal covariate shift. arXiv:1502.03167."},{"issue":"1","key":"1567_CR29","doi-asserted-by":"publisher","first-page":"79","DOI":"10.1162\/neco.1991.3.1.79","volume":"3","author":"RA Jacobs","year":"1991","unstructured":"Jacobs, R.A., Jordan, M.I., Nowlan, S.J., & Hinton, G.E. (1991). Adaptive mixtures of local experts. Neural Computation, 3(1), 79\u201387.","journal-title":"Neural Computation"},{"key":"1567_CR30","unstructured":"Jaderberg, M., Simonyan, K., Zisserman, A., & Kavukcuoglu, K. (2015). Spatial transformer networks. In Advances in neural information processing systems (pp. 2017\u20132025)."},{"key":"1567_CR31","doi-asserted-by":"crossref","unstructured":"Jung, H., Choi, M.K., Jung, J., Lee, J.H., Kwon, S., & Young Jung, W. (2017). Resnet-based vehicle classification and localization in traffic surveillance systems. In Proceedings of the IEEE conference on computer vision and pattern recognition workshops (pp. 61\u201367).","DOI":"10.1109\/CVPRW.2017.129"},{"key":"1567_CR32","doi-asserted-by":"crossref","unstructured":"Jung, H., Lee, S., Yim, J., Park, S., & Kim, J. (2015). Joint fine-tuning in deep neural networks for facial expression recognition. In Proceedings of the IEEE international conference on computer vision (pp. 2983\u20132991).","DOI":"10.1109\/ICCV.2015.341"},{"issue":"1","key":"1567_CR33","doi-asserted-by":"publisher","first-page":"100","DOI":"10.1109\/TII.2011.2173203","volume":"8","author":"M Kafai","year":"2012","unstructured":"Kafai, M., & Bhanu, B. (2012). Dynamic bayesian networks for vehicle classification in video. IEEE Transactions on Industrial Informatics, 8(1), 100\u2013109.","journal-title":"IEEE Transactions on Industrial Informatics"},{"key":"1567_CR34","unstructured":"Kar, P., & Karnick, H. (2012). Random feature maps for dot product kernels. In Artificial intelligence and statistics (pp. 583\u2013591)."},{"key":"1567_CR35","unstructured":"Kendall, A., Gal, Y., & Cipolla, R. (2018). Multi-task learning using uncertainty to weigh losses for scene geometry and semantics. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 7482\u20137491)."},{"key":"1567_CR36","doi-asserted-by":"publisher","unstructured":"Khata, M., Shvai, N., Hasnat, A., Llanza, A., Sanogo, A., Meicler, A., & Nakib, A. (2019). Novel context-aware classification for highly accurate automatic toll collection. In 2019 IEEE Intelligent vehicles symposium (IV). https:\/\/doi.org\/10.1109\/IVS.2019.8813866 (pp. 1105\u20131110).","DOI":"10.1109\/IVS.2019.8813866"},{"key":"1567_CR37","doi-asserted-by":"crossref","unstructured":"Kim, P.K., & Lim, K.T. (2017). Vehicle type classification using bagging and convolutional neural network on multi view surveillance image. In Proceedings of the IEEE conference on computer vision and pattern recognition workshops (pp. 41\u201346).","DOI":"10.1109\/CVPRW.2017.126"},{"key":"1567_CR38","doi-asserted-by":"crossref","unstructured":"Krause, J., Jin, H., Yang, J., & Fei-Fei, L. (2015). Fine-grained recognition without part annotations. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 5546\u20135555).","DOI":"10.1109\/CVPR.2015.7299194"},{"key":"1567_CR39","doi-asserted-by":"crossref","unstructured":"Krause, J., Stark, M., Deng, J., & Fei-fei, L. (2013). 3D object representations for fine-grained categorization. In Proceedings of the IEEE international conference on computer vision workshops (pp. 554\u2013561).","DOI":"10.1109\/ICCVW.2013.77"},{"key":"1567_CR40","unstructured":"Krizhevsky, A., Sutskever, I., & Hinton, G.E. (2012). Imagenet classification with deep convolutional neural networks. In Advances in neural information processing systems (pp. 1097\u20131105)."},{"key":"1567_CR41","doi-asserted-by":"crossref","unstructured":"Liao, L., Hu, R., Xiao, J., Wang, Q., Xiao, J., & Chen, J. (2015). Exploiting effects of parts in fine-grained categorization of vehicles. In IEEE international conference on image processing (pp. 745\u2013749): IEEE.","DOI":"10.1109\/ICIP.2015.7350898"},{"key":"1567_CR42","doi-asserted-by":"crossref","unstructured":"Lin, T.Y., Maire, M., Belongie, S., Hays, J., Perona, P., Ramanan, D., Doll\u00e1r, P., & Zitnick, C.L. (2014). Microsoft coco: common objects in context. In European conference on computer vision (pp. 740\u2013755): Springer.","DOI":"10.1007\/978-3-319-10602-1_48"},{"key":"1567_CR43","doi-asserted-by":"crossref","unstructured":"Lin, T.Y., RoyChowdhury, A., & Maji, S. (2015). Bilinear cnn models for fine-grained visual recognition. In Proceedings of the IEEE international conference on computer vision (pp. 1449\u20131457).","DOI":"10.1109\/ICCV.2015.170"},{"key":"1567_CR44","doi-asserted-by":"crossref","unstructured":"Lin, Y.L., Morariu, V.I., Hsu, W., & Davis, L.S. (2014). Jointly optimizing 3D modelv fitting and fine-grained classification. In European conference on computer vision (pp. 466\u2013480): Springer.","DOI":"10.1007\/978-3-319-10593-2_31"},{"key":"1567_CR45","doi-asserted-by":"crossref","unstructured":"Liu, H., Tian, Y., Yang, Y., Pang, L., & Huang, T. (2016). Deep relative distance learning: tell the difference between similar vehicles. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 2167\u20132175).","DOI":"10.1109\/CVPR.2016.238"},{"key":"1567_CR46","unstructured":"Liu, L., Jiang, H., He, P., Chen, W., Liu, X., Gao, J., & Han, J. (2019). On the variance of the adaptive learning rate and beyond. arXiv:1908.03265."},{"key":"1567_CR47","doi-asserted-by":"crossref","unstructured":"Liu, X., Liu, W., Ma, H., & Fu, H. (2016). Large-scale vehicle re-identification in urban surveillance videos. In IEEE international conference on multimedia and expo (pp. 1\u20136): IEEE.","DOI":"10.1109\/ICME.2016.7553002"},{"key":"1567_CR48","doi-asserted-by":"crossref","unstructured":"Lou, Y., Bai, Y., Liu, J., Wang, S., & Duan, L. (2019). VERI-wild: a large dataset and a new method for vehicle re-identification in the wild. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 3235\u20133243).","DOI":"10.1109\/CVPR.2019.00335"},{"key":"1567_CR49","doi-asserted-by":"crossref","unstructured":"Lowe, D.G. (1999). Object recognition from local scale-invariant features. In The proceedings of the seventh IEEE international conference on computer vision, 1999, (Vol. 2 pp. 1150\u20131157): IEEE.","DOI":"10.1109\/ICCV.1999.790410"},{"key":"1567_CR50","doi-asserted-by":"crossref","unstructured":"Luo, H., Gu, Y., Liao, X., Lai, S., & Jiang, W. (2019). Bag of tricks and a strong baseline for deep person re-identification. In Proceedings of the IEEE conference on computer vision and pattern recognition workshops (p. 0).","DOI":"10.1109\/CVPRW.2019.00190"},{"issue":"10","key":"1567_CR51","doi-asserted-by":"publisher","first-page":"5129","DOI":"10.1109\/TIP.2018.2848705","volume":"27","author":"Z Luo","year":"2018","unstructured":"Luo, Z., Branchaud-Charron, F., Lemaire, C., Konrad, J., Li, S., Mishra, A., Achkar, A., Eichel, J., & Jodoin, P.M. (2018). MIO-TCD: a new benchmark dataset for vehicle classification and localization. IEEE Transactions on Image Processing, 27(10), 5129\u20135141.","journal-title":"IEEE Transactions on Image Processing"},{"key":"1567_CR52","doi-asserted-by":"crossref","unstructured":"Oh Song, H., Xiang, Y., Jegelka, S., & Savarese, S. (2016). Deep metric learning via lifted structured feature embedding. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 4004\u20134012).","DOI":"10.1109\/CVPR.2016.434"},{"key":"1567_CR53","doi-asserted-by":"crossref","unstructured":"Peng, Y., Jin, J.S., Luo, S., Xu, M., Au, S., Zhang, Z., & Cui, Y. (2013). Vehicle type classification using data mining techniques. In The era of interactive media (pp. 325\u2013335): Springer.","DOI":"10.1007\/978-1-4614-3501-3_27"},{"key":"1567_CR54","doi-asserted-by":"crossref","unstructured":"Peng, Y., Jin, J.S., Luo, S., Xu, M., & Cui, Y. (2012). Vehicle type classification using PCA with self-clustering. In IEEE international conference on multimedia and expo workshops (pp. 384\u2013389): IEEE.","DOI":"10.1109\/ICMEW.2012.73"},{"key":"1567_CR55","doi-asserted-by":"crossref","unstructured":"Petrovic, V.S., & Cootes, T.F. (2004). Analysis of features for rigid structure vehicle type recognition. In BMVC, (Vol. 2 pp. 587\u2013 596).","DOI":"10.5244\/C.18.61"},{"key":"1567_CR56","doi-asserted-by":"crossref","unstructured":"Pham, N., & Pagh, R. (2013). Fast and scalable polynomial kernels via explicit feature maps. In Proceedings of the 19th ACM SIGKDD international conference on knowledge discovery and data mining (pp. 239\u2013247): ACM.","DOI":"10.1145\/2487575.2487591"},{"issue":"2","key":"1567_CR57","doi-asserted-by":"publisher","first-page":"142","DOI":"10.1016\/j.csi.2010.06.005","volume":"33","author":"A Psyllos","year":"2011","unstructured":"Psyllos, A., Anagnostopoulos, C.N., & Kayafas, E. (2011). Vehicle model recognition from frontal view image measurements. Computer Standards & Interfaces, 33(2), 142\u2013151.","journal-title":"Computer Standards & Interfaces"},{"key":"1567_CR58","doi-asserted-by":"publisher","first-page":"265","DOI":"10.1016\/j.jvcir.2018.09.021","volume":"56","author":"RF Rachmadi","year":"2018","unstructured":"Rachmadi, R.F., Uchimura, K., Koutaki, G., & Ogata, K. (2018). Single image vehicle classification using pseudo long short-term memory classifier. Journal of Visual Communication and Image Representation, 56, 265\u2013274.","journal-title":"Journal of Visual Communication and Image Representation"},{"key":"1567_CR59","unstructured":"Ruder, S. (2017). An overview of multi-task learning in deep neural networks. arXiv:1706.05098."},{"key":"1567_CR60","doi-asserted-by":"crossref","unstructured":"Schroff, F., Kalenichenko, D., & Philbin, J. (2015). Facenet: a unified embedding for face recognition and clustering. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 815\u2013823).","DOI":"10.1109\/CVPR.2015.7298682"},{"key":"1567_CR61","unstructured":"Sermanet, P., Eigen, D., Zhang, X., Mathieu, M., Fergus, R., & LeCun, Y. (2013). Overfeat: integrated recognition, localization and detection using convolutional networks. arXiv:1312.6229."},{"issue":"5","key":"1567_CR62","doi-asserted-by":"publisher","first-page":"637","DOI":"10.1109\/JIOT.2016.2579198","volume":"3","author":"W Shi","year":"2016","unstructured":"Shi, W., Cao, J., Zhang, Q., Li, Y., & Xu, L. (2016). Edge computing: vision and challenges. IEEE Internet of Things Journal, 3(5), 637\u2013646.","journal-title":"IEEE Internet of Things Journal"},{"key":"1567_CR63","doi-asserted-by":"crossref","unstructured":"Simon, M., & Rodner, E. (2015). Neural activation constellations: unsupervised part model discovery with convolutional networks. In Proceedings of the IEEE international conference on computer vision (pp. 1143\u20131151).","DOI":"10.1109\/ICCV.2015.136"},{"key":"1567_CR64","doi-asserted-by":"crossref","unstructured":"Sochor, J., Herout, A., & Havel, J. (2016). Boxcars: 3D boxes as cnn input for improved fine-grained vehicle recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 3006\u20133015).","DOI":"10.1109\/CVPR.2016.328"},{"issue":"1","key":"1567_CR65","doi-asserted-by":"publisher","first-page":"97","DOI":"10.1109\/TITS.2018.2799228","volume":"20","author":"J Sochor","year":"2018","unstructured":"Sochor, J., Spanhel, J., & Herout, A. (2018). Boxcars: improving fine-grained recognition of vehicles using 3D bounding boxes in traffic surveillance. IEEE Transactions on Intelligent Transportation Systems, 20 (1), 97\u2013108.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"key":"1567_CR66","doi-asserted-by":"crossref","unstructured":"Specht, D.F. (1988). Probabilistic neural networks for classification, mapping, or associative memory. In IEEE international conference on neural networks, (Vol. 1 pp. 525\u2013532).","DOI":"10.1109\/ICNN.1988.23887"},{"issue":"13","key":"1567_CR67","doi-asserted-by":"publisher","first-page":"1543","DOI":"10.1177\/0278364911400640","volume":"30","author":"M Stark","year":"2011","unstructured":"Stark, M., Krause, J., Pepik, B., Meger, D., Little, J.J., Schiele, B., & Koller, D. (2011). Fine-grained categorization for 3D scene understanding. International Journal of Robotics Research, 30 (13), 1543\u20131552.","journal-title":"International Journal of Robotics Research"},{"key":"1567_CR68","doi-asserted-by":"crossref","unstructured":"Sun, W., Zhang, X., Shi, S., He, J., & Jin, Y. (2017). Vehicle type recognition combining global and local features via two-stage classification. Mathematical Problems in Engineering, 2017.","DOI":"10.1155\/2017\/5019592"},{"key":"1567_CR69","doi-asserted-by":"crossref","unstructured":"Szegedy, C., Liu, W., Jia, Y., Sermanet, P., Reed, S., Anguelov, D., Erhan, D., Vanhoucke, V., & Rabinovich, A. (2015). Going deeper with convolutions. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 1\u20139).","DOI":"10.1109\/CVPR.2015.7298594"},{"key":"1567_CR70","doi-asserted-by":"crossref","unstructured":"Szegedy, C., Vanhoucke, V., Ioffe, S., Shlens, J., & Wojna, Z. (2016). Rethinking the inception architecture for computer vision. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 2818\u20132826).","DOI":"10.1109\/CVPR.2016.308"},{"key":"1567_CR71","doi-asserted-by":"crossref","unstructured":"Taek Lee, J., & Chung, Y. (2017). Deep learning-based vehicle classification using an ensemble of local expert and global networks. In Proceedings of the IEEE conference on computer vision and pattern recognition workshops (pp. 47\u201352).","DOI":"10.1109\/CVPRW.2017.127"},{"key":"1567_CR72","doi-asserted-by":"crossref","unstructured":"Theagarajan, R., Pala, F., & Bhanu, B. (2017). EDen: ensemble of deep networks for vehicle classification. In Proceedings of the IEEE conference on computer vision and pattern recognition workshops (pp. 33\u201340).","DOI":"10.1109\/CVPRW.2017.125"},{"key":"1567_CR73","doi-asserted-by":"crossref","unstructured":"Wang, J., Yang, J., Yu, K., Lv, F., Huang, T., & Gong, Y. (2010). Locality-constrained linear coding for image classification. In 2010 IEEE computer society conference on computer vision and pattern recognition (pp. 3360\u20133367): Citeseer.","DOI":"10.1109\/CVPR.2010.5540018"},{"key":"1567_CR74","unstructured":"Wang, Y., & Yao, Q. (2019). Few-shot learning: a survey. arXiv:1904.05046."},{"key":"1567_CR75","doi-asserted-by":"crossref","unstructured":"Wieczorkowska, A., Kubera, E., S\u0142owik, T., & Skrzypiec, K. (2015). Spectral features for audio based vehicle identification. In International workshop on new frontiers in mining complex patterns (pp. 163\u2013178): Springer.","DOI":"10.1007\/978-3-319-39315-5_11"},{"key":"1567_CR76","doi-asserted-by":"crossref","unstructured":"Xiang, Y., Fu, Y., & Huang, H. (2019). Global topology constraint network for fine-grained vehicle recognition. IEEE Transactions on Intelligent Transportation Systems.","DOI":"10.1109\/TITS.2019.2921732"},{"key":"1567_CR77","unstructured":"Xiao, T., Xu, Y., Yang, K., Zhang, J., Peng, Y., & Zhang, Z. (2015). The application of two-level attention models in deep convolutional neural network for fine-grained image classification. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 842\u2013850)."},{"key":"1567_CR78","unstructured":"Xu, K., Ba, J., Kiros, R., Cho, K., Courville, A., Salakhudinov, R., Zemel, R., & Bengio, Y. (2015). Show, attend and tell: neural image caption generation with visual attention. In International conference on machine learning (pp. 2048\u20132057)."},{"key":"1567_CR79","doi-asserted-by":"crossref","unstructured":"Xu, Z., Yang, W., Meng, A., Lu, N., Huang, H., Ying, C., & Huang, L. (2018). Towards end-to-end license plate detection and recognition: a large dataset and baseline. In Proceedings of the European conference on computer vision (ECCV) (pp. 255\u2013 271).","DOI":"10.1007\/978-3-030-01261-8_16"},{"key":"1567_CR80","doi-asserted-by":"crossref","unstructured":"Yang, L., Luo, P., Change Loy, C., & Tang, X. (2015). A large-scale car dataset for fine-grained categorization and verification. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 3973\u20133981).","DOI":"10.1109\/CVPR.2015.7299023"},{"key":"1567_CR81","unstructured":"Zeng, R., Ge, Z., Denman, S., Sridharan, S., & Fookes, C. (2019). Geometry-constrained car recognition using a 3D perspective network. arXiv:1903.07916."},{"key":"1567_CR82","doi-asserted-by":"crossref","unstructured":"Zheng, H., Fu, J., Mei, T., & Luo, J. (2017). Learning multi-attention convolutional neural network for fine-grained image recognition. In Proceedings of the IEEE international conference on computer vision (pp. 5209\u20135217).","DOI":"10.1109\/ICCV.2017.557"},{"key":"1567_CR83","unstructured":"Zhong, Z., Zheng, L., Kang, G., Li, S., & Yang, Y. (2017). Random erasing data augmentation. arXiv:1708.04896."}],"container-title":["Journal of Signal Processing Systems"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11265-020-01567-6.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11265-020-01567-6\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11265-020-01567-6.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2021,6,25]],"date-time":"2021-06-25T23:47:35Z","timestamp":1624664855000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11265-020-01567-6"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,6,26]]},"references-count":83,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2021,4]]}},"alternative-id":["1567"],"URL":"https:\/\/doi.org\/10.1007\/s11265-020-01567-6","relation":{},"ISSN":["1939-8018","1939-8115"],"issn-type":[{"value":"1939-8018","type":"print"},{"value":"1939-8115","type":"electronic"}],"subject":[],"published":{"date-parts":[[2020,6,26]]},"assertion":[{"value":"12 November 2019","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"29 March 2020","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"8 June 2020","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"26 June 2020","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}