{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,10]],"date-time":"2026-04-10T15:36:28Z","timestamp":1775835388830,"version":"3.50.1"},"reference-count":181,"publisher":"Springer Science and Business Media LLC","issue":"9","license":[{"start":{"date-parts":[[2021,4,9]],"date-time":"2021-04-09T00:00:00Z","timestamp":1617926400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2021,4,9]],"date-time":"2021-04-09T00:00:00Z","timestamp":1617926400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Appl Intell"],"published-print":{"date-parts":[[2021,9]]},"DOI":"10.1007\/s10489-021-02293-7","type":"journal-article","created":{"date-parts":[[2021,4,9]],"date-time":"2021-04-09T14:02:46Z","timestamp":1617976966000},"page":"6400-6429","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":256,"title":["Deep learning in multi-object detection and tracking: state of the art"],"prefix":"10.1007","volume":"51","author":[{"given":"Sankar K.","family":"Pal","sequence":"first","affiliation":[]},{"given":"Anima","family":"Pramanik","sequence":"additional","affiliation":[]},{"given":"J.","family":"Maiti","sequence":"additional","affiliation":[]},{"given":"Pabitra","family":"Mitra","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2021,4,9]]},"reference":[{"key":"2293_CR1","doi-asserted-by":"publisher","first-page":"128837","DOI":"10.1109\/ACCESS.2019.2939201","volume":"7","author":"L Jiao","year":"2019","unstructured":"Jiao L, Zhang F, Liu F, Yang S, Li L, Feng Z, Qu R (2019) A survey of deep learning-based object detection. IEEE Access 7:128837\u2013128868","journal-title":"IEEE Access"},{"key":"2293_CR2","unstructured":"Pal S K (2018) Data science and technology: challenges, opportunities and national relevance. 14th annual convocation speech, national institute of technology, Calicut"},{"issue":"21","key":"2293_CR3","doi-asserted-by":"publisher","first-page":"16533","DOI":"10.1007\/s00521-019-04200-1","volume":"32","author":"SK Pal","year":"2020","unstructured":"Pal S K, Bhoumik D, Chakraborty D B (2020) Granulated deep learning and z-numbers in motion detection and object recognition. Neural Comput Appl 32(21):16533\u201316548","journal-title":"Neural Comput Appl"},{"key":"2293_CR4","doi-asserted-by":"crossref","unstructured":"Chakraborty DB, Pal S K (2021) Granular Video Computing: with Rough Sets, Deep Learning and in IoT. World Scientific, Singapore","DOI":"10.1142\/12013"},{"key":"2293_CR5","doi-asserted-by":"crossref","unstructured":"Liu Y, Cheng M-M, Hu X, Wang K, Bai X (2017) Richer convolutional features for edge detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 3000\u20133009","DOI":"10.1109\/CVPR.2017.622"},{"issue":"1","key":"2293_CR6","doi-asserted-by":"publisher","first-page":"69","DOI":"10.1109\/TPAMI.1983.4767347","volume":"5","author":"SK Pal","year":"1983","unstructured":"Pal S K, King R A (1983) On edge detection of x-ray images using fuzzy sets. IEEE Trans Pattern Anal Mach Intell 5(1):69\u201377","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"5-6","key":"2293_CR7","doi-asserted-by":"publisher","first-page":"417","DOI":"10.1016\/0167-8655(83)90080-6","volume":"1","author":"F Deravi","year":"1983","unstructured":"Deravi F, Pal S K (1983) Grey level thresholding using second-order statistics. Pattern Recogn Lett 1(5-6):417\u2013422","journal-title":"Pattern Recogn Lett"},{"issue":"3","key":"2293_CR8","doi-asserted-by":"publisher","first-page":"141","DOI":"10.1016\/0167-8655(83)90053-3","volume":"1","author":"SK Pal","year":"1983","unstructured":"Pal S K, King R A, Hashim AA (1983) Automatic grey level thresholding through index of fuzziness and entropy. Pattern Recogn Lett 1(3):141\u2013146","journal-title":"Pattern Recogn Lett"},{"key":"2293_CR9","doi-asserted-by":"crossref","unstructured":"Cao Z, Simon T, Wei S-E, Sheikh Y (2017) Realtime multi-person 2d pose estimation using part affinity fields. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 7291\u20137299","DOI":"10.1109\/CVPR.2017.143"},{"key":"2293_CR10","doi-asserted-by":"crossref","unstructured":"Masi I, Wu Y, Hassner T, Natarajan P (2018) Deep face recognition: A survey. In: 2018 31st SIBGRAPI conference on graphics, patterns and images (SIBGRAPI). IEEE, pp 471\u2013478","DOI":"10.1109\/SIBGRAPI.2018.00067"},{"issue":"4","key":"2293_CR11","doi-asserted-by":"publisher","first-page":"443","DOI":"10.1177\/0165551517698564","volume":"44","author":"M Hasan","year":"2018","unstructured":"Hasan M, Orgun M A, Schwitter R (2018) A survey on real-time event detection from the twitter data stream. J Inf Sci 44(4):443\u2013463","journal-title":"J Inf Sci"},{"key":"2293_CR12","doi-asserted-by":"publisher","first-page":"17","DOI":"10.1016\/j.neucom.2018.01.092","volume":"300","author":"A Brunetti","year":"2018","unstructured":"Brunetti A, Buongiorno D, Trotta G F, Bevilacqua V (2018) Computer vision and deep learning techniques for pedestrian detection and tracking: A survey. Neurocomputing 300:17\u201333","journal-title":"Neurocomputing"},{"issue":"3","key":"2293_CR13","doi-asserted-by":"publisher","first-page":"506","DOI":"10.1109\/TMM.2016.2625259","volume":"19","author":"X Ren","year":"2016","unstructured":"Ren X, Zhou Y, He J, Chen K, Yang X, Sun J (2016) A convolutional neural network-based chinese text detection algorithm via text structure modeling. IEEE Trans Multimed 19(3):506\u2013518","journal-title":"IEEE Trans Multimed"},{"key":"2293_CR14","doi-asserted-by":"crossref","unstructured":"Fan D-P, Wang W, Cheng M-M, Shen J (2019) Shifting more attention to video salient object detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 8554\u20138564","DOI":"10.1109\/CVPR.2019.00875"},{"issue":"9","key":"2293_CR15","doi-asserted-by":"publisher","first-page":"1277","DOI":"10.1016\/0031-3203(93)90135-J","volume":"26","author":"NR Pal","year":"1993","unstructured":"Pal N R, Pal S K (1993) A review on image segmentation techniques. Pattern Recogn 26 (9):1277\u20131294","journal-title":"Pattern Recogn"},{"issue":"4","key":"2293_CR16","doi-asserted-by":"publisher","first-page":"743","DOI":"10.1109\/TPAMI.2011.155","volume":"34","author":"P Dollar","year":"2011","unstructured":"Dollar P, Wojek C, Schiele B, Perona P (2011) Pedestrian detection: An evaluation of the state of the art. IEEE Trans Pattern Anal Mach Intell 34(4):743\u2013761","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2293_CR17","doi-asserted-by":"crossref","unstructured":"Geiger A, Lenz P, Urtasun R (2012) Are we ready for autonomous driving? the kitti vision benchmark suite. In: 2012 IEEE Conference on Computer Vision and Pattern Recognition. IEEE, pp 3354\u20133361","DOI":"10.1109\/CVPR.2012.6248074"},{"issue":"3","key":"2293_CR18","doi-asserted-by":"publisher","first-page":"211","DOI":"10.1007\/s11263-015-0816-y","volume":"115","author":"O Russakovsky","year":"2015","unstructured":"Russakovsky O, Deng J, Su H, Krause J, Satheesh S, Ma S, Huang Z, Karpathy A, Khosla A, Bernstein M et al (2015) Imagenet large scale visual recognition challenge. Int J Comput Vis 115(3):211\u2013252","journal-title":"Int J Comput Vis"},{"issue":"2","key":"2293_CR19","doi-asserted-by":"publisher","first-page":"303","DOI":"10.1007\/s11263-009-0275-4","volume":"88","author":"M Everingham","year":"2010","unstructured":"Everingham M, Van Gool L, Williams Christopher KI, Winn J, Zisserman A (2010) The pascal visual object classes (voc) challenge. Int J Comput Vis 88(2):303\u2013338","journal-title":"Int J Comput Vis"},{"key":"2293_CR20","doi-asserted-by":"crossref","unstructured":"Lin T-Y, Maire M, Belongie S, Hays J, Perona P, Ramanan D, Doll\u00e1r P, Zitnick C L (2014) Microsoft coco: Common objects in context. In: European conference on computer vision. Springer, pp 740\u2013755","DOI":"10.1007\/978-3-319-10602-1_48"},{"key":"2293_CR21","unstructured":"Kuznetsova A, Rom H, Alldrin N, Uijlings J, Krasin I, Pont-Tuset J, Kamali S, Popov S, Malloci M, Duerig T et al (2018) The open images dataset v4: Unified image classification, object detection, and visual relationship detection at scale. arXiv:1811.00982"},{"issue":"6","key":"2293_CR22","doi-asserted-by":"publisher","first-page":"84","DOI":"10.1145\/3065386","volume":"60","author":"A Krizhevsky","year":"2017","unstructured":"Krizhevsky A, Sutskever I, Hinton G E (2017) Imagenet classification with deep convolutional neural networks. Commun ACM 60(6):84\u201390","journal-title":"Commun ACM"},{"key":"2293_CR23","doi-asserted-by":"crossref","unstructured":"Zhang X, Fang Z, Wen Y, Li Z, Qiao Y (2017) Range loss for deep face recognition with long-tailed training data. In: Proceedings of the IEEE International Conference on Computer Vision, pp 5409\u20135418","DOI":"10.1109\/ICCV.2017.578"},{"key":"2293_CR24","doi-asserted-by":"crossref","unstructured":"Chung D, Tahboub K, Delp E J (2017) A two stream siamese convolutional neural network for person re-identification. In: Proceedings of the IEEE International Conference on Computer Vision, pp 1983\u20131991","DOI":"10.1109\/ICCV.2017.218"},{"issue":"8","key":"2293_CR25","doi-asserted-by":"publisher","first-page":"1839","DOI":"10.1109\/TCSVT.2017.2682196","volume":"28","author":"S Zhao","year":"2017","unstructured":"Zhao S, Liu Y, Han Y, Hong R, Hu Q, Tian Q (2017) Pooling the convolutional layers in deep convnets for video action recognition. IEEE Trans Circ Syst Video Technol 28(8):1839\u20131849","journal-title":"IEEE Trans Circ Syst Video Technol"},{"issue":"5","key":"2293_CR26","doi-asserted-by":"publisher","first-page":"381","DOI":"10.1007\/s11801-017-7086-6","volume":"13","author":"H- Geng","year":"2017","unstructured":"Geng H-, Zhang H, Xue Y-, Zhou M, Xu G-, Gao Z (2017) Semantic image segmentation with fused cnn features. Optoelectron Lett 13(5):381\u2013385","journal-title":"Optoelectron Lett"},{"issue":"3","key":"2293_CR27","doi-asserted-by":"publisher","first-page":"359","DOI":"10.1007\/s11047-015-9493-6","volume":"15","author":"DB Chakraborty","year":"2016","unstructured":"Chakraborty D B, Pal S K (2016) Neighborhood granules and rough rule-base in tracking. Nat Comput 15(3):359\u2013370","journal-title":"Nat Comput"},{"issue":"4","key":"2293_CR28","doi-asserted-by":"publisher","first-page":"2188","DOI":"10.1109\/TFUZZ.2017.2768322","volume":"26","author":"DB Chakraborty","year":"2017","unstructured":"Chakraborty D B, Pal S K (2017) Neighborhood rough filter and intuitionistic entropy in unsupervised tracking. IEEE Trans Fuzzy Syst 26(4):2188\u20132200","journal-title":"IEEE Trans Fuzzy Syst"},{"issue":"12","key":"2293_CR29","doi-asserted-by":"publisher","first-page":"4096","DOI":"10.1109\/TCYB.2016.2600271","volume":"47","author":"SK Pal","year":"2016","unstructured":"Pal S K, Chakraborty D B (2016) Granular flow graph, adaptive rule generation and tracking. IEEE Trans Cybern 47(12):4096\u2013 4107","journal-title":"IEEE Trans Cybern"},{"key":"2293_CR30","unstructured":"Wang N, Yeung D-Y (2013) Learning a deep compact image representation for visual tracking. In: Advances in neural information processing systems, pp 809\u2013817"},{"issue":"3","key":"2293_CR31","doi-asserted-by":"publisher","first-page":"583","DOI":"10.1109\/TPAMI.2014.2345390","volume":"37","author":"JF Henriques","year":"2014","unstructured":"Henriques J F, Caseiro R, Martins P, Batista J (2014) High-speed tracking with kernelized correlation filters. IEEE Trans Pattern Anal Mach Intell 37(3):583\u2013596","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2293_CR32","doi-asserted-by":"crossref","unstructured":"Choi J, Jin Chang H, Fischer T, Yun S, Lee K, Jeong J, Demiris Y, Young Choi J (2018) Context-aware deep feature compression for high-speed visual tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 479\u2013488","DOI":"10.1109\/CVPR.2018.00057"},{"key":"2293_CR33","doi-asserted-by":"crossref","unstructured":"Valmadre J, Bertinetto L, Henriques J, Vedaldi A, Torr Philip HS (2017) End-to-end representation learning for correlation filter based tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 2805\u20132813","DOI":"10.1109\/CVPR.2017.531"},{"issue":"4","key":"2293_CR34","doi-asserted-by":"publisher","first-page":"325","DOI":"10.1007\/s41095-017-0087-3","volume":"3","author":"J Li","year":"2017","unstructured":"Li J, Zhou X, Chan S, Chen S (2017) Object tracking using a convolutional network and a structured output svm. Comput Vis Media 3(4):325\u2013335","journal-title":"Comput Vis Media"},{"key":"2293_CR35","doi-asserted-by":"crossref","unstructured":"Nam H, Han B (2016) Learning multi-domain convolutional neural networks for visual tracking. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4293\u20134302","DOI":"10.1109\/CVPR.2016.465"},{"key":"2293_CR36","doi-asserted-by":"crossref","unstructured":"Danelljan M, Robinson A, Khan F S, Felsberg M (2016) Beyond correlation filters: Learning continuous convolution operators for visual tracking. In: European conference on computer vision. Springer, pp 472\u2013488","DOI":"10.1007\/978-3-319-46454-1_29"},{"key":"2293_CR37","doi-asserted-by":"crossref","unstructured":"Ma C, Huang J-B, Yang X, Yang M-H (2015) Hierarchical convolutional features for visual tracking. In: Proceedings of the IEEE international conference on computer vision, pp 3074\u20133082","DOI":"10.1109\/ICCV.2015.352"},{"key":"2293_CR38","unstructured":"Milan A, Rezatofighi S H, Dick A, Reid I, Schindler K (2016) Online multi-target tracking using recurrent neural networks. arXiv:1604.03635"},{"key":"2293_CR39","doi-asserted-by":"publisher","first-page":"323","DOI":"10.1016\/j.patcog.2017.11.007","volume":"76","author":"P Li","year":"2018","unstructured":"Li P, Wang D, Wang L, Lu H (2018) Deep visual tracking: Review and experimental comparison. Pattern Recogn 76:323\u2013338","journal-title":"Pattern Recogn"},{"issue":"4","key":"2293_CR40","doi-asserted-by":"publisher","first-page":"355","DOI":"10.1049\/iet-cvi.2018.5598","volume":"13","author":"Y Xu","year":"2019","unstructured":"Xu Y, Zhou X, Chen S, Li F (2019) Deep learning for multiple object tracking: a survey. IET Comput Vis 13(4):355\u2013368","journal-title":"IET Comput Vis"},{"key":"2293_CR41","unstructured":"Leal-Taix\u00e9 L, Milan A, Schindler K, Cremers D, Reid I, Roth S (2017) Tracking the trackers: an analysis of the state of the art in multiple object tracking. arXiv:1704.02781"},{"issue":"11","key":"2293_CR42","doi-asserted-by":"publisher","first-page":"3212","DOI":"10.1109\/TNNLS.2018.2876865","volume":"30","author":"Z-Q Zhao","year":"2019","unstructured":"Zhao Z-Q, Zheng P, Xu S-, Wu X (2019) Object detection with deep learning: A review. IEEE Trans Neural Networks Learn Syst 30(11):3212\u20133232","journal-title":"IEEE Trans Neural Networks Learn Syst"},{"key":"2293_CR43","unstructured":"Ren S, He K, Girshick R, Sun J (2015) Faster r-cnn: Towards real-time object detection with region proposal networks. In: Advances in neural information processing systems, pp 91\u201399"},{"key":"2293_CR44","doi-asserted-by":"crossref","unstructured":"Redmon J, Divvala S, Girshick R, Farhadi A (2016) You only look once: Unified, real-time object detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 779\u2013788","DOI":"10.1109\/CVPR.2016.91"},{"key":"2293_CR45","doi-asserted-by":"crossref","unstructured":"Girshick R, Donahue J, Darrell T, Malik J (2014) Rich feature hierarchies for accurate object detection and semantic segmentation. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 580\u2013587","DOI":"10.1109\/CVPR.2014.81"},{"key":"2293_CR46","doi-asserted-by":"crossref","unstructured":"Redmon J, Farhadi A (2017) Yolo9000: better, faster, stronger. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 7263\u20137271","DOI":"10.1109\/CVPR.2017.690"},{"key":"2293_CR47","doi-asserted-by":"crossref","unstructured":"Weinzaepfel P, Revaud J, Harchaoui Z, Schmid C (2013) Deepflow: Large displacement optical flow with deep matching. In: Proceedings of the IEEE international conference on computer vision, pp 1385\u20131392","DOI":"10.1109\/ICCV.2013.175"},{"key":"2293_CR48","doi-asserted-by":"crossref","unstructured":"Cheng H Y, Hwang J N (2007) Multiple-target tracking for crossroad traffic utilizing modified probabilistic data association. In: 2007 IEEE International Conference on Acoustics, Speech and Signal Processing-ICASSP\u201907, vol 1. IEEE, pp I\u2013921","DOI":"10.1109\/ICASSP.2007.366059"},{"issue":"9","key":"2293_CR49","doi-asserted-by":"publisher","first-page":"859","DOI":"10.1016\/j.optlaseng.2010.04.001","volume":"48","author":"Y-C Lim","year":"2010","unstructured":"Lim Y-C, Lee M, Lee C-H, Kwon S, Lee J- (2010) Improvement of stereo vision-based position and velocity estimation and tracking using a stripe-based disparity estimation and inverse perspective map-based extended kalman filter. Opt Lasers Eng 48(9):859\u2013868","journal-title":"Opt Lasers Eng"},{"issue":"5","key":"2293_CR50","doi-asserted-by":"publisher","first-page":"921","DOI":"10.1007\/s00138-011-0336-x","volume":"23","author":"X Cao","year":"2012","unstructured":"Cao X, Lan J, Yan P, Li X (2012) Vehicle detection and tracking in airborne videos by multi-motion layer analysis. Mach Vis Appl 23(5):921\u2013935","journal-title":"Mach Vis Appl"},{"key":"2293_CR51","doi-asserted-by":"crossref","unstructured":"Kim C, Li F, Ciptadi A, Rehg J M (2015) Multiple hypothesis tracking revisited. In: Proceedings of the IEEE international conference on computer vision, pp 4696\u20134704","DOI":"10.1109\/ICCV.2015.533"},{"key":"2293_CR52","unstructured":"Simonyan K, Zisserman A (2014) Very deep convolutional networks for large-scale image recognition. arXiv:1409.1556"},{"key":"2293_CR53","doi-asserted-by":"crossref","unstructured":"Lin T-Y, Doll\u00e1r P, Girshick R, He K, Hariharan B, Belongie S (2017) Feature pyramid networks for object detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 2117\u20132125","DOI":"10.1109\/CVPR.2017.106"},{"key":"2293_CR54","doi-asserted-by":"crossref","unstructured":"Li Z, Peng C, Yu G, Zhang X, Deng Y, Sun J (2018) Detnet: A backbone network for object detection. arXiv:1804.06215","DOI":"10.1007\/978-3-030-01240-3_21"},{"key":"2293_CR55","doi-asserted-by":"crossref","unstructured":"He K, Gkioxari G, Doll\u00e1r P, Girshick R (2017) Mask r-cnn. In: Proceedings of the IEEE international conference on computer vision, pp 2961\u20132969","DOI":"10.1109\/ICCV.2017.322"},{"key":"2293_CR56","doi-asserted-by":"crossref","unstructured":"Xie S, Girshick R, Doll\u00e1r P, Tu Z, He K (2017) Aggregated residual transformations for deep neural networks. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 1492\u20131500","DOI":"10.1109\/CVPR.2017.634"},{"key":"2293_CR57","doi-asserted-by":"crossref","unstructured":"Ghiasi G, Lin T-Y, Le Q V (2019) Nas-fpn: Learning scalable feature pyramid architecture for object detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 7036\u20137045","DOI":"10.1109\/CVPR.2019.00720"},{"key":"2293_CR58","unstructured":"Howard A G, Zhu M, Chen B, Kalenichenko D, Wang W, Weyand T, Andreetto M, Adam H (2017) Mobilenets: Efficient convolutional neural networks for mobile vision applications. arXiv:1704.04861"},{"key":"2293_CR59","unstructured":"Iandola F N, Han S, Moskewicz M W, Ashraf K, Dally W J, Keutzer K (2016) Squeezenet: Alexnet-level accuracy with 50x fewer parameters and<\u20090.5 mb model size. arXiv:1602.07360"},{"key":"2293_CR60","doi-asserted-by":"crossref","unstructured":"Chollet F (2017) Xception: Deep learning with depthwise separable convolutions. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 1251\u20131258","DOI":"10.1109\/CVPR.2017.195"},{"key":"2293_CR61","doi-asserted-by":"crossref","unstructured":"Sandler M, Howard A, Zhu M, Zhmoginov A, Chen L-C (2018) Mobilenetv2: Inverted residuals and linear bottlenecks. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4510\u20134520","DOI":"10.1109\/CVPR.2018.00474"},{"issue":"9","key":"2293_CR62","doi-asserted-by":"publisher","first-page":"2352","DOI":"10.1162\/neco_a_00990","volume":"29","author":"W Rawat","year":"2017","unstructured":"Rawat W, Wang Z (2017) Deep convolutional neural networks for image classification: A comprehensive review. Neural Comput 29(9):2352\u20132449","journal-title":"Neural Comput"},{"key":"2293_CR63","doi-asserted-by":"crossref","unstructured":"Girshick R (2015) Fast r-cnn. In: Proceedings of the IEEE international conference on computer vision, pp 1440\u20131448","DOI":"10.1109\/ICCV.2015.169"},{"key":"2293_CR64","unstructured":"Dai J, Li Y, He K, Sun J (2016) R-fcn: Object detection via region-based fully convolutional networks. In: Advances in neural information processing systems, pp 379\u2013387"},{"key":"2293_CR65","doi-asserted-by":"crossref","unstructured":"He K, Zhang X, Ren S, Sun J (2016) Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 770\u2013778","DOI":"10.1109\/CVPR.2016.90"},{"key":"2293_CR66","doi-asserted-by":"crossref","unstructured":"Szegedy C, Liu W, Jia Y, Sermanet P, Reed S, Anguelov D, Erhan D, Vanhoucke V, Rabinovich A (2015) Going deeper with convolutions. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 1\u20139","DOI":"10.1109\/CVPR.2015.7298594"},{"issue":"9","key":"2293_CR67","doi-asserted-by":"publisher","first-page":"1627","DOI":"10.1109\/TPAMI.2009.167","volume":"32","author":"PF Felzenszwalb","year":"2009","unstructured":"Felzenszwalb P F, Girshick R B, McAllester D, Ramanan D (2009) Object detection with discriminatively trained part-based models. IEEE Trans Pattern Anal Mach Intell 32(9):1627\u20131645","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"9","key":"2293_CR68","doi-asserted-by":"publisher","first-page":"1904","DOI":"10.1109\/TPAMI.2015.2389824","volume":"37","author":"K He","year":"2015","unstructured":"He K, Zhang X, Ren S, Sun J (2015) Spatial pyramid pooling in deep convolutional networks for visual recognition. IEEE Trans Pattern Anal Mach Intell 37(9):1904\u20131916","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2293_CR69","doi-asserted-by":"crossref","unstructured":"Bell S, Lawrence Zitnick C, Bala K, Girshick R (2016) Inside-outside net: Detecting objects in context with skip pooling and recurrent neural networks. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 2874\u20132883","DOI":"10.1109\/CVPR.2016.314"},{"key":"2293_CR70","doi-asserted-by":"crossref","unstructured":"Liu J, Zhang S, Wang S, Metaxas D N (2016) Multispectral deep neural networks for pedestrian detection. arXiv:1611.02644","DOI":"10.5244\/C.30.73"},{"issue":"14","key":"2293_CR71","doi-asserted-by":"publisher","first-page":"2923","DOI":"10.1016\/j.ins.2011.02.022","volume":"181","author":"LA Zadeh","year":"2011","unstructured":"Zadeh L A (2011) A note on z-numbers. Inf Sci 181(14):2923\u20132932","journal-title":"Inf Sci"},{"key":"2293_CR72","unstructured":"Redmon J, Farhadi A (2018) Yolov3: An incremental improvement. arXiv:1804.02767"},{"key":"2293_CR73","unstructured":"Fu C-Y, Liu W, Ranga A, Tyagi A, Berg A C (2017) Dssd: Deconvolutional single shot detector. arXiv:1701.06659"},{"key":"2293_CR74","doi-asserted-by":"crossref","unstructured":"Lin T-Y, Goyal P, Girshick R, He K, Doll\u00e1r P (2017) Focal loss for dense object detection. In: Proceedings of the IEEE international conference on computer vision, pp 2980\u20132988","DOI":"10.1109\/ICCV.2017.324"},{"key":"2293_CR75","doi-asserted-by":"crossref","unstructured":"Zhao Q, Sheng T, Wang Y, Tang Z, Chen Y, Cai L, Ling H (2019) M2det: A single-shot object detector based on multi-level feature pyramid network. In: Proceedings of the AAAI Conference on Artificial Intelligence, vol 33, pp 9259\u20139266","DOI":"10.1609\/aaai.v33i01.33019259"},{"key":"2293_CR76","doi-asserted-by":"crossref","unstructured":"Zhang S, Wen L, Bian X, Lei Z, Li S Z (2018) Single-shot refinement neural network for object detection. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4203\u20134212","DOI":"10.1109\/CVPR.2018.00442"},{"key":"2293_CR77","doi-asserted-by":"crossref","unstructured":"Dai J, Qi H, Xiong Y, Li Y, Zhang G, Hu H, Wei Y (2017) Deformable convolutional networks. In: Proceedings of the IEEE international conference on computer vision, pp 764\u2013773","DOI":"10.1109\/ICCV.2017.89"},{"key":"2293_CR78","unstructured":"Ioffe S, Szegedy C (2015) Batch normalization: Accelerating deep network training by reducing internal covariate shift. arXiv:1502.03167"},{"key":"2293_CR79","doi-asserted-by":"crossref","unstructured":"Liu W, Anguelov D, Erhan D, Szegedy C, Reed S, Fu C-Y, Berg A C (2016) Ssd: Single shot multibox detector. In: European conference on computer vision. Springer, pp 21\u201337","DOI":"10.1007\/978-3-319-46448-0_2"},{"key":"2293_CR80","doi-asserted-by":"crossref","unstructured":"Zhu X, Hu H, Lin S, Dai J (2019) Deformable convnets v2: More deformable, better results. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 9308\u20139316","DOI":"10.1109\/CVPR.2019.00953"},{"key":"2293_CR81","doi-asserted-by":"crossref","unstructured":"Yang Z, Nevatia R (2016) A multi-scale cascade fully convolutional network face detector. In: 2016 23rd International Conference on Pattern Recognition (ICPR). IEEE, pp 633\u2013638","DOI":"10.1109\/ICPR.2016.7899705"},{"key":"2293_CR82","doi-asserted-by":"crossref","unstructured":"Tu W-C, He S, Yang Q, Chien S-Y (2016) Real-time salient object detection with a minimum spanning tree. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 2334\u20132342","DOI":"10.1109\/CVPR.2016.256"},{"issue":"3","key":"2293_CR83","doi-asserted-by":"publisher","first-page":"576","DOI":"10.1109\/TPAMI.2016.2547384","volume":"39","author":"J Yang","year":"2016","unstructured":"Yang J, Yang M-H (2016) Top-down visual saliency via joint crf and dictionary learning. IEEE Trans Pattern Anal Mach Intell 39(3):576\u2013588","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2293_CR84","doi-asserted-by":"publisher","first-page":"482","DOI":"10.1016\/j.image.2016.05.007","volume":"47","author":"D Tom\u00e8","year":"2016","unstructured":"Tom\u00e8 D, Monti F, Baroffio L, Bondi L, Tagliasacchi M, Tubaro S (2016) Deep convolutional neural networks for pedestrian detection. Signal Process Image Commun 47:482\u2013489","journal-title":"Signal Process Image Commun"},{"key":"2293_CR85","doi-asserted-by":"crossref","unstructured":"Zhao Z-Q, Bian H, Hu D, Cheng W, Glotin H (2017) Pedestrian detection based on fast r-cnn and batch normalization. In: International Conference on Intelligent Computing. Springer, pp 735\u2013746","DOI":"10.1007\/978-3-319-63309-1_65"},{"issue":"3","key":"2293_CR86","doi-asserted-by":"publisher","first-page":"847","DOI":"10.1145\/1141911.1141965","volume":"25","author":"C Rother","year":"2006","unstructured":"Rother C, Bordeaux L, Hamadi Y, Blake A (2006) Autocollage. ACM Trans Graph (TOG) 25(3):847\u2013852","journal-title":"ACM Trans Graph (TOG)"},{"issue":"9","key":"2293_CR87","doi-asserted-by":"publisher","first-page":"4001","DOI":"10.1016\/j.asoc.2012.09.003","volume":"13","author":"D Chakraborty","year":"2013","unstructured":"Chakraborty D, Shankar B U, Pal S K (2013) Granulation, rough entropy and spatiotemporal moving object detection. Appl Soft Comput 13(9):4001\u20134009","journal-title":"Appl Soft Comput"},{"issue":"11","key":"2293_CR88","doi-asserted-by":"publisher","first-page":"2495","DOI":"10.1109\/TGRS.2002.803716","volume":"40","author":"SK Pal","year":"2002","unstructured":"Pal S K, Mitra P (2002) Multispectral image segmentation using the rough-set-initialized em algorithm. IEEE Trans Geosci Remote Sens 40(11):2495\u20132501","journal-title":"IEEE Trans Geosci Remote Sens"},{"issue":"16","key":"2293_CR89","doi-asserted-by":"publisher","first-page":"2509","DOI":"10.1016\/j.patrec.2005.05.007","volume":"26","author":"SK Pal","year":"2005","unstructured":"Pal S K, Shankar B U, Mitra P (2005) Granular computing, rough entropy and object extraction. Pattern Recogn Lett 26(16):2509\u20132517","journal-title":"Pattern Recogn Lett"},{"issue":"11","key":"2293_CR90","doi-asserted-by":"publisher","first-page":"2363","DOI":"10.1016\/j.patcog.2009.04.021","volume":"42","author":"PL Rosin","year":"2009","unstructured":"Rosin P L (2009) A simple method for detecting salient regions. Pattern Recogn 42(11):2363\u20132371","journal-title":"Pattern Recogn"},{"issue":"2","key":"2293_CR91","doi-asserted-by":"crossref","first-page":"353","DOI":"10.1109\/TPAMI.2010.70","volume":"33","author":"T Liu","year":"2010","unstructured":"Liu T, Yuan Z, Sun J, Wang J, Zheng N, Tang X, Shum H-Y (2010) Learning to detect a salient object. IEEE Trans Pattern Anal Mach Intell 33(2):353\u2013367","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2293_CR92","doi-asserted-by":"crossref","unstructured":"Long J, Shelhamer E, Darrell T (2015) Fully convolutional networks for semantic segmentation. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 3431\u20133440","DOI":"10.1109\/CVPR.2015.7298965"},{"issue":"6","key":"2293_CR93","doi-asserted-by":"publisher","first-page":"989","DOI":"10.1109\/TPAMI.2009.27","volume":"31","author":"D Gao","year":"2009","unstructured":"Gao D, Han S, Vasconcelos N (2009) Discriminant saliency, the detection of suspicious coincidences, and applications to visual recognition. IEEE Trans Pattern Anal Mach Intell 31(6):989\u20131005","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2293_CR94","doi-asserted-by":"crossref","unstructured":"Xie S, Tu Z (2015) Holistically-nested edge detection. In: Proceedings of the IEEE international conference on computer vision, pp 1395\u20131403","DOI":"10.1109\/ICCV.2015.164"},{"key":"2293_CR95","doi-asserted-by":"crossref","unstructured":"Vig E, Dorr M, Cox D (2014) Large-scale optimization of hierarchical features for saliency prediction in natural images. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 2798\u20132805","DOI":"10.1109\/CVPR.2014.358"},{"key":"2293_CR96","doi-asserted-by":"crossref","unstructured":"Huang X, Shen C, Boix X, Zhao Q (2015) Salicon: Reducing the semantic gap in saliency prediction by adapting deep neural networks. In: Proceedings of the IEEE International Conference on Computer Vision, pp 262\u2013270","DOI":"10.1109\/ICCV.2015.38"},{"key":"2293_CR97","doi-asserted-by":"crossref","unstructured":"Wang L, Lu H, Ruan X, Yang M-H (2015) Deep networks for saliency detection via local estimation and global search. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 3183\u20133192","DOI":"10.1109\/CVPR.2015.7298938"},{"issue":"12","key":"2293_CR98","doi-asserted-by":"publisher","first-page":"6064","DOI":"10.1109\/TIP.2018.2864891","volume":"27","author":"H Cholakkal","year":"2018","unstructured":"Cholakkal H, Johnson J, Rajan D (2018) Backtracking spatial pyramid pooling-based image classifier for weakly supervised top\u2013down salient object detection. IEEE Trans Image Process 27(12):6064\u20136078","journal-title":"IEEE Trans Image Process"},{"issue":"3","key":"2293_CR99","doi-asserted-by":"publisher","first-page":"330","DOI":"10.1007\/s11263-015-0822-0","volume":"115","author":"S He","year":"2015","unstructured":"He S, Lau RWH, Liu W, Huang Z, Yang Q (2015) Supercnn: A superpixelwise convolutional neural network for salient object detection. Int J Comput Vis 115(3):330\u2013344","journal-title":"Int J Comput Vis"},{"key":"2293_CR100","doi-asserted-by":"crossref","unstructured":"Tang Y, Wu X (2016) Saliency detection via combining region-level and pixel-level predictions with cnns. In: European Conference on Computer Vision. Springer, pp 809\u2013825","DOI":"10.1007\/978-3-319-46484-8_49"},{"issue":"1","key":"2293_CR101","doi-asserted-by":"publisher","first-page":"121","DOI":"10.1109\/TIP.2017.2756825","volume":"27","author":"X Wang","year":"2017","unstructured":"Wang X, Ma H, Chen X, You S (2017) Edge preserving and multi-scale contextual neural network for salient object detection. IEEE Trans Image Process 27(1):121\u2013134","journal-title":"IEEE Trans Image Process"},{"issue":"8","key":"2293_CR102","doi-asserted-by":"publisher","first-page":"1213","DOI":"10.1109\/TCSVT.2012.2198090","volume":"22","author":"X Gao","year":"2012","unstructured":"Gao X, Wang N, Tao D, Li X (2012) Face sketch\u2013photo synthesis and retrieval using sparse representation. IEEE Trans Circ Sys Video Technol 22(8):1213\u20131226","journal-title":"IEEE Trans Circ Sys Video Technol"},{"issue":"10","key":"2293_CR103","doi-asserted-by":"publisher","first-page":"3237","DOI":"10.1016\/j.patcog.2007.12.001","volume":"41","author":"B Niu","year":"2008","unstructured":"Niu B, Yang Q, Shiu S C K, Pal S K (2008) Two-dimensional laplacianfaces method for face recognition. Pattern Recogn 41(10):3237\u20133243","journal-title":"Pattern Recogn"},{"issue":"1","key":"2293_CR104","doi-asserted-by":"publisher","first-page":"9","DOI":"10.1007\/s11263-013-0645-9","volume":"106","author":"N Wang","year":"2014","unstructured":"Wang N, Tao D, Gao X, Li X, Li J (2014) A comprehensive survey to face hallucination. Int J Comput Vis 106(1):9\u201330","journal-title":"Int J Comput Vis"},{"issue":"1","key":"2293_CR105","doi-asserted-by":"publisher","first-page":"103","DOI":"10.1109\/TCYB.2016.2625419","volume":"48","author":"A Majumder","year":"2016","unstructured":"Majumder A, Behera L, Subramanian V K (2016) Automatic facial expression recognition system using deep network-based data fusion. IEEE Trans Cybern 48(1):103\u2013114","journal-title":"IEEE Trans Cybern"},{"key":"2293_CR106","doi-asserted-by":"crossref","unstructured":"Jiang H, Learned-Miller E (2017) Face detection with the faster r-cnn. In: 2017 12th IEEE International Conference on Automatic Face & Gesture Recognition (FG 2017). IEEE, pp 650\u2013657","DOI":"10.1109\/FG.2017.82"},{"key":"2293_CR107","doi-asserted-by":"publisher","first-page":"42","DOI":"10.1016\/j.neucom.2018.03.030","volume":"299","author":"X Sun","year":"2018","unstructured":"Sun X, Wu P, Hoi Steven CH (2018) Face detection using deep learning: An improved faster rcnn approach. Neurocomputing 299:42\u201350","journal-title":"Neurocomputing"},{"key":"2293_CR108","unstructured":"Wang H, Li Z, Ji X, Wang Y (2017) Face r-cnn. arXiv:1706.01061"},{"key":"2293_CR109","unstructured":"Huang L, Yang Y, Deng Y, Yu Y (2015) Densebox: Unifying landmark localization with end to end object detection. arXiv:1509.04874"},{"key":"2293_CR110","doi-asserted-by":"crossref","unstructured":"Li Y, Sun B, Wu T, Wang Y (2016) Face detection with end-to-end integration of a convnet and a 3d model. . In: European Conference on Computer Vision. Springer, pp 420\u2013436","DOI":"10.1007\/978-3-319-46487-9_26"},{"key":"2293_CR111","doi-asserted-by":"crossref","unstructured":"Zhang L, Lin L, Liang X, He K (2016) Is faster r-cnn doing well for pedestrian detection? . In: European conference on computer vision. Springer, pp 443\u2013457","DOI":"10.1007\/978-3-319-46475-6_28"},{"key":"2293_CR112","doi-asserted-by":"crossref","unstructured":"Tian Y, Luo P, Wang X, Tang X (2015) Deep learning strong parts for pedestrian detection. In: Proceedings of the IEEE international conference on computer vision, pp 1904\u20131912","DOI":"10.1109\/ICCV.2015.221"},{"key":"2293_CR113","doi-asserted-by":"crossref","unstructured":"Cai Z, Saberian M, Vasconcelos N (2015) Learning complexity-aware cascades for deep pedestrian detection. In: Proceedings of the IEEE International Conference on Computer Vision, pp 3361\u20133369","DOI":"10.1109\/ICCV.2015.384"},{"issue":"6","key":"2293_CR114","doi-asserted-by":"publisher","first-page":"843","DOI":"10.1109\/TAC.1979.1102177","volume":"24","author":"D Reid","year":"1979","unstructured":"Reid D (1979) An algorithm for tracking multiple targets. IEEE Trans Autom Control 24 (6):843\u2013854","journal-title":"IEEE Trans Autom Control"},{"key":"2293_CR115","doi-asserted-by":"crossref","unstructured":"Wojke N, Bewley A, Paulus D (2017) Simple online and realtime tracking with a deep association metric. In: 2017 IEEE international conference on image processing (ICIP). IEEE, pp 3645\u20133649","DOI":"10.1109\/ICIP.2017.8296962"},{"key":"2293_CR116","doi-asserted-by":"crossref","unstructured":"Leal-Taix\u00e9 L, Canton-Ferrer C, Schindler K (2016) Learning by tracking: Siamese cnn for robust target association. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops, pp 33\u201340","DOI":"10.1109\/CVPRW.2016.59"},{"issue":"3","key":"2293_CR117","doi-asserted-by":"publisher","first-page":"595","DOI":"10.1109\/TPAMI.2017.2691769","volume":"40","author":"S-H Bae","year":"2017","unstructured":"Bae S-H, Yoon K-J (2017) Confidence-based data association and discriminative deep appearance learning for robust online multi-object tracking. IEEE Trans Pattern Anal Mach Intell 40(3):595\u2013610","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2293_CR118","doi-asserted-by":"crossref","unstructured":"Bae S-H, Yoon K-J (2014) Robust online multi-object tracking based on tracklet confidence and online discriminative appearance learning. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 1218\u20131225","DOI":"10.1109\/CVPR.2014.159"},{"key":"2293_CR119","doi-asserted-by":"crossref","unstructured":"Wang B, Wang L, Shuai B, Zuo Z, Liu T, Luk Chan K, Wang G (2016) Joint learning of convolutional neural networks and temporally constrained metrics for tracklet association. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops, pp 1\u20138","DOI":"10.1109\/CVPRW.2016.55"},{"key":"2293_CR120","doi-asserted-by":"crossref","unstructured":"Xiang Y, Alahi A, Savarese S (2015) Learning to track: Online multi-object tracking by decision making. In: Proceedings of the IEEE international conference on computer vision, pp 4705\u2013 4713","DOI":"10.1109\/ICCV.2015.534"},{"key":"2293_CR121","doi-asserted-by":"crossref","unstructured":"Tang S, Andriluka M, Andres B, Schiele B (2017) Multiple people tracking by lifted multicut and person re-identification. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 3539\u20133548","DOI":"10.1109\/CVPR.2017.394"},{"key":"2293_CR122","doi-asserted-by":"crossref","unstructured":"Chen L, Ai H, Shang C, Zhuang Z, Bai B (2017) Online multi-object tracking with convolutional neural networks. In: 2017 IEEE International Conference on Image Processing (ICIP). IEEE, pp 645\u2013649","DOI":"10.1109\/ICIP.2017.8296360"},{"key":"2293_CR123","doi-asserted-by":"crossref","unstructured":"Chu Q, Ouyang W, Li H, Wang X, Liu B, Yu N (2017) Online multi-object tracking using cnn-based single object tracker with spatial-temporal attention mechanism. In: Proceedings of the IEEE International Conference on Computer Vision, pp 4836\u20134845","DOI":"10.1109\/ICCV.2017.518"},{"key":"2293_CR124","doi-asserted-by":"crossref","unstructured":"Son J, Baek M, Cho M, Han B (2017) Multi-object tracking with quadruplet convolutional neural networks. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 5620\u20135629","DOI":"10.1109\/CVPR.2017.403"},{"key":"2293_CR125","unstructured":"Fang K (2016) Track-rnn: joint detection and tracking using recurrent neural networks. . In: Proceedings of the 29th Conference on Neural Information Processing Systems (NIPS 2016), Barcelona"},{"key":"2293_CR126","doi-asserted-by":"crossref","unstructured":"Zhou S, Wang J, Wang J, Gong Y, Zheng N (2017) Point to set similarity based deep feature learning for person re-identification. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 3741\u20133750","DOI":"10.1109\/CVPR.2017.534"},{"key":"2293_CR127","unstructured":"Xiang J, Zhang G, Hou J, Sang N, Huang R (2018) Multiple target tracking by learning feature representation and distance metric jointly. arXiv:1802.03252"},{"key":"2293_CR128","doi-asserted-by":"crossref","unstructured":"Cheng D, Gong Y, Zhou S, Wang J, Zheng N (2016) Person re-identification by multi-channel parts-based cnn with improved triplet loss function. In: Proceedings of the iEEE conference on computer vision and pattern recognition, pp 1335\u20131344","DOI":"10.1109\/CVPR.2016.149"},{"key":"2293_CR129","doi-asserted-by":"crossref","unstructured":"Ma C, Yang C, Yang F, Zhuang Y, Zhang Z, Jia H, Xie X (2018) Trajectory factory: Tracklet cleaving and re-connection by deep siamese bi-gru for multiple object tracking. In: 2018 IEEE International Conference on Multimedia and Expo (ICME). IEEE, pp 1\u20136","DOI":"10.1109\/ICME.2018.8486454"},{"key":"2293_CR130","doi-asserted-by":"crossref","unstructured":"Fernando T, Denman S, Sridharan S, Fookes C (2018) Task specific visual saliency prediction with memory augmented conditional generative adversarial networks. In: 2018 IEEE Winter Conference on Applications of Computer Vision (WACV). IEEE, pp 1539\u20131548","DOI":"10.1109\/WACV.2018.00172"},{"key":"2293_CR131","unstructured":"Goodfellow I, Pouget-Abadie J, Mirza M, Xu B, Warde-Farley D, Ozair S, Courville A, Bengio Y (2014) Generative adversarial nets. In: Advances in neural information processing systems, pp 2672\u20132680"},{"key":"2293_CR132","unstructured":"Gregor K, Danihelka I, Mnih A, Blundell C, Wierstra D (2014) Deep autoregressive networks. In: International Conference on Machine Learning. PMLR, pp 1242\u20131250"},{"key":"2293_CR133","doi-asserted-by":"crossref","unstructured":"Fang K, Xiang Y, Li X, Savarese S (2018) Recurrent autoregressive networks for online multi-object tracking. In: 2018 IEEE Winter Conference on Applications of Computer Vision (WACV). IEEE, pp 466\u2013475","DOI":"10.1109\/WACV.2018.00057"},{"key":"2293_CR134","doi-asserted-by":"crossref","unstructured":"Fernando T, Denman S, Sridharan S, Fookes C (2018) Tracking by prediction: A deep generative model for mutli-person localisation and tracking. In: 2018 IEEE Winter Conference on Applications of Computer Vision (WACV). IEEE, pp 1122\u20131132","DOI":"10.1109\/WACV.2018.00128"},{"key":"2293_CR135","doi-asserted-by":"crossref","unstructured":"Sadeghian A, Alahi A, Savarese S (2017) Tracking the untrackable: Learning to track multiple cues with long-term dependencies. In: Proceedings of the IEEE International Conference on Computer Vision, pp 300\u2013311","DOI":"10.1109\/ICCV.2017.41"},{"key":"2293_CR136","doi-asserted-by":"crossref","unstructured":"Kim C, Li F, Rehg J M (2018) Multi-object tracking with neural gating using bilinear lstm. In: Proceedings of the European Conference on Computer Vision (ECCV), pp 200\u2013215","DOI":"10.1007\/978-3-030-01237-3_13"},{"key":"2293_CR137","doi-asserted-by":"crossref","unstructured":"Schulter S, Vernaza P, Choi W, Chandraker M (2017) Deep network flow for multi-object tracking. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 6951\u20136960","DOI":"10.1109\/CVPR.2017.292"},{"key":"2293_CR138","doi-asserted-by":"crossref","unstructured":"Tang S, Andres B, Andriluka M, Schiele B (2016) Multi-person tracking by multicut and deep matching. In: European Conference on Computer Vision. Springer, pp 100\u2013111","DOI":"10.1007\/978-3-319-48881-3_8"},{"key":"2293_CR139","doi-asserted-by":"crossref","unstructured":"Li W, Zhao R, Xiao T, Wang X (2014) Deepreid: Deep filter pairing neural network for person re-identification. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 152\u2013159","DOI":"10.1109\/CVPR.2014.27"},{"key":"2293_CR140","doi-asserted-by":"crossref","unstructured":"Zheng L, Bie Z, Sun Y, Wang J, Su C, Wang S, Tian Q (2016) Mars: A video benchmark for large-scale person re-identification. In: European Conference on Computer Vision. Springer, pp 868\u2013884","DOI":"10.1007\/978-3-319-46466-4_52"},{"key":"2293_CR141","unstructured":"Leal-Taix\u00e9 L, Milan A, Reid I, Roth S, Schindler K (2015) Motchallenge 2015: Towards a benchmark for multi-target tracking. arXiv:1504.01942"},{"key":"2293_CR142","unstructured":"Milan A, Leal-Taix\u00e9 L, Reid I, Roth S, Schindler K (2016) Mot16: A benchmark for multi-object tracking. arXiv:1603.00831"},{"key":"2293_CR143","doi-asserted-by":"crossref","unstructured":"Zhu Y, Zhao C, Wang J, Zhao X, Wu Y, Lu H (2017) Couplenet: Coupling global structure with local parts for object detection. In: Proceedings of the IEEE international conference on computer vision, pp 4126\u20134134","DOI":"10.1109\/ICCV.2017.444"},{"key":"2293_CR144","doi-asserted-by":"crossref","unstructured":"Bodla N, Singh B, Chellappa R, Davis L S (2017) Soft-nms\u2013improving object detection with one line of code. In: Proceedings of the IEEE international conference on computer vision, pp 5561\u20135569","DOI":"10.1109\/ICCV.2017.593"},{"key":"2293_CR145","doi-asserted-by":"crossref","unstructured":"Sun S, Akhtar N, Song H, Mian A S, Shah M (2019) Deep affinity network for multiple object tracking. IEEE transactions on pattern analysis and machine intelligence","DOI":"10.1109\/TPAMI.2019.2929520"},{"issue":"8","key":"2293_CR146","doi-asserted-by":"publisher","first-page":"1532","DOI":"10.1109\/TPAMI.2014.2300479","volume":"36","author":"P Doll\u00e1r","year":"2014","unstructured":"Doll\u00e1r P, Appel R, Belongie S, Perona P (2014) Fast feature pyramids for object detection. IEEE Trans Pattern Anal Mach Intell 36(8):1532\u20131545","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"6","key":"2293_CR147","doi-asserted-by":"publisher","first-page":"1990","DOI":"10.1109\/TCYB.2018.2803217","volume":"49","author":"J Shen","year":"2018","unstructured":"Shen J, Liang Z, Liu J, Sun H, Shao L, Tao D (2018) Multiobject tracking by submodular optimization. IEEE Trans Cybern 49(6):1990\u20132001","journal-title":"IEEE Trans Cybern"},{"key":"2293_CR148","doi-asserted-by":"crossref","unstructured":"Bochinski E, Eiselein V, Sikora T (2017) High-speed tracking-by-detection without using image information. In: 2017 14th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS). IEEE, pp 1\u20136","DOI":"10.1109\/AVSS.2017.8078516"},{"key":"2293_CR149","doi-asserted-by":"crossref","unstructured":"Pirsiavash H, Ramanan D, Fowlkes C C (2011) Globally-optimal greedy algorithms for tracking a variable number of objects. In: CVPR 2011. IEEE, pp 1201\u20131208","DOI":"10.1109\/CVPR.2011.5995604"},{"key":"2293_CR150","doi-asserted-by":"crossref","unstructured":"Andriyenko A, Schindler K, Roth S (2012) Discrete-continuous optimization for multi-target tracking. In: 2012 IEEE Conference on Computer Vision and Pattern Recognition. IEEE, pp 1926\u20131933","DOI":"10.1109\/CVPR.2012.6247893"},{"key":"2293_CR151","doi-asserted-by":"crossref","unstructured":"Wen L, Li W, Yan J, Lei Z, Yi D, Li S Z (2014) Multiple target tracking based on undirected hierarchical relation hypergraph. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 1282\u20131289","DOI":"10.1109\/CVPR.2014.167"},{"key":"2293_CR152","doi-asserted-by":"crossref","unstructured":"Dicle C, Camps O I, Sznaier M (2013) The way they move: Tracking multiple targets with similar appearance. In: Proceedings of the IEEE international conference on computer vision, pp 2304\u20132311","DOI":"10.1109\/ICCV.2013.286"},{"key":"2293_CR153","doi-asserted-by":"crossref","unstructured":"Andriyenko A, Schindler K (2011) Multi-target tracking by continuous energy minimization. In: CVPR, vol 2, pp 7","DOI":"10.1109\/CVPR.2011.5995311"},{"key":"2293_CR154","doi-asserted-by":"crossref","unstructured":"Bewley A, Ge Z, Ott L, Ramos F, Upcroft B (2016) Simple online and realtime tracking. In: 2016 IEEE International Conference on Image Processing (ICIP). IEEE, pp 3464\u2013 3468","DOI":"10.1109\/ICIP.2016.7533003"},{"issue":"7","key":"2293_CR155","doi-asserted-by":"publisher","first-page":"1761","DOI":"10.1109\/TPAMI.2018.2842770","volume":"41","author":"R He","year":"2018","unstructured":"He R, Wu X, Sun Z, Tan T (2018) Wasserstein cnn: Learning invariant features for nir-vis face recognition. IEEE Trans Pattern Anal Mach Intell 41(7):1761\u20131773","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"10","key":"2293_CR156","doi-asserted-by":"publisher","first-page":"2005","DOI":"10.1109\/TPAMI.2011.281","volume":"34","author":"MJ Saberian","year":"2012","unstructured":"Saberian M J, Vasconcelos N (2012) Learning optimal embedded cascades. IEEE Trans Pattern Anal Mach Intell 34(10):2005\u20132018","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"10","key":"2293_CR157","doi-asserted-by":"publisher","first-page":"2681","DOI":"10.1109\/TITS.2016.2530146","volume":"17","author":"SRE Datondji","year":"2016","unstructured":"Datondji S R E, Dupuis Y, Subirats P, Vasseur P (2016) A survey of vision-based traffic monitoring of road intersections. IEEE Trans Intell Transp Syst 17(10):2681\u20132698","journal-title":"IEEE Trans Intell Transp Syst"},{"issue":"12","key":"2293_CR158","doi-asserted-by":"publisher","first-page":"7405","DOI":"10.1109\/TGRS.2016.2601622","volume":"54","author":"G Cheng","year":"2016","unstructured":"Cheng G, Zhou P, Han J (2016) Learning rotation-invariant convolutional neural networks for object detection in vhr optical remote sensing images. IEEE Trans Geosci Remote Sens 54(12):7405\u20137415","journal-title":"IEEE Trans Geosci Remote Sens"},{"key":"2293_CR159","doi-asserted-by":"publisher","first-page":"11","DOI":"10.1016\/j.isprsjprs.2016.03.014","volume":"117","author":"G Cheng","year":"2016","unstructured":"Cheng G, Han J (2016) A survey on object detection in optical remote sensing images. ISPRS J Photogramm Remote Sens 117:11\u201328","journal-title":"ISPRS J Photogramm Remote Sens"},{"issue":"3","key":"2293_CR160","doi-asserted-by":"publisher","first-page":"169","DOI":"10.1049\/trit.2018.1015","volume":"3","author":"P Shivakumara","year":"2018","unstructured":"Shivakumara P, Tang D, Asadzadehkaljahi M, Lu T, Pal U, Anisi M H (2018) Cnn-rnn based method for license plate recognition. CAAI Trans Intell Technol 3(3):169\u2013175","journal-title":"CAAI Trans Intell Technol"},{"key":"2293_CR161","doi-asserted-by":"crossref","unstructured":"Sarfraz M, Ahmed M J (2019) An approach to license plate recognition system using neural network. In: Exploring Critical Approaches of Evolutionary Computation. IGI Global, pp 20\u201336","DOI":"10.4018\/978-1-5225-5832-3.ch002"},{"issue":"1","key":"2293_CR162","doi-asserted-by":"publisher","first-page":"25","DOI":"10.26634\/jip.5.1.13984","volume":"5","author":"AS Nair","year":"2018","unstructured":"Nair A S, Raju S, Harikrishnan KJ, Mathew A (2018) A survey of techniques for license plate detection and recognition. i-manager\u2019s J Image Process 5(1):25","journal-title":"i-manager\u2019s J Image Process"},{"key":"2293_CR163","doi-asserted-by":"crossref","unstructured":"Banerjee K, Notz D, Windelen J, Gavarraju S, He M (2018) Online camera lidar fusion and object detection on hybrid data for autonomous driving. In: 2018 IEEE Intelligent Vehicles Symposium (IV). IEEE, pp 1632\u20131638","DOI":"10.1109\/IVS.2018.8500699"},{"issue":"10","key":"2293_CR164","doi-asserted-by":"publisher","first-page":"3782","DOI":"10.1109\/TITS.2019.2892405","volume":"20","author":"E Arnold","year":"2019","unstructured":"Arnold E, Al-Jarrah O Y, Dianati M, Fallah S, Oxtoby D, Mouzakitis A (2019) A survey on 3d object detection methods for autonomous driving applications. IEEE Trans Intell Transp Syst 20 (10):3782\u20133795","journal-title":"IEEE Trans Intell Transp Syst"},{"key":"2293_CR165","doi-asserted-by":"publisher","first-page":"53","DOI":"10.1016\/j.neucom.2019.04.028","volume":"350","author":"Z Li","year":"2019","unstructured":"Li Z, Dong M, Wen S, Hu X, Zhou P, Zeng Z (2019) Clu-cnns: Object detection for medical images. Neurocomputing 350:53\u201359","journal-title":"Neurocomputing"},{"key":"2293_CR166","doi-asserted-by":"crossref","unstructured":"Lu W, Zhou Y, Wan G, Hou S, Song S (2019) L3-net: Towards learning based lidar localization for autonomous driving. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 6389\u20136398","DOI":"10.1109\/CVPR.2019.00655"},{"key":"2293_CR167","doi-asserted-by":"publisher","first-page":"99540","DOI":"10.1109\/ACCESS.2019.2929365","volume":"7","author":"F Altaf","year":"2019","unstructured":"Altaf F, Islam Syed MS, Akhtar N, Janjua N K (2019) Going deep in medical image analysis: Concepts, methods, challenges, and future directions. IEEE Access 7:99540\u201399572","journal-title":"IEEE Access"},{"issue":"2","key":"2293_CR168","doi-asserted-by":"publisher","first-page":"1041","DOI":"10.1007\/s10462-018-9664-9","volume":"52","author":"S Naji","year":"2019","unstructured":"Naji S, Jalab H A, Kareem S A (2019) A survey on skin detection in colored images. Artif Intell Rev 52(2):1041\u20131087","journal-title":"Artif Intell Rev"},{"key":"2293_CR169","doi-asserted-by":"crossref","unstructured":"Anderson P, He X, Buehler C, Teney D, Johnson M, Gould S, Zhang L (2018) Bottom-up and top-down attention for image captioning and visual question answering. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 6077\u20136086","DOI":"10.1109\/CVPR.2018.00636"},{"issue":"1-3","key":"2293_CR170","doi-asserted-by":"publisher","first-page":"112","DOI":"10.1007\/s11263-012-0575-y","volume":"102","author":"S Friedman","year":"2013","unstructured":"Friedman S, Stamos I (2013) Online detection of repeated structures in point clouds of urban scenes for compression and registration. Int J Comput Vis 102(1-3):112\u2013128","journal-title":"Int J Comput Vis"},{"key":"2293_CR171","doi-asserted-by":"publisher","first-page":"291","DOI":"10.1016\/j.neucom.2018.05.080","volume":"311","author":"S Bai","year":"2018","unstructured":"Bai S, An S (2018) A survey on automatic image caption generation. Neurocomputing 311:291\u2013304","journal-title":"Neurocomputing"},{"issue":"6","key":"2293_CR172","doi-asserted-by":"publisher","first-page":"1377","DOI":"10.1109\/TPAMI.2019.2895793","volume":"42","author":"W Yang","year":"2019","unstructured":"Yang W, Tan R T, Feng J, Guo Z, Yan S, Liu J (2019) Joint rain detection and removal from a single image with contextualized deep networks. IEEE Trans Pattern Anal Mach Intell 42(6):1377\u20131393","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"1","key":"2293_CR173","doi-asserted-by":"publisher","first-page":"117","DOI":"10.1109\/TSMCB.2008.2005527","volume":"39","author":"D Sen","year":"2008","unstructured":"Sen D, Pal S K (2008) Generalized rough sets, entropy, and image ambiguity measures. IEEE Trans Syst Man Cybern Part B (Cybern) 39(1):117\u2013128","journal-title":"IEEE Trans Syst Man Cybern Part B (Cybern)"},{"key":"2293_CR174","doi-asserted-by":"publisher","first-page":"37","DOI":"10.1016\/j.tcs.2012.08.021","volume":"466","author":"A Ganivada","year":"2012","unstructured":"Ganivada A, Ray S S, Pal S K (2012) Fuzzy rough granular self-organizing map and fuzzy rough entropy. Theor Comput Sci 466:37\u201363","journal-title":"Theor Comput Sci"},{"issue":"5","key":"2293_CR175","doi-asserted-by":"publisher","first-page":"683","DOI":"10.1109\/72.159058","volume":"3","author":"SK Pal","year":"1992","unstructured":"Pal S K, Mitra S (1992) Multi-layer perceptron, fuzzy sets and classification. IEEE Trans Neural Netw 3(5):683\u2013697","journal-title":"IEEE Trans Neural Netw"},{"issue":"1","key":"2293_CR176","doi-asserted-by":"publisher","first-page":"51","DOI":"10.1109\/72.363450","volume":"6","author":"S Mitra","year":"1995","unstructured":"Mitra S, Pal S K (1995) Fuzzy multi-layer perceptron, inferencing and rule generation. IEEE Trans Neural Netw 6(1):51\u201363","journal-title":"IEEE Trans Neural Netw"},{"issue":"4","key":"2293_CR177","doi-asserted-by":"publisher","first-page":"677","DOI":"10.1016\/j.imavis.2009.10.010","volume":"28","author":"D Sen","year":"2010","unstructured":"Sen D, Pal SK (2010) Gradient histogram: thresholding in a region of interest for edge detection. Image Vis Comput 28(4):677\u2013695","journal-title":"Image Vis Comput"},{"key":"2293_CR178","doi-asserted-by":"publisher","unstructured":"Pramanik A, Pal SK, Maiti J, Mitra P (2021) Granulated RCNN and multi-class deep sort for multi-object detection and tracking. IEEE Transactions on Emerging Topics in Computational Intelligence. https:\/\/doi.org\/10.1109\/TETCI.2020.3041019","DOI":"10.1109\/TETCI.2020.3041019"},{"issue":"1\u20132","key":"2293_CR179","doi-asserted-by":"publisher","first-page":"197","DOI":"10.3233\/FI-2013-831","volume":"124","author":"SK Pal","year":"2013","unstructured":"Pal SK, Banerjee R, Dutta S, Sarma SS (2013) An insight into the Z-number approach to CWW. Fundamenta Informaticae 124(1\u20132):197\u2013229","journal-title":"Fundamenta Informaticae"},{"key":"2293_CR180","doi-asserted-by":"publisher","first-page":"143","DOI":"10.1016\/j.ins.2015.06.026","volume":"323","author":"R Banerjee","year":"2015","unstructured":"Banerjee R, Pal SK (2015) Z*-numbers: augmented Z-numbers for machine-subjectivity representation. Inform Sci 323:143\u2013178","journal-title":"Inform Sci"},{"issue":"1\u20132","key":"2293_CR181","doi-asserted-by":"publisher","first-page":"135","DOI":"10.1016\/0020-0255(92)90037-9","volume":"61","author":"SK Pal","year":"1992","unstructured":"Pal SK, Mandal DP (1992) Linguistic recognition system based on approximate reasoning. Inform Sci 61(1\u20132):135\u2013161","journal-title":"Inform Sci"}],"container-title":["Applied Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-021-02293-7.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10489-021-02293-7\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-021-02293-7.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2021,8,18]],"date-time":"2021-08-18T06:07:12Z","timestamp":1629266832000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10489-021-02293-7"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,4,9]]},"references-count":181,"journal-issue":{"issue":"9","published-print":{"date-parts":[[2021,9]]}},"alternative-id":["2293"],"URL":"https:\/\/doi.org\/10.1007\/s10489-021-02293-7","relation":{},"ISSN":["0924-669X","1573-7497"],"issn-type":[{"value":"0924-669X","type":"print"},{"value":"1573-7497","type":"electronic"}],"subject":[],"published":{"date-parts":[[2021,4,9]]},"assertion":[{"value":"26 February 2021","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"9 April 2021","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The paper is original in its contents and is not under consideration for publication in any other journals\/proceedings. There is no potential conflict of interest to disclose, such as employment, financial or non-financial interest. There is no funding received by this work. The authors have no financial or proprietary interests in any material discussed in this article.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"<!--Emphasis Type='Bold' removed-->Conflict of interest"}}]}}