{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,9,4]],"date-time":"2025-09-04T14:05:50Z","timestamp":1756994750009,"version":"3.37.3"},"reference-count":85,"publisher":"Springer Science and Business Media LLC","issue":"10","license":[{"start":{"date-parts":[[2022,9,28]],"date-time":"2022-09-28T00:00:00Z","timestamp":1664323200000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2022,9,28]],"date-time":"2022-09-28T00:00:00Z","timestamp":1664323200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"published-print":{"date-parts":[[2023,4]]},"DOI":"10.1007\/s11042-022-13999-2","type":"journal-article","created":{"date-parts":[[2022,9,28]],"date-time":"2022-09-28T10:04:07Z","timestamp":1664359447000},"page":"15143-15170","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":5,"title":["Hybrid attention network and center-guided non-maximum suppression for occluded face detection"],"prefix":"10.1007","volume":"82","author":[{"given":"Mingxin","family":"Jin","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7634-5839","authenticated-orcid":false,"given":"Huifang","family":"Li","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zhaoqiang","family":"Xia","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2022,9,28]]},"reference":[{"issue":"12","key":"13999_CR1","doi-asserted-by":"publisher","first-page":"19043","DOI":"10.1007\/s11042-021-10704-7","volume":"80","author":"SK Behera","year":"2021","unstructured":"Behera SK, Rath AK, Sethy PK (2021) Fruits yield estimation using faster r-CNN with miou. Multimed Tools Appl 80(12):19043\u201319056","journal-title":"Multimed Tools Appl"},{"key":"13999_CR2","doi-asserted-by":"crossref","unstructured":"Bodla N, Singh B, Chellappa R, Davis LS (2017) Soft-NMS\u2013improving object detection with one line of code. In: IEEE International conference on computer vision, pp 5561\u20135569","DOI":"10.1109\/ICCV.2017.593"},{"key":"13999_CR3","unstructured":"Chen Y, Kalantidis Y, Li J, Yan S, Feng J (2018) A2-nets: Double attention networks. In: Advances in neural information processing systems, vol 31"},{"key":"13999_CR4","doi-asserted-by":"crossref","unstructured":"Chen Y, Song L, Hu Y, He R (2018) Adversarial occlusion-aware face detection. In: IEEE International conference on biometrics theory, applications and systems, pp 1\u20139","DOI":"10.1109\/BTAS.2018.8698572"},{"key":"13999_CR5","unstructured":"Chen S, Wang X, Chen C, Lu Y, Zhang X, Wen L (2019) DeepSquare: Boosting the learning power of deep convolutional neural networks with elementwise square operators. arXiv:1906.04979"},{"key":"13999_CR6","doi-asserted-by":"crossref","unstructured":"Chen L, Zhang H, Xiao J, Nie L, Shao J, Liu W, Chua T-S (2017) SCA-CNN: Spatial And channel-wise attention in convolutional networks for image captioning. In: IEEE Conference on computer vision and pattern recognition, pp 5659\u20135667","DOI":"10.1109\/CVPR.2017.667"},{"key":"13999_CR7","doi-asserted-by":"crossref","unstructured":"Cheng G, Lang C, Wu M, Xie X, Yao X, Han J (2021) Feature enhancement network for object detection in optical remote sensing images. Journal of Remote Sensing 2021","DOI":"10.34133\/2021\/9805389"},{"issue":"3","key":"13999_CR8","doi-asserted-by":"publisher","first-page":"431","DOI":"10.1109\/LGRS.2020.2975541","volume":"18","author":"G Cheng","year":"2020","unstructured":"Cheng G, Si Y, Hong H, Yao X, Guo L (2020) Cross-scale feature fusion for object detection in optical remote sensing images. IEEE Geosci Remote Sens Lett 18(3):431\u2013435","journal-title":"IEEE Geosci Remote Sens Lett"},{"key":"13999_CR9","doi-asserted-by":"crossref","unstructured":"Chi C, Zhang S, Xing J, Lei Z, Li SZ, Zou X (2019) Selective refinement network for high performance face detection. In: AAAI Conference on artificial intelligence, vol 33, pp 8231\u20138238","DOI":"10.1609\/aaai.v33i01.33018231"},{"key":"13999_CR10","doi-asserted-by":"crossref","unstructured":"Dai T, Cai J, Zhang Y, Xia S-T, Zhang L (2019) Second-order attention network for single image super-resolution. In: IEEE Conference on computer vision and pattern recognition, pp 11065\u201311074","DOI":"10.1109\/CVPR.2019.01132"},{"key":"13999_CR11","doi-asserted-by":"publisher","first-page":"20","DOI":"10.1016\/j.neucom.2020.02.060","volume":"398","author":"Z Fang","year":"2020","unstructured":"Fang Z, Ren J, Marshall S, Zhao H, Wang Z, Huang K, Xiao B (2020) Triple loss for hard face detection. Neurocomputing 398:20\u201330","journal-title":"Neurocomputing"},{"key":"13999_CR12","doi-asserted-by":"crossref","unstructured":"Fu J, Liu J, Tian H, Li Y, Bao Y, Fang Z, Lu H (2019) Dual attention network for scene segmentation. In: IEEE Conference on computer vision and pattern recognition, pp 3146\u20133154","DOI":"10.1109\/CVPR.2019.00326"},{"key":"13999_CR13","unstructured":"G\u00e4hlert N, Hanselmann N, Franke U, Denzler J (2020) Visibility guided NMS: Efficient boosting of amodal object detection in crowded traffic scenes. arXiv:2006.08547"},{"key":"13999_CR14","doi-asserted-by":"publisher","first-page":"7383","DOI":"10.1109\/ACCESS.2020.2963913","volume":"8","author":"Y Gan","year":"2020","unstructured":"Gan Y, Chen J, Yang Z, Xu L (2020) Multiple attention network for facial expression recognition. IEEE Access 8:7383\u20137393","journal-title":"IEEE Access"},{"key":"13999_CR15","doi-asserted-by":"crossref","unstructured":"Gao Z, Xie J, Wang Q, Li P (2019) Global second-order pooling convolutional networks. In: IEEE Conference on computer vision and pattern recognition, pp 3024\u20133033","DOI":"10.1109\/CVPR.2019.00314"},{"key":"13999_CR16","doi-asserted-by":"crossref","unstructured":"Ge S, Li J, Ye Q, Luo Z (2017) Detecting masked faces in the wild with LLE-CNNs. In: IEEE Conference on computer vision and pattern recognition, pp 2682\u20132690","DOI":"10.1109\/CVPR.2017.53"},{"key":"13999_CR17","unstructured":"Ghiasi G, Fowlkes CC (2015) Occlusion coherence: Detecting and localizing occluded faces. arXiv:1506.08347"},{"key":"13999_CR18","unstructured":"Glorot X, Bengio Y (2010) Understanding the difficulty of training deep feedforward neural networks. In: International conference on artificial intelligence and statistics, pp 249\u2013256"},{"issue":"5","key":"13999_CR19","doi-asserted-by":"publisher","first-page":"1025","DOI":"10.1109\/TPAMI.2019.2961900","volume":"42","author":"R He","year":"2020","unstructured":"He R, Cao J, Song L, Sun Z, Tan T (2020) Adversarial cross-spectral face completion for NIR-VIS face recognition. IEEE Trans Pattern Anal Mach Intell 42(5):1025\u20131037","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"13999_CR20","doi-asserted-by":"crossref","unstructured":"He L, Li H, Zhang Q, Sun Z (2018) Dynamic feature learning for partial face recognition. In: IEEE Conference on computer vision and pattern recognition, pp 7054\u20137063","DOI":"10.1109\/CVPR.2018.00737"},{"key":"13999_CR21","doi-asserted-by":"crossref","unstructured":"Hou Q, Zhou D, Feng J (2021) Coordinate attention for efficient mobile network design. In: IEEE Conference on computer vision and pattern recognition, pp 13713\u201313722","DOI":"10.1109\/CVPR46437.2021.01350"},{"key":"13999_CR22","doi-asserted-by":"crossref","unstructured":"Hu J, Shen L, Sun G (2018) Squeeze-and-excitation networks. In: IEEE Conference on computer vision and pattern recognition, pp 7132\u20137141","DOI":"10.1109\/CVPR.2018.00745"},{"key":"13999_CR23","doi-asserted-by":"crossref","unstructured":"Hu X, Yang K, Fei L, Wang K (2019) ACNEt: Attention based network to exploit complementary features for rgbd semantic segmentation. In: IEEE International conference on image processing, pp 1440\u20131444","DOI":"10.1109\/ICIP.2019.8803025"},{"key":"13999_CR24","doi-asserted-by":"crossref","unstructured":"Huang X, Ge Z, Jie Z, Yoshie O (2020) NMS By representative region: Towards crowded pedestrian detection by proposal pairing. In: IEEE Conference on computer vision and pattern recognition, pp 10750\u201310759","DOI":"10.1109\/CVPR42600.2020.01076"},{"key":"13999_CR25","doi-asserted-by":"crossref","unstructured":"Huang Z, Wang X, Huang L, Huang C, Wei Y, Liu W (2019) CCNEt: Criss-cross attention for semantic segmentation. In: IEEE International conference on computer vision, pp 603\u2013612","DOI":"10.1109\/ICCV.2019.00069"},{"key":"13999_CR26","unstructured":"Huang L, Yuan Y, Guo J, Zhang C, Chen X, Wang J (2019) Interlaced sparse self-attention for semantic segmentation. arXiv:1907.12273"},{"issue":"5","key":"13999_CR27","doi-asserted-by":"publisher","first-page":"2203","DOI":"10.1109\/TIP.2017.2675206","volume":"26","author":"M Iliadis","year":"2017","unstructured":"Iliadis M, Wang H, Molina R, Katsaggelos AK (2017) Robust and low-rank representation for fast face identification with occlusions. IEEE Trans Image Process 26(5):2203\u20132218","journal-title":"IEEE Trans Image Process"},{"key":"13999_CR28","unstructured":"Jaderberg M, Simonyan K, Zisserman A, et al. (2015) Spatial transformer networks. In: Advances in neural information processing systems, vol 28"},{"key":"13999_CR29","unstructured":"Jain V, Learned-Miller E (2010) FDDB: A Benchmark for face detection in unconstrained settings. Technical Report UM-CS-2010-009, University of Massachusetts Amherst"},{"key":"13999_CR30","doi-asserted-by":"crossref","unstructured":"Kumar A, Marks TK, Mou W, Wang Y, Jones M, Cherian A, Koike-Akino T, Liu X, Feng C (2020) LUVLI face alignment: Estimating landmarks\u2019 location, uncertainty, and visibility likelihood. In: IEEE Conference on computer vision and pattern recognition, pp 8236\u20138246","DOI":"10.1109\/CVPR42600.2020.00826"},{"key":"13999_CR31","doi-asserted-by":"crossref","unstructured":"Lee H, Kim H-E, Nam H (2019) SRM: A style-based recalibration module for convolutional neural networks. In: IEEE International conference on computer vision, pp 1854\u20131862","DOI":"10.1109\/ICCV.2019.00194"},{"key":"13999_CR32","doi-asserted-by":"crossref","unstructured":"Li J, Wang Y, Wang C, Tai Y, Qian J, Yang J, Wang C, Li J, Huang F (2019) DSFD: Dual Shot face detector. In: IEEE Conference on computer vision and pattern recognition, pp 5060\u20135069","DOI":"10.1109\/CVPR.2019.00520"},{"key":"13999_CR33","unstructured":"Linsley D, Shiebler D, Eberhardt S, Serre T (2019) Learning what and where to attend. In: International conference on learning representations"},{"key":"13999_CR34","doi-asserted-by":"crossref","unstructured":"Liu S, Huang D, Wang Y (2019) Adaptive NMS: Refining pedestrian detection in a crowd. In: IEEE Conference on computer vision and pattern recognition, pp 6459\u20136468","DOI":"10.1109\/CVPR.2019.00662"},{"key":"13999_CR35","doi-asserted-by":"crossref","unstructured":"Liu Y, Tang X (2020) BFBOx: Searching face-appropriate backbone and feature pyramid network for face detector. In: IEEE Conference on computer vision and pattern recognition, pp 13568\u201313577","DOI":"10.1109\/CVPR42600.2020.01358"},{"key":"13999_CR36","doi-asserted-by":"crossref","unstructured":"Liu Y, Tang X, Wu X, Han J, Liu J, Ding E (2020) HAMBOx: Delving into online high-quality anchors mining for detecting outer faces. In: IEEE Conference on computer vision and pattern recognition, pp 13043\u201313051","DOI":"10.1109\/CVPR42600.2020.01306"},{"key":"13999_CR37","doi-asserted-by":"crossref","unstructured":"Lu X, Wang W, Ma C, Shen J, Shao L, Porikli F (2019) See more, know more: Unsupervised video object segmentation with co-attention siamese networks. In: IEEE Conference on computer vision and pattern recognition, pp 3623\u20133632","DOI":"10.1109\/CVPR.2019.00374"},{"issue":"4","key":"13999_CR38","first-page":"2228","volume":"44","author":"X Lu","year":"2022","unstructured":"Lu X, Wang W, Shen J, Crandall D, Luo J (2022) Zero-shot video object segmentation with co-attention siamese networks. IEEE Trans Pattern Anal Mach Intell 44(4):2228\u20132242","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"13999_CR39","doi-asserted-by":"crossref","unstructured":"Lu X, Wang W, Shen J, Crandall D, Van Gool L (2021) Segmenting objects from relational visual data. IEEE Trans Pattern Anal Mach Intell, 1\u20131","DOI":"10.1109\/TPAMI.2020.3040258"},{"key":"13999_CR40","doi-asserted-by":"publisher","first-page":"180","DOI":"10.1016\/j.patrec.2020.03.002","volume":"133","author":"J Luo","year":"2020","unstructured":"Luo J, Liu J, Lin J, Wang Z (2020) A lightweight face detector by integrating the convolutional neural network with the image pyramid. Pattern Recogn Lett 133:180\u2013187","journal-title":"Pattern Recogn Lett"},{"key":"13999_CR41","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1016\/j.imavis.2018.12.003","volume":"82","author":"U Mahbub","year":"2019","unstructured":"Mahbub U, Sarkar S, Chellappa R (2019) Partial face detection in the mobile domain. Image Vis Comput 82:1\u201317","journal-title":"Image Vis Comput"},{"key":"13999_CR42","doi-asserted-by":"crossref","unstructured":"Mathias M, Benenson R, Pedersoli M, Van Gool L (2014) Face detection without bells and whistles. In: European conference on computer vision, pp 720\u2013735","DOI":"10.1007\/978-3-319-10593-2_47"},{"key":"13999_CR43","doi-asserted-by":"crossref","unstructured":"Misra D, Nalamada T, Arasanipalai AU, Hou Q (2021) Rotate to attend: Convolutional triplet attention module. In: IEEE Winter conference on applications of computer vision, pp 3139\u20133148","DOI":"10.1109\/WACV48630.2021.00318"},{"key":"13999_CR44","unstructured":"Mnih V, Heess N, Graves A, et al. (2014) Recurrent models of visual attention. In: Advances in neural information processing systems, vol 27"},{"key":"13999_CR45","doi-asserted-by":"crossref","unstructured":"Najibi M, Samangouei P, Chellappa R, Davis LS (2017) SSH: Single Stage headless face detector. In: IEEE international conference on computer vision, pp 4875\u20134884","DOI":"10.1109\/ICCV.2017.522"},{"key":"13999_CR46","doi-asserted-by":"publisher","first-page":"119","DOI":"10.1016\/j.neucom.2017.12.071","volume":"395","author":"F Nian","year":"2020","unstructured":"Nian F, Li T, Bao B-K, Xu C (2020) Relative coordinates constraint for face alignment. Neurocomputing 395:119\u2013127","journal-title":"Neurocomputing"},{"key":"13999_CR47","doi-asserted-by":"crossref","unstructured":"Opitz M, Waltner G, Poier G, Possegger H, Bischof H (2016) Grid loss: Detecting occluded faces. In: European conference on computer vision, pp 386\u2013402","DOI":"10.1007\/978-3-319-46487-9_24"},{"key":"13999_CR48","unstructured":"Park J, Woo S, Lee J. -Y., Kweon IS (2018) BAM: Bottleneck Attention module. In: British machine vision conference, pp 147\u2013157"},{"key":"13999_CR49","doi-asserted-by":"crossref","unstructured":"Qin Z, Zhang P, Wu F, Li X (2021) Fcanet: Frequency channel attention networks. In: IEEE International conference on computer vision, pp 783\u2013792","DOI":"10.1109\/ICCV48922.2021.00082"},{"issue":"3","key":"13999_CR50","doi-asserted-by":"publisher","first-page":"426","DOI":"10.1016\/j.jvcir.2011.12.006","volume":"23","author":"M Roccetti","year":"2012","unstructured":"Roccetti M, Marfia G, Semeraro A (2012) Playing into the wild: a gesture-based interface for gaming in public spaces. J Vis Commun Image Represent 23 (3):426\u2013440","journal-title":"J Vis Commun Image Represent"},{"issue":"4","key":"13999_CR51","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/1921141.1921148","volume":"8","author":"M Roccetti","year":"2010","unstructured":"Roccetti M, Marfia G, Zanichelli M (2010) The art and craft of making the tortellino: Playing with a digital gesture recognizer for preparing pasta culinary recipes. Comput Entertain 8(4):1\u201320","journal-title":"Comput Entertain"},{"issue":"2","key":"13999_CR52","doi-asserted-by":"publisher","first-page":"540","DOI":"10.1109\/TMI.2018.2867261","volume":"38","author":"AG Roy","year":"2018","unstructured":"Roy AG, Navab N, Wachinger C (2018) Recalibrating fully convolutional networks with spatial and channel \u201csqueeze and excitation\u201d blocks. IEEE Trans Med Imaging 38(2):540\u2013549","journal-title":"IEEE Trans Med Imaging"},{"key":"13999_CR53","unstructured":"Salscheider NO (2020) FeatureNMS: Non-maximum suppression by learning feature embeddings. In: International conference on pattern recognition, pp 7848\u20137854"},{"key":"13999_CR54","doi-asserted-by":"crossref","unstructured":"Selvaraju RR, Cogswell M, Das A, Vedantam R, Parikh D, Batra D (2017) Grad-CAM: Visual explanations from deep networks via gradient-based localization. In: IEEE International conference on computer vision, pp 618\u2013626","DOI":"10.1109\/ICCV.2017.74"},{"key":"13999_CR55","doi-asserted-by":"crossref","unstructured":"Triantafyllidou D, Tefas A (2016) Face detection based on deep convolutional neural networks exploiting incremental facial part learning. In: International conference on pattern recognition, pp 3560\u20133565","DOI":"10.1109\/ICPR.2016.7900186"},{"key":"13999_CR56","doi-asserted-by":"crossref","unstructured":"Wang X, Girshick R, Gupta A, He K (2018) Non-local neural networks. In: IEEE Conference on computer vision and pattern recognition, pp 7794\u20137803","DOI":"10.1109\/CVPR.2018.00813"},{"key":"13999_CR57","doi-asserted-by":"crossref","unstructured":"Wang F, Jiang M, Qian C, Yang S, Li C, Zhang H, Wang X, Tang X (2017) Residual attention network for image classification. In: IEEE Conference on computer vision and pattern recognition, pp 3156\u20133164","DOI":"10.1109\/CVPR.2017.683"},{"key":"13999_CR58","doi-asserted-by":"crossref","unstructured":"Wang K, Peng X, Yang J, Lu S, Qiao Y (2020) Suppressing uncertainties for large-scale facial expression recognition. In: IEEE Conference on computer vision and pattern recognition, pp 6897\u20136906","DOI":"10.1109\/CVPR42600.2020.00693"},{"key":"13999_CR59","doi-asserted-by":"crossref","unstructured":"Wang X, Xiao T, Jiang Y, Shao S, Sun J, Shen C (2018) Repulsion loss: Detecting pedestrians in a crowd. In: IEEE Conference on computer vision and pattern recognition, pp 7774\u20137783","DOI":"10.1109\/CVPR.2018.00811"},{"key":"13999_CR60","unstructured":"Wang J, Yuan Y, Yu G (2017) Face attention network: An effective face detector for the occluded faces. arXiv:1711.07246"},{"key":"13999_CR61","doi-asserted-by":"crossref","unstructured":"Wang H, Zhu Y, Green B, Adam H, Yuille A, Chen L-C (2020) Axial-deeplab: Stand-alone axial-attention for panoptic segmentation. In: European conference on computer vision, pp 108\u2013126","DOI":"10.1007\/978-3-030-58548-8_7"},{"key":"13999_CR62","doi-asserted-by":"crossref","unstructured":"Woo S, Park J, Lee J-Y, Kweon IS (2018) CBAM: Convolutional Block attention module. In: European conference on computer vision, pp 3\u201319","DOI":"10.1007\/978-3-030-01234-2_1"},{"key":"13999_CR63","unstructured":"Xia BN, Gong Y, Zhang Y, Poellabauer C (2019) Second-order non-local attention networks for person re-identification. In: IEEE International conference on computer vision, pp 3760\u20133769"},{"key":"13999_CR64","doi-asserted-by":"publisher","first-page":"8590","DOI":"10.1109\/TIP.2020.3018222","volume":"29","author":"Z Xia","year":"2020","unstructured":"Xia Z, Peng W, Khor H-Q, Feng X, Zhao G (2020) Revealing the invisible with model and data shrinking for composite-database micro-expression recognition. IEEE Trans Image Process 29:8590\u20138605","journal-title":"IEEE Trans Image Process"},{"key":"13999_CR65","doi-asserted-by":"crossref","unstructured":"Yang C, Ablavsky V, Wang K, Feng Q, Betke M (2020) Learning to separate: Detecting heavily-occluded objects in urban scenes. In: European conference on computer vision, pp 530\u2013546","DOI":"10.1007\/978-3-030-58523-5_31"},{"key":"13999_CR66","doi-asserted-by":"crossref","unstructured":"Yang S, Luo P, Loy CC, Tang X (2016) WIDER FACE: A face detection benchmark. In: IEEE Conference on computer vision and pattern recognition, pp 5525\u20135533","DOI":"10.1109\/CVPR.2016.596"},{"issue":"8","key":"13999_CR67","doi-asserted-by":"publisher","first-page":"1845","DOI":"10.1109\/TPAMI.2017.2738644","volume":"40","author":"S Yang","year":"2017","unstructured":"Yang S, Luo P, Loy CC, Tang X (2017) Faceness-net: Face detection through deep facial part responses. IEEE Trans Pattern Anal Mach Intell 40(8):1845\u20131859","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"13999_CR68","unstructured":"Yang L, Zhang R-Y, Li L, Xie X (2021) SimAM: A simple, parameter-free attention module for convolutional neural networks. In: International conference on machine learning, pp 11863\u201311874"},{"key":"13999_CR69","doi-asserted-by":"crossref","unstructured":"Yang Z, Zhu L, Wu Y, Yang Y (2020) Gated channel transformation for visual recognition. In: IEEE Conference on computer vision and pattern recognition, pp 11794\u201311803","DOI":"10.1109\/CVPR42600.2020.01181"},{"key":"13999_CR70","doi-asserted-by":"crossref","unstructured":"Yu X, Fu Y, Liu T (2017) Face detection: a deep convolutional network method based on grouped facial part. In: IEEE Advanced information technology, electronic and automation control conference, pp 515\u2013519","DOI":"10.1109\/IAEAC.2017.8054068"},{"key":"13999_CR71","doi-asserted-by":"crossref","unstructured":"Yu C, Wang J, Peng C, Gao C, Yu G, Sang N (2018) Learning a discriminative feature network for semantic segmentation. In: IEEE Conference on computer vision and pattern recognition, pp 1857\u20131866","DOI":"10.1109\/CVPR.2018.00199"},{"issue":"6","key":"13999_CR72","doi-asserted-by":"publisher","first-page":"581","DOI":"10.1049\/bme2.12029","volume":"10","author":"D Zeng","year":"2021","unstructured":"Zeng D, Veldhuis R, Spreeuwers L (2021) A survey of face recognition techniques under occlusion. IET Biometrics 10(6):581\u2013606","journal-title":"IET Biometrics"},{"key":"13999_CR73","doi-asserted-by":"crossref","unstructured":"Zhang H, Dana K, Shi J, Zhang Z, Wang X, Tyagi A, Agrawal A (2018) Context encoding for semantic segmentation. In: IEEE Conference on computer vision and pattern recognition, pp 7151\u20137160","DOI":"10.1109\/CVPR.2018.00747"},{"key":"13999_CR74","doi-asserted-by":"publisher","first-page":"33","DOI":"10.1016\/j.patrec.2017.09.011","volume":"107","author":"T Zhang","year":"2018","unstructured":"Zhang T, Li J, Jia W, Sun J, Yang H (2018) Fast and robust occluded face detection in atm surveillance. Pattern Recogn Lett 107:33\u201340","journal-title":"Pattern Recogn Lett"},{"key":"13999_CR75","doi-asserted-by":"crossref","unstructured":"Zhang J, Lin L, Zhu J, Li Y, Chen Y-c, Hu Y, Hoi CS (2020) Attribute-aware pedestrian detection in a crowd. IEEE Transactions on Multimedia, 1\u20131","DOI":"10.1109\/TMM.2020.2966878"},{"key":"13999_CR76","doi-asserted-by":"crossref","unstructured":"Zhang S, Wen L, Bian X, Lei Z, Li SZ (2018) Occlusion-aware r-CNN: detecting pedestrians in a crowd. In: European conference on computer vision, pp 637\u2013653","DOI":"10.1007\/978-3-030-01219-9_39"},{"issue":"6","key":"13999_CR77","doi-asserted-by":"publisher","first-page":"537","DOI":"10.1007\/s11263-019-01159-3","volume":"127","author":"S Zhang","year":"2019","unstructured":"Zhang S, Wen L, Shi H, Lei Z, Lyu S, Li SZ (2019) Single-shot scale-aware network for real-time face detection. Int J Comput Vis 127 (6):537\u2013559","journal-title":"Int J Comput Vis"},{"key":"13999_CR78","unstructured":"Zhang K, Xiong F, Sun P, Hu L, Li B, Yu G (2019) Double anchor R-CNN for human detection in a crowd. arXiv:1909.09998"},{"issue":"10","key":"13999_CR79","doi-asserted-by":"publisher","first-page":"1499","DOI":"10.1109\/LSP.2016.2603342","volume":"23","author":"K Zhang","year":"2016","unstructured":"Zhang K, Zhang Z, Li Z, Qiao Y (2016) Joint face detection and alignment using multitask cascaded convolutional networks. IEEE Signal Process Lett 23(10):1499\u20131503","journal-title":"IEEE Signal Process Lett"},{"key":"13999_CR80","doi-asserted-by":"crossref","unstructured":"Zhang X, Zhou X, Lin M, Sun J (2018) Shufflenet: An extremely efficient convolutional neural network for mobile devices. In: IEEE Conference on computer vision and pattern recognition, pp 6848\u20136856","DOI":"10.1109\/CVPR.2018.00716"},{"key":"13999_CR81","doi-asserted-by":"crossref","unstructured":"Zhang S, Zhu X, Lei Z, Shi H, Wang X, Li SZ (2017) S3FD: Single shot scale-invariant face detector. In: IEEE International conference on computer vision, pp 192\u2013201","DOI":"10.1109\/ICCV.2017.30"},{"key":"13999_CR82","doi-asserted-by":"crossref","unstructured":"Zhao H, Ying X, Shi Y, Tong X, Wen J, Zha H (2020) RDCFAce: Radial distortion correction for face recognition. In: IEEE Conference on computer vision and pattern recognition, pp 7721\u20137730","DOI":"10.1109\/CVPR42600.2020.00774"},{"key":"13999_CR83","doi-asserted-by":"crossref","unstructured":"Zhao H, Zhang Y, Liu S, Shi J, Loy CC, Lin D, Jia J (2018) PSANEt: Point-wise spatial attention network for scene parsing. In: European conference on computer vision, pp 267\u2013283","DOI":"10.1007\/978-3-030-01240-3_17"},{"key":"13999_CR84","unstructured":"Zhu X, Ramanan D (2012) Face detection, pose estimation, and landmark localization in the wild. In: IEEE Conference on computer vision and pattern recognition, pp 2879\u20132886"},{"key":"13999_CR85","doi-asserted-by":"crossref","unstructured":"Zhu Z, Xu M, Bai S, Huang T, Bai X (2019) Asymmetric non-local neural networks for semantic segmentation. In: IEEE International conference on computer vision, pp 593\u2013602","DOI":"10.1109\/ICCV.2019.00068"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-022-13999-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11042-022-13999-2\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-022-13999-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,3,24]],"date-time":"2023-03-24T11:26:53Z","timestamp":1679657213000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11042-022-13999-2"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,9,28]]},"references-count":85,"journal-issue":{"issue":"10","published-print":{"date-parts":[[2023,4]]}},"alternative-id":["13999"],"URL":"https:\/\/doi.org\/10.1007\/s11042-022-13999-2","relation":{},"ISSN":["1380-7501","1573-7721"],"issn-type":[{"type":"print","value":"1380-7501"},{"type":"electronic","value":"1573-7721"}],"subject":[],"published":{"date-parts":[[2022,9,28]]},"assertion":[{"value":"8 November 2021","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"28 June 2022","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"19 September 2022","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"28 September 2022","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"<!--Emphasis Type='Bold' removed-->Competing interests"}}]}}