{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,5]],"date-time":"2026-06-05T19:29:14Z","timestamp":1780687754427,"version":"3.54.1"},"reference-count":91,"publisher":"Springer Science and Business Media LLC","issue":"4","license":[{"start":{"date-parts":[[2020,10,12]],"date-time":"2020-10-12T00:00:00Z","timestamp":1602460800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2020,10,12]],"date-time":"2020-10-12T00:00:00Z","timestamp":1602460800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"published-print":{"date-parts":[[2021,2]]},"DOI":"10.1007\/s11042-020-09862-x","type":"journal-article","created":{"date-parts":[[2020,10,12]],"date-time":"2020-10-12T11:02:36Z","timestamp":1602500556000},"page":"6079-6104","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":6,"title":["Journey of scene text components recognition: Progress and open issues"],"prefix":"10.1007","volume":"80","author":[{"given":"Payel","family":"Sengupta","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-3445-7469","authenticated-orcid":false,"given":"Ayatullah Faruk","family":"Mollah","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2020,10,12]]},"reference":[{"key":"9862_CR1","doi-asserted-by":"crossref","unstructured":"Abdali R, Ghani R.F (2019) Robust Character Recognition For Optical And Natural Images Using Deep Learning. Proceedings of IEEE Student Conference on Research and Development, pp. 152\u2013156","DOI":"10.1109\/SCORED.2019.8896354"},{"issue":"8","key":"9862_CR2","doi-asserted-by":"publisher","first-page":"701","DOI":"10.1016\/S0167-8655(98)00048-8","volume":"19","author":"JH Bae","year":"1998","unstructured":"Bae JH, Jung KC, Kim JW, Kim HJ (1998) Segmentation of touching characters using an MLP. Pattern Recogn Lett 19(8):701\u2013709","journal-title":"Pattern Recogn Lett"},{"issue":"6","key":"9862_CR3","doi-asserted-by":"publisher","first-page":"2789","DOI":"10.1109\/TIP.2016.2555080","volume":"25","author":"X Bai","year":"2016","unstructured":"Bai X, Yao C, Liu W (2016) Strokelets: a learned multi-scale mid-level representation for scene text recognition. IEEE Trans Image Process 25(6):2789\u20132802","journal-title":"IEEE Trans Image Process"},{"key":"9862_CR4","doi-asserted-by":"crossref","unstructured":"Bai F, Cheng Z, Niu Y, Pu S, Zhou S (2018) Edit probability for scene text recognition. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. IEEE, pp 1508\u20131516","DOI":"10.1109\/CVPR.2018.00163"},{"issue":"4","key":"9862_CR5","first-page":"3148","volume":"7","author":"NH Barnouti","year":"2018","unstructured":"Barnouti NH, Abomaali M, Al-Mayyahi MHN (2018) An efficient character recognition technique using K-nearest neighbor classifier. Int J Eng Technol 7(4):3148\u20133153","journal-title":"Int J Eng Technol"},{"key":"9862_CR6","unstructured":"Bartz C, Yang H, Meinel C (2017) STN-OCR: A single neural network for text detection and text recognition\u201d, arXiv preprint arXiv:1707.0883"},{"key":"9862_CR7","doi-asserted-by":"crossref","unstructured":"Bartz C, Yang H, Meinel C (2018) SEE: towards semi-supervised end-to-end scene text recognition. Proceedings of AAAI:6674\u20136681","DOI":"10.1609\/aaai.v32i1.12242"},{"key":"9862_CR8","doi-asserted-by":"crossref","unstructured":"Bissacco A, Cummins M, Netzer Y, Neven H (2013) Photo OCR: reading text in uncontrolled conditions\u201d, Proceedings of International Conference on Computer Vision. IEEE, pp 785\u2013792","DOI":"10.1109\/ICCV.2013.102"},{"issue":"7","key":"9862_CR9","doi-asserted-by":"publisher","first-page":"690","DOI":"10.1109\/34.506792","volume":"18","author":"RG Casey","year":"1996","unstructured":"Casey RG, Lecolinet E (1996) A survey of methods and strategies in character segmentation. IEEE Trans Pattern Anal Machine Intell IEEE 18(7):690\u2013706","journal-title":"IEEE Trans Pattern Anal Machine Intell IEEE"},{"issue":"5","key":"9862_CR10","doi-asserted-by":"publisher","first-page":"3804","DOI":"10.3906\/elk-1806-195","volume":"27","author":"B Chekol","year":"2019","unstructured":"Chekol B, Celebi N, TA\u015eCI T (2019) Segmented character recognition using curvaturebased global image feature. Turkish J Electrical Eng Comput Sci 27(5):3804\u20133814","journal-title":"Turkish J Electrical Eng Comput Sci"},{"issue":"3","key":"9862_CR11","doi-asserted-by":"publisher","first-page":"595","DOI":"10.1016\/j.patcog.2003.06.001","volume":"37","author":"D Chen","year":"2004","unstructured":"Chen D, Odobez JM, Bourlard H (2004) Text detection and recognition in images and video frames. Pattern Recogn 37(3):595\u2013608","journal-title":"Pattern Recogn"},{"key":"9862_CR12","doi-asserted-by":"publisher","first-page":"261","DOI":"10.1016\/j.neucom.2019.11.049","volume":"381","author":"X Chen","year":"2020","unstructured":"Chen X, Wang T, Zhu Y, Jin L, Luo C (2020) Adaptive embedding gate for attention-based scene text recognition. Neurocomput Elsevier 381:261\u2013271","journal-title":"Neurocomput Elsevier"},{"key":"9862_CR13","unstructured":"de Campos TE, Babu BR, Varma M (2009) Character recognition in natural images. Proceeding of the International Conference on Computer Vision\u00a0Theory and Applications (VISAPP), pp 273\u2013280"},{"key":"9862_CR14","doi-asserted-by":"crossref","unstructured":"Du X, Ma T, Y. Zheng, H. Ye, X. Wu, L. He (2020), \u201cScene Text Recognition with Temporal Convolutional Encoder,\u201d Proceedings IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 2383\u20132387","DOI":"10.1109\/ICASSP40776.2020.9054269"},{"issue":"1","key":"9862_CR15","doi-asserted-by":"crossref","first-page":"146","DOI":"10.31026\/j.eng.2018.01.10","volume":"24","author":"MF Esmaile","year":"2018","unstructured":"Esmaile MF, Abdulredaa E (2018) Optical character recognition using active contour segmentation. J Eng 24(1):146\u2013158","journal-title":"J Eng"},{"key":"9862_CR16","doi-asserted-by":"crossref","unstructured":"Fabrizio J, Marcotegui B, Cord M (2009) Text segmentation in natural scenes using Toggle-Mapping. Proceeding of 16th International Conference on Image Processing, pp 2373\u20132376","DOI":"10.1109\/ICIP.2009.5413435"},{"key":"9862_CR17","doi-asserted-by":"publisher","unstructured":"Francis LM, Sreenath N (2019) Robust scene text recognition: Using manifold regularized Twin-Support Vector Machine. J King Saud Univ - Comput Inf Scie. https:\/\/doi.org\/10.1016\/j.jksuci.2019.01.013","DOI":"10.1016\/j.jksuci.2019.01.013"},{"key":"9862_CR18","doi-asserted-by":"crossref","unstructured":"Ghosh SK, Valveny E, Bagdanov AD (2017) Visual attention models for scene textrecognition. Proceedings of 14th IAPR International Conference on\u00a0Document Analysis and Recognition, pp 943\u2013948","DOI":"10.1109\/ICDAR.2017.158"},{"key":"9862_CR19","doi-asserted-by":"crossref","unstructured":"G\u00f3mez L, Karatzas D (2017) Textproposals: a text-specific selective search algorithm for word spotting in the wild. Pattern Recogn 70:60\u201374","DOI":"10.1016\/j.patcog.2017.04.027"},{"key":"9862_CR20","first-page":"78","volume":"184","author":"Q Guo","year":"2016","unstructured":"Guo Q, Wang F, Lei J, Tu D, Li G (2016) Convolutional feature learning and hybrid CNN-HMM for scene number recognition. Neuro-Comput J 184:78\u201390","journal-title":"Neuro-Comput J"},{"key":"9862_CR21","doi-asserted-by":"crossref","unstructured":"He P, Huang W, Qiao Y, Loy CC, Tang X (2016) Reading scene text in deep convolutional sequences, Proceeding of Association for the Advancement of Artificial Intelligence, pp 1\u20138, AAAI","DOI":"10.1609\/aaai.v30i1.10465"},{"key":"9862_CR22","doi-asserted-by":"crossref","unstructured":"Hong S, Kim D, Choi MK (2020) Memory-efficient models for scene text recognition via neural architecture search. Proc IEEE Winter Conf Appl Comput Vision Workshops:183\u2013191","DOI":"10.1109\/WACVW50321.2020.9096928"},{"key":"9862_CR23","unstructured":"Iwamura M (2018) Advances of Scene Text Datasets. arXiv:1812.05219"},{"key":"9862_CR24","unstructured":"Jaderberg M, Simonyan K, Vedaldi A, Zisserman A (2014) Deep structured output learning for unconstrained text recognition. Proceedings of International\u00a0Conference on Learning Representations, pp 1\u201310"},{"key":"9862_CR25","unstructured":"Jaderberg M, Simonyan K, Vedaldi A, Zisserman A (2014) Synthetic data and artificial neural networks for natural scene text recognition. Proceedings of\u00a0Workshop on Neural Information Processing Systems, pp 1\u201310"},{"issue":"1","key":"9862_CR26","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s11263-015-0823-z","volume":"116","author":"M Jaderberg","year":"2016","unstructured":"Jaderberg M, Simonyan K, Vedaldi A, Zisserman A (2016) Reading text in the wild with convolutional neural networks. Int J Comput Vis 116(1):1\u201320","journal-title":"Int J Comput Vis"},{"key":"9862_CR27","unstructured":"KAIST Scene Text Database (2019), http:\/\/www.iapr-tc11.org\/mediawiki\/index.php\/KAIST_Scene_Text_ Database. Accessed 10 Dec 2019"},{"key":"9862_CR28","doi-asserted-by":"crossref","unstructured":"Kang C, Kim G, Yoo S (2017) Detection and recognition of text embedded in online images via neural context models. Proc Proceed Associate artificial intelligence:4103\u20134110","DOI":"10.1609\/aaai.v31i1.11189"},{"key":"9862_CR29","doi-asserted-by":"crossref","unstructured":"Karatzas D, Shafait F, Uchida S, Iwamura M (2013) ICDAR 2013 robust reading competition\u201d, Proceedings of 12th International Conference on Document Analysis and Recognition. IEEE, pp 1484\u20131493","DOI":"10.1109\/ICDAR.2013.221"},{"key":"9862_CR30","doi-asserted-by":"crossref","unstructured":"Karatzas D, Gomez-Bigorda L, Nicolaou A, Ghosh S, Bagdanov A, Iwamura M, Matas J, Neumann L, Chandrasekhar VR, Lu S, Shafait F (2015) ICDAR 2015 competition on robust reading. Proceedings of 13th International Conference on Document Analysis and Recognition, IEEE, pp 1156\u20131160","DOI":"10.1109\/ICDAR.2015.7333942"},{"key":"9862_CR31","doi-asserted-by":"crossref","unstructured":"S. H. Katper, A.R Gilal, A. Waqas, A. Alshanqiti, A. Alsughayyir and J. Jaafar, \u201cDeep neural networks combined with STN for multi-oriented text detection and recognition,\u201d Int J adv Computer Sci Appl, vol. 11, no. 4, pp.178\u2013185, 2020.","DOI":"10.14569\/IJACSA.2020.0110424"},{"key":"9862_CR32","doi-asserted-by":"crossref","unstructured":"Lee C, Osindero S (2016) Recursive recurrent nets with attention modeling for OCR in the Wild\u201d, Proceeding of conference on computer vision and pattern recognition, IEEE, pp 2231\u20132239","DOI":"10.1109\/CVPR.2016.245"},{"key":"9862_CR33","doi-asserted-by":"publisher","first-page":"3676","DOI":"10.1109\/TIP.2018.2825107","volume":"27","author":"M Liao","year":"2018","unstructured":"Liao M, Shi B, Bai X (2018) TextBoxes ++ a single-shot oriented scene text detector. IEEE Trans Image Process 27:3676\u20133690","journal-title":"IEEE Trans Image Process"},{"key":"9862_CR34","first-page":"8714","volume":"33","author":"M Liao","year":"2019","unstructured":"Liao M, Zhang J, Wan Z, Xie F, Liang J, Lyu P, Yao C, Bai X (2019) Scene text recognition from two-dimensional perspective. Proc AAAI Conf Artificial Intell 33:8714\u20138721","journal-title":"Proc AAAI Conf Artificial Intell"},{"key":"9862_CR35","doi-asserted-by":"crossref","unstructured":"Lin H, Yang P, Zhang F (2019) Review of scene text detection and recognition. Archieves of Computational Methods in Engineering, 27(2):433\u2013454","DOI":"10.1007\/s11831-019-09315-1"},{"key":"9862_CR36","doi-asserted-by":"crossref","unstructured":"Litman R, Anschel O, Tsiper S, Litman R, Mazor S, Manmatha R (2020) SCATTER: selective context attentional scene text recognizer. Proc IEEE\/CVF Conf Comput Vision Pattern Recog:11962\u201311972","DOI":"10.1109\/CVPR42600.2020.01198"},{"key":"9862_CR37","doi-asserted-by":"crossref","unstructured":"Liu H, Bir B (2019) Pose-guided R-CNN for Jersey number recognition in sports\", Proceedings of Conference on Computer Vision and Pattern Recognition Workshops, IEEE","DOI":"10.1109\/CVPRW.2019.00301"},{"key":"9862_CR38","doi-asserted-by":"crossref","unstructured":"Liu Z, Li Y, Ren F, Goh WL, Yu H (2018) Squeezedtext: a real-time scene text recognition by binary convolutional encoder-decoder network, Proceeding of Thirty-Second AAAI Conference on Artificial Intelligence, pp 7194\u20137201","DOI":"10.1609\/aaai.v32i1.12252"},{"key":"9862_CR39","doi-asserted-by":"crossref","unstructured":"Liu W, Chaofeng C, Wong K (2018) SAFE: Scale Aware Feature Encoder for Scene Text Recognition. Proceedings of Asian Conference on Computer Vision. Springer, pp 196\u2013211","DOI":"10.1007\/978-3-030-20890-5_13"},{"issue":"2","key":"9862_CR40","doi-asserted-by":"publisher","first-page":"143","DOI":"10.1007\/s10032-019-00320-5","volume":"22","author":"X Liu","year":"2019","unstructured":"Liu X, Meng G, Pan C (2019) Scene text detection and recognition with advances in deep learning: a survey. Int J Document Anal Recog (IJDAR) 22(2):143\u2013162","journal-title":"Int J Document Anal Recog (IJDAR)"},{"key":"9862_CR41","doi-asserted-by":"publisher","unstructured":"Long S, He X, Ya C (2018) Scene Text Detection and Recognition: The Deep Learning Era\u201d, Int J Comput Vis. https:\/\/doi.org\/10.1007\/s11263-020-01369-0","DOI":"10.1007\/s11263-020-01369-0"},{"key":"9862_CR42","doi-asserted-by":"crossref","unstructured":"Lucas SM, Panaretos A, Sosa L, Tang A, Wong S, Young R (2003) ICDAR 2003 robust reading competitions. Proceedings of International Conference on\u00a0Document Analysis and Recognition, IEEE, pp 682\u2013687","DOI":"10.1109\/ICDAR.2003.1227749"},{"issue":"5","key":"9862_CR43","first-page":"729","volume":"32","author":"HT Lue","year":"2010","unstructured":"Lue HT, Wen MG, Cheng HY, Fan KC, Lin CW, Yu CC (2010) A novel character segmentation method for text images captured by cameras. Electron Telecommun Res Inst (ETRI) J 32(5):729\u2013739","journal-title":"Electron Telecommun Res Inst (ETRI) J"},{"key":"9862_CR44","doi-asserted-by":"publisher","first-page":"109","DOI":"10.1016\/j.patcog.2019.01.020","volume":"90","author":"C Luo","year":"2019","unstructured":"Luo C, Jin L, Sun Z (2019) Moran: a multi-object rectified attention network for scene text recognition. Pattern Recogn 90:109\u2013118","journal-title":"Pattern Recogn"},{"key":"9862_CR45","doi-asserted-by":"crossref","unstructured":"Mancas-Thillou C, Gosselin B (2006) Character segmentation-by-recognition using log-Gabor filters, Proceeding of 18th International Conference on Pattern Recognition (ICPR'06). IEEE 2:901\u2013904","DOI":"10.1109\/ICPR.2006.362"},{"key":"9862_CR46","doi-asserted-by":"crossref","unstructured":"Mishra A, Alahari K, Jawahar CV (2012) Scene text recognition using higher order language priors, Proceedings of British Machine Vision Conference, pp\u00a0127.1\u2013127.11","DOI":"10.5244\/C.26.127"},{"key":"9862_CR47","doi-asserted-by":"crossref","unstructured":"Mishra A, Alahari K, Jawahar CV (2012) Top-Down and Bottom-Up Cues for Scene Text Recognition. Proceedings of International Conference on Computer Vision and Pattern Recognition. IEEE, pp 2687\u20132694","DOI":"10.1109\/CVPR.2012.6247990"},{"issue":"1","key":"9862_CR48","first-page":"33","volume":"1","author":"AF Mollah","year":"2011","unstructured":"Mollah AF, Basu S, Nasipuri M (2011) Segmentation of camera captured business card images for mobile devices. Int J Comput Sci Appl 1(1):33\u201337","journal-title":"Int J Comput Sci Appl"},{"key":"9862_CR49","doi-asserted-by":"crossref","unstructured":"Moysset B, Kermorvant C, Wolf C (2017) Full-Page Text Recognition Learning Where to Start and When to Stop, Proceedings of 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). IEEE 1:871\u2013876","DOI":"10.1109\/ICDAR.2017.147"},{"key":"9862_CR50","doi-asserted-by":"crossref","unstructured":"Nayef N, Patel Y, Busta M, Chowdhury PN, Karatzas D, Khlif W, Matas J, Pal U, Burie JC, Liu CL, Ogier JM (2019) ICDAR2019 Robust reading challenge on multi-lingual scene text detection and recognition\u2013RRC-MLT-2019\u201d. arXiv preprint arXiv:1907.00945","DOI":"10.1109\/ICDAR.2019.00254"},{"key":"9862_CR51","doi-asserted-by":"crossref","unstructured":"Negishi K, Iwamura M, Omachi S, Aso H (2005) Isolated character recognition by searching features in scene images, Proc First Int Workshop Camera-Based Document Anal Recog:140\u2013147","DOI":"10.1109\/ICDAR.2005.147"},{"key":"9862_CR52","unstructured":"Netzer Y, Wang T, Coates A, Bissacco A, Wu B, Ng AY (2011) Reading digits in natural images with unsupervised feature learning,\u00a0In NIPS workshop on\u00a0deep learning and unsupervised feature learning"},{"key":"9862_CR53","doi-asserted-by":"crossref","unstructured":"Neumann L, Matas J (2010) A method for text localization and recognition in real-world images\u201d, Proceedings of Asian Conference on Computer Vision. Springer, pp 770\u2013783","DOI":"10.1007\/978-3-642-19318-7_60"},{"issue":"9","key":"9862_CR54","doi-asserted-by":"publisher","first-page":"1872","DOI":"10.1109\/TPAMI.2015.2496234","volume":"38","author":"L Neumann","year":"2015","unstructured":"Neumann L, Matas J (2015) Real-time lexicon-free scene text localization and recognition. IEEE Trans Pattern Anal Mach Intell 38(9):1872\u20131885","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"9862_CR55","unstructured":"Noola DA, Kodabagi MM (2015) An approach to extract line, word and character from scene text image. Int J Emerg Technol Comput Sci Electron 14(2):916\u2013922"},{"issue":"5","key":"9862_CR56","first-page":"2075","volume":"3","author":"C Patel","year":"2013","unstructured":"Patel C, Patel A, Shah D (2013) A review of character segmentation method. Int J Current Eng Technol 3(5):2075\u20132078","journal-title":"Int J Current Eng Technol"},{"key":"9862_CR57","doi-asserted-by":"crossref","unstructured":"Pruthi D, Dhingra B, Lipton ZC (2019) Combating adversarial misspellings with robust word recognition. Proc 57th Annual Meeting Assoc Computation Linguistics, pp 5582\u20135591","DOI":"10.18653\/v1\/P19-1561"},{"key":"9862_CR58","doi-asserted-by":"crossref","unstructured":"Qiao Z, Zhou Y, Yang D, Zhou Y, Wang W (2020) SEED: semantics enhanced encoder-decoder framework for scene text recognition. Proc IEEE\/CVF Conf Comput Vis Pattern Recog:13528\u201313537","DOI":"10.1109\/CVPR42600.2020.01354"},{"key":"9862_CR59","doi-asserted-by":"crossref","unstructured":"Rong X, Yi C, Tian Y (2017) Unambiguous text localization and retrieval for cluttered scenes. Proceedings of IEEE Conference on Computer Vision and\u00a0Pattern Recognition,\u00a0pp 5494\u20135502","DOI":"10.1109\/CVPR.2017.349"},{"key":"9862_CR60","unstructured":"Roy S, Shivakumara P, Roy PP, Tan CL (2012) Wavelet-gradient-fusion for video text binarization. Proceedings of International Conference on Patten Recognition. IEEE, pp 3300\u20133303"},{"key":"9862_CR61","doi-asserted-by":"crossref","unstructured":"Roy P, Bhattacharya S, Ghosh S, Pal U (2020) STEFANN: scene text editor using font adaptive neural network. Proc IEEE\/CVF Conf Comput Vis Pattern Recog, pp 13228\u201313237","DOI":"10.1109\/CVPR42600.2020.01324"},{"key":"9862_CR62","doi-asserted-by":"crossref","unstructured":"Saidane Z, Garcia C (2007) Robust Binarization for Video Text Recognition, Proceedings of International Conference on Document Analysis and Recognition. IEEE 2:874\u2013879","DOI":"10.1109\/ICDAR.2007.4377040"},{"issue":"4","key":"9862_CR63","first-page":"303","volume":"2","author":"N Sambyal","year":"2016","unstructured":"Sambyal N, Abrol P (2016) Connected component based English character set segmentation. Int J Scientific Tech Advancements 2(4):303\u2013306","journal-title":"Int J Scientific Tech Advancements"},{"key":"9862_CR64","doi-asserted-by":"publisher","first-page":"56","DOI":"10.1016\/j.neucom.2017.05.021","volume":"266","author":"M Saric","year":"2017","unstructured":"Saric M (2017) Scene text segmentation using low variation extremal regions and sorting based character grouping. Int J Neurocomput Elsevier 266:56\u201365","journal-title":"Int J Neurocomput Elsevier"},{"key":"9862_CR65","doi-asserted-by":"crossref","unstructured":"Sarshogh MR, Hines EK, (2019) A Multitask Network for Localization and Recognition of Text in Images, arXiv preprint arXiv:1906.09266","DOI":"10.1109\/ICDAR.2019.00085"},{"key":"9862_CR66","doi-asserted-by":"crossref","unstructured":"Seeri SV, Pujari JD, Hiremath PS (2016) Text Localization and Character Extraction in Natural Scene Images using Contourlet Transform and SVM Classifier. Int J Image, Graphics Signal Process 8(5):36\u201366","DOI":"10.5815\/ijigsp.2016.05.02"},{"issue":"1","key":"9862_CR67","first-page":"336","volume":"2","author":"P Sengupta","year":"2019","unstructured":"Sengupta P, Mollah AF (2019) Scene Text Component Segmentation Using Hierarchical Distance Slicing. International Journal of Computational Intelligence & IoT 2(1) Elsevier:336\u2013339","journal-title":"International Journal of Computational Intelligence & IoT"},{"key":"9862_CR68","doi-asserted-by":"crossref","unstructured":"Shi C, Wang C, Xiao B, Zhang Y, Gao S, Z. Zhang 2013 Scene text recognition using part-based tree-structured character detection. Proc IEEE Conference Comput Vis Pattern Recog, pp. 2961\u20132968","DOI":"10.1109\/CVPR.2013.381"},{"key":"9862_CR69","doi-asserted-by":"crossref","unstructured":"Shi B, Yao, C. Zhang, Guo S (2015), \u201cAutomatic script identification in the wild. Pro Int Con Document Anal Recog, pp 531\u2013535","DOI":"10.1109\/ICDAR.2015.7333818"},{"key":"9862_CR70","doi-asserted-by":"crossref","unstructured":"Shi B, Wang X, Lyu P, Yao C, Bai X (2016) Robust scene text recognition with automatic rectification. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 4168\u20134176","DOI":"10.1109\/CVPR.2016.452"},{"issue":"11","key":"9862_CR71","doi-asserted-by":"publisher","first-page":"2298","DOI":"10.1109\/TPAMI.2016.2646371","volume":"39","author":"B Shi","year":"2016","unstructured":"Shi B, Bai X, Yao C (2016) An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition. IEEE Trans Pattern Anal Mach Intell 39(11):2298\u20132304","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"11","key":"9862_CR72","first-page":"855","volume":"31","author":"B Shi","year":"2018","unstructured":"Shi B, Yang M, Wang X, Lyu P, Bai X, Yao C (2018) Aster: an attentional scene text recognizer with flexible rectification. IEEE Trans Pattern Anal Mach Intell 31(11):855\u2013868","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"5","key":"9862_CR73","first-page":"12123","volume":"4","author":"V Shruthi","year":"2015","unstructured":"Shruthi V, Sunitha R (2015) Text detection and character segmentation from natural scene images based using graph cut Labelling. Int J Eng Comput Sci 4(5):12123\u201312126","journal-title":"Int J Eng Comput Sci"},{"key":"9862_CR74","unstructured":"Simonyan K, Zisserman A (2014) Very deep convolutional networks for large-scale image recognition arXiv preprint arXiv:1409.1556"},{"key":"9862_CR75","doi-asserted-by":"crossref","unstructured":"Su B, Lu S (2017) Accurate recognition of words in scenes without character segmentation using recurrent neural network, Pattern Recognition, vol. 63, Elsevier, pp 397\u2013405","DOI":"10.1016\/j.patcog.2016.10.016"},{"key":"9862_CR76","doi-asserted-by":"crossref","unstructured":"Tsai YS, Hsieh YY, Ho CH, Chang YC, Chang YY, Lin HJ, Chuang JH (2018) Rule-based optical character recognition for serial number on Renminbi banknote. Proc Electron Imag, pp\u00a0308.1\u2013308.6","DOI":"10.2352\/ISSN.2470-1173.2018.13.IPAS-308"},{"key":"9862_CR77","unstructured":"Wang K, Babenko B, Belongie S (2011) End-to-end scene text recognition\u201d. Proceedings of International Conference on Computer Vision. IEEE, pp 1457\u20131464"},{"key":"9862_CR78","unstructured":"Wang T, Wu D, Coates A, Ng A (2012) End-to-end text recognition with convolutional neural networks. Proc Int Conf Pattern Recog:3304\u20133308"},{"key":"9862_CR79","doi-asserted-by":"crossref","unstructured":"Xu X, Chen J, Xiao J, Gao L, Shen F, Shen HT (2020) What machines see is not what they get: fooling scene text recognition models with adversarial text images Proc IEEE\/CVF Conf Comput Vision Pattern Recog, pp 12304\u201312314","DOI":"10.1109\/CVPR42600.2020.01232"},{"key":"9862_CR80","unstructured":"Yang C, Yin XC, Li Z, Wu J, Guo C, Wang H, Xiao L (2017) AdaDNNs: adaptive ensemble of deep neural networks for scene text recognition. arXiv preprint arXiv:1710.03425"},{"key":"9862_CR81","doi-asserted-by":"crossref","unstructured":"Yang M, Guan Y, Liao M, He X, Bian K, Bai S, Yao C, Bai X (2019) Symmetry-constrained rectification network for scene text recognition. Proc IEEE Int Conf Comput Vis, pp 9147\u20139156","DOI":"10.1109\/ICCV.2019.00924"},{"key":"9862_CR82","doi-asserted-by":"publisher","first-page":"4737","DOI":"10.1109\/TIP.2014.2353813","volume":"23","author":"C Yao","year":"2014","unstructured":"Yao C, Bai X, Liu W (2014) A unified framework for multioriented text detection and recognition. IEEE Trans Image Process 23:4737\u20134749","journal-title":"IEEE Trans Image Process"},{"issue":"7","key":"9862_CR83","doi-asserted-by":"publisher","first-page":"2972","DOI":"10.1109\/TIP.2014.2317980","volume":"23","author":"C Yi","year":"2014","unstructured":"Yi C, Tian Y (2014) Scene text recognition in mobile applications by character descriptor and structure configuration. IEEE Trans Image Process 23(7):2972\u20132982","journal-title":"IEEE Trans Image Process"},{"issue":"8","key":"9862_CR84","first-page":"107","volume":"14","author":"M Yousef","year":"2020","unstructured":"Yousef M, Hussain KF, Mohammed US (2020) Accurate, data-efficient, unconstrained text recognition with convolutional neural networks. Int J Patt Recog 14(8):107\u2013482","journal-title":"Int J Patt Recog"},{"key":"9862_CR85","doi-asserted-by":"crossref","unstructured":"Zhan F, Lu S, (2019) Esir: End-to-end scene text recognition via iterative image rectification. Proceedings of the Conference on Computer Vision and Pattern Recognition, pp. 2059\u20132068, IEEE","DOI":"10.1109\/CVPR.2019.00216"},{"key":"9862_CR86","unstructured":"Zhan F, Zhu H, Lu S (2019) )Scene text synthesis for efficient and effective deep network training, arXiv preprint arXiv:1901.09193"},{"key":"9862_CR87","doi-asserted-by":"crossref","unstructured":"Zhang Y, Zhang C (2003) A new algorithm for character segmentation of license plate. Proceeding of Intelligent Vehicles Symposium. IEEE, pp 106\u2013109","DOI":"10.1109\/IVS.2003.1212892"},{"key":"9862_CR88","doi-asserted-by":"crossref","unstructured":"Zhang Y, Shuai N, Wenju L, Xing X, Dongxiang Z, Shen TH (2019) Sequence-To-Sequence Domain Adaptation Network for Robust Text Image Recognition. Proc Conf Comput Vis Pattern Recognition, 2740\u20132749, IEEE","DOI":"10.1109\/CVPR.2019.00285"},{"key":"9862_CR89","doi-asserted-by":"crossref","unstructured":"Zhang H, Yao Q, Yang M, Xu Y, Bai X. (2020) Efficient Backbone Search for Scene Text Recognition,\u201d arXiv preprint arXiv:2003.06567","DOI":"10.1007\/978-3-030-58586-0_44"},{"key":"9862_CR90","doi-asserted-by":"crossref","unstructured":"Zhou Z, Li L, Tan CL (2010) Edge based Binarization of video text images. Proceedings of International Conference on Pattern Recognition, pp 133\u2013136","DOI":"10.1109\/ICPR.2010.41"},{"key":"9862_CR91","doi-asserted-by":"publisher","first-page":"62616","DOI":"10.1109\/ACCESS.2019.2916616","volume":"7","author":"LQ Zuo","year":"2019","unstructured":"Zuo LQ, Sun HM, Mao QC, Rong Q, Jia RS (2019) Natural Scene Text Recognition Based on Encoder-Decoder Framework. IEEE Access 7:62616\u201362623","journal-title":"IEEE Access"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-020-09862-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11042-020-09862-x\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-020-09862-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,10,9]],"date-time":"2023-10-09T14:59:45Z","timestamp":1696863585000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11042-020-09862-x"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,10,12]]},"references-count":91,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2021,2]]}},"alternative-id":["9862"],"URL":"https:\/\/doi.org\/10.1007\/s11042-020-09862-x","relation":{},"ISSN":["1380-7501","1573-7721"],"issn-type":[{"value":"1380-7501","type":"print"},{"value":"1573-7721","type":"electronic"}],"subject":[],"published":{"date-parts":[[2020,10,12]]},"assertion":[{"value":"17 December 2019","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"27 August 2020","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"9 September 2020","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"12 October 2020","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}