{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,1,2]],"date-time":"2026-01-02T07:31:17Z","timestamp":1767339077203},"publisher-location":"London","reference-count":148,"publisher":"Springer London","isbn-type":[{"type":"print","value":"9780857298584"},{"type":"electronic","value":"9780857298591"}],"license":[{"start":{"date-parts":[[2014,1,1]],"date-time":"2014-01-01T00:00:00Z","timestamp":1388534400000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2014]]},"DOI":"10.1007\/978-0-85729-859-1_28","type":"book-chapter","created":{"date-parts":[[2014,5,12]],"date-time":"2014-05-12T04:40:25Z","timestamp":1399869625000},"page":"843-883","update-policy":"http:\/\/dx.doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":26,"title":["Text Localization and Recognition in Images and Video"],"prefix":"10.1007","author":[{"given":"Seiichi","family":"Uchida","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2019,7,24]]},"reference":[{"key":"28_CR1","doi-asserted-by":"crossref","unstructured":"Impedovo S, Modugno R, Ferrante A, Stasolla E (2009) New trends in digital scanning processes. In: International conference on document analysis and recognition (ICDAR2009), Barcelona, pp\u00a01071\u20131075","DOI":"10.1109\/ICDAR.2009.76"},{"key":"28_CR2","doi-asserted-by":"publisher","first-page":"977","DOI":"10.1016\/j.patcog.2003.10.012","volume":"37","author":"K Jung","year":"2004","unstructured":"Jung K, Kim KI, Jain AK (2004) Text information extraction in images and video: a survey. Pattern Recognit 37:977\u2013997","journal-title":"Pattern Recognit"},{"issue":"2\u20133","key":"28_CR3","doi-asserted-by":"publisher","first-page":"84","DOI":"10.1007\/s10032-004-0138-z","volume":"7","author":"J Liang","year":"2005","unstructured":"Liang J, Doermann D, Li H (2005) Camera-Based analysis of text and documents: a survey. Int J Doc Anal Recognit 7(2\u20133):84\u2013104","journal-title":"Int J Doc Anal Recognit"},{"issue":"3","key":"28_CR4","doi-asserted-by":"publisher","first-page":"377","DOI":"10.1109\/TITS.2006.880641","volume":"7","author":"CNE Anagnostopoulos","year":"2006","unstructured":"Anagnostopoulos CNE, Anagnostopoulos IE, Loumos V, Kayafas E (2006) A license plate-recognition algorithm for intelligent transportation system applications. IEEE Trans Intell Transp Syst 7(3):377\u2013391","journal-title":"IEEE Trans Intell Transp Syst"},{"key":"28_CR5","doi-asserted-by":"crossref","unstructured":"Frome A, Cheung G, Abdulkader A, Zennaro M, Wu B, Bissacco A, Adam H, Neven H, Vincent L (2009) Large-scale privacy protection in Google Street View. In: International conference on computer vision (ICCV2009), pp 2373\u20132380","DOI":"10.1109\/ICCV.2009.5459413"},{"key":"28_CR6","doi-asserted-by":"crossref","unstructured":"Newman W, Dance C, Taylor A, Taylor S, Taylor M, Aldhous T (1999) CamWorks: a video-based tool for efficient capture from paper source documents. In: International conference on multimedia computing and systems (ICMCS1999), Florence, pp\u00a0647\u2013653","DOI":"10.1109\/MMCS.1999.778560"},{"issue":"2\u20133","key":"28_CR7","doi-asserted-by":"publisher","first-page":"123","DOI":"10.1007\/s10032-004-0129-0","volume":"7","author":"S Pollard","year":"2005","unstructured":"Pollard S, Pilu M (2005) Building cameras for capturing documents. Int J Doc Anal Recognit 7(2\u20133):123\u2013137","journal-title":"Int J Doc Anal Recognit"},{"key":"28_CR8","unstructured":"Shafait F, Cutter MP, van Beusekom J, Bukhari SS, Breuel TM (2011) Decapod: a flexible, low cost digitization solution for small and medium archives. In: International workshop on camera-based document analysis and recognition (CBDAR2011), Beijing, pp\u00a041\u201346"},{"key":"28_CR9","unstructured":"Nakai T, Kise K, Iwamura M (2005) Hashing with local combinations of feature points and its application to camera-based document image retrieval \u2013 retrieval in\u00a00.14 second from\u00a010,000 pages. In: International workshop on camera-based document analysis and recognition (CBDAR2005), Seoul, pp\u00a087\u201394"},{"issue":"1","key":"28_CR10","doi-asserted-by":"publisher","first-page":"19","DOI":"10.1007\/s10032-008-0066-4","volume":"11","author":"X Liu","year":"2008","unstructured":"Liu X, Doermann D (2008) Mobile retriever: access to digital documents from their physical source. Int J Doc Anal Recognit 11(1):19\u201327","journal-title":"Int J Doc Anal Recognit"},{"key":"28_CR11","unstructured":"Okada Y, Takeda T, Kim Y-B, Watanabe Y (1998) Translation camera. In: International conference on pattern recognition (ICPR1998), Brisbane, pp\u00a0613\u2013617"},{"key":"28_CR12","unstructured":"Gao J, Yang J (2001) An adaptive algorithm for text detection from natural scenes. In: IEEE computer society conference on vision and pattern recognition (CVPR2001), Kauai, vol\u00a02, pp\u00a084\u201389"},{"key":"28_CR13","doi-asserted-by":"crossref","unstructured":"Haritaoglu I (2001) Scene text extraction and translation for handheld devices. In: IEEE computer society conference on computer vision and pattern recognition (CVPR 2001), Kauai, vol\u00a02, pp\u00a0408\u2013413","DOI":"10.1109\/CVPR.2001.990990"},{"key":"28_CR14","unstructured":"Yokomizo K, Sono K, Watanabe Y, Okada Y (2003) Translation camera on mobile phone. In: International conference on multimedia and expo (ICME2003), Baltimore, pp\u00a0177\u2013180"},{"issue":"1","key":"28_CR15","doi-asserted-by":"publisher","first-page":"87","DOI":"10.1109\/TIP.2003.819223","volume":"13","author":"X Chen","year":"2004","unstructured":"Chen X, Yang J, Zhang J, Waibel A (2004) Automatic detection and recognition of signs from natural scenes. IEEE Trans Image Process 13(1):87\u201399","journal-title":"IEEE Trans Image Process"},{"key":"28_CR16","doi-asserted-by":"crossref","unstructured":"Ezaki N, Bulacu M, Schomaker L (2004) Text detection from natural scene images: towards a system for visually impaired persons. In: International conference on pattern recognition (ICPR2004), Cambridge, vol\u00a02, pp\u00a0683\u2013686","DOI":"10.1109\/ICPR.2004.1334351"},{"key":"28_CR17","unstructured":"Yi C, Tian Y (2011) Assistive text reading from complex background for blind persons. In: International workshop on camera-based document analysis and recognition (CBDAR2011), Beijing, pp\u00a021\u201326"},{"key":"28_CR18","unstructured":"Liu Y, Yamamura T, Tanaka T, Ohnishi N (1999) Character-Based mobile robot navigation. In: International conference on intelligent robots and systems (IROS1999), Kyongju, Korea vol\u00a02, pp\u00a0610\u2013616"},{"issue":"2\u20133","key":"28_CR19","doi-asserted-by":"publisher","first-page":"188","DOI":"10.1007\/s10032-004-0132-5","volume":"7","author":"M Wienecke","year":"2005","unstructured":"Wienecke M, Fink GA, Sagerer G (2005) Toward automatic video-based whiteboard reading. Int J Doc Anal Recognit 7(2\u20133):188\u2013200","journal-title":"Int J Doc Anal Recognit"},{"key":"28_CR20","unstructured":"Munich ME, Peronaa P (1996) Visual input for pen-based computers. In: International conference on pattern recognition (ICPR1996), Vienna, pp\u00a033\u201337"},{"key":"28_CR21","doi-asserted-by":"crossref","unstructured":"Iwata K, Kise K, Iwamura M, Uchida S, Omachi S (2010) Tracking and retrieval of pen tip positions for an intelligent camera pen. In: International conference on frontiers in handwriting recognition (ICFHR2010), Kolkata, pp\u00a0277\u2013283","DOI":"10.1109\/ICFHR.2010.50"},{"key":"28_CR22","unstructured":"Liu Q, Liao C (2011) PaperUI. In: International workshop on camera-based document analysis and recognition (CBDAR2011), Beijing, pp\u00a03\u201311"},{"key":"28_CR23","doi-asserted-by":"crossref","unstructured":"Zhang J, Kasturi R (2008) Extraction of text objects in video documents: recent progress. In: International workshop on document analysis systems (DAS2008), Nara, pp\u00a05\u201317","DOI":"10.1109\/DAS.2008.49"},{"key":"28_CR24","doi-asserted-by":"crossref","unstructured":"Sato T, Kanade T, Hughes EK, Smith MA (1998) Video OCR for digital news archives. In: IEEE international workshop on content-based access of image and video database, Bombay, pp\u00a052\u201360","DOI":"10.1109\/CAIVD.1998.646033"},{"issue":"3","key":"28_CR25","doi-asserted-by":"publisher","first-page":"595","DOI":"10.1016\/j.patcog.2003.06.001","volume":"37","author":"D Chen","year":"2004","unstructured":"Chen D, Odobez J-M, Bourlard H (2004) Text detection and recognition in images and video frames. Pattern Recognit 37(3):595\u2013608","journal-title":"Pattern Recognit"},{"issue":"2","key":"28_CR26","doi-asserted-by":"publisher","first-page":"401","DOI":"10.1109\/TIP.2008.2008225","volume":"18","author":"W Kim","year":"2009","unstructured":"Kim W, Kim C (2009) A new approach for overlay text detection and extraction from complex video scene. IEEE Trans Image Process 18(2):401\u2013411","journal-title":"IEEE Trans Image Process"},{"issue":"6","key":"28_CR27","doi-asserted-by":"publisher","first-page":"2165","DOI":"10.1016\/j.patcog.2010.01.009","volume":"43","author":"P Shivakumara","year":"2010","unstructured":"Shivakumara P, Huang W, Phan TQ, Tan CL (2010) Accurate video text detection through classification of low and high contrast images. Pattern Recognit 43(6):2165\u20132185","journal-title":"Pattern Recognit"},{"key":"28_CR28","doi-asserted-by":"crossref","unstructured":"Smeaton AF, Over P, Kraaij W (2006) Evaluation campaigns and TRECVid. In: ACM international workshop on multimedia information retrieval (MIR2006), Santa Barbara, pp\u00a0321\u2013330","DOI":"10.1145\/1178677.1178722"},{"key":"28_CR29","doi-asserted-by":"crossref","unstructured":"Zhang D, Chang S-F (2002) Event detection in baseball video using superimposed caption recognition. In: ACM international conference on multimedia (MULTIMEDIA \u201902), Juan-les-Pins, pp\u00a0315\u2013318","DOI":"10.1145\/641007.641073"},{"key":"28_CR30","doi-asserted-by":"crossref","unstructured":"Bertini M, Del Bimbo A, Nunziati W (2006) Automatic detection of player\u2019s identity in soccer videos using faces and text cues. In: ACM international conference on multimedia (MULTIMEDIA \u201906), Santa Barbara, pp\u00a0663\u2013666","DOI":"10.1145\/1180639.1180778"},{"key":"28_CR31","doi-asserted-by":"crossref","unstructured":"Wang J, Duan L, Li Z, Liu J, Lu H, Jin JS (2006) Robust method for TV logo tracking in video streams. In: IEEE international conference on multimedia and expo (ICME2006), Toronto, pp\u00a01041\u20131044","DOI":"10.1109\/ICME.2006.262712"},{"key":"28_CR32","unstructured":"\u00d6zay N, Sankur B (2009) Automatic TV logo detection and classification in broadcast videos. In: European signal processing conference (EUSIPCO2009), Glasgow, Scotland, pp\u00a0839\u2013843"},{"key":"28_CR33","doi-asserted-by":"crossref","unstructured":"Shahab A, Shafait F, Dengel A (2011) Bayesian approach to photo time-stamp recognition. In: International conference on document analysis and recognition (ICDAR2011), Beijing, pp\u00a01039\u20131043","DOI":"10.1109\/ICDAR.2011.210"},{"key":"28_CR34","doi-asserted-by":"crossref","unstructured":"Li H, Doermann D (1999) Text enhancement in digital video using multiple frame integration. In: ACM international conference on multimedia (Part\u00a01) (MULTIMEDIA \u201999), Orlando, pp\u00a019\u201322","DOI":"10.1145\/319463.319466"},{"key":"28_CR35","unstructured":"Li H, Doermann D (2000) Superresolution-Based enhancement of text in digital video. In: International conference on pattern recognition (ICPR2000), Barcelona, vol\u00a01, pp\u00a0847\u2013850"},{"key":"28_CR36","unstructured":"Mancas-Thillou C, Mirmehdi M (2005) Super-Resolution text using the Teager filter. In: International workshop on camera-based document analysis and recognition (CBDAR2005), Seoul, Korea, pp\u00a010\u201316"},{"key":"28_CR37","doi-asserted-by":"crossref","unstructured":"Capel D, Zisserman A (2000) A super-resolution enhancement of text image sequences. In: International conference on pattern recognition (ICPR2000), Barcelona, vol\u00a01, pp\u00a0600\u2013605","DOI":"10.1109\/ICPR.2000.905409"},{"issue":"3","key":"28_CR38","doi-asserted-by":"publisher","first-page":"231","DOI":"10.1016\/1049-9652(91)90045-L","volume":"53","author":"M Irani","year":"1991","unstructured":"Irani M, Peleg S (1991) Improving resolution by image registration. Graph Models Image Process 53(3):231\u2013239","journal-title":"Graph Models Image Process"},{"issue":"2\u20133","key":"28_CR39","doi-asserted-by":"publisher","first-page":"159","DOI":"10.1007\/s10032-004-0139-y","volume":"7","author":"K Donaldson","year":"2005","unstructured":"Donaldson K, Myers GK (2005) Bayesian super-resolution of text in video with a text-specific bimodal prior. Int J Doc Anal Recognit 7(2\u20133):159\u2013167","journal-title":"Int J Doc Anal Recognit"},{"key":"28_CR40","doi-asserted-by":"crossref","unstructured":"Banerjee J, Jawahar CV (2008) Super-resolution of text images using edge-directed tangent field. In: International workshop on document analysis systems (DAS2008), Nara, pp\u00a076\u201383","DOI":"10.1109\/DAS.2008.26"},{"key":"28_CR41","doi-asserted-by":"crossref","unstructured":"Bayarsaikhan B, Kwon Y, Kim JH (2008) Anisotropic total variation method for text image super-resolution. In: International workshop on document analysis systems (DAS2008), Nara, pp\u00a0473\u2013479","DOI":"10.1109\/DAS.2008.62"},{"key":"28_CR42","doi-asserted-by":"publisher","first-page":"589","DOI":"10.1016\/S0262-8856(98)00178-4","volume":"17","author":"A Zappal\u00e1","year":"1999","unstructured":"Zappal\u00e1 A, Gee A, Taylor M (1999) Document mosaicking. Image Vis Comput 17: 589\u2013595","journal-title":"Image Vis Comput"},{"key":"28_CR43","doi-asserted-by":"publisher","first-page":"246","DOI":"10.1117\/12.526510","volume":"5299","author":"T Sato","year":"2004","unstructured":"Sato T, Ikeda S, Kanbara M, Iketani A, Nakajima N, Yokoya N, Yamada K (2004) High-resolution video mosaicing for documents and photos by estimating camera motion. Proc SPIE Electron Imaging 5299:246\u2013253","journal-title":"Proc SPIE Electron Imaging"},{"issue":"9","key":"28_CR44","doi-asserted-by":"publisher","first-page":"1167","DOI":"10.1109\/TPAMI.2002.1033210","volume":"24","author":"S Baker","year":"2002","unstructured":"Baker S, Kanade T (2002) Limits on super-resolution and how to break them. IEEE Trans Pattern Anal Mach Intell 24(9):1167\u20131183","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"28_CR45","doi-asserted-by":"crossref","unstructured":"Dalley G, Freeman B, Marks J (2004) Single-frame text super-resolution: a Bayesian approach. In: International conference on image processing (ICIP2004), Singapore, vol\u00a05, pp\u00a03295\u20133298","DOI":"10.1109\/ICIP.2004.1421818"},{"issue":"2","key":"28_CR46","doi-asserted-by":"publisher","first-page":"56","DOI":"10.1109\/38.988747","volume":"22","author":"WT Freeman","year":"2002","unstructured":"Freeman WT, Jones TR, Pasztor EC (2002) Example-Based super-resolution. IEEE Comput Graph Appl 22(2):56\u201365","journal-title":"IEEE Comput Graph Appl"},{"key":"28_CR47","unstructured":"Park J, Kwon Y, Kim JH (2005) An example-based prior model for text image super-resolution. In: International conference on document analysis and recognition (ICDAR2005), Seoul, pp\u00a0374\u2013378"},{"key":"28_CR48","doi-asserted-by":"crossref","unstructured":"Jacobs C, Simard PY, Viola P, Rinker J (2005) Text recognition of low-resolution document images. In: International conference on document analysis and recognition (ICDAR2005), Seoul, vol\u00a02, pp\u00a0695\u2013699","DOI":"10.1109\/ICDAR.2005.233"},{"key":"28_CR49","doi-asserted-by":"publisher","first-page":"230","DOI":"10.1117\/12.304635","volume":"3305","author":"MJ Taylor","year":"1998","unstructured":"Taylor MJ, Dance CR (1998) Enhancement of document images from cameras. Proc SPIE 3305:230\u2013241","journal-title":"Proc SPIE"},{"key":"28_CR50","doi-asserted-by":"publisher","first-page":"767","DOI":"10.1007\/978-3-642-10520-3_73","volume":"5876","author":"Y Tian","year":"2009","unstructured":"Tian Y, Ming W (2009) Adaptive deblurring for camera-based document image processing. Lect Notes Comput Sci 5876:767\u2013777","journal-title":"Lect Notes Comput Sci"},{"issue":"4","key":"28_CR51","doi-asserted-by":"publisher","first-page":"520","DOI":"10.1109\/TPAMI.2004.1265867","volume":"26","author":"T Kanungo","year":"2004","unstructured":"Kanungo T, Zheng Q (2004) Estimating degradation model parameters using neighborhood pattern distributions: an optimization approach. IEEE Trans Pattern Anal Mach Intell 26(4):520\u2013524","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"28_CR52","doi-asserted-by":"crossref","unstructured":"Chen X, He X, Yang J, Wu Q (2011) An effective document image deblurring algorithm. In: IEEE computer society conference on computer vision and pattern recognition (CVPR2011), Colorado Springs, pp\u00a0369\u2013376","DOI":"10.1109\/CVPR.2011.5995568"},{"key":"28_CR53","unstructured":"Qi XY, Zhang L, Tan CL (2005) Motion deblurring for optical character recognition. In: International conference on document analysis and recognition (ICDAR2005), Seoul, pp\u00a0389\u2013393"},{"key":"28_CR54","first-page":"267","volume":"3967","author":"P Clark","year":"2000","unstructured":"Clark P, Mirmehdi M (2000) Location and recovery of text on oriented surfaces. SPIE Conf Doc Recognit Retr VII 3967:267\u2013277","journal-title":"SPIE Conf Doc Recognit Retr VII"},{"key":"28_CR55","doi-asserted-by":"crossref","unstructured":"Clark P, Mirmehdi M (2001) Estimating the orientation and recovery of text planes in a single image. In: British machine vision conference (BMVC2001), Manchester, pp\u00a0421\u2013430","DOI":"10.5244\/C.15.44"},{"key":"28_CR56","first-page":"20","volume-title":"Perspective estimation for document images. SPIE Doc Recognit IX","author":"CR Dance","year":"2002","unstructured":"Dance CR (2002) Perspective estimation for document images. SPIE Doc Recognit IX 20\u201325"},{"issue":"2\u20133","key":"28_CR57","first-page":"147","volume":"7","author":"GK Myers","year":"2004","unstructured":"Myers GK, Bolles RC, Luong Q-T, Herson JA, Aradhye HB (2004) Rectification and recognition of text in\u00a03-D scenes. Int J Doc Anal Recognit 7(2\u20133):147\u2013158","journal-title":"Int J Doc Anal Recognit"},{"issue":"2\u20133","key":"28_CR58","first-page":"168","volume":"7","author":"T Yamaguchi","year":"2004","unstructured":"Yamaguchi T, Maruyama M, Miyao H, Nakano Y (2004) Digit recognition in a natural scene with skew and slant normalization. Int J Doc Anal Recognit 7(2\u20133):168\u2013177","journal-title":"Int J Doc Anal Recognit"},{"issue":"5","key":"28_CR59","doi-asserted-by":"publisher","first-page":"541","DOI":"10.1016\/j.imavis.2005.01.003","volume":"23","author":"S Lu","year":"2005","unstructured":"Lu S, Chen BM, Ko CC (2005) Perspective rectification of document images using fuzzy set and morphological operations. Image Vis Comput 23(5):541\u2013553","journal-title":"Image Vis Comput"},{"issue":"4","key":"28_CR60","doi-asserted-by":"publisher","first-page":"591","DOI":"10.1109\/TPAMI.2007.70724","volume":"30","author":"J Liang","year":"2008","unstructured":"Liang J, DeMenthon D, Doermann D (2008) Geometric rectification of camera-captured document images. IEEE Trans Pattern Anal Mach Intell 30(4):591\u2013605","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"28_CR61","unstructured":"Yin X-C, Sun J, Naoi S, Fujimoto K, Takebe H, Fujii Y, Kurokawa K (2007) A multi-stage strategy to perspective rectification for mobile phone camera-based document images. In: International conference on document analysis and recognition (ICDAR2007), Curitiba, pp\u00a0574\u2013578"},{"key":"28_CR62","doi-asserted-by":"crossref","unstructured":"Uchida S, Sakai M, Iwamura M, Omachi S, Kise K (2008) Skew estimation by instances. In: International workshop on document analysis systems (DAS2008), Nara, pp\u00a0201\u2013208","DOI":"10.1109\/DAS.2008.22"},{"key":"28_CR63","doi-asserted-by":"crossref","unstructured":"Shiraishi S, Feng Y, Uchida S (2012) A part-based skew estimation method. In: International workshop on document analysis systems (DAS2012), Gold Coast, pp\u00a0185\u2013189","DOI":"10.1109\/DAS.2012.7"},{"key":"28_CR64","doi-asserted-by":"crossref","unstructured":"Lu S, Tan CL (2007) Automatic detection of document script and orientation. In: International conference on document analysis and recognition (ICDAR2007), Curitiba, pp\u00a0237\u2013241","DOI":"10.1109\/ICDAR.2007.4378711"},{"issue":"7","key":"28_CR65","doi-asserted-by":"publisher","first-page":"1551","DOI":"10.1109\/TIP.2009.2019301","volume":"18","author":"HI Koo","year":"2009","unstructured":"Koo HI, Kim J, Cho NI (2009) Composition of a dewarped and enhanced document image from two view images. IEEE Trans Image Process 18(7):1551\u20131562","journal-title":"IEEE Trans Image Process"},{"key":"28_CR66","doi-asserted-by":"publisher","first-page":"105","DOI":"10.1007\/s10032-004-0134-3","volume":"7","author":"SM Lucas","year":"2005","unstructured":"Lucas SM et al (2005) ICDAR 2003 robust reading competitions: entries, results and future directions. Int J Doc Anal Recognit 7:105\u2013122","journal-title":"Int J Doc Anal Recognit"},{"key":"28_CR67","doi-asserted-by":"crossref","unstructured":"Lucas SM (2005) ICDAR 2005 text locating competition results. In: International conference on document analysis and recognition (ICDAR2005), Seoul, pp\u00a080\u201384","DOI":"10.1109\/ICDAR.2005.231"},{"key":"28_CR68","doi-asserted-by":"crossref","unstructured":"Shahab A, Shafait F, Dengel A (2011) ICDAR 2011 robust reading competition challenge\u00a02: reading text in scene images. In: International conference on document analysis and recognition (ICDAR2011), Beijing, pp\u00a01491\u20131496","DOI":"10.1109\/ICDAR.2011.296"},{"issue":"6","key":"28_CR69","doi-asserted-by":"publisher","first-page":"2165","DOI":"10.1016\/j.patcog.2010.01.009","volume":"43","author":"P Shivakumara","year":"2010","unstructured":"Shivakumara P, Huang W, Phan TQ, Tan CL (2010) Accurate video text detection through classification of low and high contrast images. Pattern Recognit 43(6):2165\u20132185","journal-title":"Pattern Recognit"},{"key":"28_CR70","unstructured":"Ma Y, Liu W, Bai X, Yao C, Tu Z (2012) Detecting texts of arbitrary orientations in natural images. In: IEEE conference on computer vision and pattern recognition (CVPR2012), Providence, pp\u00a01083\u20131090"},{"key":"28_CR71","doi-asserted-by":"crossref","unstructured":"Ezaki N, Kiyota K, Minh BT, Bulacu M, Schomaker L (2005) Improved text-detection methods for a camera-based text reading system for blind persons. In: International conference on document analysis and recognition (ICDAR2005), Seoul, pp\u00a0257\u2013261","DOI":"10.1109\/ICDAR.2005.137"},{"key":"28_CR72","doi-asserted-by":"crossref","unstructured":"Kuwano H, Taniguchi Y, Arai H, Mori M, Kurakake S, Kojima H (2000) Telop-on-demand: video structuring and retrieval based on text recognition. In: IEEE international conference on multimedia and expo (ICME 2000), New York, vol\u00a02, pp\u00a0759\u2013762","DOI":"10.1109\/ICME.2000.871472"},{"key":"28_CR73","unstructured":"Sin B-K, Kim S-K, Cho B-J (2002) Locating characters in scene images using frequency features. In: International conference on pattern recognition (ICPR2002), Quebec City, vol\u00a03"},{"key":"28_CR74","doi-asserted-by":"crossref","unstructured":"Liu X, Samarabandu J (2006) Multiscale edge-based text extraction from complex images. In: IEEE international conference on multimedia and expo (ICME2006), Toronto, pp\u00a01721\u20131724","DOI":"10.1109\/ICME.2006.262882"},{"key":"28_CR75","doi-asserted-by":"crossref","unstructured":"Bertini M, Colombo C, Del Bimbo A (2001) Automatic caption localization in videos using salient points. In: IEEE international conference on multimedia and expo (ICME\u201901), Tokyo, pp\u00a069\u201372","DOI":"10.1109\/ICME.2001.1237657"},{"key":"28_CR76","doi-asserted-by":"crossref","unstructured":"Huang X, Ma H (2010) Automatic detection and localization of natural scene text in video. In: International conference on pattern recognition (ICPR2010), Istanbul, pp\u00a03216\u20133219","DOI":"10.1109\/ICPR.2010.786"},{"issue":"3","key":"28_CR77","doi-asserted-by":"publisher","first-page":"790","DOI":"10.1109\/TIP.2010.2068553","volume":"20","author":"X Zhao","year":"2011","unstructured":"Zhao X, Lin K-H, Fu Y, Hu Y, Liu Y, Huang TS (2011) Text from corners: a novel approach to detect text and caption in videos. IEEE Trans Image Process 20(3):790\u2013799","journal-title":"IEEE Trans Image Process"},{"key":"28_CR78","doi-asserted-by":"crossref","unstructured":"Wolf C, Jolion J-M, Chassaing F (2002) Text localization, enhancement and binarization in multimedia documents. In: International conference on pattern recognition (ICPR2002), Quebec City, vol\u00a02, pp\u00a01037\u20131040","DOI":"10.1109\/ICPR.2002.1048482"},{"issue":"6","key":"28_CR79","doi-asserted-by":"publisher","first-page":"1397","DOI":"10.1016\/S0031-3203(02)00230-3","volume":"36","author":"EK Wong","year":"2003","unstructured":"Wong EK, Chen M (2003) A new robust algorithm for video text extraction. Pattern Recognit 36(6):1397\u20131406","journal-title":"Pattern Recognit"},{"issue":"2","key":"28_CR80","doi-asserted-by":"publisher","first-page":"401","DOI":"10.1109\/TIP.2008.2008225","volume":"18","author":"W Kim","year":"2009","unstructured":"Kim W, Kim C (2009) A new approach for overlay text detection and extraction from complex video scene. IEEE Trans Image Process 18(2):401\u2013411","journal-title":"IEEE Trans Image Process"},{"key":"28_CR81","doi-asserted-by":"crossref","unstructured":"Phan TQ, Shivakumara P, Tan CL (2009) A Laplacian method for video text detection. In: International conference on document analysis and recognition (ICDAR 2009), Barcelona, pp\u00a066\u201370","DOI":"10.1109\/ICDAR.2009.153"},{"key":"28_CR82","doi-asserted-by":"crossref","unstructured":"Wang K, Belongie S (2010) Word spotting in the wild. In: European conference on computer vision (ECCV2010), Heraklion, pp\u00a0591\u2013604","DOI":"10.1007\/978-3-642-15549-9_43"},{"key":"28_CR83","doi-asserted-by":"crossref","unstructured":"Uchida S, Shigeyoshi Y, Kunishige Y, Feng Y (2011) A keypoint-based approach toward scenery character detection. In: International conference on document analysis and recognition (ICDAR 2011), Beijing, pp\u00a0819\u2013823","DOI":"10.1109\/ICDAR.2011.168"},{"key":"28_CR84","doi-asserted-by":"crossref","unstructured":"Mishra A, Alahari K, Jawahar CV (2012) Top-down and bottom-up cues for scene text recognition. In: IEEE conference on computer vision and pattern recognition (CVPR2012), Providence, pp\u00a02687\u20132694","DOI":"10.1109\/CVPR.2012.6247990"},{"issue":"9","key":"28_CR85","doi-asserted-by":"publisher","first-page":"1413","DOI":"10.1016\/j.imavis.2010.03.004","volume":"28","author":"M Anthimopoulos","year":"2010","unstructured":"Anthimopoulos M, Gatos B, Pratikakis I (2010) A two-stage scheme for text detection in video images. Image Vis Comput 28(9):1413\u20131426","journal-title":"Image Vis Comput"},{"key":"28_CR86","doi-asserted-by":"crossref","unstructured":"Chaddha N, Sharma R, Agrawal A, Gupta A (1994) Text segmentation in mixed-mode images. In: Asilomar conference on signals, systems and computers, Pacific Grove, vol\u00a02, pp\u00a01356\u20131361","DOI":"10.1109\/ACSSC.1994.471679"},{"issue":"4","key":"28_CR87","doi-asserted-by":"publisher","first-page":"385","DOI":"10.1109\/34.845381","volume":"22","author":"Y Zhong","year":"2000","unstructured":"Zhong Y, Zhang H, Jain AK (2000) Automatic caption localization in compressed video. IEEE Trans Pattern Anal Mach Intell 22(4):385\u2013392","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"1","key":"28_CR88","first-page":"1","volume":"11","author":"H Goto","year":"2008","unstructured":"Goto H (2008) Redefining the DCT-based feature for scene text detection. Analysis and comparison of spatial frequency-based features. Int J Doc Anal Recognit 11(1):1\u20138","journal-title":"Analysis and comparison of spatial frequency-based features. Int J Doc Anal Recognit"},{"issue":"3","key":"28_CR89","doi-asserted-by":"publisher","first-page":"169","DOI":"10.1007\/BF02626996","volume":"5","author":"AK Jain","year":"1992","unstructured":"Jain AK, Bhattacharjee S (1992) Text segmentation using Gabor filters for automatic document processing. Mach Vis Appl 5(3):169\u2013184","journal-title":"Mach Vis Appl"},{"key":"28_CR90","doi-asserted-by":"crossref","unstructured":"Saoi T, Goto H, Kobayashi H (2005) Text detection in color scene images based on unsupervised clustering of multi-channel wavelet features. In: International conference on document analysis and recognition (ICDAR 2005), Seoul, pp\u00a0690\u2013694","DOI":"10.1109\/ICDAR.2005.227"},{"issue":"8","key":"28_CR91","doi-asserted-by":"publisher","first-page":"2117","DOI":"10.1109\/TIP.2007.900098","volume":"16","author":"S Kumar","year":"2007","unstructured":"Kumar S, Gupta R, Khanna N, Chaudhury S, Joshi SD (2007) Text extraction and document image segmentation using matched wavelets and MRF model. IEEE Trans Image Process 16(8):2117\u20132128","journal-title":"IEEE Trans Image Process"},{"issue":"10","key":"28_CR92","doi-asserted-by":"publisher","first-page":"1733","DOI":"10.1109\/TPAMI.2009.38","volume":"31","author":"JJ Weinman","year":"2009","unstructured":"Weinman JJ, Learned-Miller E, Hanson AR (2009) Scene text recognition using similarity and a lexicon with sparse belief propagation. IEEE Trans Pattern Anal Mach Intell 31(10): 1733\u20131746","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"28_CR93","doi-asserted-by":"crossref","unstructured":"Kim KC, Byun HR, Song YJ, Choi YW, Chi SY, Kim KK, Chung YK (2004) Scene text extraction in natural scene images using hierarchical feature combining and verification. In: International conference on pattern recognition (ICPR2004), Cambridge, vol\u00a02, pp\u00a0679\u2013682","DOI":"10.1109\/ICPR.2004.1334350"},{"issue":"1","key":"28_CR94","doi-asserted-by":"publisher","first-page":"87","DOI":"10.1109\/TIP.2003.819223","volume":"13","author":"X Chen","year":"2004","unstructured":"Chen X, Yang J, Zhang J, Waibel A (2004) Automatic detection and recognition of signs from natural scenes. IEEE Trans Image Process 13(1):87\u201399","journal-title":"IEEE Trans Image Process"},{"key":"28_CR95","unstructured":"Pan Y-F, Hou X, Liu C-L (2008) A robust system to detect and localize texts in natural scene images. In: International workshop on document analysis systems (DAS2008), Nara, pp\u00a035\u201342"},{"key":"28_CR96","doi-asserted-by":"crossref","unstructured":"Peng X, Cao H, Prasad R, Natarajan P (2011) Text extraction from video using conditional random fields. In: International conference on document analysis and recognition (ICDAR2011), Beijing, pp\u00a01029\u20131033","DOI":"10.1109\/ICDAR.2011.208"},{"key":"28_CR97","unstructured":"Pan W, Bui TD, Suen CY (2008) Text detection from scene images using sparse representation. In: International conference on pattern recognition (ICPR2008), Tampa, pp\u00a01\u20135"},{"key":"28_CR98","doi-asserted-by":"crossref","unstructured":"Coates A, Carpenter B, Case C, Satheesh S, Suresh B, Wang T, Wu DJ, Ng AY (2011) Text detection and character recognition in scene images with unsupervised feature learning. In: International conference on document analysis and recognition (ICDAR2011), Beijing, pp\u00a0440\u2013445","DOI":"10.1109\/ICDAR.2011.95"},{"key":"28_CR99","doi-asserted-by":"crossref","unstructured":"Yi C, Tian Y (2011) Text detection in natural scene images by stroke Gabor words. In: International conference on document analysis and recognition (ICDAR2011), Beijing, pp\u00a0177\u2013181","DOI":"10.1109\/ICDAR.2011.44"},{"key":"28_CR100","doi-asserted-by":"crossref","unstructured":"Shahab A, Shafait F, Dengel A (2011) Bayesian approach to photo time-stamp recognition. In: International conference on document analysis and recognition (ICDAR2011), Beijing, pp\u00a01039\u20131043","DOI":"10.1109\/ICDAR.2011.210"},{"key":"28_CR101","doi-asserted-by":"crossref","unstructured":"Shahab A, Shafait F, Dengel A, Uchida S (2012) How salient is scene text. In: International workshop on document analysis systems (DAS2012), Gold Coast, pp\u00a0317\u2013321","DOI":"10.1109\/DAS.2012.42"},{"key":"28_CR102","doi-asserted-by":"crossref","unstructured":"Gandhi T, Kasturi R, Antani S (2000) Application of planar motion segmentation for scene text extraction. In: International conference on pattern recognition (ICPR2000), Barcelona, vol\u00a01, pp\u00a01445\u20131449","DOI":"10.1109\/ICPR.2000.905372"},{"key":"28_CR103","unstructured":"Park S-B, Oh K-J, Kim H-N, Jo G-S (2008) Automatic subtitles localization through speaker identification in multimedia system. In: IEEE international workshop on semantic computing and applications (IWSCA2008), Incheon, Korea, pp\u00a0166\u2013172"},{"key":"28_CR104","doi-asserted-by":"crossref","unstructured":"Kunishige Y, Feng Y, Uchida S (2011) Scenery character detection with environmental context. In: International conference on document analysis and recognition (ICDAR2011), Beijing","DOI":"10.1109\/ICDAR.2011.212"},{"key":"28_CR105","doi-asserted-by":"crossref","unstructured":"Bhattacharya U, Parui SK, S Mondal (2009) Devanagari and Bangla text extraction from natural scene images. In: International conference on document analysis and recognition (ICDAR2009), Barcelona, pp\u00a0171\u2013175","DOI":"10.1109\/ICDAR.2009.178"},{"key":"28_CR106","doi-asserted-by":"crossref","unstructured":"Kim E, Lee SH, Kim JH (2009) Scene text extraction using focus of mobile camera. In: International conference on document analysis and recognition (ICDAR 2009), Barcelona, pp\u00a0166\u2013170","DOI":"10.1109\/ICDAR.2009.21"},{"key":"28_CR107","doi-asserted-by":"crossref","unstructured":"Rother C, Kolmogorov V, Blake A (2004) GrabCut: interactive foreground extraction using iterated graph cuts. In: Proceedings of the SIGGRAPH, Los Angeles, pp\u00a0309\u2013314","DOI":"10.1145\/1186562.1015720"},{"key":"28_CR108","doi-asserted-by":"publisher","first-page":"791","DOI":"10.1016\/S0031-3203(98)00108-3","volume":"32","author":"S Messelodi","year":"1999","unstructured":"Messelodi S, Modena CM (1999) Automatic identification and skew estimation of text lines in real scene images. Pattern Recognit 32:791\u2013810","journal-title":"Pattern Recognit"},{"key":"28_CR109","unstructured":"Gatos B, Pratikakis I, Perantonis SJ (2005) Text detection in indoor\/outdoor scene images. In: International workshop on camera-based document analysis and recognition (CBDAR2005), Seoul, Korea, pp\u00a0127\u2013132"},{"key":"28_CR110","unstructured":"Chen X, Yuille AL (2004) Detecting and reading text in natural scenes. In: IEEE conference on computer vision and pattern recognition (CVPR2004), Washington, DC, vol\u00a02, pp\u00a0366\u2013373"},{"key":"28_CR111","unstructured":"Hu S, Chen M (2005) Adaptive Frechet kernel based support vector machine for text detection. In: International conference on acoustics, speech, and signal processing (ICASSP2005), Philadelphia, vol\u00a05, pp\u00a0365\u2013368"},{"key":"28_CR112","doi-asserted-by":"crossref","unstructured":"Xu L, Nagayoshi H, Sako H (2008) Kanji character detection from complex real scene images based on character properties. In: International workshop on document analysis systems (DAS2008), Nara, pp\u00a0278\u2013285","DOI":"10.1109\/DAS.2008.34"},{"key":"28_CR113","unstructured":"Hanif SM, Prevost L (2009) Text detection and localization in complex scene images using constrained AdaBoost algorithm. In: International conference on document analysis and recognition (ICDAR2009), Barcelona, pp\u00a01\u20135"},{"issue":"2","key":"28_CR114","doi-asserted-by":"publisher","first-page":"214","DOI":"10.1109\/34.273729","volume":"16","author":"J Ohya","year":"1994","unstructured":"Ohya J, Shio A, Akamatsu S (1994) Recognizing characters in scene images. IEEE Trans Pattern Anal Mach Intell 16(2):214\u2013220","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"28_CR115","unstructured":"Kusachi Y, Suzuki A, Ito N, Arakawa K (2004) Kanji recognition in scene images without detection of text fields \u2013 robust against variation of viewpoint, contrast, and background texture. In: International conference on pattern recognition (ICPR2004), Cambridge, vol\u00a01, pp\u00a0457\u2013460"},{"key":"28_CR116","doi-asserted-by":"crossref","unstructured":"Antani S, Crandall D, Kasturi R (2000) Robust extraction of text in video. In: International conference on pattern recognition (ICPR2000), Barcelona, vol\u00a03, pp\u00a0831\u2013834","DOI":"10.1109\/ICPR.2000.905537"},{"key":"28_CR117","doi-asserted-by":"crossref","unstructured":"Ren X, Malik J (2003) Learning a classification model for segmentation. In: International conference on computer vision (ICCV2003), Nice, vol\u00a01, pp\u00a010\u201317","DOI":"10.1109\/ICCV.2003.1238308"},{"key":"28_CR118","doi-asserted-by":"crossref","unstructured":"Epshtein B, Ofek E, Wexler Y (2010) Detecting text in natural scenes with stroke width transform. In: IEEE conference on computer vision and pattern recognition (CVPR2010), San Francisco, pp\u00a02963\u20132970","DOI":"10.1109\/CVPR.2010.5540041"},{"key":"28_CR119","doi-asserted-by":"publisher","first-page":"761","DOI":"10.1016\/j.imavis.2004.02.006","volume":"22","author":"J Matas","year":"2004","unstructured":"Matas J, Chum O, Urban M, Pajdla T (2004) Robust wide-baseline stereo from maximally stable extremal regions. Image Vis Comput 22:761\u2013767","journal-title":"Image Vis Comput"},{"key":"28_CR120","doi-asserted-by":"crossref","unstructured":"Cho MS, Seok J-H, Lee S, Kim JH (2011) Scene text extraction by superpixel CRFs combining multiple character features. In: International conference on document analysis and recognition (ICDAR2011), Beijing, pp\u00a01034\u20131038","DOI":"10.1109\/ICDAR.2011.209"},{"key":"28_CR121","doi-asserted-by":"crossref","unstructured":"Wang X, Ding X, Liu C (2001) Character extraction and recognition in natural scene images. In: International conference on document analysis and recognition (ICDAR2001), Seattle, pp\u00a01084\u20131088","DOI":"10.1109\/ICDAR.2001.953953"},{"issue":"10","key":"28_CR122","doi-asserted-by":"publisher","first-page":"2287","DOI":"10.1016\/S0031-3203(03)00082-7","volume":"36","author":"K Wang","year":"2003","unstructured":"Wang K, Kangas JA (2003) Character location in scene images from digital camera. Pattern Recognit 36(10):2287\u20132299","journal-title":"Pattern Recognit"},{"issue":"1\u20132","key":"28_CR123","doi-asserted-by":"publisher","first-page":"97","DOI":"10.1016\/j.cviu.2006.11.010","volume":"107","author":"C Mancas-Thillou","year":"2007","unstructured":"Mancas-Thillou C, Gosselin B (2007) Color text extraction with selective metric-based clustering. Comput Vis Image Underst 107(1\u20132):97\u2013107","journal-title":"Comput Vis Image Underst"},{"key":"28_CR124","doi-asserted-by":"crossref","unstructured":"Liu Q, Jung C, Moon Y (2006) Text segmentation based on stroke filter. In: Annual ACM international conference on multimedia (MULTIMEDIA 2006), Santa Barbara, pp\u00a0129\u2013132","DOI":"10.1145\/1180639.1180677"},{"key":"28_CR125","doi-asserted-by":"crossref","unstructured":"Donoser M, Arth C, Bischof H (2007) Detecting, tracking and recognizing license plates. In: Asian conference on computer vision (ACCV2007), Tokyo, vol\u00a0II, pp\u00a0447\u2013456","DOI":"10.1007\/978-3-540-76390-1_44"},{"key":"28_CR126","doi-asserted-by":"publisher","first-page":"770","DOI":"10.1007\/978-3-642-19318-7_60","volume-title":"Computer Vision \u2013 ACCV 2010","author":"Lukas Neumann","year":"2011","unstructured":"Neumann L, Matas J (2010) A method for text localization and recognition in real-world images. In: Asian conference on computer vision (ACCV2010), Queenstown, vol\u00a0III, pp\u00a0770\u2013783"},{"key":"28_CR127","unstructured":"Merino-Gracia C, Lenc K, Mirmehdi M (2011) A head-mounted device for recognizing text in natural scenes. In: International workshop on camera-based document analysis and recognition (CBDAR2011), Beijing, pp\u00a027\u201332"},{"key":"28_CR128","doi-asserted-by":"crossref","unstructured":"Neumann L, Matas J (2012) Real-time scene text localization and recognition. In: IEEE conference on computer vision and pattern recognition (CVPR2012), Providence, pp\u00a03538\u20133545","DOI":"10.1109\/CVPR.2012.6248097"},{"key":"28_CR129","unstructured":"Li C, Ding X, Wu Y (2001) Automatic text location in natural scene images. In: International conference on document analysis and recognition (ICDAR 2001), Seattle, pp\u00a01069\u20131073"},{"key":"28_CR130","unstructured":"Huang R, Oba S, Palaiahnakote S, Uchida S (2012) Scene character detection and recognition based on multiple hypotheses framework. In: International conference on pattern recognition (ICPR2012), Tsukuba, pp\u00a0717\u2013720"},{"issue":"4","key":"28_CR131","doi-asserted-by":"publisher","first-page":"258","DOI":"10.1007\/s10032-001-0073-1","volume":"4","author":"H Goto","year":"2001","unstructured":"Goto H, Aso H (2001) Character pattern extraction from documents with complex backgrounds. Int J Doc Anal Recognit 4(4):258\u2013268","journal-title":"Int J Doc Anal Recognit"},{"key":"28_CR132","unstructured":"Zhang D-Q, Chang S-F (2000) Learning to detect scene text using a higher-order MRF with belief propagation. In: Conference on computer vision and pattern recognition workshop (CVPRW2004), Washington, DC, pp\u00a0101\u2013108"},{"issue":"7","key":"28_CR133","doi-asserted-by":"publisher","first-page":"1349","DOI":"10.1016\/S0031-3203(00)00081-9","volume":"34","author":"H Hase","year":"2001","unstructured":"Hase H, Shinokawa T, Yoneda M, Suen CY (2001) Character string extraction from color documents. Pattern Recognit 34(7):1349\u20131365","journal-title":"Pattern Recognit"},{"key":"28_CR134","doi-asserted-by":"crossref","unstructured":"Iwamura M, Tsuji T, Kise K (2010) Memory-based recognition of camera-captured characters. In: International workshop on document analysis systems (DAS2010), Boston, pp\u00a089\u201396","DOI":"10.1145\/1815330.1815342"},{"key":"28_CR135","doi-asserted-by":"crossref","unstructured":"Pan P, Zhu Y, Sun J, Naoi S (2011) Recognizing characters with severe perspective distortion using hash tables and perspective invariants. In: International conference on document analysis and recognition (ICDAR 2011), Beijing, pp\u00a0548\u2013552","DOI":"10.1109\/ICDAR.2011.116"},{"issue":"8","key":"28_CR136","doi-asserted-by":"publisher","first-page":"1781","DOI":"10.1093\/ietisy\/e88-d.8.1781","volume":"E88-D","author":"S Uchida","year":"2005","unstructured":"Uchida S, Sakoe H (2005) A survey of elastic matching techniques for handwritten character recognition. IEICE Trans Inf Syst E88-D(8):1781\u20131790","journal-title":"IEICE Trans Inf Syst"},{"issue":"3","key":"28_CR137","doi-asserted-by":"publisher","first-page":"315","DOI":"10.1109\/34.910884","volume":"23","author":"S Omachi","year":"2001","unstructured":"Omachi S, Inoue M, Aso H (2001) Structure extraction from decorated characters using multiscale images. IEEE Trans Pattern Anal Mach Intell 23(3):315\u2013322","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"28_CR138","unstructured":"Mancas-Thillou C, Mancas M (2007) Comparison between pen-scanner and digital camera acquisition for engraved character recognition. In: International workshop on camera-based document analysis and recognition (CBDAR 2007), Curitiba, Brazil, pp\u00a0130\u2013137"},{"issue":"4","key":"28_CR139","doi-asserted-by":"publisher","first-page":"1230","DOI":"10.1016\/j.patcog.2007.08.005","volume":"41","author":"S Uchida","year":"2008","unstructured":"Uchida S, Miyazaki H, Sakoe H (2008) Mosaicing-by-recognition for video-based text recognition. Pattern Recognit 41(4):1230\u20131240","journal-title":"Pattern Recognit"},{"key":"28_CR140","doi-asserted-by":"crossref","unstructured":"Uchida S, Sakai M, Iwamura M, Omachi S, Kise K (2007) Extraction of embedded class information from universal character pattern. In: International conference on document analysis and recognition (ICDAR 2007), Curitiba, vol\u00a01, pp\u00a0437\u2013441","DOI":"10.1109\/ICDAR.2007.4378747"},{"key":"28_CR141","doi-asserted-by":"crossref","unstructured":"Sawaki M, Murase H, Hagita N (2000) Automatic acquisition of context-based image templates for degraded character recognition in scene images. In: International conference on pattern recognition (ICPR2000), Barcelona, vol\u00a04, pp\u00a015\u201318","DOI":"10.1109\/ICPR.2000.902855"},{"key":"28_CR142","unstructured":"Saidane Z, Garcia C (2007) Automatic scene text recognition using a convolutional neural network. In: International workshop on camera-based document analysis and recognition (CBDAR 2007), Curitiba, Brazil, pp\u00a0100\u2013106"},{"key":"28_CR143","unstructured":"Netzer Y, Wang T, Coates A, Bissacco A, Wu B, Ng AY (2011) Reading digits in natural images with unsupervised feature learning. In: NIPS workshop on deep learning and unsupervised feature learning, Granada, Spain."},{"key":"28_CR144","unstructured":"de Camposm TE, Babu BR, Varma M (2009) Character recognition in natural images. In: International conference on computer vision theory and applications (VISAPP2009), Lisboa, pp\u00a0273\u2013280"},{"key":"28_CR145","unstructured":"Lu S, Tan CL (2006) Camera text recognition based on perspective invariants. In: International conference on pattern recognition (ICPR 2006), Hong Kong, vol\u00a02, pp\u00a01042\u20131045"},{"issue":"4","key":"28_CR146","doi-asserted-by":"publisher","first-page":"755","DOI":"10.1109\/TPAMI.2009.196","volume":"32","author":"L Li","year":"2010","unstructured":"Li L, Tan CL (2010) Recognizing planar symbols with severe perspective deformation. IEEE Trans Pattern Anal Mach Intell 32(4):755\u2013762","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"28_CR147","doi-asserted-by":"crossref","unstructured":"Yokobayashi M, Wakahara T (2006) Binarization and recognition of degraded characters using a maximum separability axis in color space and GAT correlation. In: International conference on pattern recognition (ICPR 2006), Hong Kong, vol\u00a02, pp\u00a0885\u2013888","DOI":"10.1109\/ICPR.2006.326"},{"key":"28_CR148","doi-asserted-by":"crossref","unstructured":"Beaufort R, Mancas-Thillou C (2007) A weighted finite-state framework for correcting errors in natural scene OCR. In: International conference on document analysis and recognition (ICDAR 2007), Curitiba, vol\u00a02, pp\u00a0889\u2013893","DOI":"10.1109\/ICDAR.2007.4377043"}],"container-title":["Handbook of Document Image Processing and Recognition"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-0-85729-859-1_28","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,7,23]],"date-time":"2019-07-23T01:23:33Z","timestamp":1563845013000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-0-85729-859-1_28"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2014]]},"ISBN":["9780857298584","9780857298591"],"references-count":148,"URL":"https:\/\/doi.org\/10.1007\/978-0-85729-859-1_28","relation":{},"subject":[],"published":{"date-parts":[[2014]]},"assertion":[{"value":"24 July 2019","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}}]}}