{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,7]],"date-time":"2025-11-07T19:24:08Z","timestamp":1762543448038,"version":"3.37.3"},"reference-count":45,"publisher":"Springer Science and Business Media LLC","issue":"1","license":[{"start":{"date-parts":[[2021,5,5]],"date-time":"2021-05-05T00:00:00Z","timestamp":1620172800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2021,5,5]],"date-time":"2021-05-05T00:00:00Z","timestamp":1620172800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["61972180"],"award-info":[{"award-number":["61972180"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Appl Intell"],"published-print":{"date-parts":[[2022,1]]},"DOI":"10.1007\/s10489-021-02331-4","type":"journal-article","created":{"date-parts":[[2021,5,5]],"date-time":"2021-05-05T09:03:54Z","timestamp":1620205434000},"page":"514-529","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":8,"title":["Scene text detection by adaptive feature selection with text scale-aware loss"],"prefix":"10.1007","volume":"52","author":[{"ORCID":"https:\/\/orcid.org\/0000-0001-8087-3001","authenticated-orcid":false,"given":"Qin","family":"Wu","sequence":"first","affiliation":[]},{"given":"Wenli","family":"Luo","sequence":"additional","affiliation":[]},{"given":"Zhilei","family":"Chai","sequence":"additional","affiliation":[]},{"given":"Guodong","family":"Guo","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2021,5,5]]},"reference":[{"key":"2331_CR1","doi-asserted-by":"crossref","unstructured":"Baek Y, Lee B, Han D, Yun S, Lee H (2019) Character region awareness for text detection. In: 2019 IEEE\/CVF conference on computer vision and pattern recognition (CVPR), pp 9357\u20139366","DOI":"10.1109\/CVPR.2019.00959"},{"key":"2331_CR2","doi-asserted-by":"crossref","unstructured":"Chollet F (2017) Xception: Deep learning with depthwise separable convolutions. In: 2017 IEEE conference on computer vision and pattern recognition (CVPR), pp 1800\u20131807","DOI":"10.1109\/CVPR.2017.195"},{"key":"2331_CR3","doi-asserted-by":"publisher","unstructured":"Dai J, Qi H, Xiong Y, Li Y, Zhang G, Hu H, Wei Y (2017) Deformable convolutional networks. In: 2017 IEEE international conference on computer vision (ICCV). https:\/\/doi.org\/10.1109\/ICCV.2017.89, pp 764\u2013773,","DOI":"10.1109\/ICCV.2017.89"},{"key":"2331_CR4","doi-asserted-by":"crossref","unstructured":"Deng D, Liu H, Li X, Cai D (2018) Pixellink: Detecting scene text via instance segmentation. In: Proceedings of the thirty-second AAAI conference on artificial intelligence. https:\/\/www.aaai.org\/ocs\/index.php\/AAAI\/AAAI18\/paper\/view\/16469. AAAI Press, pp 6773\u20136780","DOI":"10.1609\/aaai.v32i1.12269"},{"key":"2331_CR5","doi-asserted-by":"crossref","unstructured":"Epshtein B, Ofek E, Wexler Y (2010) Detecting text in natural scenes with stroke width transform. In: 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 2963\u20132970","DOI":"10.1109\/CVPR.2010.5540041"},{"key":"2331_CR6","doi-asserted-by":"crossref","unstructured":"He K, Zhang X, Ren S, Sun J (2016) Identity mappings in deep residual networks. In: Computer vision \u2013 ECCV 2016. Springer International Publishing, Cham, pp 630\u2013645","DOI":"10.1007\/978-3-319-46493-0_38"},{"issue":"2","key":"2331_CR7","doi-asserted-by":"publisher","first-page":"386","DOI":"10.1109\/TPAMI.2018.2844175","volume":"42","author":"K He","year":"2020","unstructured":"He K, Gkioxari G, Doll\u00e1r P, Girshick R (2020) Mask r-cnn. IEEE Trans Pattern Anal Mach Intell 42(2):386\u2013397","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2331_CR8","doi-asserted-by":"crossref","unstructured":"He P, Huang W, He T, Zhu Q, Qiao Y, Li X (2017) Single shot text detector with regional attention. In: 2017 IEEE International conference on computer vision (ICCV), pp 3066\u20133074","DOI":"10.1109\/ICCV.2017.331"},{"key":"2331_CR9","doi-asserted-by":"publisher","unstructured":"He W, Zhang X, Yin F, Liu C (2017) Deep direct regression for multi-oriented scene text detection. In: 2017 IEEE international conference on computer vision (ICCV). https:\/\/doi.org\/10.1109\/ICCV.2017.87, pp 745\u2013753","DOI":"10.1109\/ICCV.2017.87"},{"key":"2331_CR10","doi-asserted-by":"crossref","unstructured":"Hu H, Zhang C, Luo Y, Wang Y, Han J, Ding E (2017) Wordsup: Exploiting word annotations for character based text detection. In: 2017 IEEE International conference on computer vision (ICCV), pp 4950\u20134959","DOI":"10.1109\/ICCV.2017.529"},{"issue":"8","key":"2331_CR11","doi-asserted-by":"publisher","first-page":"2011","DOI":"10.1109\/TPAMI.2019.2913372","volume":"42","author":"J Hu","year":"2020","unstructured":"Hu J, Shen L, Albanie S, Sun G, Wu E (2020) Squeeze-and-excitation networks. IEEE Trans Pattern Anal Mach Intell 42(8):2011\u20132023","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2331_CR12","doi-asserted-by":"crossref","unstructured":"Huang G, Liu Z, Van Der Maaten L, Weinberger KQ (2017) Densely connected convolutional networks. In: 2017 IEEE conference on computer vision and pattern recognition (CVPR), pp 2261\u20132269","DOI":"10.1109\/CVPR.2017.243"},{"key":"2331_CR13","doi-asserted-by":"crossref","unstructured":"Karatzas D, Gomez-Bigorda L, Nicolaou A, Ghosh S, Bagdanov A, Iwamura M, Matas J, Neumann L, Chandrasekhar VR, Lu S, Shafait F, Uchida S, Valveny E (2015) Icdar 2015 competition on robust reading. In: 2015 13th international conference on document analysis and recognition (ICDAR), pp 1156\u20131160","DOI":"10.1109\/ICDAR.2015.7333942"},{"key":"2331_CR14","doi-asserted-by":"crossref","unstructured":"Liao M, Shi B, Bai X, Wang X, Liu W (2017) Textboxes: A fast text detector with a single deep neural network. In: Proceedings of the thirty-first AAAI conference on artificial intelligence, February 4-9, 2017, San Francisco, California, USA. http:\/\/aaai.org\/ocs\/index.php\/AAAI\/AAAI17\/paper\/view\/14202. AAAI Press, pp 4161\u20134167","DOI":"10.1609\/aaai.v31i1.11196"},{"issue":"8","key":"2331_CR15","doi-asserted-by":"publisher","first-page":"3676","DOI":"10.1109\/TIP.2018.2825107","volume":"27","author":"M Liao","year":"2018","unstructured":"Liao M, Shi B, Bai X (2018) Textboxes++: A single-shot oriented scene text detector. IEEE Trans Image Process 27(8):3676\u20133690. https:\/\/doi.org\/10.1109\/TIP.2018.2825107","journal-title":"IEEE Trans Image Process"},{"key":"2331_CR16","doi-asserted-by":"crossref","unstructured":"Liao M, Zhu Z, Shi B, Xia G, Bai X (2018) Rotation-sensitive regression for oriented scene text detection. In: 2018 IEEE\/CVF conference on computer vision and pattern recognition, pp 5909\u20135918","DOI":"10.1109\/CVPR.2018.00619"},{"issue":"2","key":"2331_CR17","doi-asserted-by":"publisher","first-page":"532","DOI":"10.1109\/TPAMI.2019.2937086","volume":"43","author":"M Liao","year":"2021","unstructured":"Liao M, Lyu P, He M, Yao C, Wu W, Bai X (2021) Mask textspotter: An end-to-end trainable neural network for spotting text with arbitrary shapes. IEEE Trans Pattern Anal Mach Intell 43(2):532\u2013548. https:\/\/doi.org\/10.1109\/TPAMI.2019.2937086","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2331_CR18","doi-asserted-by":"crossref","unstructured":"Lin T, Dollar\u0301 P, Girshick R, He K, Hariharan B, Belongie S (2017) Feature pyramid networks for object detection. In: 2017 IEEE conference on computer vision and pattern recognition (CVPR), pp 936\u2013944","DOI":"10.1109\/CVPR.2017.106"},{"key":"2331_CR19","doi-asserted-by":"crossref","unstructured":"Liu W, Anguelov D, Erhan D, Szegedy C, Reed S, Fu C Y, Berg A C (2016) Ssd: Single shot multibox detector. In: Computer vision \u2013 ECCV 2016. Springer International Publishing, Cham, pp 21\u201337","DOI":"10.1007\/978-3-319-46448-0_2"},{"key":"2331_CR20","doi-asserted-by":"publisher","unstructured":"Liu X, Zhou G, Zhang R, Wei X (2020) An accurate segmentation-based scene text detector with context attention and repulsive text border. In: 2020 IEEE\/CVF conference on computer vision and pattern recognition workshops (CVPRW). https:\/\/doi.org\/10.1109\/CVPRW50498.2020.00283, pp 2344\u20132352","DOI":"10.1109\/CVPRW50498.2020.00283"},{"issue":"2019","key":"2331_CR21","doi-asserted-by":"publisher","first-page":"337","DOI":"10.1016\/j.patcog.2019.02.002","volume":"90","author":"Y Liu","year":"2019","unstructured":"Liu Y, Jin L, Zhang S, Luo C, Zhang S (2019) Curved scene text detection via transverse and longitudinal sequence connection. Pattern Recognit 90(2019):337\u2013345. https:\/\/doi.org\/10.1016\/j.patcog.2019.02.002","journal-title":"Pattern Recognit"},{"key":"2331_CR22","doi-asserted-by":"crossref","unstructured":"Liu Z, Lin G, Yang S, Feng J, Lin W, Goh WL (2018) Learning Markov clustering networks for scene text detection. In: 2018 IEEE\/CVF Conference on computer vision and pattern recognition, pp 6936\u20136944","DOI":"10.1109\/CVPR.2018.00725"},{"issue":"4","key":"2331_CR23","first-page":"640","volume":"39","author":"J Long","year":"2015","unstructured":"Long J, Shelhamer E, Darrell T (2015) Fully convolutional networks for semantic segmentation. IEEE Trans Pattern Anal Mach Intell 39(4):640\u2013651","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2331_CR24","doi-asserted-by":"crossref","unstructured":"Long S, Ruan J, Zhang W, He X, Wu W, Yao C (2018) Textsnake: A flexible representation for detecting text of arbitrary shapes. In: Computer vision \u2013 ECCV 2018. Springer International Publishing, Cham, pp 19\u201335","DOI":"10.1007\/978-3-030-01216-8_2"},{"key":"2331_CR25","doi-asserted-by":"crossref","unstructured":"Lyu P, Yao C, Wu W, Yan S, Bai X (2018) Multi-oriented scene text detection via corner localization and region segmentation. In: 2018 IEEE\/CVF conference on computer vision and pattern recognition, pp 7553\u20137563","DOI":"10.1109\/CVPR.2018.00788"},{"issue":"11","key":"2331_CR26","doi-asserted-by":"publisher","first-page":"3111","DOI":"10.1109\/TMM.2018.2818020","volume":"20","author":"J Ma","year":"2018","unstructured":"Ma J, Shao W, Ye H, Wang L, Wang H, Zheng Y, Xue X (2018) Arbitrary-oriented scene text detection via rotation proposals. IEEE Trans Multimed 20(11):3111\u20133122","journal-title":"IEEE Trans Multimed"},{"key":"2331_CR27","doi-asserted-by":"crossref","unstructured":"Nayef N, Yin F, Bizid I, Choi H, Feng Y, Karatzas D, Luo Z, Pal U, Rigaud C, Chazalon J, Khlif W, Luqman M M, Burie J, Liu C, Ogier J (2017) Icdar2017 robust reading challenge on multi-lingual scene text detection and script identification - rrc-mlt. In: 2017 14th IAPR international conference on document analysis and recognition (ICDAR), vol 01, pp 1454\u20131459","DOI":"10.1109\/ICDAR.2017.237"},{"key":"2331_CR28","doi-asserted-by":"crossref","unstructured":"Neumann L, Matas J (2011) A method for text localization and recognition in real-world images. In: Computer vision \u2013 ACCV 2010. Springer, Berlin, pp 770\u2013783","DOI":"10.1007\/978-3-642-19318-7_60"},{"key":"2331_CR29","doi-asserted-by":"crossref","unstructured":"Neumann L, Matas J (2012) Real-time scene text localization and recognition. In: 2012 IEEE conference on computer vision and pattern recognition, pp 3538\u20133545","DOI":"10.1109\/CVPR.2012.6248097"},{"issue":"6","key":"2331_CR30","doi-asserted-by":"publisher","first-page":"1137","DOI":"10.1109\/TPAMI.2016.2577031","volume":"39","author":"S Ren","year":"2017","unstructured":"Ren S, He K, Girshick R, Sun J (2017) Faster r-cnn: Towards real-time object detection with region proposal networks. IEEE Trans Pattern Anal Mach Intell 39(6):1137\u20131149. https:\/\/doi.org\/10.1109\/TPAMI.2016.2577031","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"2331_CR31","doi-asserted-by":"publisher","unstructured":"Shi B, Bai X, Belongie S (2017) Detecting oriented text in natural images by linking segments. In: 2017 IEEE conference on computer vision and pattern recognition (CVPR). https:\/\/doi.org\/10.1109\/CVPR.2017.371. IEEE Computer Society, Los Alamitos, pp 3482\u20133490","DOI":"10.1109\/CVPR.2017.371"},{"key":"2331_CR32","doi-asserted-by":"crossref","unstructured":"Shrivastava A, Gupta A, Girshick R (2016) Training region-based object detectors with online hard example mining. In: 2016 IEEE conference on computer vision and pattern recognition (CVPR), pp 761\u2013769","DOI":"10.1109\/CVPR.2016.89"},{"issue":"2019","key":"2331_CR33","doi-asserted-by":"publisher","first-page":"1376","DOI":"10.1007\/s10489-018-1338-4","volume":"49","author":"R Soni","year":"2019","unstructured":"Soni R, Kumar B, Chand S (2019) Text detection and localization in natural scene images based on text awareness score. Appl Intell 49(2019):1376\u20131405. https:\/\/doi.org\/10.1007\/s10489-018-1338-4","journal-title":"Appl Intell"},{"key":"2331_CR34","doi-asserted-by":"crossref","unstructured":"Szegedy C, Vanhoucke V, Ioffe S, Shlens J, Wojna Z (2016) Rethinking the inception architecture for computer vision. In: 2016 IEEE conference on computer vision and pattern recognition (CVPR), pp 2818\u20132826","DOI":"10.1109\/CVPR.2016.308"},{"key":"2331_CR35","doi-asserted-by":"crossref","unstructured":"Tian Z, Huang W, He T, He P, Qiao Y (2016) Detecting text in natural image with connectionist text proposal network. In: Computer vision \u2013 ECCV 2016. Springer International Publishing, Cham, pp 56\u201372","DOI":"10.1007\/978-3-319-46484-8_4"},{"key":"2331_CR36","doi-asserted-by":"publisher","unstructured":"Tian Z, Shu M, Lyu P, Li R, Zhou C, Shen X, Jia J (2019) Learning shape-aware embedding for scene text detection. In: 2019 IEEE\/CVF conference on computer vision and pattern recognition (CVPR). https:\/\/doi.org\/10.1109\/CVPR.2019.00436, pp 4229\u20134238","DOI":"10.1109\/CVPR.2019.00436"},{"key":"2331_CR37","doi-asserted-by":"crossref","unstructured":"Wang W, Xie E, Li X, Hou W, Lu T, Yu G, Shao S (2019) Shape robust text detection with progressive scale expansion network. In: 2019 IEEE\/CVF conference on computer vision and pattern recognition (CVPR), pp 9328\u20139337","DOI":"10.1109\/CVPR.2019.00956"},{"key":"2331_CR38","doi-asserted-by":"publisher","unstructured":"Xie E, Zang Y, Shao S, Yu G, Yao C, Li G (2019) Scene text detection with supervised pyramid context network. In: The thirty-third AAAI conference on artificial intelligence, AAAI 2019. https:\/\/doi.org\/10.1609\/aaai.v33i01.33019038. AAAI Press, pp 9038\u20139045","DOI":"10.1609\/aaai.v33i01.33019038"},{"key":"2331_CR39","doi-asserted-by":"publisher","unstructured":"Yao C, Bai X, Liu W, Ma Y, Tu Z (2012) Detecting texts of arbitrary orientations in natural images. In: 2012 IEEE conference on computer vision and pattern recognition. https:\/\/doi.org\/10.1109\/CVPR.2012.6247787, pp 1083\u20131090","DOI":"10.1109\/CVPR.2012.6247787"},{"issue":"11","key":"2331_CR40","doi-asserted-by":"publisher","first-page":"4737","DOI":"10.1109\/TIP.2014.2353813","volume":"23","author":"C Yao","year":"2014","unstructured":"Yao C, Bai X, Liu W (2014) A unified framework for multioriented text detection and recognition. Image Processing IEEE Transactions on 23(11):4737\u20134749","journal-title":"Image Processing IEEE Transactions on"},{"key":"2331_CR41","doi-asserted-by":"publisher","unstructured":"Zhang C, Liang B, Huang Z, En M, Han J, Ding E, Ding X (2019) Look more than once: An accurate detector for text of arbitrary shapes. In: 2019 IEEE\/CVF conference on computer vision and pattern recognition (CVPR). https:\/\/doi.org\/10.1109\/CVPR.2019.01080, pp 10544\u201310553","DOI":"10.1109\/CVPR.2019.01080"},{"key":"2331_CR42","doi-asserted-by":"crossref","unstructured":"Zhang Z, Shen W, Yao C, Bai X (2015) Symmetry-based text line detection in natural scenes. In: 2015 IEEE Conference on computer vision and pattern recognition (CVPR), pp 2558\u20132567","DOI":"10.1109\/CVPR.2015.7298871"},{"key":"2331_CR43","doi-asserted-by":"crossref","unstructured":"Zhang Z, Zhang C, Shen W, Yao C, Liu W, Bai X (2016) Multi-oriented text detection with fully convolutional networks. In: 2016 IEEE conference on computer vision and pattern recognition (CVPR), pp 4159\u20134167","DOI":"10.1109\/CVPR.2016.451"},{"key":"2331_CR44","doi-asserted-by":"crossref","unstructured":"Zhong Z, Jin L, Huang S (2017) Deeptext: A new approach for text proposal generation and text detection in natural images. In: 2017 IEEE international conference on acoustics, speech and signal processing (ICASSP), pp 1208\u20131212","DOI":"10.1109\/ICASSP.2017.7952348"},{"key":"2331_CR45","doi-asserted-by":"crossref","unstructured":"Zhou X, Yao C, Wen H, Wang Y, Zhou S, He W, Liang J (2017) East: An efficient and accurate scene text detector. In: 2017 IEEE conference on computer vision and pattern recognition (CVPR), pp 2642\u20132651","DOI":"10.1109\/CVPR.2017.283"}],"container-title":["Applied Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-021-02331-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10489-021-02331-4\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-021-02331-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,12,26]],"date-time":"2022-12-26T11:10:40Z","timestamp":1672053040000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10489-021-02331-4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,5,5]]},"references-count":45,"journal-issue":{"issue":"1","published-print":{"date-parts":[[2022,1]]}},"alternative-id":["2331"],"URL":"https:\/\/doi.org\/10.1007\/s10489-021-02331-4","relation":{},"ISSN":["0924-669X","1573-7497"],"issn-type":[{"type":"print","value":"0924-669X"},{"type":"electronic","value":"1573-7497"}],"subject":[],"published":{"date-parts":[[2021,5,5]]},"assertion":[{"value":"6 March 2021","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"5 May 2021","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that they have no conflict of interest.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"<!--Emphasis Type='Bold' removed-->Conflict of Interests"}}]}}