{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,20]],"date-time":"2025-10-20T10:24:28Z","timestamp":1760955868409,"version":"3.41.0"},"reference-count":36,"publisher":"Springer Science and Business Media LLC","issue":"4","license":[{"start":{"date-parts":[[2018,8,7]],"date-time":"2018-08-07T00:00:00Z","timestamp":1533600000000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"funder":[{"name":"National Science Foundation of China Grant","award":["61672088"],"award-info":[{"award-number":["61672088"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["World Wide Web"],"published-print":{"date-parts":[[2019,7]]},"DOI":"10.1007\/s11280-018-0615-9","type":"journal-article","created":{"date-parts":[[2018,8,7]],"date-time":"2018-08-07T04:27:31Z","timestamp":1533616051000},"page":"1481-1498","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":4,"title":["Spatial alignment network for facial landmark localization"],"prefix":"10.1007","volume":"22","author":[{"given":"Huifang","family":"Li","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yidong","family":"Li","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Junliang","family":"Xing","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Hairong","family":"Dong","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2018,8,7]]},"reference":[{"key":"615_CR1","doi-asserted-by":"crossref","unstructured":"Asthana, A., Zafeiriou, S., Cheng, S., Pantic, M.: Robust discriminative response map fitting with constrained local models. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 3444\u20133451 (2013)","DOI":"10.1109\/CVPR.2013.442"},{"key":"615_CR2","unstructured":"Bartz, C., Yang, H., Meinel, C.: Stn-ocr: a single neural network for text detection and text recognition (2017)"},{"issue":"12","key":"615_CR3","doi-asserted-by":"publisher","first-page":"2930","DOI":"10.1109\/TPAMI.2013.23","volume":"35","author":"PN Belhumeur","year":"2013","unstructured":"Belhumeur, P.N., Jacobs, D.W., Kriegman, D.J., Kumar, N.: Localizing parts of faces using a consensus of exemplars. IEEE Trans. Pattern Anal. Mach. Intell. 35(12), 2930\u20132940 (2013)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"615_CR4","doi-asserted-by":"crossref","unstructured":"Cai, Q., Gallup, D., Zhang, C., Zhang, Z.: 3d deformable face tracking with a commodity depth camera. In: Computer Vision - ECCV 2010, European Conference on Computer Vision, pp 229\u2013242. Proceedings, Heraklion (2010)","DOI":"10.1007\/978-3-642-15558-1_17"},{"key":"615_CR5","doi-asserted-by":"crossref","unstructured":"Cao, X., Wei, Y., Wen, F., Sun, J.: Face alignment by explicit shape regression. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 2887\u20132894 (2012)","DOI":"10.1109\/CVPR.2012.6248015"},{"key":"615_CR6","doi-asserted-by":"crossref","unstructured":"Chen, L.C., Yang, Y., Wang, J., Xu, W., Yuille, A.L.: Attention to scale: Scale-aware semantic image segmentation. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 3640\u20133649 (2016)","DOI":"10.1109\/CVPR.2016.396"},{"key":"615_CR7","doi-asserted-by":"crossref","unstructured":"Chu, Q., Ouyang, W., Li, H., Wang, X, Liu, B., Yu, N.: Online multi-object tracking using cnn-based single object tracker with spatial-temporal attention mechanism (2017)","DOI":"10.1109\/ICCV.2017.518"},{"key":"615_CR8","doi-asserted-by":"crossref","unstructured":"Chu, X., Yang, W., Ouyang, W., Ma, C., Yuille, A.L., Wang, X.: Multi-context attention for human pose estimation (2017)","DOI":"10.1109\/CVPR.2017.601"},{"key":"615_CR9","doi-asserted-by":"crossref","unstructured":"Cootes, T.F., Edwards, G.J., Taylor, C.J.: Active appearance models. In: European Conference on Computer Vision, pp. 484\u2013498 (1998)","DOI":"10.1007\/BFb0054760"},{"issue":"6","key":"615_CR10","first-page":"1078","volume":"238","author":"P Dollar","year":"2010","unstructured":"Dollar, P., Welinder, P., Perona, P.: Cascaded pose regression. IEEE 238 (6), 1078\u20131085 (2010)","journal-title":"IEEE"},{"key":"615_CR11","doi-asserted-by":"crossref","unstructured":"He, K., Zhang, X., Ren, S., Sun, J.: Deep residual learning for image recognition. In: Computer Vision and Pattern Recognition, pp. 770\u2013778 (2016)","DOI":"10.1109\/CVPR.2016.90"},{"key":"615_CR12","doi-asserted-by":"crossref","unstructured":"Jourabloo, A., Liu, X.: Pose-invariant 3d face alignment. In: IEEE International Conference on Computer Vision, pp. 3694\u20133702 (2016)","DOI":"10.1109\/ICCV.2015.421"},{"key":"615_CR13","unstructured":"Kingma, D.P., Adam, J.B.a.: A method for stochastic optimization. Computer Science (2014)"},{"key":"615_CR14","doi-asserted-by":"crossref","unstructured":"Kowalski, M., Naruniec, J., Trzcinski, T: Deep alignment network: A convolutional neural network for robust face alignment, pp. 2034\u20132043 (2017)","DOI":"10.1109\/CVPRW.2017.254"},{"key":"615_CR15","unstructured":"Krizhevsky, A., Sutskever, I., Hinton, G.E.: Imagenet classification with deep convolutional neural networks. In: International Conference on Neural Information Processing Systems, pp 1097\u20131105 (2012)"},{"key":"615_CR16","doi-asserted-by":"crossref","unstructured":"Li, H., Li, Y., Liu, W., Dong, H.: Coarse-to-fine facial landmarks localization based on convolutional feature. In: 2017 International Conference on Behavioral, Economic, Socio-cultural Computing (BESC), pp. 1\u20136 (2017)","DOI":"10.1109\/BESC.2017.8256378"},{"key":"615_CR17","doi-asserted-by":"crossref","unstructured":"Li, Y., Chang, M.-C., Farid, H., Lyu, S.: In ictu oculi: Exposing ai generated fake face videos by detecting eye blinking. arXiv: 1806.02877 (2018)","DOI":"10.1109\/WIFS.2018.8630787"},{"key":"615_CR18","doi-asserted-by":"crossref","unstructured":"Lin, C.H., Lucey, S.: Inverse compositional spatial transformer networks, pp. 2252\u20132260 (2016)","DOI":"10.1109\/CVPR.2017.242"},{"key":"615_CR19","doi-asserted-by":"crossref","unstructured":"Liu, Y., Jourabloo, A., Liu, X.: Learning deep models for face antispoofng: binary or auxiliary supervision (2018)","DOI":"10.1109\/CVPR.2018.00048"},{"key":"615_CR20","doi-asserted-by":"crossref","unstructured":"Lv, J., Shao, X., Xing, J., Cheng, C., Zhou, X.: A deep regression architecture with two-stage re-initialization for high performance facial landmark detection. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 3691\u20133700 (2017)","DOI":"10.1109\/CVPR.2017.393"},{"key":"615_CR21","unstructured":"Mo, K.: Spatial transformer network"},{"key":"615_CR22","doi-asserted-by":"crossref","unstructured":"Ramanan, D.: Face detection, pose estimation, and landmark localization in the wild. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 2879\u20132886 (2012)","DOI":"10.1109\/CVPR.2012.6248014"},{"issue":"99","key":"615_CR23","first-page":"1","volume":"PP","author":"R Ranjan","year":"2016","unstructured":"Ranjan, R., Patel, V.M., Chellappa, R.: Hyperface: A deep multi-task learning framework for face detection, landmark localization, pose estimation, and gender recognition. IEEE Trans. Pattern Anal. Mach. Intell. PP(99), 1\u20131 (2016)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"615_CR24","doi-asserted-by":"crossref","unstructured":"Rashid, M., Gu, X., Yong, J.L.: Interspecies knowledge transfer for facial keypoint detection (2017)","DOI":"10.1109\/CVPR.2017.174"},{"key":"615_CR25","doi-asserted-by":"crossref","unstructured":"Sagonas, C., Tzimiropoulos, G., Zafeiriou, S., Pantic, M.: A semi-automatic methodology for facial landmark annotation. In: IEEE Conference on Computer Vision and Pattern Recognition Workshops, pp. 896\u2013903 (2013)","DOI":"10.1109\/CVPRW.2013.132"},{"key":"615_CR26","doi-asserted-by":"crossref","unstructured":"Sagonas, C., Tzimiropoulos, G., Zafeiriou, S., Pantic, M.: 300 faces in-the-wild challenge The first facial landmark localization challenge. In: IEEE International Conference on Computer Vision Workshops, pp. 397\u2013403 (2014)","DOI":"10.1109\/ICCVW.2013.59"},{"key":"615_CR27","doi-asserted-by":"publisher","first-page":"3","DOI":"10.1016\/j.imavis.2016.01.002","volume":"47","author":"C Sagonas","year":"2016","unstructured":"Sagonas, C., Antonakos, E., Tzimiropoulos, G., Zafeiriou, S., Pantic, M: 300 faces in-the-wild challenge: database and results. Image Vis. Comput. 47, 3\u201318 (2016)","journal-title":"Image Vis. Comput."},{"key":"615_CR28","volume-title":"Deformable Model Fitting by Regularized Landmark Mean-Shift","author":"JM Saragih","year":"2010","unstructured":"Saragih, J.M., Lucey, S., Cohn, J.F.: Deformable Model Fitting by Regularized Landmark Mean-Shift. Kluwer Academic Publishers, Netherlands (2010)"},{"key":"615_CR29","doi-asserted-by":"crossref","unstructured":"Sun, Y., Wang, X., Tang, X.: Deep convolutional network cascade for facial point detection. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 3476\u20133483 (2013)","DOI":"10.1109\/CVPR.2013.446"},{"key":"615_CR30","doi-asserted-by":"crossref","unstructured":"Trigeorgis, G., Snape, P., Nicolaou, M.A., Antonakos, E., Zafeiriou, S.: Mnemonic descent method: a recurrent process applied for end-to-end face alignment. In: Computer Vision and Pattern Recognition (2016)","DOI":"10.1109\/CVPR.2016.453"},{"key":"615_CR31","doi-asserted-by":"crossref","unstructured":"Tuzel, O., Marks, T.K., Tambe, S.: Robust face alignment using a mixture of invariant experts. In: European Conference on Computer Vision, pp. 825\u2013841 (2016)","DOI":"10.1007\/978-3-319-46454-1_50"},{"key":"615_CR32","doi-asserted-by":"crossref","unstructured":"Xie, S., Girshick, R., Dollar, P, Tu, Z., He, K.: Aggregated residual transformations for deep neural networks (2016)","DOI":"10.1109\/CVPR.2017.634"},{"key":"615_CR33","doi-asserted-by":"crossref","unstructured":"Xiong, X., Torre, F.D.L.: Supervised descent method and its applications to face alignment. In: Computer Vision and Pattern Recognition, pp. 532\u2013539 (2013)","DOI":"10.1109\/CVPR.2013.75"},{"key":"615_CR34","doi-asserted-by":"crossref","unstructured":"Zhang, J., Shan, S., Kan, M., Chen, X.: Coarse-to-fine auto-encoder networks (cfan) for real-time face alignment. In: European Conference on Computer Vision, pp. 1\u201316 (2014)","DOI":"10.1007\/978-3-319-10605-2_1"},{"key":"615_CR35","doi-asserted-by":"crossref","unstructured":"Zhang, Z., Luo, P., Chen, C.L., Tang, X.: Facial landmark detection by deep multi-task learning. In: European Conference on Computer Vision, pp. 94\u2013108 (2014)","DOI":"10.1007\/978-3-319-10599-4_7"},{"key":"615_CR36","doi-asserted-by":"crossref","unstructured":"Zhou, B., Khosla, A., Lapedriza, A., Oliva, A., Torralba, A.: Learning deep features for discriminative localization. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 2921\u20132929 (2016)","DOI":"10.1109\/CVPR.2016.319"}],"container-title":["World Wide Web"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s11280-018-0615-9.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s11280-018-0615-9\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s11280-018-0615-9.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,7,6]],"date-time":"2025-07-06T06:51:24Z","timestamp":1751784684000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s11280-018-0615-9"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,8,7]]},"references-count":36,"journal-issue":{"issue":"4","published-print":{"date-parts":[[2019,7]]}},"alternative-id":["615"],"URL":"https:\/\/doi.org\/10.1007\/s11280-018-0615-9","relation":{},"ISSN":["1386-145X","1573-1413"],"issn-type":[{"type":"print","value":"1386-145X"},{"type":"electronic","value":"1573-1413"}],"subject":[],"published":{"date-parts":[[2018,8,7]]},"assertion":[{"value":"8 March 2018","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"2 May 2018","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"18 June 2018","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"7 August 2018","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}