{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,21]],"date-time":"2025-10-21T15:23:16Z","timestamp":1761060196934,"version":"3.40.3"},"publisher-location":"Cham","reference-count":61,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783319464534"},{"type":"electronic","value":"9783319464541"}],"license":[{"start":{"date-parts":[[2016,1,1]],"date-time":"2016-01-01T00:00:00Z","timestamp":1451606400000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2016,1,1]],"date-time":"2016-01-01T00:00:00Z","timestamp":1451606400000},"content-version":"vor","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2016]]},"DOI":"10.1007\/978-3-319-46454-1_4","type":"book-chapter","created":{"date-parts":[[2016,9,15]],"date-time":"2016-09-15T09:15:09Z","timestamp":1473930909000},"page":"52-70","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":58,"title":["Deep Deformation Network for Object Landmark Localization"],"prefix":"10.1007","author":[{"given":"Xiang","family":"Yu","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Feng","family":"Zhou","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Manmohan","family":"Chandraker","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2016,9,16]]},"reference":[{"issue":"1","key":"4_CR1","first-page":"38","volume":"61","author":"T Cootes","year":"1995","unstructured":"Cootes, T., Taylor, C., Cooper, D., Graham, J.: Active shape models-their training and application. CVIU 61(1), 38\u201359 (1995)","journal-title":"CVIU"},{"key":"4_CR2","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"crossref","first-page":"484","DOI":"10.1007\/BFb0054760","volume-title":"Computer Vision - ECCV\u201998","author":"TF Cootes","year":"1998","unstructured":"Cootes, T.F., Edwards, G.J., Taylor, C.J.: Active appearance models. In: Burkhardt, H., Neumann, B. (eds.) ECCV 1998. LNCS, vol. 1407, p. 484. Springer, Heidelberg (1998)"},{"issue":"10","key":"4_CR3","first-page":"3054","volume":"41","author":"D Cristinacce","year":"2007","unstructured":"Cristinacce, D., Cootes, T.: Automatic feature localization with constrained local models. PR 41(10), 3054\u20133067 (2007)","journal-title":"PR"},{"issue":"9","key":"4_CR4","doi-asserted-by":"publisher","first-page":"1627","DOI":"10.1109\/TPAMI.2009.167","volume":"32","author":"P Felzenszwalb","year":"2010","unstructured":"Felzenszwalb, P., Girshick, R., McAllester, D., Ramanan, D.: Object detection with discriminatively trained part-based models. PAMI 32(9), 1627\u20131645 (2010)","journal-title":"PAMI"},{"key":"4_CR5","doi-asserted-by":"crossref","unstructured":"Yang, Y., Ramanan, D.: Articulated pose estimation with flexible mixtures-of-parts. In: CVPR (2011)","DOI":"10.1109\/CVPR.2011.5995741"},{"key":"4_CR6","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"168","DOI":"10.1007\/978-3-642-15567-3_13","volume-title":"Computer Vision \u2013 ECCV 2010","author":"L Bourdev","year":"2010","unstructured":"Bourdev, L., Maji, S., Brox, T., Malik, J.: Detecting people using mutually consistent poselet activations. In: Daniilidis, K., Maragos, P., Paragios, N. (eds.) ECCV 2010, Part VI. LNCS, vol. 6316, pp. 168\u2013181. Springer, Heidelberg (2010)"},{"key":"4_CR7","unstructured":"Simonyan, K., Zisserman, A.: Very deep convolutional networks for large-scale image recognition. In: arXiv preprint (2014)"},{"key":"4_CR8","doi-asserted-by":"crossref","unstructured":"Sun, Y., Wang, X., Tang, X.: Deep convolutional network cascade for facial point detection. In: CVPR (2013)","DOI":"10.1109\/CVPR.2013.446"},{"key":"4_CR9","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"crossref","first-page":"94","DOI":"10.1007\/978-3-319-10599-4_7","volume-title":"Computer Vision \u2013 ECCV 2014","author":"Z Zhang","year":"2014","unstructured":"Zhang, Z., Luo, P., Loy, C.C., Tang, X.: Facial landmark detection by deep multi-task learning. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014, Part VI. LNCS, vol. 8694, pp. 94\u2013108. Springer, Heidelberg (2014)"},{"key":"4_CR10","series-title":"Lecture Notes in Computer Science","first-page":"1","volume-title":"Computer Vision \u2013 ECCV 2014","author":"J Zhang","year":"2014","unstructured":"Zhang, J., Shan, S., Kan, M., Chen, X.: Coarse-to-fine auto-encoder networks (CFAN) for real-time face alignment. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014, Part II. LNCS, vol. 8690, pp. 1\u201316. Springer, Heidelberg (2014)"},{"key":"4_CR11","doi-asserted-by":"crossref","unstructured":"Toshev, A., Szegedy, C.: Deeppose: human pose estimation via deep neural networks. In: CVPR (2014)","DOI":"10.1109\/CVPR.2014.214"},{"issue":"2","key":"4_CR12","doi-asserted-by":"publisher","first-page":"200","DOI":"10.1007\/s11263-010-0380-4","volume":"91","author":"J Saragih","year":"2011","unstructured":"Saragih, J., Lucey, S., Cohn, J.: Deformable model fitting by regularized landmark mean-shift. IJCV 91(2), 200\u2013215 (2011)","journal-title":"IJCV"},{"key":"4_CR13","unstructured":"Yu, X., Yang, F., Huang, J., Metaxas, D.: Explicit occlusion detection based deformable fitting for facial landmark localization. In: FG (2013)"},{"key":"4_CR14","doi-asserted-by":"crossref","unstructured":"Pedersoli, M., Timofte, R., Tuytelaars, T., Gool, L.V.: Using a deformation field model for localizing faces and facial points under weak supervisional regression forests. In: CVPR (2014)","DOI":"10.1109\/CVPR.2014.472"},{"key":"4_CR15","doi-asserted-by":"crossref","unstructured":"Yu, X., Huang, J., Zhang, S., Metaxas, D.: Face landmark fitting via optimized part mixtures and cascaded deformable model. PAMI (2015)","DOI":"10.1109\/TPAMI.2015.2509999"},{"issue":"2","key":"4_CR16","doi-asserted-by":"publisher","first-page":"135","DOI":"10.1023\/B:VISI.0000029666.37597.d3","volume":"60","author":"I Matthews","year":"2004","unstructured":"Matthews, I., Baker, S.: Active appearance models revisited. IJCV 60(2), 135\u2013164 (2004)","journal-title":"IJCV"},{"key":"4_CR17","doi-asserted-by":"crossref","unstructured":"Tzimiropoulos, G., Pantic, M.: Optimization problems for fast AAM fitting in-the-wild. In: ICCV (2013)","DOI":"10.1109\/ICCV.2013.79"},{"key":"4_CR18","doi-asserted-by":"crossref","unstructured":"Cheng, X., Sridharan, S., Saragih, J., Lucey, S.: Rank minimization across appearance and shape for AAM ensemble fitting. In: ICCV (2013)","DOI":"10.1109\/ICCV.2013.77"},{"key":"4_CR19","doi-asserted-by":"crossref","unstructured":"Belhumeur, P., Jacobs, D., Kriegman, D., Kumar, N.: Localizing parts of faces using a consensus of exemplars. In: CVPR (2011)","DOI":"10.1109\/CVPR.2011.5995602"},{"key":"4_CR20","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"crossref","first-page":"105","DOI":"10.1007\/978-3-319-10593-2_8","volume-title":"Computer Vision \u2013 ECCV 2014","author":"X Yu","year":"2014","unstructured":"Yu, X., Lin, Z., Brandt, J., Metaxas, D.N.: Consensus of regression for occlusion-robust facial feature localization. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014, Part IV. LNCS, vol. 8692, pp. 105\u2013118. Springer, Heidelberg (2014)"},{"key":"4_CR21","doi-asserted-by":"crossref","unstructured":"Zhou, F., Brandt, J., Lin, Z.: Exemplar-based graph matching for robust facial landmark localization. In: ICCV (2013)","DOI":"10.1109\/ICCV.2013.131"},{"issue":"2","key":"4_CR22","doi-asserted-by":"publisher","first-page":"177","DOI":"10.1007\/s11263-013-0667-3","volume":"107","author":"X Cao","year":"2013","unstructured":"Cao, X., Wei, Y., Wen, F., Sun, J.: Face alignment by explicit shape regression. Int. J. Comput. Vis. 107(2), 177\u2013190 (2013)","journal-title":"Int. J. Comput. Vis."},{"key":"4_CR23","doi-asserted-by":"crossref","unstructured":"Dantone, M., Gall, J., Fanelli, G., Gool, L.V.: Realtime facial feature detection using conditional regression forests. In: CVPR (2012)","DOI":"10.1109\/CVPR.2012.6247976"},{"key":"4_CR24","doi-asserted-by":"crossref","unstructured":"Xiong, X., la Torre, F.D.: Supervised descent method and its applications to face alignment. In: CVPR (2013)","DOI":"10.1109\/CVPR.2013.75"},{"key":"4_CR25","doi-asserted-by":"crossref","unstructured":"Ren, S., Cao, X., Wei, Y., Sun, J.: Face alignment at 3000 FPS via regressing local binary features. In: CVPR (2014)","DOI":"10.1109\/CVPR.2014.218"},{"key":"4_CR26","doi-asserted-by":"crossref","unstructured":"Kazemi, V., Sullivan, J.: One millisecond face alignment with an ensemble of regression trees. In: CVPR (2014)","DOI":"10.1109\/CVPR.2014.241"},{"key":"4_CR27","doi-asserted-by":"crossref","unstructured":"Lee, D., Park, H., Too, C.: Face alignment using cascade gaussian process regression trees. In: CVPR (2015)","DOI":"10.1109\/CVPR.2015.7299048"},{"key":"4_CR28","unstructured":"Zhu, S., Li, C., Loy, C., Tang, X.: Face alignment by coarse-to-fine shape searching. In: CVPR (2015)"},{"key":"4_CR29","doi-asserted-by":"crossref","unstructured":"Yang, H., Mou, W., Zhang, Y., Patras, I., Gunes, H., Robinson, P.: Face alignment assisted by head pose estimation. In: BMVC (2015)","DOI":"10.5244\/C.29.130"},{"issue":"1","key":"4_CR30","doi-asserted-by":"publisher","first-page":"55","DOI":"10.1023\/B:VISI.0000042934.15159.49","volume":"61","author":"P Felzenszwalb","year":"2005","unstructured":"Felzenszwalb, P., Huttenlocher, D.: Pictorial structures for object recognition. IJCV 61(1), 55\u201379 (2005)","journal-title":"IJCV"},{"key":"4_CR31","doi-asserted-by":"crossref","unstructured":"Wang, F., Li, Y.: Beyond physical connections: tree models in human pose estimation. In: CVPR (2013)","DOI":"10.1109\/CVPR.2013.83"},{"key":"4_CR32","doi-asserted-by":"crossref","unstructured":"Pishchulin, L., Andriluka, M., Gehler, P., Schiele, B.: Strong appearance and expressive spatial models for human pose estimation. In: ICCV (2013)","DOI":"10.1109\/ICCV.2013.433"},{"key":"4_CR33","unstructured":"Chen, X., Yuille, A.: Articulated pose estimation by a graphical model with image dependent pairwise relations. In: NIPS (2014)"},{"key":"4_CR34","unstructured":"Tompson, J., Jain, A., LeCun, Y., Bregler, C.: Joint training of a convolutional network and a graphical model for human pose estimation. In: NIPS (2014)"},{"key":"4_CR35","unstructured":"Fan, X., Zheng, K., Lin, Y., Wang, S.: Combining local appearance and holistic view: dual-source deep neural networks for human pose estimation. In: CVPR (2015)"},{"key":"4_CR36","doi-asserted-by":"crossref","unstructured":"Wah, C., Branson, S., Perona, P., Belongie, S.: Multiclass recognition and part localization with humans in the loop. In: ICCV (2011)","DOI":"10.1109\/ICCV.2011.6126539"},{"key":"4_CR37","doi-asserted-by":"crossref","unstructured":"Chai, Y., Lempitsky, V., Zisserman, A.: Symbiotic segmentation and part localization for fine-grained categorization. In: ICCV (2013)","DOI":"10.1109\/ICCV.2013.47"},{"key":"4_CR38","doi-asserted-by":"crossref","unstructured":"Liu, J., Belhumeur, P.: Bird part localization using exemplar-based models with enforced pose and subcategory consistency. In: ICCV (2013)","DOI":"10.1109\/ICCV.2013.313"},{"key":"4_CR39","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"crossref","first-page":"834","DOI":"10.1007\/978-3-319-10590-1_54","volume-title":"Computer Vision \u2013 ECCV 2014","author":"N Zhang","year":"2014","unstructured":"Zhang, N., Donahue, J., Girshick, R., Darrell, T.: Part-based R-CNNs for fine-grained category detection. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014, Part I. LNCS, vol. 8689, pp. 834\u2013849. Springer, Heidelberg (2014)"},{"key":"4_CR40","doi-asserted-by":"crossref","unstructured":"Lin, D., Shen, X., Lu, C., Jia, J.: Deep LAC: deep localization, alignment and classification for fine-grained recognition. In: CVPR (2015)","DOI":"10.1109\/CVPR.2015.7298775"},{"key":"4_CR41","unstructured":"Zhu, X., Ramanan, D.: Face detection, pose estimation and landmark localization in the wild. In: CVPR (2012)"},{"key":"4_CR42","doi-asserted-by":"crossref","unstructured":"Dollar, P., Welder, P., Perona, P.: Cascaded pose regression. In: CVPR (2010)","DOI":"10.1109\/CVPR.2010.5540094"},{"key":"4_CR43","doi-asserted-by":"crossref","unstructured":"Burgos-Artizzu, X., Perona, P., Dollar, P.: Robust face landmark estimation under occlusion. In: ICCV (2013)","DOI":"10.1109\/ICCV.2013.191"},{"key":"4_CR44","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"crossref","first-page":"568","DOI":"10.1007\/978-3-319-10605-2_37","volume-title":"Computer Vision \u2013 ECCV 2014","author":"J Yan","year":"2014","unstructured":"Yan, J., Lei, Z., Yang, Y., Li, S.Z.: Stacked deformable part model with shape regression for object part localization. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014, Part II. LNCS, vol. 8690, pp. 568\u2013583. Springer, Heidelberg (2014)"},{"key":"4_CR45","doi-asserted-by":"crossref","unstructured":"Agrawal, P., Carreira, J., Malik, J.: Learning to see by moving. In: ICCV (2015)","DOI":"10.1109\/ICCV.2015.13"},{"key":"4_CR46","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"249","DOI":"10.1007\/978-3-319-19665-7_21","volume-title":"Image Analysis","author":"AS Razavian","year":"2015","unstructured":"Razavian, A.S., Azizpour, H., Maki, A., Sullivan, J., Ek, C.H., Carlsson, S.: Persistent evidence of local image properties in generic convnets. In: Paulsen, R.R., Pedersen, K.S. (eds.) SCIA 2015. LNCS, vol. 9127, pp. 249\u2013262. Springer, Heidelberg (2015)"},{"key":"4_CR47","unstructured":"Jaderberg, M., Simony, K., Zisserman, A., Kavukcuoglu, K.: Spatial transformer networks. In: NIPS (2015)"},{"key":"4_CR48","doi-asserted-by":"crossref","unstructured":"Kanazawa, A., Jacobs, D., Chandraker, M.: Warpnet: weakly supervised matching for single-view reconstruction. In: CVPR (2016)","DOI":"10.1109\/CVPR.2016.354"},{"key":"4_CR49","doi-asserted-by":"crossref","unstructured":"Long, J., Shelhamer, E., Darrell, T.: Fully convolutional networks for semantic segmentation. In: CVPR (2015)","DOI":"10.1109\/CVPR.2015.7298965"},{"key":"4_CR50","doi-asserted-by":"crossref","unstructured":"Ren, S., He, K., Girshick, R., Sun, J.: Faster R-CNN: Towards real-time object detection with region proposal networks. In: arXiv preprint (2016)","DOI":"10.1109\/TPAMI.2016.2577031"},{"key":"4_CR51","doi-asserted-by":"crossref","unstructured":"Bengio, Y., Louradour, J., Collobert, R., Weston, J.: Curriculum learning. In: ICML (2009)","DOI":"10.1145\/1553374.1553380"},{"key":"4_CR52","doi-asserted-by":"crossref","unstructured":"Baltrusaitis, T., Robinson, P., Morency, L.: Constrained local neural fields for robust facial landmark detection in the wild. In: ICCVW (2013)","DOI":"10.1109\/ICCVW.2013.54"},{"issue":"6","key":"4_CR53","doi-asserted-by":"publisher","first-page":"567","DOI":"10.1109\/34.24792","volume":"11","author":"FL Bookstein","year":"1989","unstructured":"Bookstein, F.L.: Principal warps: thin-plate splines and the decomposition of deformations. PAMI 11(6), 567\u2013585 (1989)","journal-title":"PAMI"},{"key":"4_CR54","doi-asserted-by":"crossref","unstructured":"Jia, Y., Shelhamer, E., Donahue, J., Karayev, S., Long, J., Girshick, R., Guadarrama, S., Darrell, T.: Caffe: Convolutional architecture for fast feature embedding. arXiv preprint (2014)","DOI":"10.1145\/2647868.2654889"},{"key":"4_CR55","doi-asserted-by":"crossref","unstructured":"Sagonas, C., Tzimiropoulos, G., Zafeiriou, S., Pantic, M.: 300 faces in-the-wild challenge: the first facial landmark localization challenge. In: ICCVW (2013)","DOI":"10.1109\/ICCVW.2013.59"},{"key":"4_CR56","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"crossref","first-page":"679","DOI":"10.1007\/978-3-642-33712-3_49","volume-title":"Computer Vision \u2013 ECCV 2012","author":"V Le","year":"2012","unstructured":"Le, V., Brandt, J., Lin, Z., Bourdev, L., Huang, T.S.: Interactive facial feature localization. In: Fitzgibbon, A., Lazebnik, S., Perona, P., Sato, Y., Schmid, C. (eds.) ECCV 2012, Part III. LNCS, vol. 7574, pp. 679\u2013692. Springer, Heidelberg (2012)"},{"key":"4_CR57","unstructured":"Messer, K., Matas, J., Kittler, J., Letting, J., Maitre, G.: XM2VTSDB: the extended M2VTS database. In: Second International Conference on Audio and Video-based Biometric Person Authentication (AVBPA) (1999)"},{"key":"4_CR58","doi-asserted-by":"crossref","unstructured":"Johnson, S., Everingham, M.: Clustered pose and nonlinear appearance models for human pose estimation. In: British Machine Vision Conference (2010)","DOI":"10.5244\/C.24.12"},{"key":"4_CR59","doi-asserted-by":"crossref","unstructured":"Johnson, S., Everingham, M.: Learning effective human pose estimation from inaccurate annotation. In: CVPR (2011)","DOI":"10.1109\/CVPR.2011.5995318"},{"key":"4_CR60","unstructured":"Zhang, N., Shelhamer, E., Gao, Y., Darrell, T.: Fine-grained pose prediction, normalization and recognition. In: arXiv preprint (2016)"},{"key":"4_CR61","unstructured":"Welder, P., Branson, S., Mita, T., Wah, C., Schrod, F., Belong, S., Perona, P.: Caltech-ucsd birds 200. In: CTechnical report CNS-TR-2010-001 (2010)"}],"container-title":["Lecture Notes in Computer Science","Computer Vision \u2013 ECCV 2016"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-319-46454-1_4","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,7,8]],"date-time":"2022-07-08T14:53:37Z","timestamp":1657292017000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-319-46454-1_4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2016]]},"ISBN":["9783319464534","9783319464541"],"references-count":61,"URL":"https:\/\/doi.org\/10.1007\/978-3-319-46454-1_4","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2016]]},"assertion":[{"value":"16 September 2016","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"ECCV","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"European Conference on Computer Vision","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Amsterdam","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"The Netherlands","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2016","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"8 October 2016","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"16 October 2016","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"14","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"eccv2016","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"http:\/\/www.eccv2016.org\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"This content has been made available to all.","name":"free","label":"Free to read"}]}}