{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,18]],"date-time":"2026-06-18T15:45:15Z","timestamp":1781797515989,"version":"3.54.5"},"reference-count":36,"publisher":"Springer Science and Business Media LLC","issue":"6","license":[{"start":{"date-parts":[[2020,9,4]],"date-time":"2020-09-04T00:00:00Z","timestamp":1599177600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0"},{"start":{"date-parts":[[2020,9,4]],"date-time":"2020-09-04T00:00:00Z","timestamp":1599177600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0"}],"funder":[{"name":"Universit\u251c\u00e1 degli Studi di Trento"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["J Real-Time Image Proc"],"published-print":{"date-parts":[[2020,12]]},"abstract":"<jats:title>Abstract<\/jats:title><jats:p>Camera calibration is a necessary preliminary step in computer vision for the estimation of the position of objects in the 3D world. Despite the intrinsic camera parameters can be easily computed offline, extrinsic parameters need to be computed each time a camera changes its position, thus not allowing for fast and dynamic network re-configuration. In this paper we present an unsupervised and automatic framework for the estimation of the extrinsic parameters of a camera network, which leverages on optimised 3D human mesh recovery from a single image, and which does not require the use of additional markers. We show how it is possible to retrieve the real-world position of the cameras in the network together with the floor plane, exploiting regular RGB images and with a weak prior knowledge of the internal parameters. Our framework can also work with a single camera and in real-time, allowing the user to add, re-position, or remove cameras from the network in a dynamic fashion.<\/jats:p>","DOI":"10.1007\/s11554-020-01002-w","type":"journal-article","created":{"date-parts":[[2020,9,4]],"date-time":"2020-09-04T07:02:34Z","timestamp":1599202954000},"page":"1757-1768","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":12,"title":["Fast automatic camera network calibration through human mesh recovery"],"prefix":"10.1007","volume":"17","author":[{"given":"Nicola","family":"Garau","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Francesco G. B.","family":"De Natale","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Nicola","family":"Conci","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2020,9,4]]},"reference":[{"key":"1002_CR1","doi-asserted-by":"crossref","unstructured":"Andriluka, M., Roth, S., Schiele, B.: Pictorial structures revisited: People detection and articulated pose estimation. In: 2009 IEEE Conference on Computer Vision and Pattern Recognition, pp. 1014\u20131021 (2009)","DOI":"10.1109\/CVPRW.2009.5206754"},{"key":"1002_CR2","doi-asserted-by":"crossref","unstructured":"Cao, Z., Simon, T., Wei, S., Sheikh, Y.: Realtime multi-person 2d pose estimation using part affinity fields. In: 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 1302\u20131310 (2017)","DOI":"10.1109\/CVPR.2017.143"},{"key":"1002_CR3","doi-asserted-by":"crossref","unstructured":"Cao, Z., Hidalgo, G., Simon, T., Wei, S.-E., Sheikh, Y.: Openpose: realtime multi-person 2d pose estimation using part affinity fields (2018). arXiv preprint arXiv:1812.08008","DOI":"10.1109\/CVPR.2017.143"},{"key":"1002_CR4","first-page":"845","volume-title":"Advances in Neural Information Processing Systems","author":"JM Coughlan","year":"2001","unstructured":"Coughlan, J.M., Yuille, A.L.: The manhattan world assumption: Regularities in scene statistics which enable bayesian inference. In: Leen, T.K., Dietterich, T.G., Tresp, V. (eds.) Advances in Neural Information Processing Systems, vol. 13, pp. 845\u2013851. MIT Press, Cambridge (2001)"},{"key":"1002_CR5","doi-asserted-by":"crossref","unstructured":"Desai, K., Prabhakaran, B., Raghuraman, S.: Skeleton-based continuous extrinsic calibration of multiple rgb-d kinect cameras. In: Proceedings of the 9th ACM Multimedia Systems Conference, MMSys\u201918, pp. 250\u2013257, New York, NY, USA (2018) (Association for Computing Machinery)","DOI":"10.1145\/3204949.3204969"},{"issue":"2","key":"1002_CR6","doi-asserted-by":"publisher","first-page":"99","DOI":"10.1109\/MRA.2006.1638022","volume":"13","author":"H Durrant-Whyte","year":"2006","unstructured":"Durrant-Whyte, H., Bailey, T.: Simultaneous localization and mapping: part i. IEEE Robot. Autom. Mag. 13(2), 99\u2013110 (2006)","journal-title":"IEEE Robot. Autom. Mag."},{"key":"1002_CR7","doi-asserted-by":"crossref","unstructured":"Garau, N., Conci, N.: Unsupervised continuous camera network pose estimation through human mesh recovery. In: Proceedings of the 13th International Conference on Distributed Smart Cameras, ICDSC 2019, New York, NY, USA (2019) (Association for Computing Machinery)","DOI":"10.1145\/3349801.3349803"},{"key":"1002_CR8","doi-asserted-by":"crossref","unstructured":"Geiger, A., Moosmann, F., Car, \u00d6., Schuster, B.: Automaticcamera and range sensor calibration using a single shot. In: 2012IEEE International Conference on Robotics and Automation, pp. 3936\u20133943 (2012)","DOI":"10.1109\/ICRA.2012.6224570"},{"key":"1002_CR9","unstructured":"Hidalgo, G., Raaj, Y., Idrees, H., Xiang, D., Joo, H., Simon, T., Sheikh, Y.: Single-network whole-body pose estimation (2019). arXiv preprint arXiv:1909.13423"},{"key":"1002_CR10","doi-asserted-by":"crossref","unstructured":"Hold-Geoffroy, Y., Sunkavalli, K., Eisenmann, J., Fisher, M., Gambaretto, E., Hadap, S., Lalonde, J.-F.: A perceptual measure for deep single image camera calibration. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 2354\u20132363 (2018)","DOI":"10.1109\/CVPR.2018.00250"},{"key":"1002_CR11","doi-asserted-by":"crossref","unstructured":"Inomata, R., Terabayashi, K., Umeda, K., Godin, G.: Registration of 3d geometric model and color images using sift and range intensity images. In: Bebis, G., Boyle, R., Parvin, B., Koracin, D., Wang, S., Kyungnam, K., Benes, B., Moreland, K., Borst, C., DiVerdi, S., Yi-Jen, Ming J. (Eds.), Advances in Visual Computing, Berlin, Heidelberg. Springer Berlin Heidelberg, pp. 325\u2013336 (2011)","DOI":"10.1007\/978-3-642-24028-7_30"},{"key":"1002_CR12","doi-asserted-by":"crossref","unstructured":"Joo, H., Liu, H., Tan, L., Gui, L., Nabbe, B., Matthews, I., Kanade, T., Nobuhara, S., Sheikh, Y.: Panoptic studio: A massively multiview system for social motion capture. In: 2015 IEEE International Conference on Computer Vision (ICCV), pp. 3334\u20133342 (2015)","DOI":"10.1109\/ICCV.2015.381"},{"key":"1002_CR13","doi-asserted-by":"crossref","unstructured":"Kanazawa, A., Black, M.J., Jacobs, D.W., Malik, J.: End-to-end recovery of human shape and pose. In: 2018 IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 7122\u20137131 (2018)","DOI":"10.1109\/CVPR.2018.00744"},{"key":"1002_CR14","doi-asserted-by":"crossref","unstructured":"Kanazawa, A., Zhang, J.Y., Felsen, P., Malik, J.: Learning 3d human dynamics from video. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 5614\u20135623 (2019)","DOI":"10.1109\/CVPR.2019.00576"},{"issue":"5","key":"1002_CR15","doi-asserted-by":"publisher","first-page":"349","DOI":"10.1049\/ip-vis:20010574","volume":"148","author":"H Kim","year":"2001","unstructured":"Kim, H., Hong, K.S.: Practical self-calibration of pan-tilt cameras. IEE Proc. Vis. Image Signal Process. 148(5), 349\u2013355 (2001)","journal-title":"IEE Proc. Vis. Image Signal Process."},{"key":"1002_CR16","doi-asserted-by":"crossref","unstructured":"Kolotouros, N., Pavlakos, G., Black, M.J., Daniilidis, K.: Learning to reconstruct 3d human pose and shape via model-fitting in the loop (2019). arXiv preprint arXiv:1909.12828","DOI":"10.1109\/ICCV.2019.00234"},{"key":"1002_CR17","doi-asserted-by":"publisher","first-page":"154","DOI":"10.1007\/978-3-319-10584-0_11","volume-title":"Computer Vision\u2013ECCV 2014","author":"MM Loper","year":"2014","unstructured":"Loper, M.M., Black, M.J.: Opendr: an approximate differentiable renderer. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) Computer Vision\u2013ECCV 2014, pp. 154\u2013169. Springer, Cham (2014)"},{"issue":"6","key":"1002_CR18","first-page":"248","volume":"34","author":"M Loper","year":"2015","unstructured":"Loper, M., Mahmood, N., Romero, J., Pons-Moll, G., Black, M.J.: Smpl: a skinned multi-person linear model. ACM Trans. Gr. (TOG) 34(6), 248 (2015)","journal-title":"ACM Trans. Gr. (TOG)"},{"key":"1002_CR19","unstructured":"Lucas, B.D., Kanade, T.: An iterative image registration technique with an application to stereo vision. pp. 674\u2013679 (1981)"},{"issue":"9","key":"1002_CR20","doi-asserted-by":"publisher","first-page":"2210","DOI":"10.1109\/TCSVT.2017.2731792","volume":"28","author":"S Miyata","year":"2018","unstructured":"Miyata, S., Saito, H., Takahashi, K., Mikami, D., Isogawa, M., Kojima, A.: Extrinsic camera calibration without visible corresponding points using omnidirectional cameras. IEEE Trans. Circuits Syst. Video Technol. 28(9), 2210\u20132219 (2018)","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"1002_CR21","unstructured":"Nist\u00e9r, D., Naroditsky, O., Bergen, J.: Visual odometry. In: Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2004. CVPR 2004, vol. 1. IEEE, pp. I\u2013I (2004)"},{"key":"1002_CR22","doi-asserted-by":"crossref","unstructured":"Peng, X.B., Kanazawa, A., Malik, J., Abbeel, P., Levine, S.: Sfv: Reinforcement learning of physical skills from videos. In: SIGGRAPH Asia 2018 Technical Papers. ACM, p. 178 (2018)","DOI":"10.1145\/3272127.3275014"},{"key":"1002_CR23","doi-asserted-by":"publisher","first-page":"130","DOI":"10.1016\/j.patcog.2015.11.019","volume":"53","author":"LL Presti","year":"2016","unstructured":"Presti, L.L., Cascia, M.L.: 3d skeleton-based human action classification: a survey. Pattern Recogn. 53, 130\u2013147 (2016)","journal-title":"Pattern Recogn."},{"key":"1002_CR24","doi-asserted-by":"publisher","first-page":"33","DOI":"10.1007\/978-3-319-10605-2_3","volume-title":"Computer Vision\u2014ECCV 2014","author":"V Ramakrishna","year":"2014","unstructured":"Ramakrishna, V., Munoz, D., Hebert, M., Andrew Bagnell, J., Sheikh, Y.: Pose machines: articulated pose estimation via inference machines. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) Computer Vision\u2014ECCV 2014, pp. 33\u201347. Springer, Cham (2014)"},{"issue":"3","key":"1002_CR25","doi-asserted-by":"publisher","first-page":"166","DOI":"10.1049\/ip-vis:20010078","volume":"148","author":"Y Seo","year":"2001","unstructured":"Seo, Y., Hong, K.S.: Theory and practice on the self-calibration of a rotating and zooming camera from two views. IEE Proceedings - Vision, Image and Signal Processing 148(3), 166\u2013172 (2001)","journal-title":"IEE Proceedings - Vision, Image and Signal Processing"},{"key":"1002_CR26","doi-asserted-by":"crossref","unstructured":"Shotton, J., Fitzgibbon, A., Cook, M., Sharp, T., Finocchio, M., Moore, R., Kipman, A., Blake, A.: Real-time human pose recognition in parts from single depth images. In: CVPR 2011. Proceedings of the IEEE Computer Vision and Pattern Recognition (CVPR) 2011, pp. 1297\u20131304 (2011)","DOI":"10.1109\/CVPR.2011.5995316"},{"issue":"1","key":"1002_CR27","doi-asserted-by":"publisher","first-page":"116","DOI":"10.1145\/2398356.2398381","volume":"56","author":"J Shotton","year":"2013","unstructured":"Shotton, J., Sharp, T., Kipman, A., Fitzgibbon, A., Finocchio, M., Blake, A., Cook, M., Moore, R.: Real-time human pose recognition in parts from single depth images. Commun. ACM 56(1), 116\u2013124 (2013)","journal-title":"Commun. ACM"},{"key":"1002_CR28","unstructured":"Simek, K.: Pinhole camera diagram, dissecting the camera matrix. http:\/\/ksimek.github.io\/pinhole_camera_diagram\/, 2013. Accessed 26 Apr 2019"},{"key":"1002_CR29","doi-asserted-by":"crossref","unstructured":"Tang, Z., Hwang, J., Lin, Y., Chuang, J.: Multiple-kernel adaptive segmentation and tracking (mast) for robust object tracking. In: 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 1115\u20131119 (2016)","DOI":"10.1109\/ICASSP.2016.7471849"},{"key":"1002_CR30","doi-asserted-by":"publisher","first-page":"10754","DOI":"10.1109\/ACCESS.2019.2891224","volume":"7","author":"Z Tang","year":"2019","unstructured":"Tang, Z., Lin, Y., Lee, K., Hwang, J., Chuang, J.: Esther: Joint camera self-calibration and automatic radial distortion correction from tracking of walking humans. IEEE Access 7, 10754\u201310766 (2019)","journal-title":"IEEE Access"},{"key":"1002_CR31","doi-asserted-by":"crossref","unstructured":"Tome, D., Russell, C., Agapito, L.: Lifting from the deep: Convolutional 3d pose estimation from a single image. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 2500\u20132509 (2017)","DOI":"10.1109\/CVPR.2017.603"},{"issue":"4","key":"1002_CR32","doi-asserted-by":"publisher","first-page":"791","DOI":"10.1109\/TPAMI.2017.2699648","volume":"40","author":"F Vasconcelos","year":"2018","unstructured":"Vasconcelos, F., Barreto, J.P., Boyer, E.: Automatic camera calibration using multiple sets of pairwise correspondences. IEEE Trans. Pattern Anal. Mach. Intell. 40(4), 791\u2013803 (2018)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"1002_CR33","doi-asserted-by":"crossref","unstructured":"Wei, S., Ramakrishna, V., Kanade, T., Sheikh, Y.: Convolutional pose machines. In: 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 4724\u20134732 (2016)","DOI":"10.1109\/CVPR.2016.511"},{"issue":"11","key":"1002_CR34","doi-asserted-by":"publisher","first-page":"1330","DOI":"10.1109\/34.888718","volume":"22","author":"Z Zhang","year":"2000","unstructured":"Zhang, Z.: A flexible new technique for camera calibration. IEEE Trans. Pattern Anal. Mach. Intell. 22(11), 1330\u20131334 (2000)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"issue":"6","key":"1002_CR35","doi-asserted-by":"publisher","first-page":"065013","DOI":"10.1088\/1361-6501\/aab4d6","volume":"29","author":"G Zhang","year":"2018","unstructured":"Zhang, G., Zhao, H., Hong, Y., Ma, Y., Li, J., Guo, H.: On-orbit space camera self-calibration based on the orthogonal vanishing points obtained from solar panels. Meas. Sci. Technol. 29(6), 065013 (2018)","journal-title":"Meas. Sci. Technol."},{"key":"1002_CR36","doi-asserted-by":"publisher","first-page":"46","DOI":"10.1016\/j.imavis.2017.12.006","volume":"70","author":"F Zhao","year":"2018","unstructured":"Zhao, F., Tamaki, T., Kurita, T., Raytchev, B., Kaneda, K.: Marker-based non-overlapping camera calibration methods with additional support camera views. Image Vis. Comput. 70, 46\u201354 (2018)","journal-title":"Image Vis. Comput."}],"container-title":["Journal of Real-Time Image Processing"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11554-020-01002-w.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11554-020-01002-w\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11554-020-01002-w.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,11,16]],"date-time":"2022-11-16T14:39:16Z","timestamp":1668609556000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11554-020-01002-w"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,9,4]]},"references-count":36,"journal-issue":{"issue":"6","published-print":{"date-parts":[[2020,12]]}},"alternative-id":["1002"],"URL":"https:\/\/doi.org\/10.1007\/s11554-020-01002-w","relation":{},"ISSN":["1861-8200","1861-8219"],"issn-type":[{"value":"1861-8200","type":"print"},{"value":"1861-8219","type":"electronic"}],"subject":[],"published":{"date-parts":[[2020,9,4]]},"assertion":[{"value":"2 December 2019","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"11 July 2020","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"4 September 2020","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}