{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,12]],"date-time":"2026-05-12T05:11:33Z","timestamp":1778562693111,"version":"3.51.4"},"reference-count":95,"publisher":"Springer Science and Business Media LLC","issue":"6","license":[{"start":{"date-parts":[[2026,5,12]],"date-time":"2026-05-12T00:00:00Z","timestamp":1778544000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0"},{"start":{"date-parts":[[2026,5,12]],"date-time":"2026-05-12T00:00:00Z","timestamp":1778544000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0"}],"funder":[{"DOI":"10.13039\/100010665","name":"H2020 Marie Sk\u0142odowska-Curie Actions","doi-asserted-by":"publisher","award":["956585"],"award-info":[{"award-number":["956585"]}],"id":[{"id":"10.13039\/100010665","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/100012774","name":"Innovationsfonden","doi-asserted-by":"publisher","award":["0223-00041B"],"award-info":[{"award-number":["0223-00041B"]}],"id":[{"id":"10.13039\/100012774","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100005192","name":"Technical University of Denmark","doi-asserted-by":"crossref","id":[{"id":"10.13039\/501100005192","id-type":"DOI","asserted-by":"crossref"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Int J Comput Vis"],"published-print":{"date-parts":[[2026,6]]},"abstract":"<jats:title>Abstract<\/jats:title>\n                  <jats:p>\n                    Achieving physically consistent image editing remains a significant challenge in computer vision. Existing image editing methods typically rely on neural networks, which struggle to accurately handle shadows and refractions. Conversely, physics-based inverse rendering often requires multi-view optimization, limiting its practicality in single-image scenarios. In this paper, we propose\n                    <jats:bold>Materialist<\/jats:bold>\n                    , a neural-initialized physically based rendering pipeline for single-image inverse rendering. Unlike previous hybrid methods that use physics to guide neural generation, our method leverages neural networks to predict initial material properties, which are then rigorously optimized via progressive differentiable rendering. Our approach enables a range of applications, including material editing, object insertion, and relighting, while also introducing an effective method for editing material transparency via ray-traced refraction without requiring full scene geometry. Furthermore, our envmap estimation method also achieves competitive performance, further enhancing the accuracy of image editing task. Experiments demonstrate strong performance across synthetic and real-world datasets, excelling even on challenging out-of-domain images.\n                  <\/jats:p>","DOI":"10.1007\/s11263-026-02833-z","type":"journal-article","created":{"date-parts":[[2026,5,12]],"date-time":"2026-05-12T04:24:21Z","timestamp":1778559861000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["Materialist: Physically Based Editing Using Single-Image Inverse Rendering"],"prefix":"10.1007","volume":"134","author":[{"ORCID":"https:\/\/orcid.org\/0000-0001-8433-1672","authenticated-orcid":false,"given":"Lezhong","family":"Wang","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0000-6002-730X","authenticated-orcid":false,"given":"Duc Minh","family":"Tran","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-1993-5036","authenticated-orcid":false,"given":"Ruiqi","family":"Cui","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-8995-2865","authenticated-orcid":false,"given":"Thomson","family":"TG","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-0068-8170","authenticated-orcid":false,"given":"Anders Bjorholm","family":"Dahl","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-2569-6473","authenticated-orcid":false,"given":"Siavash Arjomand","family":"Bigdeli","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-0603-3669","authenticated-orcid":false,"given":"Jeppe Revall","family":"Frisvad","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-4683-2454","authenticated-orcid":false,"given":"Manmohan","family":"Chandraker","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2026,5,12]]},"reference":[{"key":"2833_CR1","doi-asserted-by":"crossref","unstructured":"Azinovic, D., Li, T. M., Kaplanyan A, & Nie\u00dfner M (2019). Inverse path tracing for joint material and lighting estimation. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 2447\u20132456.","DOI":"10.1109\/CVPR.2019.00255"},{"key":"2833_CR2","doi-asserted-by":"crossref","unstructured":"Bao, J., Chen, G., & Cui, S. (2025). PIR: Photometric inverse rendering with shading cues modeling and surface reflectance regularization. In: Proceedings of International Conference on 3D Vision (3DV). IEEE.","DOI":"10.1109\/3DV66043.2025.00055"},{"issue":"3","key":"2833_CR3","doi-asserted-by":"publisher","first-page":"24","DOI":"10.1145\/1531326.1531330","volume":"28","author":"C Barnes","year":"2009","unstructured":"Barnes, C., Shechtman, E., Finkelstein, A., & Goldman, D. B. (2009). PatchMatch: A randomized correspondence algorithm for structural image editing. ACM Transactions on Graphics, 28(3), 24.","journal-title":"ACM Transactions on Graphics"},{"issue":"4","key":"2833_CR4","doi-asserted-by":"publisher","first-page":"159","DOI":"10.1145\/2601097.2601206","volume":"33","author":"S Bell","year":"2014","unstructured":"Bell, S., Bala, K., & Snavely, N. (2014). Intrinsic images in the wild. ACM Transactions on Graphics, 33(4), 159.","journal-title":"ACM Transactions on Graphics"},{"key":"2833_CR5","unstructured":"Bhat, S. F., Birkl, R., Wofk, D., Wonka, P., & M\u00fcller, M. (2023). ZoeDepth: Zero-shot transfer by combining relative and metric depth. arXiv:2302.12288."},{"key":"2833_CR6","unstructured":"Birkl, R., Wofk, D., & M\u00fcller, M. (2023). MiDaS v3.1 \u2013 a model zoo for robust monocular relative depth estimation. arXiv:2307.14460."},{"key":"2833_CR7","doi-asserted-by":"crossref","unstructured":"Brooks, T., Holynski, A., & Efros, A. A. (2023). InstructPix2Pix: Learning to follow image editing instructions. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 18392\u201318402.","DOI":"10.1109\/CVPR52729.2023.01764"},{"key":"2833_CR8","unstructured":"Burley, B. (2012). Physically-based shading at Disney. In: Practical Physically Based Shading in Film and Game Production. ACM SIGGRAPH 2012 Courses."},{"key":"2833_CR9","unstructured":"Burley, B. (2015). Extending the Disney BRDF to a BSDF with integrated subsurface scattering. In: Physically Based Shading in Theory and Practice. ACM SIGGRAPH 2015 Courses."},{"key":"2833_CR10","doi-asserted-by":"crossref","unstructured":"Careaga, C., & Aksoy, Y. (2025). Physically controllable relighting of photographs. In: SIGGRAPH 2025 Conference Papers. ACM, pp 105:1\u2013105:10.","DOI":"10.1145\/3721238.3730666"},{"key":"2833_CR11","unstructured":"Chen, W., Gao, J., Ling, H., Smith, E., Lehtinen, J., Jacobson, A., & Fidler, S. (2019). Learning to predict 3D objects with an interpolation-based differentiable renderer. In: Advances in Neural Information Processing Systems 32 (NeurIPS 2019)."},{"key":"2833_CR12","unstructured":"Chen, W., Litalien, J., Gao, J., Wang, Z., Fuji\u00a0Tsang, C., Khamis, S., Litany, O., & Fidler, S. (2021). DIB-R++: learning to predict lighting and material with a hybrid differentiable renderer. In: Advances in Neural Information Processing Systems 34 (NeurIPS 2021), pp 22834\u201322848."},{"key":"2833_CR13","doi-asserted-by":"crossref","unstructured":"Choi, J., Lee, S., Park, H., Jung, S. W., Kim, I. J., & Cho, J. (2023). MAIR: multi-view attention inverse rendering with 3d spatially-varying lighting estimation. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 8392\u20138401.","DOI":"10.1109\/CVPR52729.2023.00811"},{"key":"2833_CR14","doi-asserted-by":"crossref","unstructured":"Dastjerdi, M. R. K., Eisenmann, J., Hold-Geoffroy, Y., & Lalonde, J. F. (2023). EverLight: Indoor-outdoor editable HDR lighting estimation. In: Proceedings of International Conference on Computer Vision (ICCV). IEEE, pp 7420\u20137429.","DOI":"10.1109\/ICCV51070.2023.00682"},{"key":"2833_CR15","doi-asserted-by":"crossref","unstructured":"Deng, X., Luan, F., Walter, B., Bala, K.,& Marschner, S. (2022). Reconstructing translucent objects using differentiable rendering. In: SIGGRAPH 2022 Conference Proceedings. ACM, pp 38:1\u201338:10.","DOI":"10.1145\/3528233.3530714"},{"key":"2833_CR16","unstructured":"Eigen, D., Puhrsch, C., & Fergus, R. (2014). Depth map prediction from a single image using a multi-scale deep network. In: Advances in Neural Information Processing Systems 27 (NeurIPS 2014)."},{"key":"2833_CR17","doi-asserted-by":"crossref","unstructured":"Enyo, Y., & Nishino, K. (2024). Diffusion reflectance map: Single-image stochastic inverse rendering of illumination and reflectance. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 11873\u201311883.","DOI":"10.1109\/CVPR52733.2024.01128"},{"key":"2833_CR18","doi-asserted-by":"crossref","unstructured":"Gu\u00e9don, A., & Lepetit, V. (2024). SuGaR: Surface-aligned gaussian splatting for efficient 3D mesh reconstruction and high-quality mesh rendering. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 5354\u20135363.","DOI":"10.1109\/CVPR52733.2024.00512"},{"key":"2833_CR19","doi-asserted-by":"crossref","unstructured":"Hasselgren, J., Hofmann, N., & Munkberg, J. (2022). Shape, light, and material decomposition from images using Monte Carlo rendering and denoising. Advances in Neural Information Processing Systems 35 (NeurIPS 2022) pp 22856\u201322869","DOI":"10.52202\/068431-1661"},{"key":"2833_CR20","unstructured":"He, K., Liang, R., Munkberg, J., Hasselgren, J., Vijaykumar, N., Keller, A., Fidler, S., Gilitschenski, I., Gojcic, Z., & Wang, Z. (2025). UniRelight: Learning joint decomposition and synthesis for video relighting. arXiv:2506.15673"},{"key":"2833_CR21","unstructured":"Hertz, A., Mokady, R., Tenenbaum, J., Aberman, K., Pritch, Y.,& Cohen-Or, D. (2023). Prompt-to-prompt image editing with cross-attention control. In: Proceedings of International Conference on Learning Representations (ICLR)."},{"key":"2833_CR22","doi-asserted-by":"crossref","unstructured":"Hu, R., Ravi, N., Berg, A. C., & Pathak, D. (2021). Worldsheet: Wrapping the world in a 3D sheet for view synthesis from a single image. In: Proceedings of International Conference on Computer Vision (ICCV). IEEE, pp 12528\u201312537.","DOI":"10.1109\/ICCV48922.2021.01230"},{"key":"2833_CR23","unstructured":"Jakob, W., Speierer, S., Roussel, N., Nimier-David, M., Vicini, D., Zeltner, T., Nicolet, B., Crespo, M., Leroy, V.,& Zhang, Z. (2022). Mitsuba 3 renderer. https:\/\/mitsuba-renderer.org"},{"key":"2833_CR24","unstructured":"Jasper AI Team. (2024). Flux.1-dev: Upscaler ControlNet. https:\/\/huggingface.co\/jasperai\/Flux.1-dev-Controlnet-Upscaler, accessed 13 November 2024."},{"key":"2833_CR25","unstructured":"Kato, H., Beker, D., Morariu, M., Ando, T., Matsuoka, T., Kehl, W., & Gaidon, A. (2020). Differentiable rendering: A survey. arXiv:2006.12057"},{"issue":"2","key":"2833_CR26","doi-asserted-by":"publisher","first-page":"158","DOI":"10.1145\/965103.807438","volume":"13","author":"DS Kay","year":"1979","unstructured":"Kay, D. S., & Greenberg, D. (1979). Transparency for computer synthesized images. Computer Graphics (SIGGRAPH \u201979), 13(2), 158\u2013164.","journal-title":"Computer Graphics (SIGGRAPH \u201979)"},{"key":"2833_CR27","doi-asserted-by":"crossref","unstructured":"Ke, B., Qu, K., Wang, T., Metzger, N., Huang, S., Li, B., Obukhov, A., & Schindler, K. (2025). Marigold: Affordable adaptation of diffusion-based image generators for image analysis. arXiv:2505.09358","DOI":"10.1109\/TPAMI.2025.3591076"},{"issue":"4","key":"2833_CR28","doi-asserted-by":"publisher","first-page":"139","DOI":"10.1145\/3592433","volume":"42","author":"B Kerbl","year":"2023","unstructured":"Kerbl, B., Kopanas, G., Leimk\u00fchler, T., & Drettakis, G. (2023). 3D Gaussian splatting for real-time radiance field rendering. ACM Transactions on Graphics, 42(4), 139.","journal-title":"ACM Transactions on Graphics"},{"issue":"3","key":"2833_CR29","doi-asserted-by":"publisher","first-page":"654","DOI":"10.1145\/1141911.1141937","volume":"25","author":"EA Khan","year":"2006","unstructured":"Khan, E. A., Reinhard, E., Fleming, R. W., & B\u00fclthoff, H. H. (2006). Image-based material editing. ACM Transactions on Graphics, 25(3), 654\u2013663.","journal-title":"ACM Transactions on Graphics"},{"key":"2833_CR30","doi-asserted-by":"crossref","unstructured":"Kocsis, P., Sitzmann, V., & Nie\u00dfner, M. (2024). Intrinsic image diffusion for indoor single-view material estimation. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 5198\u20135208.","DOI":"10.1109\/CVPR52733.2024.00497"},{"key":"2833_CR31","doi-asserted-by":"crossref","unstructured":"Li, Z., Sunkavalli, K., & Chandraker, M. (2018a). Materials for masses: SVBRDF acquisition with a single mobile phone image. In: Proceedings of the European Conference on Computer Vision (ECCV). Springer, pp 72\u201387.","DOI":"10.1007\/978-3-030-01219-9_5"},{"issue":"6","key":"2833_CR32","doi-asserted-by":"publisher","first-page":"269","DOI":"10.1145\/3272127.3275055","volume":"37","author":"Z Li","year":"2018","unstructured":"Li, Z., Xu, Z., Ramamoorthi, R., Sunkavalli, K., & Chandraker, M. (2018). Learning to reconstruct shape and spatially-varying reflectance from a single image. ACM Transactions on Graphics, 37(6), 269.","journal-title":"ACM Transactions on Graphics"},{"key":"2833_CR33","doi-asserted-by":"crossref","unstructured":"Li, Z., Shafiei, M., Ramamoorthi, R., Sunkavalli, K., & Chandraker, M. (2020). Inverse rendering for complex indoor scenes: Shape, spatially-varying lighting and SVBRDF from a single image. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 2475\u20132484.","DOI":"10.1109\/CVPR42600.2020.00255"},{"key":"2833_CR34","doi-asserted-by":"crossref","unstructured":"Li, Z., Yu, T. W., Sang, S., Wang, S., Song, M., Liu, Y., Yeh, Y. Y., Zhu, R., Gundavarapu, N., Shi, J., Bi, S., Yu, H. X., Xu, Z., Sunkavalli, K., Hasan, M., Ramamoorthi, R., & Chandraker, M. (2021). OpenRooms: An open framework for photorealistic indoor scene datasets. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 7190\u20137199.","DOI":"10.1109\/CVPR46437.2021.00711"},{"key":"2833_CR35","doi-asserted-by":"crossref","unstructured":"Li, Z., Shi, J., Bi, S., Zhu, R., Sunkavalli, K., Ha\u0161an, M., Xu, Z., Ramamoorthi, R.,& Chandraker, M. (2022). Physically-based editing of indoor scene lighting from a single image. In: European Conference on Computer Vision (ECCV). Springer, pp 555\u2013572.","DOI":"10.1007\/978-3-031-20068-7_32"},{"key":"2833_CR36","doi-asserted-by":"crossref","unstructured":"Li, Z., Wang, L., Cheng, M., Pan, C., & Yang, J. (2023). Multi-view inverse rendering for large-scale real-world indoor scenes. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 12499\u201312509.","DOI":"10.1109\/CVPR52729.2023.01203"},{"key":"2833_CR37","doi-asserted-by":"crossref","unstructured":"Liang, R., Gojcic, Z., Nimier-David, M., Acuna, D., Vijaykumar, N., Fidler, S., & Wang, Z. (2024). Photorealistic object insertion with diffusion-guided inverse rendering. In: European Conference on Computer Vision (ECCV). Springer, pp 446\u2013465.","DOI":"10.1007\/978-3-031-73030-6_25"},{"key":"2833_CR38","doi-asserted-by":"crossref","unstructured":"Liang, R., Gojcic, Z., Ling, H., Munkberg, J., Hasselgren, J., Lin, Z. H., Gao, J., Keller, A., Vijaykumar, N., & Fidler, S., et\u00a0al (2025). DiffusionRenderer: Neural inverse and forward rendering with video diffusion models. In: Proceedings of the Computer Vision and Pattern Recognition Conference (CVPR), pp 26069\u201326080.","DOI":"10.1109\/CVPR52734.2025.02428"},{"key":"2833_CR39","unstructured":"Liu, Y., Lin, C., Zeng, Z., Long, X., Liu, L., Komura, T., & Wang, W. (2024). SyncDreamer: Generating multiview-consistent images from a single-view image. In: Proceedings of International Conference on Learning Representations (ICLR)."},{"key":"2833_CR40","doi-asserted-by":"crossref","unstructured":"Long, X., Guo, Y. C., Lin, C., Liu, Y., Dou, Z., Liu, L., Ma, Y., Zhang, S. H., Habermann, M., Theobalt, C., et\u00a0al. (2024). Wonder3D: Single image to 3D using cross-domain diffusion. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 9970\u20139980.","DOI":"10.1109\/CVPR52733.2024.00951"},{"issue":"4","key":"2833_CR41","doi-asserted-by":"publisher","first-page":"101","DOI":"10.1111\/cgf.14344","volume":"40","author":"F Luan","year":"2021","unstructured":"Luan, F., Zhao, S., Bala, K., & Dong, Z. (2021). Unified shape and SVBRDF recovery using differentiable Monte Carlo rendering. Computer Graphics Forum, 40(4), 101\u2013113.","journal-title":"Computer Graphics Forum"},{"key":"2833_CR42","doi-asserted-by":"crossref","unstructured":"Luo, J., Ceylan, D., Yoon, J. S., Zhao, N., Philip, J., Fr\u00fchst\u00fcck, A., Li, W., Richardt, C., & Wang, T. (2024). IntrinsicDiffusion: joint intrinsic layers from latent diffusion models. In: ACM SIGGRAPH 2024 Conference Papers. ACM, pp 74:1\u201374:11.","DOI":"10.1145\/3641519.3657472"},{"issue":"6","key":"2833_CR43","doi-asserted-by":"publisher","first-page":"233","DOI":"10.1145\/3618357","volume":"42","author":"L Lyu","year":"2023","unstructured":"Lyu, L., Tewari, A., Habermann, M., Saito, S., Zollh\u00f6fer, M., Leimk\u00fchler, T., & Theobalt, C. (2023). Diffusion posterior illumination for ambiguity-aware inverse rendering. ACM Transactions on Graphics, 42(6), 233.","journal-title":"ACM Transactions on Graphics"},{"issue":"4","key":"2833_CR44","doi-asserted-by":"publisher","first-page":"106","DOI":"10.1145\/3731173","volume":"44","author":"L Lyu","year":"2025","unstructured":"Lyu, L., Deschaintre, V., Hold-Geoffroy, Y., Ha\u0161an, M., Yoon, J. S., Leimk\u00fcehler, T., Theobalt, C., & Georgiev, I. (2025). IntrinsicEdit: Precise generative image manipulation in intrinsic space. ACM Transactions on Graphics, 44(4), 106.","journal-title":"ACM Transactions on Graphics"},{"key":"2833_CR45","unstructured":"Meng, C., He, Y., Song, Y., Song, J., Wu, J., Zhu, J. Y., & Ermon, S. (2021). SDEdit: Guided image synthesis and editing with stochastic differential equations. In: Proceedings of International Conference on Learning Representations (ICLR)."},{"issue":"1","key":"2833_CR46","doi-asserted-by":"publisher","first-page":"99","DOI":"10.1145\/3503250","volume":"65","author":"B Mildenhall","year":"2021","unstructured":"Mildenhall, B., Srinivasan, P. P., Tancik, M., Barron, J. T., Ramamoorthi, R., & Ng, R. (2021). NeRF: Representing scenes as neural radiance fields for view synthesis. Communications of the ACM, 65(1), 99\u2013106.","journal-title":"Communications of the ACM"},{"key":"2833_CR47","doi-asserted-by":"crossref","unstructured":"Mokady, R., Hertz, A., Aberman, K., Pritch, Y., & Cohen-Or, D. (2023) Null-text inversion for editing real images using guided diffusion models. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 6038\u20136047.","DOI":"10.1109\/CVPR52729.2023.00585"},{"key":"2833_CR48","unstructured":"Oquab, M., Darcet, T., Moutakanni, T., Vo, H. V., Szafraniec, M., Khalidov, V., Fernandez, P., Haziza, D., Massa, F., El-Nouby, A., Howes, R., Huang, P. Y., Xu, H., Sharma, V., Li, S. W., Galuba, W., Rabbat, M., Assran, M., Ballas, N., Synnaeve, G., Misra, I., Jegou, H., Mairal, J., Labatut, P., Joulin, A., & Bojanowski, P. (2024). DINOv2: Learning robust visual features without supervision. Transactions on Machine Learning Research"},{"key":"2833_CR49","doi-asserted-by":"crossref","unstructured":"Pan, X., Tewari, A., Leimk\u00fchler, T., Liu, L., Meka, A., & Theobalt, C. (2023). Drag your GAN: Interactive point-based manipulation on the generative image manifold. In: ACM SIGGRAPH 2023 Conference Proceedings. ACM, pp 78:1\u201378:11.","DOI":"10.1145\/3588432.3591500"},{"issue":"4","key":"2833_CR50","doi-asserted-by":"publisher","first-page":"43","DOI":"10.1145\/3450626.3459872","volume":"40","author":"R Pandey","year":"2021","unstructured":"Pandey, R., Orts-Escolano, S., Legendre, C., Haene, C., Bouaziz, S., Rhemann, C., Debevec, P. E., & Fanello, S. R. (2021). Total relighting: Learning to relight portraits for background replacement. ACM Transactions on Graphics, 40(4), 43.","journal-title":"ACM Transactions on Graphics"},{"key":"2833_CR51","doi-asserted-by":"crossref","unstructured":"Park, J. J., Holynski, A., & Seitz, S. M. (2020). Seeing the world in a bag of chips. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 1417\u20131427.","DOI":"10.1109\/CVPR42600.2020.00149"},{"issue":"4","key":"2833_CR52","doi-asserted-by":"publisher","first-page":"66","DOI":"10.1145\/1778765.1778803","volume":"29","author":"SG Parker","year":"2010","unstructured":"Parker, S. G., Bigler, J., Dietrich, A., Friedrich, H., Hoberock, J., Luebke, D., McAllister, D., McGuire, M., Morley, K., Robison, A., & Stich, M. (2010). OptiX: A general purpose ray tracing engine. ACM Transactions on Graphics, 29(4), 66.","journal-title":"ACM Transactions on Graphics"},{"key":"2833_CR53","doi-asserted-by":"crossref","unstructured":"Phongthawee, P., Chinchuthakun, W., Sinsunthithet, N., Jampani, V., Raj, A., Khungurn, P., & Suwajanakorn, S. (2024). DiffusionLight: Light probes for free by painting a chrome ball. In: Proceedings of Computer Vision and Pattern Recognition (CVPR), pp 98\u2013108.","DOI":"10.1109\/CVPR52733.2024.00018"},{"key":"2833_CR54","doi-asserted-by":"crossref","unstructured":"Popat, K., & Picard, R. W. (1993). Novel cluster-based probability model for texture synthesis, classification, and compression. In: Visual Communications and Image Processing \u201993, vol 2094. SPIE, pp 756\u2013768.","DOI":"10.1117\/12.157992"},{"key":"2833_CR55","doi-asserted-by":"crossref","unstructured":"Ranftl, R., Bochkovskiy, A., & Koltun, V. (2021). Vision transformers for dense prediction. In: Proceedings of International Conference on Computer Vision (ICCV). IEEE, pp 12179\u201312188.","DOI":"10.1109\/ICCV48922.2021.01196"},{"key":"2833_CR56","unstructured":"Ravi, N., Gabeur, V., Hu, Y. T., Hu, R., Ryali, C., Ma, T., Khedr, H., R\u00e4dle, R., Rolland, C., Gustafson, L., Mintun, E., Pan J, Alwala KV, Carion N, Wu CY, Girshick R, Doll\u00e1r P, & Feichtenhofer, C. (2025). SAM 2: Segment anything in images and videos. In: Proceedings of International Conference on Learning Representations (ICLR)."},{"key":"2833_CR57","doi-asserted-by":"crossref","unstructured":"Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022a). High-resolution image synthesis with latent diffusion models. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 10684\u201310695.","DOI":"10.1109\/CVPR52688.2022.01042"},{"key":"2833_CR58","doi-asserted-by":"crossref","unstructured":"Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022b). High-resolution image synthesis with latent diffusion models. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), pp 10684\u201310695.","DOI":"10.1109\/CVPR52688.2022.01042"},{"key":"2833_CR59","doi-asserted-by":"crossref","unstructured":"Sang, S., & Chandraker, M. (2020). Single-shot neural relighting and SVBRDF estimation. In: European Conference on Computer Vision (ECCV), Springer, pp 85\u2013101.","DOI":"10.1007\/978-3-030-58529-7_6"},{"key":"2833_CR60","doi-asserted-by":"crossref","unstructured":"Sarkar, A., Mai, H., Mahapatra, A., Lazebnik, S., Forsyth, D. A., & Bhattad, A. (2024). Shadows don\u2019t lie and lines can\u2019t bend! Generative models don\u2019t know projective geometry... for now. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 28140\u201328149.","DOI":"10.1109\/CVPR52733.2024.02658"},{"issue":"3","key":"2833_CR61","doi-asserted-by":"publisher","first-page":"233","DOI":"10.1111\/1467-8659.1330233","volume":"13","author":"C Schlick","year":"1994","unstructured":"Schlick, C. (1994). An inexpensive BRDF model for physically-based rendering. Computer Graphics Forum, 13(3), 233\u2013246.","journal-title":"Computer Graphics Forum"},{"key":"2833_CR62","doi-asserted-by":"crossref","unstructured":"Sengupta, S., Gu, J., Kim, K., Liu, G., Jacobs, D. W., & Kautz, J. (2019) Neural inverse rendering of an indoor scene from a single image. In: Proceedings of International Conference on Computer Vision (ICCV). IEEE, pp 8598\u20138607.","DOI":"10.1109\/ICCV.2019.00869"},{"key":"2833_CR63","doi-asserted-by":"crossref","unstructured":"Shade, J., Gortler, S., He, L. W., & Szeliski, R. (1998). Layered depth images. In: Proceedings of SIGGRAPH \u201998, pp 231\u2013242.","DOI":"10.1145\/280814.280882"},{"key":"2833_CR64","doi-asserted-by":"crossref","unstructured":"Sharma, P., Jampani, V., Li, Y., Jia, X., Lagun, D., Durand, F., Freeman, B., & Matthews, M. (2024). Alchemist: Parametric control of material properties with diffusion models. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 24130\u201324141.","DOI":"10.1109\/CVPR52733.2024.02278"},{"key":"2833_CR65","unstructured":"Shi, R., Chen, H., Zhang, Z., Liu, M., Xu, C., Wei, X., Chen, L., Zeng, C., & Su, H. (2023) Zero123++: a single image to consistent multi-view diffusion base model. arXiv:2310.15110."},{"key":"2833_CR66","doi-asserted-by":"crossref","unstructured":"Shi, Y., Xue, C., Liew, J. H., Pan, J., Yan, H., Zhang, W., Tan, V. Y., & Bai, S. (2024). DragDiffusion: Harnessing diffusion models for interactive point-based image editing. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 8839\u20138849.","DOI":"10.1109\/CVPR52733.2024.00844"},{"key":"2833_CR67","doi-asserted-by":"crossref","unstructured":"Shih, M. L., Su, S. Y., Kopf, J., & Huang, J. B. (2020). 3d photography using context-aware layered depth inpainting. In: Proceedings of Computer Vision and Pattern Recognition Conference (CVPR), pp 8028\u20138038.","DOI":"10.1109\/CVPR42600.2020.00805"},{"issue":"27","key":"2833_CR68","doi-asserted-by":"publisher","first-page":"7679","DOI":"10.1364\/AO.56.007679","volume":"56","author":"JD Stets","year":"2017","unstructured":"Stets, J. D., Dal Corso, A., Nielsen, J. B., Lyngby, R. A., Jensen, S. H. N., Wilm, J., Doest, M. B., Gundlach, C., Eiriksson, E. R., Conradsen, K., Dahl, A. B., B\u00e6rentzen, J. A., Frisvad, J. R., & Aan\u00e6s, H. (2017). Scene reassembly after multimodal digitization and pipeline evaluation using photorealistic rendering. Applied Optics, 56(27), 7679\u20137690.","journal-title":"Applied Optics"},{"key":"2833_CR69","doi-asserted-by":"crossref","unstructured":"Sun, C., Cai, G., Li, Z., Yan, K., Zhang, C., Marshall, C., Huang, J. B., Zhao, S., & Dong, Z. (2023). Neural-PBIR reconstruction of shape, material, and illumination. In: Proceedings of International Conference on Computer Vision (ICCV). IEEE, pp 18046\u201318056.","DOI":"10.1109\/ICCV51070.2023.01654"},{"key":"2833_CR70","doi-asserted-by":"crossref","unstructured":"Swedish, T., Henley, C., & Raskar, R. (2021). Objects as cameras: Estimating high-frequency illumination from shadows. In: Proceedings of International Conference on Computer Vision (ICCV). IEEE, pp 2593\u20132602.","DOI":"10.1109\/ICCV48922.2021.00259"},{"key":"2833_CR71","doi-asserted-by":"crossref","unstructured":"Tang, J., Zhu, Y., Wang, H., Chan, J. H., Li, S., & Shi, B. (2022). Estimating spatially-varying lighting in urban scenes with disentangled representation. In: European Conference on Computer Vision (ECCV). Springer, pp 454\u2013469.","DOI":"10.1007\/978-3-031-20068-7_26"},{"key":"2833_CR72","doi-asserted-by":"crossref","unstructured":"Verbin, D., Mildenhall, B., Hedman, P., Barron, J. T., Zickler, T., & Srinivasan, P. P. (2024). Eclipse: Disambiguating illumination and materials using unintended shadows. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 77\u201386.","DOI":"10.1109\/CVPR52733.2024.00016"},{"key":"2833_CR73","unstructured":"Walter, B., Marschner, S. R., Li, H., & Torrance, K. E. (2007). Microfacet models for refraction through rough surfaces. In: Proceedings of Eurographics Sympoisum on Rendering (EGSR). Eurographics Association, pp 195\u2013206."},{"key":"2833_CR74","doi-asserted-by":"crossref","unstructured":"Wang, G., Yang, Y., Loy, C. C., & Liu, Z. (2022). Stylelight: Hdr panorama generation for lighting estimation and editing. In: European Conference on Computer Vision (ECCV). Springer, pp 477\u2013492.","DOI":"10.1007\/978-3-031-19784-0_28"},{"key":"2833_CR75","doi-asserted-by":"crossref","unstructured":"Wang, L., Frisvad, J. R., Jensen, M. B., & Bigdeli, S. A. (2024). StereoDiffusion: Training-free stereo image generation using latent diffusion models. In: Proceedings of Computer Vision and Pattern Recognition Workshop (CVPRW). IEEE, pp 7416\u20137425.","DOI":"10.1109\/CVPRW63382.2024.00737"},{"key":"2833_CR76","unstructured":"Wang, P., Liu, L., Liu, Y., Theobalt, C., Komura, T., & Wang, W. (2021a) NeuS: Learning neural implicit surfaces by volume rendering for multi-view reconstruction. In: Advances in Neural Information Processing Systems 34 (NeurIPS 2021), pp 27171\u201327183."},{"key":"2833_CR77","doi-asserted-by":"crossref","unstructured":"Wang, R., Xu, S., Dai, C., Xiang, J., Deng, Y., Tong, X., & Yang, J. (2025). MoGe: Unlocking accurate monocular geometry estimation for open-domain images with optimal training supervision. In: Proceedings of the Computer Vision and Pattern Recognition Conference (CVPR), pp 5261\u20135271.","DOI":"10.1109\/CVPR52734.2025.00496"},{"key":"2833_CR78","doi-asserted-by":"crossref","unstructured":"Wang, X., Xie, L., Dong, C., & Shan Y. (2021b). Real-esrgan: Training real-world blind super-resolution with pure synthetic data. In: Proceedings of International Conference on Computer Vision (ICCV). IEEE, pp 1905\u20131914.","DOI":"10.1109\/ICCVW54120.2021.00217"},{"key":"2833_CR79","unstructured":"Wu, C., Li, J., Zhou, J., Lin, J., Gao, K., Yan, K., ming, Yin, S., Bai, S., Xu, X., Chen, Y., Chen, Y., Tang, Z., Zhang, Z., Wang, Z., Yang, A., Yu, B., Cheng, C., Liu, D., Li, D., Zhang, H., Meng, H., Wei, H., Ni, J., Chen, K., Cao, K., Peng, L., Qu, L., Wu, M., Wang, P., Yu, S., Wen, T., Feng, W., Xu, X., Wang, Y., Zhang, Y., Zhu, Y., Wu, Y., Cai, Y., & Liu, Z. (2025). Qwen-image technical report. arXiv:2508.02324"},{"key":"2833_CR80","doi-asserted-by":"crossref","unstructured":"Wu, K., Liu, F., Cai, Z., Yan, R., Wang, H., Hu, Y., Duan, Y., & Ma, K. (2024). Unique3D: High-quality and efficient 3D mesh generation from a single image. In: Advances in Neural Information Processing Systems 37 (NeurIPS 2024), pp 125116\u2013125141.","DOI":"10.52202\/079017-3974"},{"key":"2833_CR81","doi-asserted-by":"crossref","unstructured":"Wu, L., Zhu, R., Yaldiz, M. B., Zhu, Y., Cai, H., Matai, J., Porikli, F., Li, T. M., Chandraker, M., & Ramamoorthi, R. (2023) Factorized inverse path tracing for efficient and accurate material-lighting estimation. In: Proceedings of International Conference on Computer Vision (ICCV). IEEE, pp 3848\u20133858.","DOI":"10.1109\/ICCV51070.2023.00356"},{"key":"2833_CR82","doi-asserted-by":"crossref","unstructured":"Yan. K., Luan, F., Ha\u0161an, M., Groueix, T., Deschaintre, V., & Zhao, S. (2023). PSDR-room: Single photo to scene using differentiable rendering. In: SIGGRAPH Asia 2023 Conference Papers, pp 28:1\u201328:11.","DOI":"10.1145\/3610548.3618165"},{"key":"2833_CR83","doi-asserted-by":"crossref","unstructured":"Yang, L., Kang, B., Huang, Z., Xu, X., Feng, J., & Zhao, H. (2024). Depth anything: Unleashing the power of large-scale unlabeled data. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 10371\u201310381.","DOI":"10.1109\/CVPR52733.2024.00987"},{"key":"2833_CR84","doi-asserted-by":"crossref","unstructured":"Yao, Y., Zhang, J., Liu, J., Qu, Y., Fang, T., McKinnon, D., Tsin, Y., & Quan, L. (2022). NeILF: Neural incident light field for physically-based material estimation. In: European Conference on Computer Vision (ECCV), Springer, pp 700\u2013716.","DOI":"10.1007\/978-3-031-19821-2_40"},{"issue":"6","key":"2833_CR85","doi-asserted-by":"publisher","first-page":"231","DOI":"10.1145\/3550454.3555442","volume":"41","author":"YY Yeh","year":"2022","unstructured":"Yeh, Y. Y., Nagano, K., Khamis, S., Kautz, J., Liu, M. Y., & Wang, T. C. (2022). Learning to relight portrait images via a virtual light stage and synthetic-to-real adaptation. ACM Transactions on Graphics, 41(6), 231.","journal-title":"ACM Transactions on Graphics"},{"issue":"8","key":"2833_CR86","doi-asserted-by":"publisher","first-page":"10129","DOI":"10.1109\/TPAMI.2023.3244658","volume":"45","author":"B Yu","year":"2023","unstructured":"Yu, B., Yang, S., Cui, X., Dong, S., Chen, B., & Shi, B. (2023). MILO: Multi-bounce inverse rendering for indoor scene with light-emitting objects. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(8), 10129\u201310142.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"key":"2833_CR87","doi-asserted-by":"crossref","unstructured":"Yu, H. X., Agarwala, S., Herrmann, C., Szeliski, R., Snavely, N., Wu, J., & Sun, D. (2023b). Accidental light probes. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 12521\u201312530.","DOI":"10.1109\/CVPR52729.2023.01205"},{"key":"2833_CR88","doi-asserted-by":"crossref","unstructured":"Yu, Z., Peng, S., Niemeyer, M., Sattler, T., & Geiger, A. (2022). MonoSDF: Exploring monocular geometric cues for neural implicit surface reconstruction. In: Advances in Neural Information Processing Systems 35 (NeurIPS 2022), pp 25018\u201325032.","DOI":"10.52202\/068431-1814"},{"key":"2833_CR89","doi-asserted-by":"crossref","unstructured":"Yu, Z., Chen, A., Huang, B., Sattler, T., & Geiger, A. (2024). Mip-splatting: Alias-free 3D Gaussian splatting. In: Proceedings of Computer Vision and Pattern Recognition (CVPR), pp 19447\u201319456.","DOI":"10.1109\/CVPR52733.2024.01839"},{"key":"2833_CR90","doi-asserted-by":"crossref","unstructured":"Zeng, Z., Deschaintre, V., Georgiev, I., Hold-Geoffroy, Y., Hu, Y., Luan, F., Yan, L. Q., & Ha\u0161an, M. (2024). RGB$$\\leftrightarrow $$X: Image decomposition and synthesis using material- and lighting-aware diffusion models. In: ACM SIGGRAPH 2024 Conference Papers. ACM, pp 75:1\u201375:11.","DOI":"10.1145\/3641519.3657445"},{"issue":"4","key":"2833_CR91","doi-asserted-by":"publisher","first-page":"76","DOI":"10.1145\/3450626.3459782","volume":"40","author":"C Zhang","year":"2021","unstructured":"Zhang, C., Yu, Z., & Zhao, S. (2021). Path-space differentiable rendering of participating media. ACM Transactions on Graphics, 40(4), 76.","journal-title":"ACM Transactions on Graphics"},{"key":"2833_CR92","doi-asserted-by":"crossref","unstructured":"Zhang, K., Luan, F., Li, Z., & Snavely, N. (2022). IRON: Inverse rendering by optimizing neural SDFs and materials from photometric images. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 5565\u20135574.","DOI":"10.1109\/CVPR52688.2022.00548"},{"key":"2833_CR93","unstructured":"Zhou, Q. Y., Park, J., & Koltun, V. (2018). Open3D: A modern library for 3D data processing. arXiv:1801.09847"},{"key":"2833_CR94","doi-asserted-by":"crossref","unstructured":"Zhu, J., Luan, F., Huo, Y., Lin, Z., Zhong, Z., Xi, D., Wang, R., Bao, H., Zheng, J., & Tang, R. (2022a). Learning-based inverse rendering of complex indoor scenes with differentiable Monte Carlo raytracing. In: SIGGRAPH Asia 2022 Conference Papers. ACM, pp 6:1\u20136:8.","DOI":"10.1145\/3550469.3555407"},{"key":"2833_CR95","doi-asserted-by":"crossref","unstructured":"Zhu, R., Li, Z., Matai, J., Porikli, F., & Chandraker, M. (2022b). IRISformer: Dense vision transformers for single-image inverse rendering in indoor scenes. In: Proceedings of Computer Vision and Pattern Recognition (CVPR). IEEE, pp 2822\u20132831.","DOI":"10.1109\/CVPR52688.2022.00284"}],"container-title":["International Journal of Computer Vision"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11263-026-02833-z.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11263-026-02833-z","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11263-026-02833-z.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,5,12]],"date-time":"2026-05-12T04:25:10Z","timestamp":1778559910000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11263-026-02833-z"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,5,12]]},"references-count":95,"journal-issue":{"issue":"6","published-print":{"date-parts":[[2026,6]]}},"alternative-id":["2833"],"URL":"https:\/\/doi.org\/10.1007\/s11263-026-02833-z","relation":{},"ISSN":["0920-5691","1573-1405"],"issn-type":[{"value":"0920-5691","type":"print"},{"value":"1573-1405","type":"electronic"}],"subject":[],"published":{"date-parts":[[2026,5,12]]},"assertion":[{"value":"6 August 2025","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"24 March 2026","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"12 May 2026","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}],"article-number":"267"}}