{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,6]],"date-time":"2025-12-06T08:14:17Z","timestamp":1765008857320,"version":"3.46.0"},"publisher-location":"New York, NY, USA","reference-count":33,"publisher":"ACM","content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2025,12,9]]},"DOI":"10.1145\/3743093.3771077","type":"proceedings-article","created":{"date-parts":[[2025,12,6]],"date-time":"2025-12-06T08:06:16Z","timestamp":1765008376000},"page":"1-7","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":0,"title":["Diffusion-Driven 3D Gaussian Splatting for Occlusion-Free Egocentric Scene Reconstruction"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0009-0002-9101-6675","authenticated-orcid":false,"given":"Roucheng","family":"Lai","sequence":"first","affiliation":[{"name":"Sun Yat-sen University, Guangzhou, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0000-4772-9569","authenticated-orcid":false,"given":"Haijing","family":"Liu","sequence":"additional","affiliation":[{"name":"Sun Yat-sen University, Guangzhou, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-2132-6515","authenticated-orcid":false,"given":"Hefeng","family":"Wu","sequence":"additional","affiliation":[{"name":"Sun Yat-sen University, Guangzhou, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2025,12,6]]},"reference":[{"key":"e_1_3_3_1_2_2","doi-asserted-by":"crossref","unstructured":"Ronald\u00a0T Azuma. 1997. A survey of augmented reality. Presence: Teleoperators & Virtual Environments 6 4 (1997) 355\u2013385.","DOI":"10.1162\/pres.1997.6.4.355"},{"key":"e_1_3_3_1_3_2","doi-asserted-by":"crossref","unstructured":"Cesar Cadena Luca Carlone Henry Carrillo Yasir Latif Davide Scaramuzza Jose Neira Ian Reid and John\u00a0J Leonard. 2016. Past present and future of simultaneous localization and mapping: Toward the robust-perception age. IEEE Transactions on Robotics 32 6 (2016) 1309\u20131332.","DOI":"10.1109\/TRO.2016.2624754"},{"key":"e_1_3_3_1_4_2","first-page":"276","volume-title":"European Conference on Computer Vision (ECCV)","author":"Cao Lijun","year":"2022","unstructured":"Lijun Cao, Haodi Ma, Yifan Nie, Yifan Shan, and Jianfei Zhang. 2022. EgoHOS: Egocentric Hand-Object Segmentation via Interaction Context. In European Conference on Computer Vision (ECCV). Springer, 276\u2013292."},{"key":"e_1_3_3_1_5_2","unstructured":"Weifeng Chen Jie Wu Pan Xie Hefeng Wu and et al.2023. Control-A-Video: Controllable Text-to-Video Generation with Diffusion Models. arxiv:https:\/\/arXiv.org\/abs\/2305.13840\u00a0[cs.CV] arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2305.13840."},{"key":"e_1_3_3_1_6_2","first-page":"370","volume-title":"European Conference on Computer Vision","author":"Chen Yuedong","year":"2024","unstructured":"Yuedong Chen, Haofei Xu, Chuanxia Zheng, Bohan Zhuang, Marc Pollefeys, Andreas Geiger, Tat-Jen Cham, and Jianfei Cai. 2024. Mvsplat: Efficient 3d gaussian splatting from sparse multi-view images. In European Conference on Computer Vision. Springer, 370\u2013386."},{"key":"e_1_3_3_1_7_2","first-page":"720","volume-title":"Proceedings of the European conference on computer vision (ECCV)","author":"Damen Dima","year":"2018","unstructured":"Dima Damen, Hazel Doughty, Giovanni\u00a0Maria Farinella, Sanja Fidler, Antonino Furnari, Evangelos Kazakos, Davide Moltisanti, Jonathan Munro, Toby Perrett, Will Price, et\u00a0al. 2018. Scaling egocentric vision: The epic-kitchens dataset. In Proceedings of the European conference on computer vision (ECCV). 720\u2013736."},{"key":"e_1_3_3_1_8_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.01208"},{"key":"e_1_3_3_1_9_2","first-page":"6840","volume-title":"Advances in Neural Information Processing Systems (NeurIPS)","author":"Ho Jonathan","year":"2020","unstructured":"Jonathan Ho, Ajay Jain, and Pieter Abbeel. 2020. Denoising diffusion probabilistic models. In Advances in Neural Information Processing Systems (NeurIPS) , Vol.\u00a033. 6840\u20136851."},{"key":"e_1_3_3_1_10_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.00907"},{"key":"e_1_3_3_1_11_2","doi-asserted-by":"crossref","unstructured":"Benjamin Kerbl Georgios Kopanas Thomas Leimk\u00fchler and George Drettakis. 2023. 3D Gaussian Splatting for Real-Time Radiance Field Rendering. ACM Transactions on Graphics (TOG) 42 4 (2023) 1\u201315.","DOI":"10.1145\/3592433"},{"key":"e_1_3_3_1_12_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV51070.2023.00371"},{"key":"e_1_3_3_1_13_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52688.2022.02034"},{"key":"e_1_3_3_1_14_2","unstructured":"Zhibin Liu Haoye Dong Aviral Chharia and Hefeng Wu. 2024. Human-VDM: Learning Single-Image 3D Human Gaussian Splatting from Video Diffusion Models. arxiv:https:\/\/arXiv.org\/abs\/2409.02851\u00a0[cs.CV] arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2409.02851."},{"key":"e_1_3_3_1_15_2","unstructured":"Zhiheng Liu Hao Ouyang Qiuyu Wang Ka\u00a0Leong Cheng Jie Xiao Kai Zhu Nan Xue Yu Liu and et al.2024. Infusion: Inpainting 3d gaussians via learning depth completion from diffusion prior. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2404.11613 (2024)."},{"key":"e_1_3_3_1_16_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52688.2022.01117"},{"key":"e_1_3_3_1_17_2","unstructured":"Jonas Luiten Georgios Kopanas Bastian Leibe and Deva Ramanan. 2023. Dynamic 3D Gaussians: Tracking by Splatting. arxiv:https:\/\/arXiv.org\/abs\/2308.06713\u00a0[cs.CV] arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2308.06713."},{"key":"e_1_3_3_1_18_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR46437.2021.00713"},{"key":"e_1_3_3_1_19_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-58452-8_24"},{"key":"e_1_3_3_1_20_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV48922.2021.00581"},{"key":"e_1_3_3_1_21_2","unstructured":"Daniel Podell and et al.2023. SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis. arxiv:https:\/\/arXiv.org\/abs\/2307.01952\u00a0[cs.CV] arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2307.01952."},{"key":"e_1_3_3_1_22_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR46437.2021.01018"},{"key":"e_1_3_3_1_23_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52688.2022.01042"},{"key":"e_1_3_3_1_24_2","volume-title":"Augmented Reality: Principles and Practice","author":"Schmalstieg Dieter","year":"2016","unstructured":"Dieter Schmalstieg and Tobias Hollerer. 2016. Augmented Reality: Principles and Practice. Addison-Wesley Professional."},{"key":"e_1_3_3_1_25_2","volume-title":"International Conference on Learning Representations (ICLR)","author":"Song Jiaming","year":"2021","unstructured":"Jiaming Song, Chenlin Meng, and Stefano Ermon. 2021. Denoising Diffusion Implicit Models. In International Conference on Learning Representations (ICLR)."},{"key":"e_1_3_3_1_26_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-58548-8_34"},{"key":"e_1_3_3_1_27_2","unstructured":"Tao Tang Likui Zhang Youpeng Wen and et al.2025. RoboPearls: Editable Video Simulation for Robot Manipulation. arxiv:https:\/\/arXiv.org\/abs\/2506.22756\u00a0[cs.CV] arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2506.22756."},{"key":"e_1_3_3_1_28_2","doi-asserted-by":"crossref","unstructured":"Zhou Wang Alan\u00a0C Bovik Hamid\u00a0R Sheikh and Eero\u00a0P Simoncelli. 2004. Image quality assessment: from error visibility to structural similarity. IEEE transactions on image processing 13 4 (2004) 600\u2013612.","DOI":"10.1109\/TIP.2003.819861"},{"key":"e_1_3_3_1_29_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.01920"},{"key":"e_1_3_3_1_30_2","doi-asserted-by":"crossref","unstructured":"Hefeng Wu Weifeng Chen Zhibin Liu Tianshui Chen Zhiguang Chen and Liang Lin. 2024. Contrastive Transformer Learning With Proximity Data Generation for Text-Based Person Search. IEEE Transactions on Circuits and Systems for Video Technology 34 8 (2024) 7005\u20137016.","DOI":"10.1109\/TCSVT.2023.3329220"},{"key":"e_1_3_3_1_31_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.01922"},{"key":"e_1_3_3_1_32_2","unstructured":"Daiwei Zhang Gengyan Li Jiajie Li Micka\u00ebl Bressieux Otmar Hilliges Marc Pollefeys Luc Van\u00a0Gool and Xi Wang. 2024. Egogaussian: Dynamic scene understanding from egocentric video with 3d gaussian splatting. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2406.19811 (2024)."},{"key":"e_1_3_3_1_33_2","first-page":"10384","volume-title":"Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR)","author":"Zhang Fei","year":"2021","unstructured":"Fei Zhang, Shijie Peng, Xin Li, Changxin Zhang, Xiaoyu Chen, and Jianfei Cai. 2021. VISOOR: A dataset for visual object-oriented relation reasoning from egocentric videos. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 10384\u201310393."},{"key":"e_1_3_3_1_34_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00068"}],"event":{"name":"MMAsia '25: ACM Multimedia Asia","location":"Kuala Lumpur Malaysia","acronym":"MMAsia '25","sponsor":["SIGMM ACM Special Interest Group on Multimedia"]},"container-title":["Proceedings of the 7th ACM International Conference on Multimedia in Asia"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3743093.3771077","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,12,6]],"date-time":"2025-12-06T08:10:15Z","timestamp":1765008615000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3743093.3771077"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,12,6]]},"references-count":33,"alternative-id":["10.1145\/3743093.3771077","10.1145\/3743093"],"URL":"https:\/\/doi.org\/10.1145\/3743093.3771077","relation":{},"subject":[],"published":{"date-parts":[[2025,12,6]]},"assertion":[{"value":"2025-12-06","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}