{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,22]],"date-time":"2026-04-22T20:22:01Z","timestamp":1776889321876,"version":"3.51.2"},"publisher-location":"New York, NY, USA","reference-count":58,"publisher":"ACM","content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2025,10,27]]},"DOI":"10.1145\/3746027.3754554","type":"proceedings-article","created":{"date-parts":[[2025,10,25]],"date-time":"2025-10-25T06:47:18Z","timestamp":1761374838000},"page":"2536-2545","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":1,"title":["Graph Canvas for Controllable 3D Scene Generation"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0009-0004-0164-3523","authenticated-orcid":false,"given":"Libin","family":"Liu","sequence":"first","affiliation":[{"name":"Beijing University of Technology, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0008-6264-9178","authenticated-orcid":false,"given":"Shen","family":"Chen","sequence":"additional","affiliation":[{"name":"East China University of Science and Technology, Hangzhou, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0000-8570-2172","authenticated-orcid":false,"given":"Sen","family":"Jia","sequence":"additional","affiliation":[{"name":"University of Washington, Seattle, WA, USA and VitaSight, Shanghai, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0007-3372-2949","authenticated-orcid":false,"given":"Jingzhe","family":"Shi","sequence":"additional","affiliation":[{"name":"Tsinghua University, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0007-3407-1658","authenticated-orcid":false,"given":"Can","family":"Jin","sequence":"additional","affiliation":[{"name":"Rutgers University, New Brunswick, NJ, USA"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-8141-1108","authenticated-orcid":false,"given":"Zongkai","family":"Wu","sequence":"additional","affiliation":[{"name":"SKAI Intelligence, Hangzhou, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-8877-2421","authenticated-orcid":false,"given":"Jenq-Neng","family":"Hwang","sequence":"additional","affiliation":[{"name":"University of Washington, Seattle, WA, USA"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-2929-0828","authenticated-orcid":false,"given":"Lei","family":"Li","sequence":"additional","affiliation":[{"name":"University of Washington, Seattle, WA, USA and VitaSight, Shanghai, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2025,10,27]]},"reference":[{"key":"e_1_3_2_1_1_1","doi-asserted-by":"crossref","unstructured":"Krzysztof Janowicz Song Gao Grant McKenzie Yingjie Hu and Budhendra Bhaduri. 2020. GeoAI: spatially explicit artificial intelligence techniques for geographic knowledge discovery and beyond. 625--636 pages.","DOI":"10.1080\/13658816.2019.1684500"},{"key":"e_1_3_2_1_2_1","unstructured":"Sean Tucker. 2024. A systematic review of geospatial location embedding approaches in large language models: A path to spatial AI systems. arXiv:2401.10279 [cs.IR] https:\/\/arxiv.org\/abs\/2401.10279"},{"key":"e_1_3_2_1_3_1","volume-title":"Thippa Reddy Gadekallu, Rutvij H Jhaveri, Ajay Bandi, Junxin Chen, Wei Wang, Adarsh Arunkumar Shirawalmath, Raghav Ravishankar, and Weizheng Wang.","author":"Yenduri Gokul","year":"2024","unstructured":"Gokul Yenduri, Ramalingam M, Praveen Kumar Reddy Maddikunta, Thippa Reddy Gadekallu, Rutvij H Jhaveri, Ajay Bandi, Junxin Chen, Wei Wang, Adarsh Arunkumar Shirawalmath, Raghav Ravishankar, and Weizheng Wang. 2024. Spatial Computing: Concept, Applications, Challenges and Future Directions. arXiv:2402.07912 [cs.HC] https:\/\/arxiv.org\/abs\/2402.07912"},{"key":"e_1_3_2_1_4_1","doi-asserted-by":"publisher","DOI":"10.1109\/WACV57701.2024.00057"},{"key":"e_1_3_2_1_5_1","volume-title":"Xin Eric Wang, and William Yang Wang","author":"Feng Weixi","year":"2024","unstructured":"Weixi Feng, Wanrong Zhu, Tsu-jui Fu, Varun Jampani, Arjun Akula, Xuehai He, Sugato Basu, Xin Eric Wang, and William Yang Wang. 2024. Layoutgpt: Compositional visual planning and generation with large language models. Advances in Neural Information Processing Systems 36 (2024)."},{"key":"e_1_3_2_1_6_1","volume-title":"Spatialbot: Precise spatial understanding with vision language models. arXiv preprint arXiv:2406.13642","author":"Cai Wenxiao","year":"2024","unstructured":"Wenxiao Cai, Iaroslav Ponomarenko, Jianhao Yuan, Xiaoqi Li, Wankou Yang, Hao Dong, and Bo Zhao. 2024. Spatialbot: Precise spatial understanding with vision language models. arXiv preprint arXiv:2406.13642 (2024)."},{"key":"e_1_3_2_1_7_1","first-page":"12013","article-title":"Atiss: Autoregressive transformers for indoor scene synthesis","volume":"34","author":"Paschalidou Despoina","year":"2021","unstructured":"Despoina Paschalidou, Amlan Kar, Maria Shugrina, Karsten Kreis, Andreas Geiger, and Sanja Fidler. 2021. Atiss: Autoregressive transformers for indoor scene synthesis. Advances in Neural Information Processing Systems 34 (2021), 12013--12026.","journal-title":"Advances in Neural Information Processing Systems"},{"key":"e_1_3_2_1_8_1","volume-title":"Proceedings of the International Conference on Computer Vision (ICCV). 5678--5685","author":"Lee Alice","year":"2023","unstructured":"Alice Lee and Thomas Kim. 2023. MVDream: Multi-View Consistent 3D Object Generation from Single-View Images. In Proceedings of the International Conference on Computer Vision (ICCV). 5678--5685."},{"key":"e_1_3_2_1_9_1","volume-title":"DreamFusion: Text-to-3D using 2D Diffusion. arXiv preprint arXiv:2209.14988","author":"Poole Ben","year":"2022","unstructured":"Ben Poole, Ajay Jain, Jonathan T Barron, and Ben Mildenhall. 2022. DreamFusion: Text-to-3D using 2D Diffusion. arXiv preprint arXiv:2209.14988 (2022)."},{"key":"e_1_3_2_1_10_1","volume-title":"GaussianDiffusion: A Variational Approach to 3D Gaussian Splatting with Structured Noise. arXiv preprint arXiv:2308.03415","author":"Li Xiaohui","year":"2023","unstructured":"Xiaohui Li, Mingchao Huang, Zhen Shen, and Lingyu Wang. 2023. GaussianDiffusion: A Variational Approach to 3D Gaussian Splatting with Structured Noise. arXiv preprint arXiv:2308.03415 (2023)."},{"key":"e_1_3_2_1_11_1","first-page":"83314","article-title":"Scaling law for time series forecasting","volume":"37","author":"Shi Jingzhe","year":"2024","unstructured":"Jingzhe Shi, Qinwei Ma, Huan Ma, and Lei Li. 2024. Scaling law for time series forecasting. Advances in Neural Information Processing Systems 37 (2024), 83314-- 83344.","journal-title":"Advances in Neural Information Processing Systems"},{"key":"e_1_3_2_1_12_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV48922.2021.00104"},{"key":"e_1_3_2_1_13_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.00974"},{"key":"e_1_3_2_1_14_1","volume-title":"Layout-your-3D: Controllable and Precise 3D Generation with 2D Blueprint. arXiv preprint arXiv:2410.15391","author":"Zhou Junwei","year":"2024","unstructured":"Junwei Zhou, Xueting Li, Lu Qi, and Ming-Hsuan Yang. 2024. Layout-your-3D: Controllable and Precise 3D Generation with 2D Blueprint. arXiv preprint arXiv:2410.15391 (2024)."},{"key":"e_1_3_2_1_15_1","doi-asserted-by":"publisher","DOI":"10.1016\/j.cag.2023.08.003"},{"key":"e_1_3_2_1_16_1","volume-title":"Instructscene: Instruction-driven 3d indoor scene synthesis with semantic graph prior. arXiv preprint arXiv:2402.04717","author":"Lin Chenguo","year":"2024","unstructured":"Chenguo Lin and Yadong Mu. 2024. Instructscene: Instruction-driven 3d indoor scene synthesis with semantic graph prior. arXiv preprint arXiv:2402.04717 (2024)."},{"key":"e_1_3_2_1_17_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.02012"},{"key":"e_1_3_2_1_18_1","doi-asserted-by":"publisher","DOI":"10.1145\/3503250"},{"key":"e_1_3_2_1_19_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV48922.2021.00580"},{"key":"e_1_3_2_1_20_1","volume-title":"Proceedings of the IEEE\/CVF International Conference on Computer Vision. 9065--9076","author":"Chen Zhaoxi","year":"2023","unstructured":"GuangcongWang, Zhaoxi Chen, Chen Change Loy, and Ziwei Liu. 2023. Sparsenerf: Distilling depth ranking for few-shot novel view synthesis. In Proceedings of the IEEE\/CVF International Conference on Computer Vision. 9065--9076."},{"key":"e_1_3_2_1_21_1","volume-title":"3D Gaussian Splatting for Efficient Scene Representation. arXiv preprint arXiv:2302.08354","author":"Kerbl Bernhard","year":"2023","unstructured":"Bernhard Kerbl, Wolfgang Wraber, Bernhard Egger, and Andreas Lugmayr. 2023. 3D Gaussian Splatting for Efficient Scene Representation. arXiv preprint arXiv:2302.08354 (2023)."},{"key":"e_1_3_2_1_22_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.01952"},{"key":"e_1_3_2_1_23_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.01839"},{"key":"e_1_3_2_1_24_1","volume-title":"Magic3D: High-Resolution Text-to-3D Content Creation. arXiv preprint arXiv:2301.10832","author":"Lin Chen-Hsuan","year":"2023","unstructured":"Chen-Hsuan Lin, Jun Gao, Deqing Sun, Jason Baldridge, Alexei A Efros, Ali Farhadi, and Jong-Chul Park. 2023. Magic3D: High-Resolution Text-to-3D Content Creation. arXiv preprint arXiv:2301.10832 (2023)."},{"key":"e_1_3_2_1_25_1","volume-title":"ProlificDreamer: High-Quality 3D Generation via Explicit Shape Priors. arXiv preprint arXiv:2304.03416","author":"Wang Hao","year":"2023","unstructured":"Hao Wang, Mingming Chen, Qing Sun, Yu Zhang, Jay Lee, Zhiqiang Cheng, and Ting Zhang. 2023. ProlificDreamer: High-Quality 3D Generation via Explicit Shape Priors. arXiv preprint arXiv:2304.03416 (2023)."},{"key":"e_1_3_2_1_26_1","volume-title":"Comp3D: Compositional Text-to-3D Generation with NeRF-based Layouts. arXiv preprint arXiv:2303.04567","author":"Po Brian","year":"2023","unstructured":"Brian Po and Gordon Wetzstein. 2023. Comp3D: Compositional Text-to-3D Generation with NeRF-based Layouts. arXiv preprint arXiv:2303.04567 (2023)."},{"key":"e_1_3_2_1_27_1","volume-title":"CompoNeRF: Customizable Layouts for Compositional 3D Generation. arXiv preprint arXiv:2305.09134","author":"Lin Chen-Hsuan","year":"2023","unstructured":"Chen-Hsuan Lin, Yujie Liu, Di Fang, Wang Lin, and Fangzhou Zhou. 2023. CompoNeRF: Customizable Layouts for Compositional 3D Generation. arXiv preprint arXiv:2305.09134 (2023)."},{"key":"e_1_3_2_1_28_1","volume-title":"3DGS: Gaussian Splatting with Point Cloud Initialization for High-Quality Text-to-3D. arXiv preprint arXiv:2305.01267","author":"Yi Tianyu","year":"2023","unstructured":"Tianyu Yi, Yiwei Chen, Fei Liu, Tao Wang, and Wenbo Zhang. 2023. 3DGS: Gaussian Splatting with Point Cloud Initialization for High-Quality Text-to-3D. arXiv preprint arXiv:2305.01267 (2023)."},{"key":"e_1_3_2_1_29_1","volume-title":"Diffusion-based Text-to-Point Models for 3D Gaussian Splatting. arXiv preprint arXiv:2305.06271","author":"Liang Wei","year":"2023","unstructured":"Wei Liang, Ping Zhou, Xiaofei Chen, and Dongdong Wu. 2023. Diffusion-based Text-to-Point Models for 3D Gaussian Splatting. arXiv preprint arXiv:2305.06271 (2023)."},{"key":"e_1_3_2_1_30_1","volume-title":"GaussianCube: Structuring Gaussian Splatting using Optimal Transport for 3D Generative Modeling. arXiv preprint arXiv:2403.19655","author":"Zhang Bowen","year":"2024","unstructured":"Bowen Zhang, Yiji Cheng, Jiaolong Yang, Chunyu Wang, Feng Zhao, Yansong Tang, Dong Chen, and Baining Guo. 2024. GaussianCube: Structuring Gaussian Splatting using Optimal Transport for 3D Generative Modeling. arXiv preprint arXiv:2403.19655 (2024)."},{"key":"e_1_3_2_1_31_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52734.2025.01638"},{"key":"e_1_3_2_1_32_1","volume-title":"Dreamgaussian: Generative gaussian splatting for efficient 3d content creation. arXiv preprint arXiv:2309.16653","author":"Tang Jiaxiang","year":"2023","unstructured":"Jiaxiang Tang, Jiawei Ren, Hang Zhou, Ziwei Liu, and Gang Zeng. 2023. Dreamgaussian: Generative gaussian splatting for efficient 3d content creation. arXiv preprint arXiv:2309.16653 (2023)."},{"key":"e_1_3_2_1_33_1","volume-title":"Two-stage 3DGS: Geometry Optimization and Texture Refinement for Gaussian Splatting. arXiv preprint arXiv:2307.03472","author":"Chen Jiahao","year":"2023","unstructured":"Jiahao Chen, Xiao Lin, Yuqi Liu, and Feng Zhang. 2023. Two-stage 3DGS: Geometry Optimization and Texture Refinement for Gaussian Splatting. arXiv preprint arXiv:2307.03472 (2023)."},{"key":"e_1_3_2_1_34_1","volume-title":"Gaussian Splatting in Two Stages for Consistent 3D Generation. arXiv preprint arXiv:2307.04561","author":"Tang Wei","year":"2023","unstructured":"Wei Tang, Ling Sun, Tao Jin, and Ming Li. 2023. Gaussian Splatting in Two Stages for Consistent 3D Generation. arXiv preprint arXiv:2307.04561 (2023)."},{"key":"e_1_3_2_1_35_1","unstructured":"Stanislaw Szymanowicz Jason Y. Zhang Pratul Srinivasan Ruiqi Gao Arthur Brussee Aleksander Holynski Ricardo Martin-Brualla Jonathan T. Barron and Philipp Henzler. 2025. Bolt3D: Generating 3D Scenes in Seconds. arXiv:2503.14445 [cs.CV] https:\/\/arxiv.org\/abs\/2503.14445"},{"key":"e_1_3_2_1_36_1","volume-title":"Computer Graphics International Conference. Springer, 81--92","author":"Li Lei","year":"2023","unstructured":"Lei Li. 2023. Hierarchical edge aware learning for 3d point cloud. In Computer Graphics International Conference. Springer, 81--92."},{"key":"e_1_3_2_1_37_1","volume-title":"3D Editing with Language: A New Paradigm for Text-to-3D Generation. arXiv preprint arXiv:2309.10234","author":"Fang Jiawei","year":"2023","unstructured":"Jiawei Fang, Sheng Liu, Yue Zhou, and Feng Zhang. 2023. 3D Editing with Language: A New Paradigm for Text-to-3D Generation. arXiv preprint arXiv:2309.10234 (2023)."},{"key":"e_1_3_2_1_38_1","volume-title":"Avatar Simulation Using Large Language Models. arXiv preprint arXiv:2308.06789","author":"Ren Wei","year":"2023","unstructured":"Wei Ren, Tian Chen, Mingliang Liu, and Hui Zhang. 2023. Avatar Simulation Using Large Language Models. arXiv preprint arXiv:2308.06789 (2023)."},{"key":"e_1_3_2_1_39_1","volume-title":"Procedural 3D Modeling with Large Language Models. arXiv preprint arXiv:2308.04521","author":"Sun Yuan","year":"2023","unstructured":"Yuan Sun, Xiaohui Zhang, Ji Liu, and Yanping Zhao. 2023. Procedural 3D Modeling with Large Language Models. arXiv preprint arXiv:2308.04521 (2023)."},{"key":"e_1_3_2_1_40_1","unstructured":"Minglin Chen Longguang Wang Sheng Ao Ye Zhang Kai Xu and Yulan Guo. 2025. Layout2Scene: 3D Semantic Layout Guided Scene Generation via Geometry and Appearance Diffusion Priors. arXiv:2501.02519 [cs.CV] https:\/\/arxiv.org\/abs\/2501.02519"},{"key":"e_1_3_2_1_41_1","unstructured":"Hao Feng Zhi Zuo Jia-Hui Pan Ka-Hei Hui Yihua Shao Qi Dou Wei Xie and Zhengzhe Liu. 2025. WonderVerse: Extendable 3D Scene Generation with Video Generative Models. arXiv:2503.09160 [cs.CV] https:\/\/arxiv.org\/abs\/2503.09160"},{"key":"e_1_3_2_1_42_1","doi-asserted-by":"crossref","unstructured":"Zhifei Yang Keyang Lu Chao Zhang Jiaxing Qi Hanqi Jiang Ruifei Ma Shenglin Yin Yifan Xu Mingzhe Xing Zhen Xiao Jieyi Long and Guangyao Zhai. 2025. MMGDreamer: Mixed-Modality Graph for Geometry-Controllable 3D Indoor Scene Generation. arXiv:2502.05874 [cs.CV] https:\/\/arxiv.org\/abs\/2502.05874","DOI":"10.1609\/aaai.v39i9.33017"},{"key":"e_1_3_2_1_43_1","unstructured":"Yuheng Liu Xinke Li Yuning Zhang Lu Qi Xin Li Wenping Wang Chongshou Li Xueting Li and Ming-Hsuan Yang. 2025. Controllable 3D Outdoor Scene Generation via Scene Graphs. arXiv:2503.07152 [cs.CV] https:\/\/arxiv.org\/abs\/2503.07152"},{"key":"e_1_3_2_1_44_1","volume-title":"Chatmotion: A multimodal multi-agent for human motion analysis. arXiv preprint arXiv:2502.18180","author":"Li Lei","year":"2025","unstructured":"Lei Li, Sen Jia, Jianhao Wang, Zhaochong An, Jiaang Li, Jenq-Neng Hwang, and Serge Belongie. 2025. Chatmotion: A multimodal multi-agent for human motion analysis. arXiv preprint arXiv:2502.18180 (2025)."},{"key":"e_1_3_2_1_45_1","volume-title":"SceneWiz3D: Intelligent 3D Scene Composition via Large Language Models. arXiv preprint arXiv:2306.10245","author":"Zhang Xinyu","year":"2023","unstructured":"Xinyu Zhang, Ruibo Xu, Fei Li, Li-Yi Chang, and Bo Wen. 2023. SceneWiz3D: Intelligent 3D Scene Composition via Large Language Models. arXiv preprint arXiv:2306.10245 (2023)."},{"key":"e_1_3_2_1_46_1","volume-title":"Gala3d: Towards text-to-3d complex scene generation via layout-guided generative gaussian splatting. arXiv preprint arXiv:2402.07207","author":"Zhou Xiaoyu","year":"2024","unstructured":"Xiaoyu Zhou, Xingjian Ran, Yajiao Xiong, Jinlin He, Zhiwei Lin, Yongtao Wang, Deqing Sun, and Ming-Hsuan Yang. 2024. Gala3d: Towards text-to-3d complex scene generation via layout-guided generative gaussian splatting. arXiv preprint arXiv:2402.07207 (2024)."},{"key":"e_1_3_2_1_47_1","volume-title":"Scenesuggest: Context-driven 3d scene design. arXiv preprint arXiv:1703.00061","author":"Savva Manolis","year":"2017","unstructured":"Manolis Savva, Angel X Chang, and Maneesh Agrawala. 2017. Scenesuggest: Context-driven 3d scene design. arXiv preprint arXiv:1703.00061 (2017)."},{"key":"e_1_3_2_1_48_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.01536"},{"key":"e_1_3_2_1_49_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2019.00748"},{"key":"e_1_3_2_1_50_1","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1145\/3306346.3322941","article-title":"Planit: Planning and instantiating indoor scenes with relation graph and spatial prior networks","volume":"38","author":"Wang Kai","year":"2019","unstructured":"Kai Wang, Yu-An Lin, Ben Weissmann, Manolis Savva, Angel X Chang, and Daniel Ritchie. 2019. Planit: Planning and instantiating indoor scenes with relation graph and spatial prior networks. ACM Transactions on Graphics (TOG) 38, 4 (2019), 1--15.","journal-title":"ACM Transactions on Graphics (TOG)"},{"key":"e_1_3_2_1_51_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICCVW60793.2023.00314"},{"key":"e_1_3_2_1_52_1","volume-title":"European Conference on Computer Vision. Springer, 52--70","author":"Fu Rao","year":"2024","unstructured":"Rao Fu, Zehao Wen, Zichen Liu, and Srinath Sridhar. 2024. Anyhome: Openvocabulary generation of structured and textured 3d homes. In European Conference on Computer Vision. Springer, 52--70."},{"key":"e_1_3_2_1_53_1","unstructured":"Long Ouyang Jeffrey Wu Xu Jiang Diogo Almeida Carroll Wainwright Pamela Mishkin Chong Zhang Sandhini Agarwal Katarina Slama Alex Ray et al. 2022. Training language models to follow instructions with human feedback. Advances in neural information processing systems 35 (2022) 27730--27744."},{"key":"e_1_3_2_1_54_1","volume-title":"Point-e: A system for generating 3d point clouds from complex prompts. arXiv preprint arXiv:2212.08751","author":"Nichol Alex","year":"2022","unstructured":"Alex Nichol, Heewoo Jun, Prafulla Dhariwal, Pamela Mishkin, and Mark Chen. 2022. Point-e: A system for generating 3d point clouds from complex prompts. arXiv preprint arXiv:2212.08751 (2022)."},{"key":"e_1_3_2_1_55_1","volume-title":"Adding Conditional Control to Text-to-Image Diffusion Models. arXiv preprint arXiv:2302.05543","author":"Zhang Lvmin","year":"2023","unstructured":"Lvmin Zhang, Mane Wu, Junyan Zhu, Richard Zhang, He Zhang, Yijun Wang, Xiaogang Qi, and Xiaowei Zhang. 2023. Adding Conditional Control to Text-to-Image Diffusion Models. arXiv preprint arXiv:2302.05543 (2023)."},{"key":"e_1_3_2_1_56_1","volume-title":"Gaussiandreamer: Fast generation from text to 3d gaussian splatting with point cloud priors. arXiv preprint arXiv:2310.08529","author":"Yi Taoran","year":"2023","unstructured":"Taoran Yi, Jiemin Fang, Guanjun Wu, Lingxi Xie, Xiaopeng Zhang, Wenyu Liu, Qi Tian, and Xinggang Wang. 2023. Gaussiandreamer: Fast generation from text to 3d gaussian splatting with point cloud priors. arXiv preprint arXiv:2310.08529 (2023)."},{"key":"e_1_3_2_1_57_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.02022"},{"key":"e_1_3_2_1_58_1","volume-title":"Dreamtime: An improved optimization strategy for text-to-3d content creation. arXiv preprint arXiv:2306.12422","author":"Huang Yukun","year":"2023","unstructured":"Yukun Huang, Jianan Wang, Yukai Shi, Xianbiao Qi, Zheng-Jun Zha, and Lei Zhang. 2023. Dreamtime: An improved optimization strategy for text-to-3d content creation. arXiv preprint arXiv:2306.12422 (2023)."}],"event":{"name":"MM '25: The 33rd ACM International Conference on Multimedia","location":"Dublin Ireland","acronym":"MM '25","sponsor":["SIGMM ACM Special Interest Group on Multimedia"]},"container-title":["Proceedings of the 33rd ACM International Conference on Multimedia"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3746027.3754554","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,12,10]],"date-time":"2025-12-10T04:15:15Z","timestamp":1765340115000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3746027.3754554"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,10,27]]},"references-count":58,"alternative-id":["10.1145\/3746027.3754554","10.1145\/3746027"],"URL":"https:\/\/doi.org\/10.1145\/3746027.3754554","relation":{},"subject":[],"published":{"date-parts":[[2025,10,27]]},"assertion":[{"value":"2025-10-27","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}