{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,10]],"date-time":"2025-12-10T04:04:18Z","timestamp":1765339458278,"version":"3.46.0"},"publisher-location":"New York, NY, USA","reference-count":51,"publisher":"ACM","funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62222202,62232004,U23A20272"],"award-info":[{"award-number":["62222202,62232004,U23A20272"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Beijing Natural Science Foundation","award":["L223002"],"award-info":[{"award-number":["L223002"]}]},{"name":"111 Project","award":["B18008"],"award-info":[{"award-number":["B18008"]}]},{"name":"Key Research and Development Special projects of Henan Province","award":["251111210900"],"award-info":[{"award-number":["251111210900"]}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2025,10,27]]},"DOI":"10.1145\/3746027.3755399","type":"proceedings-article","created":{"date-parts":[[2025,10,25]],"date-time":"2025-10-25T06:54:15Z","timestamp":1761375255000},"page":"10093-10102","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":0,"title":["Venus: Generating Large-scale mmWave Radar Data via Few 2D Videos for Gesture Recognition While Lying Down"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0009-0006-8656-5134","authenticated-orcid":false,"given":"Yue","family":"Ling","sequence":"first","affiliation":[{"name":"Beijing University of Posts and Telecommunications, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-7337-9168","authenticated-orcid":false,"given":"Dong","family":"Zhao","sequence":"additional","affiliation":[{"name":"Beijing University of Posts and Telecommunications, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-1123-6978","authenticated-orcid":false,"given":"Kaikai","family":"Deng","sequence":"additional","affiliation":[{"name":"Henan University of Science and Technology, Henan, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0000-4531-0609","authenticated-orcid":false,"given":"Kangwen","family":"Yin","sequence":"additional","affiliation":[{"name":"Beijing University of Posts and Telecommunications, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0006-4367-973X","authenticated-orcid":false,"given":"Zixiao","family":"He","sequence":"additional","affiliation":[{"name":"Beijing University of Posts and Telecommunications, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7380-0306","authenticated-orcid":false,"given":"Yizong","family":"Wang","sequence":"additional","affiliation":[{"name":"Peking University, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-7199-5047","authenticated-orcid":false,"given":"Huadong","family":"Ma","sequence":"additional","affiliation":[{"name":"Beijing University of Post and Telecommunication, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2025,10,27]]},"reference":[{"doi-asserted-by":"publisher","key":"e_1_3_2_1_1_1","DOI":"10.1145\/3411764.3445138"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_2_1","DOI":"10.1109\/7.18645"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_3_1","DOI":"10.1155\/2023\/7616683"},{"key":"e_1_3_2_1_4_1","first-page":"1","article-title":"Sensecollect: We need efficient ways to collect on-body sensor-based human activity data!","volume":"5","author":"Chen Wenqiang","year":"2021","unstructured":"Wenqiang Chen, Shupei Lin, Elizabeth Thompson, and John Stankovic. 2021. Sensecollect: We need efficient ways to collect on-body sensor-based human activity data!. In Proc. of ACM IMWUT, Vol. 5. 1-27.","journal-title":"Proc. of ACM IMWUT"},{"key":"e_1_3_2_1_5_1","first-page":"28","article-title":"Rf genesis: Zero-shot generalization of mmwave sensing through simulation-based data synthesis and generative diffusion models","author":"Chen Xingyu","year":"2023","unstructured":"Xingyu Chen and Xinyu Zhang. 2023. Rf genesis: Zero-shot generalization of mmwave sensing through simulation-based data synthesis and generative diffusion models. In Proc. of ACM SenSys. 28-42.","journal-title":"Proc. of ACM SenSys."},{"key":"e_1_3_2_1_6_1","first-page":"77","article-title":"RF-diffusion: Radio signal generation via time-frequency diffusion","author":"Chi Guoxuan","year":"2024","unstructured":"Guoxuan Chi, Zheng Yang, Chenshu Wu, Jingao Xu, Yuchong Gao, Yunhao Liu, and Tony Xiao Han. 2024. RF-diffusion: Radio signal generation via time-frequency diffusion. In Proc. of ACM MobiCom. 77-92.","journal-title":"Proc. of ACM MobiCom."},{"key":"e_1_3_2_1_7_1","first-page":"1","article-title":"Geryon: Edge Assisted Real-time and Robust Object Detection on Drones via mmWave Radar and Camera Fusion","volume":"6","author":"Deng Kaikai","year":"2022","unstructured":"Kaikai Deng, Dong Zhao, Qiaoyue Han, Shuyue Wang, Zihan Zhang, Anfu Zhou, and Huadong Ma. 2022. Geryon: Edge Assisted Real-time and Robust Object Detection on Drones via mmWave Radar and Camera Fusion. In Proc. of ACM IMWUT, Vol. 6. 1-27.","journal-title":"Proc. of ACM IMWUT"},{"key":"e_1_3_2_1_8_1","first-page":"1","article-title":"Midas: Generating mmWave Radar Data from Videos for Training Pervasive and Privacy-preserving Human Sensing Tasks","volume":"7","author":"Deng Kaikai","year":"2023","unstructured":"Kaikai Deng, Dong Zhao, Qiaoyue Han, Zihan Zhang, Shuyue Wang, Anfu Zhou, and Huadong Ma. 2023a. Midas: Generating mmWave Radar Data from Videos for Training Pervasive and Privacy-preserving Human Sensing Tasks. In Proc. of ACM IMWUT, Vol. 7. 1-26.","journal-title":"Proc. of ACM IMWUT"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_9_1","DOI":"10.1145\/3580872"},{"key":"e_1_3_2_1_10_1","volume-title":"Generating Rich and Fine-Grained Mmwave Radar Data From 2D Videos for Generalized Gesture Recognition","author":"Deng Kaikai","year":"2024","unstructured":"Kaikai Deng, Dong Zhao, Wenxin Zheng, Yue Ling, Kangwen Yin, and Huadong Ma. 2024. G^3R: Generating Rich and Fine-Grained Mmwave Radar Data From 2D Videos for Generalized Gesture Recognition. IEEE Transactions on Mobile Computing (2024)."},{"unstructured":"Alexey Dosovitskiy Lucas Beyer Alexander Kolesnikov Dirk Weissenborn Xiaohua Zhai Thomas Unterthiner Mostafa Dehghani Matthias Minderer Georg Heigold Sylvain Gelly et al. 2020. An image is worth 16x16 words: Transformers for image recognition at scale. arXiv preprint arXiv:2010.11929 (2020).","key":"e_1_3_2_1_11_1"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_12_1","DOI":"10.1109\/TAES.2020.2969579"},{"key":"e_1_3_2_1_13_1","first-page":"1","article-title":"Towards robust gesture recognition by characterizing the sensing quality of WiFi signals","volume":"6","author":"Gao Ruiyang","year":"2022","unstructured":"Ruiyang Gao, Wenwei Li, Yaxiong Xie, Enze Yi, Leye Wang, Dan Wu, and Daqing Zhang. 2022. Towards robust gesture recognition by characterizing the sensing quality of WiFi signals. Proc. of ACM IMWUT, Vol. 6, 1 (2022), 1-26.","journal-title":"Proc. of ACM IMWUT"},{"key":"e_1_3_2_1_14_1","first-page":"1108","article-title":"Understanding user behavior in volumetric video watching: Dataset, analysis and prediction","author":"Hu Kaiyuan","year":"2023","unstructured":"Kaiyuan Hu, Haowen Yang, Yili Jin, Junhua Liu, Yongting Chen, Miao Zhang, and Fangxin Wang. 2023. Understanding user behavior in volumetric video watching: Dataset, analysis and prediction. In Proc. of the ACM MM. 1108-1116.","journal-title":"Proc. of the ACM MM."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_15_1","DOI":"10.1109\/JIOT.2023.3293092"},{"key":"e_1_3_2_1_16_1","volume-title":"Rodar: Robust gesture recognition based on mmWave radar under human activity interference","author":"Jin Can","year":"2024","unstructured":"Can Jin, Xiangzhu Meng, Xuanheng Li, Jie Wang, Miao Pan, and Yuguang Fang. 2024. Rodar: Robust gesture recognition based on mmWave radar under human activity interference. IEEE Transactions on Mobile Computing (2024)."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_17_1","DOI":"10.1109\/TMTT.2022.3216577"},{"key":"e_1_3_2_1_18_1","volume-title":"Audiogen: Textually guided audio generation. arXiv preprint arXiv:2209.15352","author":"Kreuk Felix","year":"2022","unstructured":"Felix Kreuk, Gabriel Synnaeve, Adam Polyak, Uriel Singer, Alexandre D\u00e9fossez, Jade Copet, Devi Parikh, Yaniv Taigman, and Yossi Adi. 2022. Audiogen: Textually guided audio generation. arXiv preprint arXiv:2209.15352 (2022)."},{"key":"e_1_3_2_1_19_1","volume-title":"Modified MUSIC algorithm for estimating DOA of signals. Signal processing","author":"Kundu Debasis","year":"1996","unstructured":"Debasis Kundu. 1996. Modified MUSIC algorithm for estimating DOA of signals. Signal processing, Vol. 48, 1 (1996), 85-90."},{"key":"e_1_3_2_1_20_1","first-page":"462","article-title":"Room-Scale Hand Gesture Recognition Using Smart Speakers","author":"Li Dong","year":"2022","unstructured":"Dong Li, Jialin Liu, Sunghoon Ivan Lee, and Jie Xiong. 2022. Room-Scale Hand Gesture Recognition Using Smart Speakers. In Proc. of ACM SenSys. 462-475.","journal-title":"Proc. of ACM SenSys."},{"key":"e_1_3_2_1_21_1","first-page":"1","article-title":"Signring: Continuous american sign language recognition using imu rings and virtual imu data","volume":"7","author":"Li Jiyang","year":"2023","unstructured":"Jiyang Li, Lin Huang, Siddharth Shah, Sean J Jones, Yincheng Jin, Dingran Wang, Adam Russell, Seokmin Choi, Yang Gao, Junsong Yuan, et al., 2023. Signring: Continuous american sign language recognition using imu rings and virtual imu data. Proc. of ACM IMWUT, Vol. 7, 3 (2023), 1-29.","journal-title":"Proc. of ACM IMWUT"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_22_1","DOI":"10.1049\/joe.2019.0557"},{"key":"e_1_3_2_1_23_1","volume-title":"SBRF: A fine-grained radar signal generator for human sensing","author":"Li Jiamu","year":"2024","unstructured":"Jiamu Li, Dongheng Zhang, Zhi Wu, Cong Yu, Yadong Li, Qi Chen, Yang Hu, Qibin Sun, and Yan Chen. 2024b. SBRF: A fine-grained radar signal generator for human sensing. IEEE Transactions on Mobile Computing (2024)."},{"key":"e_1_3_2_1_24_1","first-page":"3984","article-title":"PathUp","author":"Li Jingxiong","year":"2024","unstructured":"Jingxiong Li, Sunyi Zheng, Chenglu Zhu, Yuxuan Sun, Pingyi Chen, Zhongyi Shui, Yunlong Zhang, Honglin Li, and Lin Yang. 2024c. PathUp: Patch-wise Timestep Tracking for Multi-class Large Pathology Image Synthesising Diffusion Model. In Proc. of the ACM MM. 3984-3993.","journal-title":"In Proc. of the ACM MM."},{"key":"e_1_3_2_1_25_1","first-page":"7203","article-title":"Pu-gan: a point cloud upsampling adversarial network","author":"Li Ruihui","year":"2019","unstructured":"Ruihui Li, Xianzhi Li, Chi-Wing Fu, Daniel Cohen-Or, and Pheng-Ann Heng. 2019a. Pu-gan: a point cloud upsampling adversarial network. In Proc. of IEEE CVPR. 7203-7212.","journal-title":"Proc. of IEEE CVPR."},{"key":"e_1_3_2_1_26_1","first-page":"7336","article-title":"Generative Multimodal Data Augmentation for Low-Resource Multimodal Named Entity Recognition","author":"Li Ziyan","year":"2024","unstructured":"Ziyan Li, Jianfei Yu, Jia Yang, Wenya Wang, Li Yang, and Rui Xia. 2024a. Generative Multimodal Data Augmentation for Low-Resource Multimodal Named Entity Recognition. In Proc. of the ACM MM. 7336-7345.","journal-title":"Proc. of the ACM MM."},{"key":"e_1_3_2_1_27_1","first-page":"1","article-title":"Uranus: Empowering Generalized Gesture Recognition with Mobility through Generating Large-scale mmWave Radar Data","volume":"8","author":"Ling Yue","year":"2024","unstructured":"Yue Ling, Dong Zhao, Kaikai Deng, Kangwen Yin, Wenxin Zheng, and Huadong Ma. 2024. Uranus: Empowering Generalized Gesture Recognition with Mobility through Generating Large-scale mmWave Radar Data. Proc. of ACM IMWUT, Vol. 8, 4 (2024), 1-28.","journal-title":"Proc. of ACM IMWUT"},{"key":"e_1_3_2_1_28_1","volume-title":"Audioldm: Text-to-audio generation with latent diffusion models. arXiv preprint arXiv:2301.12503","author":"Liu Haohe","year":"2023","unstructured":"Haohe Liu, Zehua Chen, Yi Yuan, Xinhao Mei, Xubo Liu, Danilo Mandic, Wenwu Wang, and Mark D Plumbley. 2023. Audioldm: Text-to-audio generation with latent diffusion models. arXiv preprint arXiv:2301.12503 (2023)."},{"key":"e_1_3_2_1_29_1","first-page":"1","article-title":"MTransSee: Enabling environment-independent mmWave sensing based gesture recognition via transfer learning","volume":"6","author":"Liu Haipeng","year":"2022","unstructured":"Haipeng Liu, Kening Cui, Kaiyuan Hu, Yuheng Wang, Anfu Zhou, Liang Liu, and Huadong Ma. 2022. MTransSee: Enabling environment-independent mmWave sensing based gesture recognition via transfer learning. In Proc. of ACM IMWUT, Vol. 6. 1-28.","journal-title":"Proc. of ACM IMWUT"},{"key":"e_1_3_2_1_30_1","first-page":"1","article-title":"Real-time arm gesture recognition in smart home scenarios via millimeter wave sensing","volume":"4","author":"Liu Haipeng","year":"2020","unstructured":"Haipeng Liu, Yuheng Wang, Anfu Zhou, Hanyue He, Wei Wang, Kunpeng Wang, Peilin Pan, Yixuan Lu, Liang Liu, and Huadong Ma. 2020. Real-time arm gesture recognition in smart home scenarios via millimeter wave sensing. In Proc. of ACM IMWUT, Vol. 4. 1-28.","journal-title":"Proc. of ACM IMWUT"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_31_1","DOI":"10.1109\/JIOT.2021.3098338"},{"key":"e_1_3_2_1_32_1","first-page":"1","article-title":"Comparison between Adam, AdaMax and Adam W optimizers to implement a Weather Forecast based on Neural Networks for the Andean city of Quito","author":"Llugsi Ricardo","year":"2021","unstructured":"Ricardo Llugsi, Samira El Yacoubi, Allyx Fontaine, and Pablo Lupera. 2021. Comparison between Adam, AdaMax and Adam W optimizers to implement a Weather Forecast based on Neural Networks for the Andean city of Quito. In Proc. of IEEE ETCM. 1-6.","journal-title":"Proc. of IEEE ETCM."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_33_1","DOI":"10.1109\/TMC.2022.3217487"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_34_1","DOI":"10.1108\/INTR-12-2021-0931"},{"key":"e_1_3_2_1_35_1","first-page":"32","article-title":"Comparing point clouds","author":"M\u00e9moli Facundo","year":"2004","unstructured":"Facundo M\u00e9moli and Guillermo Sapiro. 2004. Comparing point clouds. In In Proc. of ACM SGP. 32-40.","journal-title":"In Proc. of ACM SGP."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_36_1","DOI":"10.1609\/aaai.v34i01.5430"},{"key":"e_1_3_2_1_37_1","first-page":"2159","article-title":"Attention based dual branches fingertip detection network and virtual key system","author":"Mou Chong","year":"2020","unstructured":"Chong Mou and Xin Zhang. 2020. Attention based dual branches fingertip detection network and virtual key system. In Proc. of ACM MM. 2159-2165.","journal-title":"Proc. of ACM MM."},{"key":"e_1_3_2_1_38_1","first-page":"4195","article-title":"Scalable diffusion models with transformers","author":"Peebles William","year":"2023","unstructured":"William Peebles and Saining Xie. 2023. Scalable diffusion models with transformers. In Proc. of IEEE CVPR. 4195-4205.","journal-title":"Proc. of IEEE CVPR."},{"key":"e_1_3_2_1_39_1","first-page":"1666","article-title":"Kullback-Leibler divergence estimation of continuous distributions","author":"P\u00e9rez-Cruz Fernando","year":"2008","unstructured":"Fernando P\u00e9rez-Cruz. 2008. Kullback-Leibler divergence estimation of continuous distributions. In Proc. of IEEE ISIT. 1666-1670.","journal-title":"Proc. of IEEE ISIT."},{"key":"e_1_3_2_1_40_1","volume-title":"Proc. of NIPS","volume":"30","author":"Qi Charles Ruizhongtai","year":"2017","unstructured":"Charles Ruizhongtai Qi, Li Yi, Hao Su, and Leonidas J Guibas. 2017. Pointnet: Deep hierarchical feature learning on point sets in a metric space. In Proc. of NIPS, Vol. 30."},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_41_1","DOI":"10.1109\/TAES.2021.3139848"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_42_1","DOI":"10.1109\/IM.2001.924423"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_43_1","DOI":"10.1109\/TMC.2022.3153717"},{"doi-asserted-by":"publisher","key":"e_1_3_2_1_44_1","DOI":"10.1109\/RADAR.2018.8378629"},{"key":"e_1_3_2_1_45_1","volume-title":"Make-a-video: Text-to-video generation without text-video data. arXiv preprint arXiv:2209.14792","author":"Singer Uriel","year":"2022","unstructured":"Uriel Singer, Adam Polyak, Thomas Hayes, Xi Yin, Jie An, Songyang Zhang, Qiyuan Hu, Harry Yang, Oron Ashual, Oran Gafni, et al., 2022. Make-a-video: Text-to-video generation without text-video data. arXiv preprint arXiv:2209.14792 (2022)."},{"key":"e_1_3_2_1_46_1","first-page":"13243","article-title":"Putting people in their place: Monocular regression of 3d people in depth","author":"Sun Yu","year":"2022","unstructured":"Yu Sun, Wu Liu, Qian Bao, Yili Fu, Tao Mei, and Michael J Black. 2022. Putting people in their place: Monocular regression of 3d people in depth. In Proc. of IEEE CVPR. 13243-13252.","journal-title":"Proc. of IEEE CVPR."},{"key":"e_1_3_2_1_47_1","volume-title":"Proc. of NIPS","volume":"35","author":"Vaswani Ashish","year":"2017","unstructured":"Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, \u0141ukasz Kaiser, and Illia Polosukhin. 2017. Attention is all you need. In Proc. of NIPS, Vol. 35."},{"key":"e_1_3_2_1_48_1","first-page":"33330","volume-title":"Proc. of NIPS","volume":"35","author":"Wu Xiaoyang","year":"2022","unstructured":"Xiaoyang Wu, Yixing Lao, Li Jiang, Xihui Liu, and Hengshuang Zhao. 2022. Point transformer v2: Grouped vector attention and partition-based pooling. In Proc. of NIPS, Vol. 35. 33330-33342."},{"key":"e_1_3_2_1_49_1","volume-title":"The Dawn of Synthetic Era: Synthesizing mmWave Radar Data from 2D Videos for Human Sensing","author":"Xing Ling","year":"2025","unstructured":"Ling Xing, Kaikai Deng, Honghai Wu, Huahong Ma, Jianping Gao, and Yue Ling. 2025. The Dawn of Synthetic Era: Synthesizing mmWave Radar Data from 2D Videos for Human Sensing. IEEE Communications Magazine (2025)."},{"key":"e_1_3_2_1_50_1","first-page":"1","article-title":"Towards generalized mmwave-based human pose estimation through signal augmentation","author":"Xue Hongfei","year":"2023","unstructured":"Hongfei Xue, Qiming Cao, Chenglin Miao, Yan Ju, Haochen Hu, Aidong Zhang, and Lu Su. 2023. Towards generalized mmwave-based human pose estimation through signal augmentation. In Proc. of ACM MobiCom. 1-15.","journal-title":"Proc. of ACM MobiCom."},{"key":"e_1_3_2_1_51_1","first-page":"377","article-title":"Synthesized Millimeter-Waves for Human Motion Sensing","author":"Zhang Xiaotong","year":"2022","unstructured":"Xiaotong Zhang, Zhenjiang Li, and Jin Zhang. 2022. Synthesized Millimeter-Waves for Human Motion Sensing. In Proc. of ACM SenSys. 377-390.","journal-title":"Proc. of ACM SenSys."}],"event":{"sponsor":["SIGMM ACM Special Interest Group on Multimedia"],"acronym":"MM '25","name":"MM '25: The 33rd ACM International Conference on Multimedia","location":"Dublin Ireland"},"container-title":["Proceedings of the 33rd ACM International Conference on Multimedia"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3746027.3755399","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,12,10]],"date-time":"2025-12-10T03:59:27Z","timestamp":1765339167000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3746027.3755399"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,10,27]]},"references-count":51,"alternative-id":["10.1145\/3746027.3755399","10.1145\/3746027"],"URL":"https:\/\/doi.org\/10.1145\/3746027.3755399","relation":{},"subject":[],"published":{"date-parts":[[2025,10,27]]},"assertion":[{"value":"2025-10-27","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}