{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,8,31]],"date-time":"2025-08-31T10:29:11Z","timestamp":1756636151501,"version":"3.40.5"},"reference-count":75,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/legalcode"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Access"],"published-print":{"date-parts":[[2025]]},"DOI":"10.1109\/access.2025.3553372","type":"journal-article","created":{"date-parts":[[2025,3,22]],"date-time":"2025-03-22T00:44:29Z","timestamp":1742604269000},"page":"52385-52396","source":"Crossref","is-referenced-by-count":1,"title":["Height-Adaptive Deformable Multi-Modal Fusion for 3D Object Detection"],"prefix":"10.1109","volume":"13","author":[{"ORCID":"https:\/\/orcid.org\/0009-0009-9015-9018","authenticated-orcid":false,"given":"Jiahao","family":"Li","sequence":"first","affiliation":[{"name":"School of Mechanical and Automotive Engineering, Shanghai University of Engineering Science, Shanghai, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0007-6488-0536","authenticated-orcid":false,"given":"Lingshan","family":"Chen","sequence":"additional","affiliation":[{"name":"School of Mechanical and Automotive Engineering, Shanghai University of Engineering Science, Shanghai, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0007-1019-3917","authenticated-orcid":false,"given":"Zhen","family":"Li","sequence":"additional","affiliation":[{"name":"School of Mechanical and Automotive Engineering, Shanghai University of Engineering Science, Shanghai, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2012.6248074"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.3390\/s21062140"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/MITS.2019.2907630"},{"key":"ref4","article-title":"Dual radar: A multi-modal dataset with dual 4D radar for autonomous driving","author":"Zhang","year":"2023","journal-title":"arXiv:2310.07602"},{"key":"ref5","article-title":"V2X-radar: A multi-modal dataset with 4D radar for cooperative perception","author":"Yang","year":"2024","journal-title":"arXiv:2411.10962"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1145\/3664647.3681565"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/TNNLS.2020.3015992"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2020.2972974"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2020.3023541"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/TIV.2023.3264658"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2024.3439557"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.01164"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2016.2577031"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.91"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2020.3032166"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/ICCVW54120.2021.00107"},{"key":"ref17","first-page":"1475","article-title":"Probabilistic and geometric depth: Detecting objects in perspective","volume-title":"Proc. 5th Conf. Robot Learn.","volume":"164","author":"Wang"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-58568-6_12"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v37i2.25233"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00864"},{"article-title":"Pseudo-LiDAR++: Accurate depth for 3D object detection in autonomous driving","volume-title":"Proc. Int. Conf. Learn. Represent.","author":"You","key":"ref21"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.48550\/ARXIV.1706.03762"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-58452-8_13"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR46437.2021.01422"},{"article-title":"Deformable DETR: Deformable transformers for end-to-end object detection","volume-title":"Proc. Int. Conf. Learn. Represent.","author":"Zhu","key":"ref25"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-19812-0_31"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV51070.2023.00302"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV51070.2023.00840"},{"key":"ref29","first-page":"180","article-title":"DETR3D: 3D object detection from multi-view images via 3D-to-2D queries","volume-title":"Proc. 5th Conf. Robot Learn.","author":"Wang"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-20077-9_1"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.16"},{"key":"ref32","article-title":"PointNet++: Deep hierarchical feature learning on point sets in a metric space","volume-title":"Proc. Adv. Neural Inf. Process. Syst.","volume":"30","author":"Qi"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00086"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.01054"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1109\/TGRS.2023.3271020"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.01298"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00472"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-20080-9_3"},{"key":"ref39","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v35i2.16207"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.3390\/s18103337"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR46437.2021.01161"},{"key":"ref42","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2019.00667"},{"key":"ref43","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00102"},{"key":"ref44","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.691"},{"key":"ref45","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2018.8594049"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.00466"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR46437.2021.01162"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.1109\/ITSC48978.2021.9564951"},{"key":"ref49","doi-asserted-by":"publisher","DOI":"10.1109\/TGRS.2024.3387732"},{"key":"ref50","doi-asserted-by":"publisher","DOI":"10.1109\/TGRS.2024.3519386"},{"key":"ref51","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-58555-6_3"},{"key":"ref52","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2022.3228806"},{"key":"ref53","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV51070.2023.01656"},{"key":"ref54","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-20074-8_36"},{"key":"ref55","doi-asserted-by":"publisher","DOI":"10.1007\/978-981-99-8435-0_32"},{"key":"ref56","article-title":"VoxelNextFusion: A simple, unified and effective voxel fusion framework for multi-modal 3D object detection","author":"Song","year":"2024","journal-title":"arXiv:2401.02702"},{"key":"ref57","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-58583-9_43"},{"key":"ref58","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA48891.2023.10160968"},{"key":"ref59","doi-asserted-by":"publisher","DOI":"10.1109\/TLA.2024.10412035"},{"key":"ref60","article-title":"TiGDistill-BEV: Multi-view BEV 3D object detection via target inner-geometry learning distillation","author":"Xu","year":"2024","journal-title":"arXiv:2412.20911"},{"key":"ref61","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.00252"},{"key":"ref62","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52729.2023.00105"},{"key":"ref63","article-title":"Benchmarking and improving bird\u2019s eye view perception robustness in autonomous driving","author":"Xie","year":"2024","journal-title":"arXiv:2405.17426"},{"key":"ref64","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV51070.2023.00801"},{"key":"ref65","article-title":"M2DA: Multi-modal fusion transformer incorporating driver attention for autonomous driving","author":"Xu","year":"2024","journal-title":"arXiv:2403.12552"},{"key":"ref66","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2024\/141"},{"key":"ref67","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2022\/116"},{"key":"ref68","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV51070.2023.00311"},{"key":"ref69","doi-asserted-by":"publisher","DOI":"10.1109\/TCSVT.2023.3306361"},{"key":"ref70","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-73347-5_20"},{"key":"ref71","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52688.2022.00116"},{"key":"ref72","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52688.2022.01667"},{"key":"ref73","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.90"},{"key":"ref74","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV48922.2021.00986"},{"key":"ref75","first-page":"16494","article-title":"Multimodal virtual point 3D detection","volume-title":"Proc. Adv. Neural Inf. Process. Syst.","author":"Yin"}],"container-title":["IEEE Access"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/6287639\/10820123\/10935618.pdf?arnumber=10935618","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,5,8]],"date-time":"2025-05-08T17:40:27Z","timestamp":1746726027000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10935618\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025]]},"references-count":75,"URL":"https:\/\/doi.org\/10.1109\/access.2025.3553372","relation":{},"ISSN":["2169-3536"],"issn-type":[{"type":"electronic","value":"2169-3536"}],"subject":[],"published":{"date-parts":[[2025]]}}}