{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,12]],"date-time":"2025-12-12T13:50:56Z","timestamp":1765547456524,"version":"3.44.0"},"reference-count":62,"publisher":"IEEE","license":[{"start":{"date-parts":[[2025,5,19]],"date-time":"2025-05-19T00:00:00Z","timestamp":1747612800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,5,19]],"date-time":"2025-05-19T00:00:00Z","timestamp":1747612800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025,5,19]]},"DOI":"10.1109\/icra55743.2025.11128787","type":"proceedings-article","created":{"date-parts":[[2025,9,2]],"date-time":"2025-09-02T17:28:56Z","timestamp":1756834136000},"page":"16884-16891","source":"Crossref","is-referenced-by-count":1,"title":["Towards Effective Utilization of Mixed-Quality Demonstrations in Robotic Manipulation via Segment-Level Selection and Optimization"],"prefix":"10.1109","author":[{"given":"Jingjing","family":"Chen","sequence":"first","affiliation":[{"name":"Shanghai Jiao Tong University"}]},{"given":"Hongjie","family":"Fang","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University"}]},{"given":"Hao-Shu","family":"Fang","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University"}]},{"given":"Cewu","family":"Lu","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University"}]}],"member":"263","reference":[{"key":"ref1","first-page":"1732","volume-title":"Imitation Learning by Estimating Ex-pertise of Demonstrators","volume":"162","author":"Beliaev"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA57147.2024.10611293"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2023.xix.025"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/lra.2024.3418275"},{"key":"ref5","first-page":"9912","article-title":"Unsupervised Learning of Visual Features by Contrasting Cluster Assignments","volume":"33","author":"Caron","year":"2020","journal-title":"Advances in Neural Information Processing Systems"},{"first-page":"1761","volume-title":"PolarNet: 3D Point Clouds for Language-Guided Robotic Manipulation","author":"Chen","key":"ref6"},{"key":"ref7","first-page":"1597","article-title":"A Simple Framework for Contrastive Learning of Visual Representations","author":"Chen","year":"2020","journal-title":"International Conference on Machine Learning"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.15607\/RSS.2023.XIX.026"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00319"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/icra57147.2024.10611477"},{"key":"ref11","article-title":"Bunny-VisionPro: Real-Time Bimanual Dexterous Teleoperation for Imitation Learning","author":"Ding","year":"2024","journal-title":"ar Xiv preprint"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2023.xix.011"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/TSMC.1976.5408784"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA57147.2024.10611615"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA57147.2024.10610799"},{"first-page":"1981","volume-title":"Eliciting Compatible Demonstrations for Multi-Human Imitation Learning","author":"Gandhi","key":"ref16"},{"first-page":"3949","volume-title":"Act3D: 3D Feature Field Transform-ers for Multi-Task Robotic Manipulation","author":"Gervet","key":"ref17"},{"first-page":"694","volume-title":"RVT: Robotic View Transformer for 3D Object Manipulation","author":"Goyal","key":"ref18"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.5555\/3495724.3497510"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.90"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.00975"},{"key":"ref22","article-title":"Generative Adversarial Imitation Learning","volume":"29","author":"Ho","year":"2016","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref23","first-page":"6840","article-title":"Denoising Diffusion Probabilistic Models","volume":"33","author":"Ho","year":"2020","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2022.3140817"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52688.2022.01337"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.15607\/RSS.2024.XX.120"},{"key":"ref27","first-page":"18661","article-title":"Supervised Contrastive Learning","author":"Khosla","year":"2020","journal-title":"Advances in Neural Information Processing Systems 33"},{"volume-title":"DemoDICE: Offline Imitation Learning with Supplementary Imperfect Demonstrations","author":"Kim","key":"ref28"},{"key":"ref29","first-page":"1437","volume-title":"Learning to Discern: Imitating Hetero-geneous Human Demonstrations with Preference and Rep-resentation Learning","volume":"229","author":"Kuhar"},{"first-page":"23301","volume-title":"LIV: Language-Image Representations and Rewards for Robotic Control","author":"Jason Ma","key":"ref30"},{"volume-title":"VIP: Towards Universal Visual Reward and Representation via Value-Implicit Pre-Training","author":"Jason Ma","key":"ref31"},{"key":"ref32","article-title":"Actra: Optimized Transformer Architecture for Vision-Language-Action Models in Robot Learning","author":"Ma","year":"2024","journal-title":"arXiv preprint"},{"key":"ref33","first-page":"1678","volume-title":"What Matters in Learning from Offline Human Demonstrations for Robot Manipulation","volume":"164","author":"Mandlekar"},{"key":"ref34","first-page":"892","volume-title":"R3M: A Universal Visual Representation for Robot Manipulation","volume":"205","author":"Nair"},{"key":"ref35","article-title":"DINOv2: Learning Robust Visual Features without Supervision","author":"Oquab","year":"2024","journal-title":"Trans. Mach. Learn. Res"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2022.xviii.010"},{"key":"ref37","article-title":"ALVINN: An Autonomous Land Vehi-cle in a Neural Network","volume":"1","author":"Pomerleau","year":"1988","journal-title":"Advances in Neural Information Processing Systems"},{"first-page":"652","volume-title":"PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation","author":"Qi","key":"ref38"},{"key":"ref39","first-page":"8748","article-title":"Learning Transferable Visual Models from Natural Language Supervision","volume-title":"International Conference on Machine Learning","author":"Radford","year":"2021"},{"first-page":"627","volume-title":"A Reduction of Imitation Learning and Structured Prediction to No-Regret Online Learning","author":"Ross","key":"ref40"},{"volume-title":"Behavioral Cloning from Noisy Demonstrations","author":"Sasaki","key":"ref41"},{"key":"ref42","first-page":"22955","article-title":"Behavior Transformers: Cloning k Modes with One Stone","volume":"35","author":"Muhammad Shafiullah","year":"2022","journal-title":"Advances in Neural Information Processing Systems"},{"first-page":"2195","volume-title":"Waypoint-Based Imitation Learning for Robotic Manipulation","author":"Xiaoyang Shi","key":"ref43"},{"first-page":"785","volume-title":"Perceiver-Actor: A Multi-Task Transformer for Robotic Manipulation","author":"Shridhar","key":"ref44"},{"key":"ref45","article-title":"Learning Structured Output Representation using Deep Conditional Generative Models","volume":"28","author":"Sohn","year":"2015","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2024.xx.051"},{"key":"ref47","first-page":"1723","volume-title":"BridgeData V2: A Dataset for Robot Learning at Scale","volume":"229","author":"Rich Walke"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2024.xx.043"},{"key":"ref49","doi-asserted-by":"publisher","DOI":"10.1109\/IROS58592.2024.10801678"},{"key":"ref50","first-page":"3851","volume-title":"Improving Behavioural Cloning with Positive Unlabeled Learning","volume":"229","author":"Wang"},{"key":"ref51","article-title":"SWBT: Similarity Weighted Behavior Trans-former with the Imperfect Demonstration for Robotic Ma-nipulation","author":"Wu","year":"2024","journal-title":"arXiv preprint"},{"first-page":"6818","volume-title":"Imitation learning from imperfect demonstration","author":"Wu","key":"ref52"},{"first-page":"24725","volume-title":"Discriminator- Weighted Offline Imitation Learning from Suboptimal Demonstrations","author":"Xu","key":"ref53"},{"key":"ref54","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2024.xx.054"},{"key":"ref55","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2023.xix.027"},{"key":"ref56","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2024.xx.067"},{"volume-title":"SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulation","author":"Zhang","key":"ref57"},{"key":"ref58","first-page":"12340","article-title":"Confidence-Aware Imitation Learning from Demonstrations with Varying Optimality","volume":"34","author":"Zhang","year":"2021","journal-title":"Ad-vances in Neural Information Processing Systems"},{"key":"ref59","article-title":"Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation","author":"Zhang","year":"2024","journal-title":"ar Xiv preprint"},{"key":"ref60","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA57147.2024.10611125"},{"key":"ref61","doi-asserted-by":"publisher","DOI":"10.15607\/rss.2023.xix.016"},{"key":"ref62","article-title":"Robosuite: A Modular Simulation Frame-work and Benchmark for Robot Learning","author":"Zhu","year":"2020","journal-title":"ar Xiv preprint"}],"event":{"name":"2025 IEEE International Conference on Robotics and Automation (ICRA)","start":{"date-parts":[[2025,5,19]]},"location":"Atlanta, GA, USA","end":{"date-parts":[[2025,5,23]]}},"container-title":["2025 IEEE International Conference on Robotics and Automation (ICRA)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/11127273\/11127223\/11128787.pdf?arnumber=11128787","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,9,3]],"date-time":"2025-09-03T06:09:00Z","timestamp":1756879740000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11128787\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,5,19]]},"references-count":62,"URL":"https:\/\/doi.org\/10.1109\/icra55743.2025.11128787","relation":{},"subject":[],"published":{"date-parts":[[2025,5,19]]}}}