{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,29]],"date-time":"2026-06-29T17:53:20Z","timestamp":1782755600745,"version":"3.54.5"},"reference-count":47,"publisher":"MDPI AG","issue":"12","license":[{"start":{"date-parts":[[2024,11,26]],"date-time":"2024-11-26T00:00:00Z","timestamp":1732579200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["Entropy"],"abstract":"<jats:p>In industrial robotic arm gripping operations within disordered environments, the loss of physical information on the object\u2019s surface is often caused by changes such as varying lighting conditions, weak surface textures, and sensor noise. This leads to inaccurate object detection and pose estimation information. A method for industrial object pose estimation using point cloud data is proposed to improve pose estimation accuracy. During the feature extraction process, both global and local information are captured by integrating the appearance features of RGB images with the geometric features of point clouds. Integrating semantic information with instance features effectively distinguishes instances of similar objects. The fusion of depth information and RGB color channels enriches spatial context and structure. A cross-entropy loss function is employed for multi-class target classification, and a discriminative loss function enables instance segmentation. A novel point cloud registration method is also introduced to address re-projection errors when mapping 3D keypoints to 2D planes. This method utilizes 3D geometric information, extracting edge features using point cloud curvature and normal vectors, and registers them with models to obtain accurate pose information. Experimental results demonstrate that the proposed method is effective and superior on the LineMod and YCB-Video datasets. Finally, objects are grasped by deploying a robotic arm on the grasping platform.<\/jats:p>","DOI":"10.3390\/e26121022","type":"journal-article","created":{"date-parts":[[2024,11,26]],"date-time":"2024-11-26T09:10:14Z","timestamp":1732612214000},"page":"1022","update-policy":"https:\/\/doi.org\/10.3390\/mdpi_crossmark_policy","source":"Crossref","is-referenced-by-count":10,"title":["6D Pose Estimation of Industrial Parts Based on Point Cloud Geometric Information Prediction for Robotic Grasping"],"prefix":"10.3390","volume":"26","author":[{"given":"Qinglei","family":"Zhang","sequence":"first","affiliation":[{"name":"China Institute of FTZ Supply Chain, Shanghai Maritime University, Shanghai 201306, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Cuige","family":"Xue","sequence":"additional","affiliation":[{"name":"Logistics Engineering College, Shanghai Maritime University, Shanghai 201306, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jiyun","family":"Qin","sequence":"additional","affiliation":[{"name":"China Institute of FTZ Supply Chain, Shanghai Maritime University, Shanghai 201306, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jianguo","family":"Duan","sequence":"additional","affiliation":[{"name":"China Institute of FTZ Supply Chain, Shanghai Maritime University, Shanghai 201306, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Ying","family":"Zhou","sequence":"additional","affiliation":[{"name":"China Institute of FTZ Supply Chain, Shanghai Maritime University, Shanghai 201306, China"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"1968","published-online":{"date-parts":[[2024,11,26]]},"reference":[{"key":"ref_1","doi-asserted-by":"crossref","first-page":"102453","DOI":"10.1016\/j.rcim.2022.102453","article-title":"ROS-industrial based robotic cell for Industry 4.0: Eye-in-hand stereo camera and visual servoing for flexible, fast, and accurate picking and hooking in the production line","volume":"80","author":"Alberto","year":"2023","journal-title":"Robot. Comput. Integr. Manuf."},{"key":"ref_2","doi-asserted-by":"crossref","first-page":"102140","DOI":"10.1016\/j.rcim.2021.102140","article-title":"Generic development methodology for flexible robotic pick-and-place workcells based on digital twin","volume":"71","author":"Tipary","year":"2021","journal-title":"Robot. Comput. Integr. Manuf."},{"key":"ref_3","doi-asserted-by":"crossref","first-page":"102366","DOI":"10.1016\/j.rcim.2022.102366","article-title":"A review of robotic assembly strategies for the full operation procedure: Planning, execution and evaluation","volume":"78","author":"Jiang","year":"2022","journal-title":"Robot. Comput. Integr. Manuf."},{"key":"ref_4","first-page":"629","article-title":"Active garment recognition and target grasping point detection using deep learning","volume":"74","author":"Corona","year":"2018","journal-title":"In Proceedings of the IEEE\/CVF Conf. Comput. Vis. Pattern Recognit."},{"key":"ref_5","doi-asserted-by":"crossref","first-page":"1677","DOI":"10.1007\/s10462-020-09888-5","article-title":"Vision-based robotic grasping from object localization, object pose estimation to grasp estimation for parallel grippers: A review","volume":"54","author":"Du","year":"2021","journal-title":"Artif. Intell. Rev."},{"key":"ref_6","doi-asserted-by":"crossref","first-page":"102541","DOI":"10.1016\/j.rcim.2023.102541","article-title":"Instance segmentation based 6D pose estimation of industrial objects using point clouds for robotic bin-picking","volume":"82","author":"Zhuang","year":"2023","journal-title":"Robot. Comput. Integr. Manuf."},{"key":"ref_7","doi-asserted-by":"crossref","unstructured":"Wang, C., Xu, D.F., Zhu, Y.K., Mart\u00edn-Mart\u00edn, R., Lu, C.W., Li, F.F., and Savarese, S. (2019, January 15\u201320). DenseFusion: 6D object pose estimation by iterative dense fusion. Proceedings of the 2019 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, CA, USA.","DOI":"10.1109\/CVPR.2019.00346"},{"key":"ref_8","doi-asserted-by":"crossref","unstructured":"He, Y.S., Sun, W., Huang, H.B., Liu, J.R., Fan, H.Q., and Sun, J. (2020, January 13\u201319). PVN3D: A deep point-wise 3D keypoints voting network for 6DoF pose estimation. Proceedings of the 2020 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA.","DOI":"10.1109\/CVPR42600.2020.01165"},{"key":"ref_9","doi-asserted-by":"crossref","unstructured":"Liu, H.S., Cong, H., Wang, S., Fan, H.J., Tian, D.Y., and Tang, Y.D. (2017, January 24\u201328). Deep learning of directional truncated signed distance function for robust 3D object recognition. Proceedings of the 2017 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS), Vancouver, BC, Canada.","DOI":"10.1109\/IROS.2017.8206488"},{"key":"ref_10","doi-asserted-by":"crossref","unstructured":"Xiang, Y., Schmidt, T., Narayanan, V., and Fox, D. (2017). PoseCNN: A convolutional neural network for 6D object pose estimation in cluttered scenes. arXiv.","DOI":"10.15607\/RSS.2018.XIV.019"},{"key":"ref_11","doi-asserted-by":"crossref","unstructured":"Li, C., Bai, J., and Hager, H.D. (2018, January 18\u201323). A unified framework for multi-view multi-class object pose estimation. Proceedings of the 2018 IEEE\/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA.","DOI":"10.1007\/978-3-030-01270-0_16"},{"key":"ref_12","unstructured":"Qi, C.R., Su, H., Mo, K.C., and Guibas, L.J. (2017, January 21\u201326). PointNet: Deep learning on point sets for 3D classification and segmentation. Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, USA."},{"key":"ref_13","unstructured":"Qi, C.R., Yi, L., Su, H., and Guibas, L.J. (2017). PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space. arXiv."},{"key":"ref_14","doi-asserted-by":"crossref","unstructured":"Wang, W., Yu, R., Huang, Q., and Neumann, U. (2018, January 18\u201323). SGPN: Similarity group proposal network for 3D point cloud instance segmentation. Proceedings of the 2018 IEEE\/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA.","DOI":"10.1109\/CVPR.2018.00272"},{"key":"ref_15","doi-asserted-by":"crossref","unstructured":"Wang, X., Liu, S., Shen, X., Shen, C., and Jia, J. (2019, January 15\u201320). Associatively segmenting instances and semantics in point clouds. Proceedings of the 2019 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, CA, USA.","DOI":"10.1109\/CVPR.2019.00422"},{"key":"ref_16","doi-asserted-by":"crossref","unstructured":"Jiang, L., Zhao, H., Shi, S., Liu, S., Fu, C.W., and Jia, J. (2020, January 13\u201319). PointGroup: Dual-set point grouping for 3D instance segmentation. Proceedings of the 2020 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA.","DOI":"10.1109\/CVPR42600.2020.00492"},{"key":"ref_17","doi-asserted-by":"crossref","unstructured":"He, Y.S., Huang, H.B., Fan, H.Q., Chen, Q.F., and Sun, J. (2021, January 20\u201325). FFB6D: A full flow bidirectional fusion network for 6D pose estimation. Proceedings of the 2021 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Nashville, TN, USA.","DOI":"10.1109\/CVPR46437.2021.00302"},{"key":"ref_18","first-page":"3523","article-title":"Image segmentation using deep learning: A survey","volume":"44","author":"Minaee","year":"2021","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"ref_19","first-page":"22106","article-title":"Semi-supervised semantic segmentation via adaptive equalization learning","volume":"34","author":"Hu","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref_20","first-page":"2980","article-title":"Focal loss for dense object detection","volume":"42","author":"Lin","year":"2017","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"ref_21","doi-asserted-by":"crossref","unstructured":"Cui, Y., Jia, M., and Lin, T.Y. (2019, January 15\u201320). Class-balanced loss based on effective number of samples. Proceedings of the 2019 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Long Beach, CA, USA.","DOI":"10.1109\/CVPR.2019.00949"},{"key":"ref_22","first-page":"15288","article-title":"Calibrating deep neural networks using focal loss","volume":"33","author":"Mukhoti","year":"2020","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref_23","doi-asserted-by":"crossref","first-page":"79","DOI":"10.1214\/aoms\/1177729694","article-title":"On Information and Sufficiency","volume":"22","author":"Kullback","year":"1951","journal-title":"Ann. Math. Stat."},{"key":"ref_24","doi-asserted-by":"crossref","unstructured":"Rusu, R.B., Bradski, G., Thibaux, R., John, H., and Willow, G. (2010, January 18\u201322). Fast 3D Recognition and Pose Using the Viewpoint Feature Histogram. Proceedings of the 2010 IEEE\/RSJ International Conference on Intelligent Robots and Systems, Taipei, Taiwan.","DOI":"10.1109\/IROS.2010.5651280"},{"key":"ref_25","doi-asserted-by":"crossref","unstructured":"Aldoma, A., Vincze, M., Blodow, N., David, G., Suat, G., Rusu, R.B., Bradski, G., and Garage, W. (2011, January 6\u201313). CAD-model Recognition and 6DOF Pose Estimation Using 3D Cues. Proceedings of the 2011 IEEE International Conference on Computer Vision Workshops (ICCV Workshops), Barcelona, Spain.","DOI":"10.1109\/ICCVW.2011.6130296"},{"key":"ref_26","doi-asserted-by":"crossref","unstructured":"Drost, B., Ulrich, M., Navab, N., and Ilic, S. (2010, January 13\u201318). Model Globally, Match Locally: Efficient and Robust 3D Object Recognition. Proceedings of the 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Francisco, CA, USA.","DOI":"10.1109\/CVPR.2010.5540108"},{"key":"ref_27","doi-asserted-by":"crossref","unstructured":"Mohamad, M., Rappaport, D., and Greenspan, M. (2014, January 8\u201311). Generalized 4-points congruent sets for 3D registration. Proceedings of the 2014 2nd International Conference on 3D Vision, Tokyo, Japan.","DOI":"10.1109\/3DV.2014.21"},{"key":"ref_28","doi-asserted-by":"crossref","first-page":"520","DOI":"10.1007\/978-3-319-10590-1_34","article-title":"Learning to rank 3D features","volume":"Volume 8689","author":"Tuzel","year":"2014","journal-title":"Computer Vision\u2014ECCV 2014"},{"key":"ref_29","doi-asserted-by":"crossref","first-page":"66","DOI":"10.1016\/j.cviu.2017.09.004","article-title":"A performance evaluation of point pair features","volume":"166","author":"Kiforenko","year":"2018","journal-title":"Comput. Vis. Image Understand."},{"key":"ref_30","doi-asserted-by":"crossref","unstructured":"Wong, J.M., Kee, V., Le, T., Wagner, S., Mariottini, G.L., Schneider, A., and Wu, J. (2017, January 24\u201328). Segicp: Integrated Deep Semantic Segmentation and Pose Estimation. Proceedings of the 2017 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS), Vancouver, BC, Canada.","DOI":"10.1109\/IROS.2017.8206470"},{"key":"ref_31","doi-asserted-by":"crossref","first-page":"536","DOI":"10.1007\/978-3-319-10605-2_35","article-title":"Learning 6D object pose estimation using 3D object coor dinates","volume":"Volume 8690","author":"Brachmann","year":"2014","journal-title":"Computer Vision\u2014ECCV 2014"},{"key":"ref_32","first-page":"4561","article-title":"PVNet: Pixel-wise voting network for 6DoF pose estimation","volume":"44","author":"Peng","year":"2019","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"ref_33","doi-asserted-by":"crossref","unstructured":"Hu, Q., Yang, B., Xie, L., Rosa, S., Guo, Y., Wang, Z., Trigoni, N., and Markham, A. (2020, January 13\u201319). RandLA-Net: Efficient semantic segmentation of large scale point clouds. Proceedings of the 2020 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA.","DOI":"10.1109\/CVPR42600.2020.01112"},{"key":"ref_34","doi-asserted-by":"crossref","unstructured":"Qi, C.R., Su, H., Nie\u00dfner, M., Dai, A., Yan, M., and Guibas, L.J. (2016, January 27\u201330). Volumetric and multi-view cnns for object classification on 3d data. Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, NV, USA.","DOI":"10.1109\/CVPR.2016.609"},{"key":"ref_35","unstructured":"Brabandere, B.D., Neven, D., and Gool, L.V. (2017, January 21\u201326). Semantic instance segmentation for autonomous driving. Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW), Honolulu, HI, USA."},{"key":"ref_36","doi-asserted-by":"crossref","first-page":"603","DOI":"10.1109\/34.1000236","article-title":"Mean shift: A robust approach toward feature space analysis","volume":"5","author":"Comaniciu","year":"2002","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"ref_37","doi-asserted-by":"crossref","unstructured":"Rusu, R.B., and Cousins, S. (2011, January 9\u201313). 3D is here: Point Cloud Library (PCL). Proceedings of the 2011 IEEE International Conference on Robotics and Automation, Shanghai, China.","DOI":"10.1109\/ICRA.2011.5980567"},{"key":"ref_38","unstructured":"Rusu, R.B., Blodow, N., Marton, Z., Soos, A., and Beetz, M. (November, January 29). Towards 3D Object Maps for Autonomous Household RobotsIn. Proceedings of the 2007 IEEE\/RSJ International Conference on Intelligent Robots and Systems, San Diego, CA, USA."},{"key":"ref_39","doi-asserted-by":"crossref","unstructured":"Liu, D., Arai, S., Miao, J., Kinugawa, J., Wang, Z., and Kosuge, K. (2018). Point pair feature-based pose estimation with multiple edge appearance models (PPF-MEAM) for robotic bin picking. Sensors, 8.","DOI":"10.3390\/s18082719"},{"key":"ref_40","doi-asserted-by":"crossref","unstructured":"Li, M., and Hashimoto, K. (2017). Curve Set Feature-based Robust and Fast Pose Estimation Algorithm. Sensors, 17.","DOI":"10.3390\/s17081782"},{"key":"ref_41","doi-asserted-by":"crossref","unstructured":"Hinterstoisser, S., Lepetit, V., Ilic, S., Holzer, S., Bradski, G., Konolige, K., and Navab, N. (2012). Model based training, detection and pose estimation of texture-less 3d objects in heavily cluttered scenes. Computer Vision\u2014ECCV 2012, Springer.","DOI":"10.1007\/978-3-642-33885-4_60"},{"key":"ref_42","unstructured":"Paszke, A., Gross, S., Massa, F., Lerer, A., Bradbury, J., Chanan, G., Killeen, T., Lin, Z., Gimelshein, N., and Antiga, L. (2019, January 8\u201314). PyTorch: An imperative style, high-performance deep learning library. Proceedings of the Advances in Neural Information Processing Systems 32 (NeurIPS 2019), Vancouver, BC, Canada."},{"key":"ref_43","doi-asserted-by":"crossref","unstructured":"He, K., Zhang, X., Ren, S., and Sun, J. (2016, January 27\u201330). Deep residual learning for image recognition. Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, NV, USA.","DOI":"10.1109\/CVPR.2016.90"},{"key":"ref_44","doi-asserted-by":"crossref","unstructured":"Zhao, H., Shi, J., Qi, X., Wang, X., and Jia, J. (2017, January 21\u201326). Pyramid scene parsing network. Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, USA.","DOI":"10.1109\/CVPR.2017.660"},{"key":"ref_45","doi-asserted-by":"crossref","unstructured":"Xu, D., Anguelov, D., and Jain, A. (2018, January 28\u201323). PointFusion: Deep sensor fusion for 3D bounding box estimation. Proceedings of the 2018 IEEE\/CVF Conference on Computer Vision and Pattern Recognition, Salt Lake City, UT, USA.","DOI":"10.1109\/CVPR.2018.00033"},{"key":"ref_46","doi-asserted-by":"crossref","unstructured":"Chen, W., Jia, X., Chang, H.J., and Duan, J. (2020, January 13\u201319). G2l-net: Global to local network for real-time 6d pose estimation with embedding vector features. Proceedings of the 2020 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA.","DOI":"10.1109\/CVPR42600.2020.00429"},{"key":"ref_47","doi-asserted-by":"crossref","unstructured":"Zakharov, S., Shugurov, I., and Ilic, S. (November, January 27). DPOD: 6D pose object detector and refiner. Proceedings of the 2019 IEEE\/CVF International Conference on Computer Vision (ICCV), Seoul, Republic of Korea.","DOI":"10.1109\/ICCV.2019.00203"}],"container-title":["Entropy"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/www.mdpi.com\/1099-4300\/26\/12\/1022\/pdf","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,10,10]],"date-time":"2025-10-10T16:39:53Z","timestamp":1760114393000},"score":1,"resource":{"primary":{"URL":"https:\/\/www.mdpi.com\/1099-4300\/26\/12\/1022"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,11,26]]},"references-count":47,"journal-issue":{"issue":"12","published-online":{"date-parts":[[2024,12]]}},"alternative-id":["e26121022"],"URL":"https:\/\/doi.org\/10.3390\/e26121022","relation":{},"ISSN":["1099-4300"],"issn-type":[{"value":"1099-4300","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024,11,26]]}}}