{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,13]],"date-time":"2026-03-13T21:00:42Z","timestamp":1773435642713,"version":"3.50.1"},"reference-count":57,"publisher":"Springer Science and Business Media LLC","issue":"3","license":[{"start":{"date-parts":[[2024,12,20]],"date-time":"2024-12-20T00:00:00Z","timestamp":1734652800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,12,20]],"date-time":"2024-12-20T00:00:00Z","timestamp":1734652800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["52175471"],"award-info":[{"award-number":["52175471"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100007129","name":"Natural Science Foundation of Shandong Province","doi-asserted-by":"publisher","award":["ZR2021MF110"],"award-info":[{"award-number":["ZR2021MF110"]}],"id":[{"id":"10.13039\/501100007129","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Appl Intell"],"published-print":{"date-parts":[[2025,2]]},"DOI":"10.1007\/s10489-024-06098-2","type":"journal-article","created":{"date-parts":[[2024,12,20]],"date-time":"2024-12-20T18:36:24Z","timestamp":1734719784000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":5,"title":["A robot path tracking method based on manual guidance and path reinforcement learning"],"prefix":"10.1007","volume":"55","author":[{"given":"Yong","family":"Pan","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-3185-1062","authenticated-orcid":false,"given":"Chengjun","family":"Chen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Dongnian","family":"Li","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zhengxu","family":"Zhao","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2024,12,20]]},"reference":[{"key":"6098_CR1","doi-asserted-by":"crossref","first-page":"102619","DOI":"10.1016\/j.rcim.2023.102619","volume":"85","author":"W Deng","year":"2024","unstructured":"Deng W, Liu Q, Pham DT, Hu J, Lam KM, Wang Y, Zhou Z (2024) Predictive exposure control for vision-based robotic disassembly using deep learning and predictive learning. Rob Comput-Integrat Manuf 85:102619","journal-title":"Rob Comput-Integrat Manuf"},{"issue":"2","key":"6098_CR2","doi-asserted-by":"crossref","first-page":"425","DOI":"10.1007\/s10845-021-01885-x","volume":"33","author":"C Yuan","year":"2022","unstructured":"Yuan C, Li G, Kamarthi S, Jin X, Moghaddam M (2022) Trends in intelligent manufacturing research: a keyword co-occurrence network based review. J Intell Manuf 33(2):425\u2013439","journal-title":"J Intell Manuf"},{"key":"6098_CR3","doi-asserted-by":"crossref","first-page":"471","DOI":"10.1016\/j.jmsy.2022.05.005","volume":"63","author":"B Wang","year":"2022","unstructured":"Wang B, Zheng P, Yin Y, Shih A, Wang L (2022) Toward human-centric smart manufacturing: A human-cyber-physical systems (HCPS) perspective. J Manuf Syst 63:471\u2013490","journal-title":"J Manuf Syst"},{"key":"6098_CR4","doi-asserted-by":"crossref","first-page":"102351","DOI":"10.1016\/j.rcim.2022.102351","volume":"77","author":"C Yang","year":"2022","unstructured":"Yang C, Wang Y, Lan S, Wang L, Shen W, Huang GQ (2022) Cloud-edge-device collaboration mechanisms of deep learning models for smart robots in mass personalization. Robot Comput-Integrat Manuf 77:102351","journal-title":"Robot Comput-Integrat Manuf"},{"key":"6098_CR5","doi-asserted-by":"crossref","first-page":"1038658","DOI":"10.3389\/frobt.2023.1038658","volume":"10","author":"Z Xie","year":"2023","unstructured":"Xie Z, Liang X, Roberto C (2023) Learning-based robotic grasping: A review. Frontiers in Robotics and AI 10:1038658","journal-title":"Frontiers in Robotics and AI"},{"key":"6098_CR6","doi-asserted-by":"crossref","first-page":"102644","DOI":"10.1016\/j.rcim.2023.102644","volume":"86","author":"Y Huang","year":"2024","unstructured":"Huang Y, Liu D, Liu Z, Wang K, Wang Q, Tan J (2024) A novel robotic grasping method for moving objects based on multi-agent deep reinforcement learning. Robot Comput-Integrat Manuf 86:102644","journal-title":"Robot Comput-Integrat Manuf"},{"issue":"8","key":"6098_CR7","doi-asserted-by":"crossref","first-page":"1175","DOI":"10.1007\/s10514-023-10112-w","volume":"47","author":"X Zhu","year":"2023","unstructured":"Zhu X, Wang D, Su G, Biza O, Walters R, Platt R (2023) On robot grasp learning using equivariant models. Auton Robot 47(8):1175\u20131193","journal-title":"Auton Robot"},{"issue":"24","key":"6098_CR8","doi-asserted-by":"crossref","first-page":"30677","DOI":"10.1007\/s10489-023-05156-5","volume":"53","author":"C Chen","year":"2023","unstructured":"Chen C, Zhang C, Pan Y (2023) Active compliance control of robot peg-in-hole assembly based on combined reinforcement learning. Appl Intell 53(24):30677\u201330690","journal-title":"Appl Intell"},{"issue":"6","key":"6098_CR9","doi-asserted-by":"crossref","first-page":"4713","DOI":"10.1007\/s10489-024-05417-x","volume":"54","author":"C Wang","year":"2024","unstructured":"Wang C, Lin Z, Liu B, Su C, Chen G, Xie L (2024) Task attention-based multimodal fusion and curriculum residual learning for context generalization in robotic assembly. Appl Intell 54(6):4713\u20134735","journal-title":"Appl Intell"},{"key":"6098_CR10","doi-asserted-by":"crossref","first-page":"1280773","DOI":"10.3389\/fnbot.2023.1280773","volume":"17","author":"P Jin","year":"2023","unstructured":"Jin P, Lin Y, Song Y, Li T, Yang W (2023) Vision-force-fused curriculum learning for robotic contact-rich assembly tasks. Front Neurorobot 17:1280773","journal-title":"Front Neurorobot"},{"key":"6098_CR11","doi-asserted-by":"crossref","unstructured":"Guo Q, Yang Z, Xu J, Jiang Y, Wang W, Liu Z, Sun Y (2024) Progress, challenges and trends on vision sensing technologies in automatic\/intelligent robotic welding: State-of-the-art review.\u00a0Robot Comput Integr Manuf\u00a089:102767","DOI":"10.1016\/j.rcim.2024.102767"},{"key":"6098_CR12","doi-asserted-by":"crossref","first-page":"112551","DOI":"10.1016\/j.sna.2021.112551","volume":"320","author":"Y Xu","year":"2021","unstructured":"Xu Y, Wang Z (2021) Visual sensing technologies in robotic welding: Recent research developments and future interests. Sens Actuators, A 320:112551","journal-title":"Sens Actuators, A"},{"key":"6098_CR13","doi-asserted-by":"crossref","first-page":"107535","DOI":"10.1016\/j.engappai.2023.107535","volume":"128","author":"S Yu","year":"2024","unstructured":"Yu S, Guan Y, Hu J, Hong J, Zhu H, Zhang T (2024) Unified seam tracking algorithm via three-point weld representation for autonomous robotic welding. Eng Appl Artif Intell 128:107535","journal-title":"Eng Appl Artif Intell"},{"key":"6098_CR14","doi-asserted-by":"crossref","first-page":"101929","DOI":"10.1016\/j.rcim.2019.101929","volume":"64","author":"L Yang","year":"2020","unstructured":"Yang L, Liu Y, Peng J, Liang Z (2020) A novel system for off-line 3D seam extraction and path planning based on point cloud segmentation for arc welding robot. Robot Comput-Integrat Manufact 64:101929","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR15","doi-asserted-by":"crossref","first-page":"102702","DOI":"10.1016\/j.rcim.2023.102702","volume":"87","author":"Y Geng","year":"2024","unstructured":"Geng Y, Zhang Y, Tian X, Zhou L (2024) A novel 3D vision-based robotic welding path extraction method for complex intersection curves. Robot Comput-Integrat Manufact 87:102702","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR16","doi-asserted-by":"crossref","first-page":"102433","DOI":"10.1016\/j.rcim.2022.102433","volume":"79","author":"Y Geng","year":"2023","unstructured":"Geng Y, Lai M, Tian X, Xu X, Jiang Y, Zhang Y (2023) A novel seam extraction and path planning method for robotic welding of medium-thickness plate structural parts based on 3D vision. Robot Comput-Integrat Manuf 79:102433","journal-title":"Robot Comput-Integrat Manuf"},{"issue":"3","key":"6098_CR17","doi-asserted-by":"crossref","first-page":"5002","DOI":"10.1109\/LRA.2021.3070828","volume":"6","author":"P Zhou","year":"2021","unstructured":"Zhou P, Peng R, Xu M, Wu V, Navarro-Alarcon D (2021) Path planning with automatic seam extraction over point cloud models for robotic arc welding. IEEE Robot Autom Lett 6(3):5002\u20135009","journal-title":"IEEE Robot Autom Lett"},{"key":"6098_CR18","doi-asserted-by":"crossref","first-page":"102393","DOI":"10.1016\/j.rcim.2022.102393","volume":"78","author":"R Xiao","year":"2022","unstructured":"Xiao R, Xu Y, Hou Z, Xu F, Zhang H, Chen S (2022) A novel visual guidance framework for robotic welding based on binocular cooperation. Robot Comput-Integrat Manuf 78:102393","journal-title":"Robot Comput-Integrat Manuf"},{"key":"6098_CR19","doi-asserted-by":"crossref","unstructured":"Zhou P, Zheng P, Qi J, Li C, Duan A, Xu M, Navarro-Alarcon D (2023) Neural reactive path planning with Riemannian motion policies for robotic silicone sealing.\u00a0Robot Comput Integr Manuf 81:102518","DOI":"10.1016\/j.rcim.2022.102518"},{"key":"6098_CR20","doi-asserted-by":"crossref","first-page":"75","DOI":"10.1016\/j.cirpj.2022.11.003","volume":"40","author":"C Li","year":"2023","unstructured":"Li C, Zheng P, Yin Y, Wang B, Wang L (2023) Deep reinforcement learning in smart manufacturing: A review and prospects. CIRP J Manuf Sci Technol 40:75\u2013101","journal-title":"CIRP J Manuf Sci Technol"},{"key":"6098_CR21","doi-asserted-by":"crossref","first-page":"102130","DOI":"10.1016\/j.rcim.2021.102130","volume":"71","author":"A Maldonado-Ramirez","year":"2021","unstructured":"Maldonado-Ramirez A, Rios-Cabrera R, Lopez-Juarez I (2021) A visual path-following learning approach for industrial robots using DRL. Robot Comput-Integrat Manufact 71:102130","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR22","doi-asserted-by":"crossref","first-page":"122003","DOI":"10.1016\/j.eswa.2023.122003","volume":"238","author":"T Zhang","year":"2024","unstructured":"Zhang T, Chu H, Zou Y, Sun H (2024) A robust electromyography signals-based interaction interface for human-robot collaboration in 3D operation scenarios. Expert Syst Appl 238:122003","journal-title":"Expert Syst Appl"},{"key":"6098_CR23","doi-asserted-by":"crossref","unstructured":"Calandra D, Prattic\u00f2 FG, Cannav\u00f2 A, Casetti C, Lamberti F (2022) Digital twin-and extended reality-based telepresence for collaborative robot programming in the 6g perspective.\u00a0Digit Commun Netw\u00a010(2):315\u2013327","DOI":"10.1016\/j.dcan.2022.10.007"},{"key":"6098_CR24","doi-asserted-by":"crossref","first-page":"102920","DOI":"10.1016\/j.mechatronics.2022.102920","volume":"89","author":"F Ferraguti","year":"2023","unstructured":"Ferraguti F, Villani V, Storchi C (2023) MyWelder: A collaborative system for intuitive robot-assisted welding. Mechatronics 89:102920","journal-title":"Mechatronics"},{"key":"6098_CR25","doi-asserted-by":"crossref","first-page":"102234","DOI":"10.1016\/j.rcim.2021.102234","volume":"73","author":"D Fogli","year":"2022","unstructured":"Fogli D, Gargioni L, Guida G, Tampalini F (2022) A hybrid approach to user-oriented programming of collaborative robots. Robot Comput-Integrat Manufact 73:102234","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR26","doi-asserted-by":"crossref","first-page":"102596","DOI":"10.1016\/j.rcim.2023.102596","volume":"84","author":"D Sun","year":"2023","unstructured":"Sun D, Zhang P, Chen M (2023) A versatile interaction framework for robot programming based on hand gestures and poses. Robot Comput-Integrat Manuf 84:102596","journal-title":"Robot Comput-Integrat Manuf"},{"key":"6098_CR27","doi-asserted-by":"crossref","first-page":"102085","DOI":"10.1016\/j.rcim.2020.102085","volume":"68","author":"C Nuzzi","year":"2021","unstructured":"Nuzzi C, Pasinetti S, Pagani R, Ghidini S, Beschi M, Coffetti G, Sansoni G (2021) MEGURU: a gesture-based robot program builder for Meta-Collaborative workstations. Robot Comput-Integrat Manuf 68:102085","journal-title":"Robot Comput-Integrat Manuf"},{"key":"6098_CR28","doi-asserted-by":"crossref","first-page":"102492","DOI":"10.1016\/j.rcim.2022.102492","volume":"81","author":"Y Pan","year":"2023","unstructured":"Pan Y, Chen C, Zhao Z, Hu T, Zhang J (2023) Robot teaching system based on hand-robot contact state detection and motion intention recognition. Robot Comput-Integrat Manuf 81:102492","journal-title":"Robot Comput-Integrat Manuf"},{"key":"6098_CR29","doi-asserted-by":"crossref","unstructured":"Maurtua I, Fernandez I, Kildal J, Susperregi L, Tellaeche A, Ibarguren A (2016) Enhancing safe human-robot collaboration through natural multimodal communication. In: 2016 IEEE 21st International Conference on Emerging Technologies and Factory Automation (ETFA), Berlin, Germany, pp 1\u20138","DOI":"10.1109\/ETFA.2016.7733573"},{"key":"6098_CR30","doi-asserted-by":"crossref","first-page":"102304","DOI":"10.1016\/j.rcim.2021.102304","volume":"75","author":"J Fan","year":"2022","unstructured":"Fan J, Zheng P, Li S (2022) Vision-based holistic scene understanding towards proactive human\u2013robot collaboration. Robot Comput-Integrat Manuf 75:102304","journal-title":"Robot Comput-Integrat Manuf"},{"key":"6098_CR31","doi-asserted-by":"crossref","first-page":"101820","DOI":"10.1016\/j.rcim.2019.101820","volume":"61","author":"SK Ong","year":"2020","unstructured":"Ong SK, Yew AWW, Thanigaivel NK, Nee AY (2020) Augmented reality-assisted robot programming system for industrial applications. Robot Comput-Integrat Manufact 61:101820","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR32","doi-asserted-by":"crossref","first-page":"102770","DOI":"10.1016\/j.rcim.2024.102770","volume":"89","author":"M Kapinus","year":"2024","unstructured":"Kapinus M, Beran V, Materna Z, Bambu\u0161ek D (2024) Augmented reality spatial programming paradigm applied to end-user robot programming. Robot Comput-Integrat Manufact 89:102770","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR33","doi-asserted-by":"crossref","first-page":"101891","DOI":"10.1016\/j.rcim.2019.101891","volume":"63","author":"A Hietanen","year":"2020","unstructured":"Hietanen A, Pieters R, Lanz M, Latokartano J, K\u00e4m\u00e4r\u00e4inen JK (2020) AR-based interaction for human-robot collaborative manufacturing. Robot Comput-Integrat Manufact 63:101891","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR34","doi-asserted-by":"crossref","first-page":"37","DOI":"10.3389\/frobt.2019.00037","volume":"I","author":"D Aschenbrenner","year":"2019","unstructured":"Aschenbrenner D, Leutert F, \u00c7en\u00e7en A, Verlinden J, Schilling K, Latoschik M, Lukosch S (2019) Comparing human factors for augmented reality supported single-user and collaborative repair operations of industrial robots. Front Robot A I:37","journal-title":"Front Robot A"},{"key":"6098_CR35","doi-asserted-by":"crossref","first-page":"102836","DOI":"10.1016\/j.rcim.2024.102836","volume":"91","author":"SH Choi","year":"2025","unstructured":"Choi SH, Kim M, Lee JY (2025) Smart and user-centric manufacturing information recommendation using multimodal learning to support human-robot collaboration in mixed reality environments. Robot Comput-Integrat Manufact 91:102836","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR36","doi-asserted-by":"crossref","first-page":"102167","DOI":"10.1016\/j.rcim.2021.102167","volume":"71","author":"Y Pan","year":"2021","unstructured":"Pan Y, Chen C, Li D, Zhao Z, Hong J (2021) Augmented reality-based robot teleoperation system using RGB-D imaging and attitude teaching device. Robot Comput-Integrat Manufact 71:102167","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR37","doi-asserted-by":"crossref","first-page":"104385","DOI":"10.1016\/j.robot.2023.104385","volume":"164","author":"Y Lan","year":"2023","unstructured":"Lan Y, Ren J, Tang T, Xu X, Shi Y, Tang Z (2023) Efficient reinforcement learning with least-squares soft Bellman residual for robotic grasping. Robot Auton Syst 164:104385","journal-title":"Robot Auton Syst"},{"key":"6098_CR38","doi-asserted-by":"crossref","first-page":"72","DOI":"10.1016\/j.robot.2018.11.004","volume":"112","author":"Y Tsurumine","year":"2019","unstructured":"Tsurumine Y, Cui Y, Uchibe E, Matsubara T (2019) Deep reinforcement learning with smooth policy update: Application to robotic cloth manipulation. Robot Auton Syst 112:72\u201383","journal-title":"Robot Auton Syst"},{"key":"6098_CR39","unstructured":"Mnih V, Kavukcuoglu K, Silver D, Graves A, Antonoglou I, Wierstra D, Riedmiller M (2013) Playing atari with deep reinforcement learning. arXiv preprint arXiv:1312.5602.\u00a0Accessed Oct 2023"},{"key":"6098_CR40","doi-asserted-by":"crossref","first-page":"108372","DOI":"10.1016\/j.ymssp.2021.108372","volume":"165","author":"Y Zou","year":"2022","unstructured":"Zou Y, Chen T, Chen X, Li J (2022) Robotic seam tracking system combining convolution filter and deep reinforcement learning. Mech Syst Signal Process 165:108372","journal-title":"Mech Syst Signal Process"},{"key":"6098_CR41","doi-asserted-by":"crossref","first-page":"102321","DOI":"10.1016\/j.rcim.2022.102321","volume":"76","author":"C Li","year":"2022","unstructured":"Li C, Zheng P, Li S, Pang Y, Lee CK (2022) AR-assisted digital twin-enabled robot collaborative manufacturing system with human-in-the-loop. Robot Comput-Integrat Manufact 76:102321","journal-title":"Robot Comput-Integrat Manufact"},{"key":"6098_CR42","unstructured":"Schulman J, Wolski F, Dhariwal P, Radford A, Klimov O (2017) Proximal policy optimization algorithms. arXiv preprint arXiv:1707.06347.\u00a0Accessed Oct 2023"},{"issue":"1","key":"6098_CR43","first-page":"741","volume":"35","author":"H Zhao","year":"2021","unstructured":"Zhao H, She Q, Zhu C, Yang Y, Xu K (2021) Online 3D bin packing with constrained deep reinforcement learning. Proceed AAAI Conf Artif Intell 35(1):741\u2013749","journal-title":"Proceed AAAI Conf Artif Intell"},{"key":"6098_CR44","doi-asserted-by":"crossref","first-page":"67","DOI":"10.1016\/j.patrec.2017.06.017","volume":"105","author":"A Jevti\u0107","year":"2018","unstructured":"Jevti\u0107 A, Colom\u00e9 A, Alenya G, Torras C (2018) Robot motion adaptation through user intervention and reinforcement learning. Pattern Recogn Lett 105:67\u201375","journal-title":"Pattern Recogn Lett"},{"key":"6098_CR45","doi-asserted-by":"crossref","first-page":"121198","DOI":"10.1016\/j.eswa.2023.121198","volume":"243","author":"H Jeon","year":"2024","unstructured":"Jeon H, Kim DW, Kang BY (2024) Deep reinforcement learning for cooperative robots based on adaptive sentiment feedback. Expert Syst Appl 243:121198","journal-title":"Expert Syst Appl"},{"key":"6098_CR46","doi-asserted-by":"crossref","unstructured":"Zheng P, Li C, Fan J, Wang L (2024) A vision-language-guided and deep reinforcement learning-enabled approach for unstructured human-robot collaborative manufacturing task fulfilment. CIRP Annals\u00a073(1):341\u2013344","DOI":"10.1016\/j.cirp.2024.04.003"},{"key":"6098_CR47","doi-asserted-by":"crossref","first-page":"75","DOI":"10.1016\/j.eng.2022.05.017","volume":"21","author":"J Wu","year":"2023","unstructured":"Wu J, Huang Z, Hu Z, Lv C (2023) Toward human-in-the-loop AI: Enhancing deep reinforcement learning via real-time human guidance for autonomous driving. Engineering 21:75\u201391","journal-title":"Engineering"},{"key":"6098_CR48","doi-asserted-by":"crossref","unstructured":"Tobin J, Fong R, Ray A, Schneider J, Zaremba W, Abbeel P (2017) Domain randomization for transferring deep neural networks from simulation to the real world. In: 2017 IEEE\/RSJ international conference on intelligent robots and systems (IROS), BC, Canada, pp 23\u201330\u00a0","DOI":"10.1109\/IROS.2017.8202133"},{"key":"6098_CR49","doi-asserted-by":"crossref","unstructured":"Lew T, Singh S, Prats M, Bingham J, Weisz J, Holson B, ..., Gonzalez M (2023) Robotic table wiping via reinforcement learning and whole-body trajectory optimization. In: 2023 IEEE International Conference on Robotics and Automation (ICRA), London, United Kingdom, pp 7184\u20137190","DOI":"10.1109\/ICRA48891.2023.10161283"},{"key":"6098_CR50","doi-asserted-by":"crossref","unstructured":"Su Z, Liu W, Yu Z, Hu D, Liao Q, Tian Q, Liu L (2021) Pixel difference networks for efficient edge detection. In: Proceedings of the IEEE\/CVF international conference on computer vision. pp 5117\u20135127","DOI":"10.1109\/ICCV48922.2021.00507"},{"issue":"5","key":"6098_CR51","doi-asserted-by":"crossref","first-page":"898","DOI":"10.1109\/TPAMI.2010.161","volume":"33","author":"P Arbelaez","year":"2010","unstructured":"Arbelaez P, Maire M, Fowlkes C, Malik J (2010) Contour detection and hierarchical image segmentation. IEEE Trans Pattern Anal Mach Intell 33(5):898\u2013916","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"6098_CR52","doi-asserted-by":"crossref","first-page":"85","DOI":"10.1016\/j.softx.2018.12.005","volume":"9","author":"OR Bingol","year":"2019","unstructured":"Bingol OR, Krishnamurthy A (2019) NURBS-Python: An open-source object-oriented NURBS modeling framework in Python. SoftwareX 9:85\u201394","journal-title":"SoftwareX"},{"key":"6098_CR53","unstructured":"Dadashi R, Hussenot L, Vincent D, Girgin S, Raichuk A, Geist M, Pietquin O (2021) Continuous control with action quantization from demonstrations. arXiv preprint arXiv:2110.10149. Accessed Oct 2023"},{"issue":"7\u20139","key":"6098_CR54","doi-asserted-by":"crossref","first-page":"1180","DOI":"10.1016\/j.neucom.2007.11.026","volume":"71","author":"J Peters","year":"2008","unstructured":"Peters J, Schaal S (2008) Natural actor-critic. Neurocomputing 71(7\u20139):1180\u20131190","journal-title":"Neurocomputing"},{"key":"6098_CR55","unstructured":"Kakade SM (2001) A natural policy gradient.\u00a0Adv Neural\u00a0Inf\u00a0Process Syst\u00a014:1531\u20131538"},{"key":"6098_CR56","doi-asserted-by":"crossref","unstructured":"Huang S, Onta\u00f1\u00f3n S (2020) A closer look at invalid action masking in policy gradient algorithms. arXiv preprint arXiv:2006.14171.\u00a0Accessed Oct 2023","DOI":"10.32473\/flairs.v35i.130584"},{"issue":"268","key":"6098_CR57","first-page":"1","volume":"22","author":"A Raffin","year":"2021","unstructured":"Raffin A, Hill A, Gleave A, Kanervisto A, Ernestus M, Dormann N (2021) Stable-baselines3: Reliable reinforcement learning implementations. J Mach Learn Res 22(268):1\u20138","journal-title":"J Mach Learn Res"}],"container-title":["Applied Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-024-06098-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10489-024-06098-2\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-024-06098-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,1,30]],"date-time":"2025-01-30T16:05:43Z","timestamp":1738253143000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10489-024-06098-2"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,12,20]]},"references-count":57,"journal-issue":{"issue":"3","published-print":{"date-parts":[[2025,2]]}},"alternative-id":["6098"],"URL":"https:\/\/doi.org\/10.1007\/s10489-024-06098-2","relation":{},"ISSN":["0924-669X","1573-7497"],"issn-type":[{"value":"0924-669X","type":"print"},{"value":"1573-7497","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024,12,20]]},"assertion":[{"value":"20 November 2024","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"20 December 2024","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}],"article-number":"197"}}