{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,28]],"date-time":"2026-04-28T20:19:48Z","timestamp":1777407588485,"version":"3.51.4"},"reference-count":20,"publisher":"Emerald","issue":"1","license":[{"start":{"date-parts":[[2024,7,16]],"date-time":"2024-07-16T00:00:00Z","timestamp":1721088000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.emerald.com\/insight\/site-policies"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IR"],"published-print":{"date-parts":[[2025,1,27]]},"abstract":"<jats:sec>\n<jats:title content-type=\"abstract-subheading\">Purpose<\/jats:title>\n<jats:p>Robotic arms play a crucial role in various industrial operations, such as sorting, assembly, handling and spraying. However, traditional robotic arm control algorithms often struggle to adapt when faced with the challenge of dynamic obstacles. This paper aims to propose a dynamic obstacle avoidance method based on reinforcement learning to address real-time processing of dynamic obstacles.<\/jats:p>\n<\/jats:sec>\n<jats:sec>\n<jats:title content-type=\"abstract-subheading\">Design\/methodology\/approach<\/jats:title>\n<jats:p>This paper introduces an innovative method that introduces a feature extraction network that integrates gating mechanisms on the basis of traditional reinforcement learning algorithms. Additionally, an adaptive dynamic reward mechanism is designed to optimize the obstacle avoidance strategy.<\/jats:p>\n<\/jats:sec>\n<jats:sec>\n<jats:title content-type=\"abstract-subheading\">Findings<\/jats:title>\n<jats:p>Validation through the CoppeliaSim simulation environment and on-site testing has demonstrated the method's capability to effectively evade randomly moving obstacles, with a significant improvement in the convergence speed compared to traditional algorithms.<\/jats:p>\n<\/jats:sec>\n<jats:sec>\n<jats:title content-type=\"abstract-subheading\">Originality\/value<\/jats:title>\n<jats:p>The proposed dynamic obstacle avoidance method based on Reinforcement Learning not only accomplishes the task of dynamic obstacle avoidance efficiently but also offers a distinct advantage in terms of convergence speed. This approach provides a novel solution to the obstacle avoidance methods for robotic arms.<\/jats:p>\n<\/jats:sec>","DOI":"10.1108\/ir-05-2024-0206","type":"journal-article","created":{"date-parts":[[2024,7,15]],"date-time":"2024-07-15T07:58:29Z","timestamp":1721030309000},"page":"9-17","source":"Crossref","is-referenced-by-count":7,"title":["An obstacle avoidance method for robotic arm based on reinforcement learning"],"prefix":"10.1108","volume":"52","author":[{"given":"Peng","family":"Wu","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Heng","family":"Su","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Hao","family":"Dong","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Tengfei","family":"Liu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Min","family":"Li","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zhihao","family":"Chen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"140","published-online":{"date-parts":[[2024,7,16]]},"reference":[{"issue":"2","key":"key2025012405290698700_ref001","doi-asserted-by":"crossref","first-page":"1017","DOI":"10.1016\/j.ifacol.2023.10.1698","article-title":"Informed circular fields for global reactive obstacle avoidance of robotic manipulators","volume":"56","year":"2023","journal-title":"IFAC-PapersOnLine"},{"key":"key2025012405290698700_ref002","doi-asserted-by":"crossref","first-page":"64","DOI":"10.1016\/j.neucom.2022.05.006","article-title":"A deep reinforcement learning based method for real-time path planning and dynamic obstacle avoidance","volume":"497","year":"2022","journal-title":"Neurocomputing"},{"issue":"1","key":"key2025012405290698700_ref003","doi-asserted-by":"crossref","first-page":"80","DOI":"10.1504\/IJAAC.2020.103797","article-title":"Synthesise of MPC controller for uncertain systems subject to input and output constraints: application to anthropomorphic robot arm","volume":"14","year":"2020","journal-title":"International Journal of Automation and Control"},{"key":"key2025012405290698700_ref004","doi-asserted-by":"crossref","first-page":"106099","DOI":"10.1016\/j.engappai.2023.106099","article-title":"Trajectory planning for a 6-axis robotic arm with particle swarm optimization algorithm","volume":"122","year":"2023","journal-title":"Engineering Applications of Artificial Intelligence"},{"issue":"8","key":"key2025012405290698700_ref005","doi-asserted-by":"crossref","first-page":"101650","DOI":"10.1016\/j.jksuci.2023.101650","article-title":"Path planning algorithm of robot arm based on improved RRT* and BP neural network algorithm","volume":"35","year":"2023","journal-title":"Journal of King Saud University \u2013 Computer and Information Sciences"},{"key":"key2025012405290698700_ref006","first-page":"1861","article-title":"Soft actor-critic: off-policy maximum entropy deep reinforcement learning with a stochastic actor","volume-title":"International Conference on Machine Learning","year":"2018"},{"key":"key2025012405290698700_ref007","first-page":"1","article-title":"Collision-Free motion planning for multiple robot arms by combining deep q-network and graph search algorithm","volume-title":"2023 IEEE 19th International Conference on Automation Science and Engineering (CASE)","year":"2023"},{"issue":"2","key":"key2025012405290698700_ref008","doi-asserted-by":"publisher","first-page":"203","DOI":"10.1007\/s41315-021-00177-0","article-title":"A survey on visual servoing for wheeled mobile robots","volume":"5","year":"2021","journal-title":"International Journal of Intelligent Robotics and Applications"},{"issue":"6","key":"key2025012405290698700_ref009","first-page":"123","article-title":"Continuous control with deep reinforcement learning","volume":"10","year":"2015","journal-title":"Journal of Computer Science"},{"issue":"4","key":"key2025012405290698700_ref010","doi-asserted-by":"crossref","first-page":"3513","DOI":"10.1109\/LRA.2019.2927956","article-title":"Timed-elastic bands for manipulation motion planning","volume":"4","year":"2019","journal-title":"IEEE Robotics and Automation Letters"},{"key":"key2025012405290698700_ref011","first-page":"1312","article-title":"Playing atari with deep reinforcement learning","year":"2013","journal-title":"Arxiv Preprint Arxiv"},{"issue":"1","key":"key2025012405290698700_ref012","doi-asserted-by":"publisher","DOI":"10.1146\/annurev-control-061623-094742","article-title":"Sampling-based motion planning: a comparative review","volume":"7","year":"2023","journal-title":"Annual Review of Control, Robotics, and Autonomous Systems"},{"key":"key2025012405290698700_ref013","first-page":"372","article-title":"Forward and inverse kinematics modeling and simulation of six-axis joint robot arm based on exponential product method","year":"2020"},{"issue":"8","key":"key2025012405290698700_ref014","doi-asserted-by":"crossref","first-page":"2095","DOI":"10.1007\/s12555-019-0076-7","article-title":"Trajectory planning with collision avoidance for redundant robots using jacobian and artificial potential field-based real-time inverse kinematics","volume":"18","year":"2020","journal-title":"International Journal of Control, Automation and Systems"},{"issue":"6","key":"key2025012405290698700_ref015","doi-asserted-by":"crossref","first-page":"337","DOI":"10.1177\/02783649221083331","article-title":"Hybrid control for combining model-based and model-free reinforcement learning","volume":"42","year":"2023","journal-title":"The International Journal of Robotics Research"},{"issue":"2","key":"key2025012405290698700_ref016","first-page":"397","article-title":"Self-configuring robot path planning with obstacle avoidance via deep reinforcement learning","volume":"5","year":"2020","journal-title":"IEEE Control Systems Letters"},{"issue":"18","key":"key2025012405290698700_ref017","doi-asserted-by":"crossref","first-page":"205","DOI":"10.3901\/JME.2020.18.205","article-title":"Improved A-star algorithm for safety insured optimal path with smoothed corner turns","volume":"56","year":"2020","journal-title":"Journal of Mechanical Engineering"},{"issue":"1","key":"key2025012405290698700_ref018","doi-asserted-by":"crossref","first-page":"107","DOI":"10.1109\/TITS.2019.2954952","article-title":"Memory-based deep reinforcement learning for obstacle avoidance in UAV with limited environment knowledge","volume":"22","year":"2021","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"issue":"3","key":"key2025012405290698700_ref019","doi-asserted-by":"publisher","first-page":"305","DOI":"10.1177\/02783649231210325","article-title":"DUEL: depth visUal ego-motion learning for autonomous robot obstacle avoidance","volume":"43","year":"2024","journal-title":"The International Journal of Robotics Research"},{"issue":"4","key":"key2025012405290698700_ref020","doi-asserted-by":"crossref","first-page":"1159","DOI":"10.18494\/SAM.2020.2540","article-title":"Research on obstacle avoidance method for mobile robot based on multisensor information fusion","volume":"32","year":"2020","journal-title":"Sensors and Materials"}],"container-title":["Industrial Robot: the international journal of robotics research and application"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/www.emerald.com\/insight\/content\/doi\/10.1108\/IR-05-2024-0206\/full\/xml","content-type":"application\/xml","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/www.emerald.com\/insight\/content\/doi\/10.1108\/IR-05-2024-0206\/full\/html","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,7,24]],"date-time":"2025-07-24T21:39:12Z","timestamp":1753393152000},"score":1,"resource":{"primary":{"URL":"http:\/\/www.emerald.com\/ir\/article\/52\/1\/9-17\/1242411"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,7,16]]},"references-count":20,"journal-issue":{"issue":"1","published-online":{"date-parts":[[2024,7,16]]},"published-print":{"date-parts":[[2025,1,27]]}},"alternative-id":["10.1108\/IR-05-2024-0206"],"URL":"https:\/\/doi.org\/10.1108\/ir-05-2024-0206","relation":{},"ISSN":["0143-991X","1758-5791"],"issn-type":[{"value":"0143-991X","type":"print"},{"value":"1758-5791","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024,7,16]]}}}