{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,2]],"date-time":"2025-12-02T14:33:53Z","timestamp":1764686033314,"version":"3.46.0"},"reference-count":45,"publisher":"Springer Science and Business Media LLC","issue":"11","license":[{"start":{"date-parts":[[2025,10,14]],"date-time":"2025-10-14T00:00:00Z","timestamp":1760400000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,10,14]],"date-time":"2025-10-14T00:00:00Z","timestamp":1760400000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["52362047, 72361017"],"award-info":[{"award-number":["52362047, 72361017"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Gansu Provincial Department of Education : Excellent Graduate Student \u201dInnovation Star\u201d Project","award":["2023CXZX-523"],"award-info":[{"award-number":["2023CXZX-523"]}]},{"name":"Excellent Doctoral Program of Gansu Province","award":["23JRRA906"],"award-info":[{"award-number":["23JRRA906"]}]},{"name":"Major Research Plan of Gansu Province","award":["21YF5GA052"],"award-info":[{"award-number":["21YF5GA052"]}]},{"name":"2021 Gansu Higher Education Industry Support Plan","award":["2021CYZC-60"],"award-info":[{"award-number":["2021CYZC-60"]}]},{"name":"\u201dDouble-First Class\u201d Major Research Programs, Educational Department of Gansu Province","award":["GSSYLXM-04)"],"award-info":[{"award-number":["GSSYLXM-04)"]}]},{"name":"the Central Leading Local Science and Technology Development Fund Project","award":["22ZY1QA005"],"award-info":[{"award-number":["22ZY1QA005"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Mach Learn"],"published-print":{"date-parts":[[2025,11]]},"DOI":"10.1007\/s10994-025-06887-x","type":"journal-article","created":{"date-parts":[[2025,10,14]],"date-time":"2025-10-14T16:04:19Z","timestamp":1760457859000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["ST-PPO: a spatio-temporal attention enhanced proximal policy optimization algorithm for autonomous driving in complex traffic scenarios"],"prefix":"10.1007","volume":"114","author":[{"given":"Cheng","family":"Da","sequence":"first","affiliation":[]},{"given":"Yongsheng","family":"Qian","sequence":"additional","affiliation":[]},{"given":"Junwei","family":"Zeng","sequence":"additional","affiliation":[]},{"given":"Xunting","family":"Wei","sequence":"additional","affiliation":[]},{"given":"Futao","family":"Zhang","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2025,10,14]]},"reference":[{"issue":"6","key":"6887_CR1","doi-asserted-by":"crossref","first-page":"7123","DOI":"10.1109\/TPAMI.2022.3223908","volume":"45","author":"M Bojarski","year":"2023","unstructured":"Bojarski, M., Chen, C., & Daw, A. (2023). End-to-end learning for autonomous driving: Challenges and opportunities. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(6), 7123\u20137142.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"issue":"12","key":"6887_CR2","first-page":"4271","volume":"20","author":"C Chen","year":"2019","unstructured":"Chen, C., Seff, A., Kornhauser, A., & Xiao, J. (2019). Deep reinforcement learning for automated vehicle control: A survey. IEEE Transactions on Intelligent Transportation Systems, 20(12), 4271\u20134290.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"issue":"6","key":"6887_CR3","first-page":"5638","volume":"23","author":"J Chen","year":"2021","unstructured":"Chen, J., Li, S. E., & Tomizuka, M. (2021). Interpretable end-to-end urban autonomous driving with latent deep reinforcement learning. IEEE Transactions on Intelligent Transportation Systems, 23(6), 5638\u20135651.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"issue":"4","key":"6887_CR4","first-page":"4773","volume":"45","author":"Q Chen","year":"2022","unstructured":"Chen, Q., Xu, J., & Koltun, V. (2022). A survey on deep learning for autonomous driving. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(4), 4773\u20134799.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"issue":"2","key":"6887_CR5","doi-asserted-by":"crossref","first-page":"1208","DOI":"10.1109\/COMST.2023.3263921","volume":"25","author":"S Chen","year":"2023","unstructured":"Chen, S., Liu, S., & Yao, S. (2023). Deep reinforcement learning for autonomous driving: A comprehensive review. IEEE Communications Surveys and Tutorials, 25(2), 1208\u20131241.","journal-title":"IEEE Communications Surveys and Tutorials"},{"key":"6887_CR6","doi-asserted-by":"crossref","unstructured":"Chen, Y.-C., Chitta, M., Liu, L., Norouzi, A., Huang, Z., Yang, X., Han, J., & Zhao, D. (2022). Scept: Scene-consistent, policy-based trajectory predictions for planning. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 14669\u201314679.","DOI":"10.1109\/CVPR52688.2022.01659"},{"issue":"3","key":"6887_CR7","first-page":"589","volume":"10","author":"Y Chen","year":"2023","unstructured":"Chen, Y., Liu, M., & Wang, F.-Y. (2023). Attention mechanisms in autonomous driving systems: Current status and future perspectives. IEEE\/CAA Journal of Automatica Sinica, 10(3), 589\u2013605.","journal-title":"IEEE\/CAA Journal of Automatica Sinica"},{"issue":"10","key":"6887_CR8","first-page":"9912","volume":"24","author":"F Codevilla","year":"2023","unstructured":"Codevilla, F., Santana, E., L\u00f3pez, A. M., & Gaidon, A. (2023). Conditional imitation learning for autonomous driving. IEEE Transactions on Intelligent Transportation Systems, 24(10), 9912\u20139931.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"key":"6887_CR9","unstructured":"Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., et al. (2020). An image is worth 16x16 words: Transformers for image recognition at scale. arXiv preprint arXiv:2010.11929."},{"issue":"8","key":"6887_CR10","first-page":"7821","volume":"24","author":"Y Feng","year":"2023","unstructured":"Feng, Y., Wang, S., & Liu, Y. (2023). Multimodal sensor fusion in autonomous driving: A comprehensive survey. IEEE Transactions on Intelligent Transportation Systems, 24(8), 7821\u20137840.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"key":"6887_CR11","doi-asserted-by":"crossref","unstructured":"Gao, J., Sun, C., Zhao, H., Shen, Y., Anguelov, D., Li, C., & Schmid, C. (2020). Vectornet: Encoding hd maps and agent dynamics from vectorized representation. Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, 11525\u201311533.","DOI":"10.1109\/CVPR42600.2020.01154"},{"issue":"20","key":"6887_CR12","doi-asserted-by":"crossref","first-page":"7161","DOI":"10.3390\/app10207161","volume":"10","author":"D Ha","year":"2020","unstructured":"Ha, D., Kim, H., Kang, J., Lee, J., Jang, K., Han, K., & Kim, J. W. (2020). Proximal policy optimization with deep reinforcement learning for autonomous vehicles. Applied Sciences, 10(20), 7161.","journal-title":"Applied Sciences"},{"key":"6887_CR13","volume":"141","author":"H Huang","year":"2021","unstructured":"Huang, H., Zhang, Y., Liu, X., & Gao, Y. (2021). Spatio-temporal attention networks for robotic manipulation tasks. Robotics and Autonomous Systems, 141, Article 103781.","journal-title":"Robotics and Autonomous Systems"},{"issue":"2","key":"6887_CR14","first-page":"778","volume":"44","author":"Y Ji","year":"2022","unstructured":"Ji, Y., Wang, J., Zhou, G., & Yu, K. (2022). Video action recognition with spatio-temporal transformer networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 44(2), 778\u2013789.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"key":"6887_CR15","unstructured":"Jia, S., Chen, W., Shen, H., Sun, J., Chen, Z., Wang, Z., & Zhang, C. (2023). Stp3: End-to-end vision-based autonomous driving via spatial-temporal feature learning., In: IEEE International Conference on Robotics and Automation (ICRA), pp. 8161\u20138167 (2023). IEEE."},{"key":"6887_CR16","doi-asserted-by":"crossref","unstructured":"Kendall, A., Hawke, J., Janz, D., Mazur, P., Reda, D., Allen, J.-M., Lam, V.-D., Bewley, A., & Shah, A. (2019). Learning to drive in a day., 2019 International Conference on Robotics and Automation (ICRA), 8248\u20138254.","DOI":"10.1109\/ICRA.2019.8793742"},{"issue":"6","key":"6887_CR17","doi-asserted-by":"publisher","first-page":"4909","DOI":"10.1109\/TITS.2021.3054625","volume":"23","author":"BR Kiran","year":"2021","unstructured":"Kiran, B. R., Sobh, I., Talpaert, V., Mannion, P., Al Sallab, A. A., Yogamani, S., & P\u00e9rez, P. (2021). Deep reinforcement learning for autonomous driving: A survey. IEEE Transactions on Intelligent Transportation Systems, 23(6), 4909\u20134926.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"issue":"12","key":"6887_CR18","first-page":"23808","volume":"23","author":"L Li","year":"2022","unstructured":"Li, L., Lu, Y., Wang, R., & Chen, J. (2022). Safe reinforcement learning for autonomous driving. IEEE Transactions on Intelligent Transportation Systems, 23(12), 23808\u201323823.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"issue":"7","key":"6887_CR19","doi-asserted-by":"crossref","first-page":"6748","DOI":"10.1109\/TITS.2023.3264453","volume":"24","author":"X Li","year":"2023","unstructured":"Li, X., Wang, S., & Yi, J. (2023). Transformer-based approaches for autonomous driving: A survey. IEEE Transactions on Intelligent Transportation Systems, 24(7), 6748\u20136767.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"key":"6887_CR20","doi-asserted-by":"crossref","unstructured":"Liang, M., Yang, B., Hu, R., Chen, Y., Liao, R., Feng, S., & Urtasun, R. (2020). Learning lane graph representations for motion forecasting. European Conference on Computer Vision, 541\u2013556.","DOI":"10.1007\/978-3-030-58536-5_32"},{"key":"6887_CR21","first-page":"15314","volume":"34","author":"M Liu","year":"2021","unstructured":"Liu, M., Gao, H., & Ji, S. (2021). Graph transformer networks: Learning meta-path graphs to improve gnns. Advances in Neural Information Processing Systems, 34, 15314\u201315325.","journal-title":"Advances in Neural Information Processing Systems"},{"issue":"3","key":"6887_CR22","first-page":"2145","volume":"8","author":"S Liu","year":"2023","unstructured":"Liu, S., Wang, B., & Zhao, D. (2023). Integrated perception and prediction for autonomous driving. IEEE Transactions on Intelligent Vehicles, 8(3), 2145\u20132164.","journal-title":"IEEE Transactions on Intelligent Vehicles"},{"issue":"2","key":"6887_CR23","first-page":"159","volume":"10","author":"W Liu","year":"2023","unstructured":"Liu, W., Wang, Z., Liu, X., & Zhang, W. (2023). Deep learning approaches for autonomous driving: Recent advances and future directions. IEEE\/CAA Journal of Automatica Sinica, 10(2), 159\u2013180.","journal-title":"IEEE\/CAA Journal of Automatica Sinica"},{"issue":"5","key":"6887_CR24","first-page":"4725","volume":"24","author":"Y Liu","year":"2023","unstructured":"Liu, Y., Wang, Z., & Zhang, X. (2023). Reinforcement learning in autonomous driving: Progress and challenges. IEEE Transactions on Intelligent Transportation Systems, 24(5), 4725\u20134744.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"key":"6887_CR25","unstructured":"Ngiam, J., Caine, B., Vasudevan, V., Zhang, Z., Chiang, H.-T.L., Ling, J., Roelofs, R., Bewley, A., Liu, C., Vondrick, C., et al. (2021). Scene transformer: A unified architecture for predicting multiple agent trajectories., In: International Conference on Learning Representations."},{"issue":"9","key":"6887_CR26","first-page":"4543","volume":"34","author":"X Pan","year":"2023","unstructured":"Pan, X., You, X., & Wang, Z. (2023). Imitation learning for autonomous driving: A survey. IEEE Transactions on Neural Networks and Learning Systems, 34(9), 4543\u20134562.","journal-title":"IEEE Transactions on Neural Networks and Learning Systems"},{"key":"6887_CR27","doi-asserted-by":"crossref","unstructured":"Saxena, D. M., Bae, S., Nakhaei, A., Fujimura, K., & Likhachev, M. (2020). Driving in dense traffic with model-free reinforcement learning., 2020 IEEE International Conference on Robotics and Automation (ICRA), 5385\u20135392.","DOI":"10.1109\/ICRA40945.2020.9197132"},{"key":"6887_CR28","unstructured":"Schulman, J., Wolski, F., Dhariwal, P., Radford, A., & Klimov, O. (2017). Proximal policy optimization algorithms., arXiv preprint arXiv:1707.06347."},{"key":"6887_CR29","unstructured":"Shalev-Shwartz, S., Shammah, S., & Shashua, A. (2016). Safe, multi-agent, reinforcement learning for autonomous driving. arXiv preprint arXiv:1610.03295."},{"key":"6887_CR30","unstructured":"Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, \u0141, & Polosukhin, I. (2017). Attention is all you need. Advances in neural information processing systems,30."},{"issue":"3","key":"6887_CR31","first-page":"1235","volume":"34","author":"H Wang","year":"2023","unstructured":"Wang, H., Yu, Z., & Zhao, D. (2023). Deep learning for autonomous driving perception: A comprehensive survey. IEEE Transactions on Neural Networks and Learning Systems, 34(3), 1235\u20131258.","journal-title":"IEEE Transactions on Neural Networks and Learning Systems"},{"issue":"3","key":"6887_CR32","first-page":"789","volume":"7","author":"Q Wang","year":"2021","unstructured":"Wang, Q., Li, Z., Li, S. E., Li, Q., Xiao, M., & Wang, J. (2021). Decision-making for autonomous driving via augmented adversarial transformer. IEEE Transactions on Intelligent Vehicles, 7(3), 789\u2013801.","journal-title":"IEEE Transactions on Intelligent Vehicles"},{"issue":"9","key":"6887_CR33","first-page":"8901","volume":"24","author":"Y Wang","year":"2023","unstructured":"Wang, Y., Zhang, W., & Liu, W. (2023). Spatiotemporal learning for autonomous driving: A systematic review. IEEE Transactions on Intelligent Transportation Systems, 24(9), 8901\u20138920.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"issue":"1","key":"6887_CR34","first-page":"113","volume":"8","author":"B Wu","year":"2023","unstructured":"Wu, B., Zhou, X., & Zhao, Q. (2023). A comprehensive survey of vision-based autonomous driving. IEEE Transactions on Intelligent Vehicles, 8(1), 113\u2013138.","journal-title":"IEEE Transactions on Intelligent Vehicles"},{"issue":"8","key":"6887_CR35","first-page":"4102","volume":"34","author":"H Wu","year":"2023","unstructured":"Wu, H., Zhang, J., & Liu, Z. (2023). Transformer architectures in autonomous driving: A comprehensive review. IEEE Transactions on Neural Networks and Learning Systems, 34(8), 4102\u20134121.","journal-title":"IEEE Transactions on Neural Networks and Learning Systems"},{"issue":"6","key":"6887_CR36","first-page":"6789","volume":"72","author":"J Wu","year":"2023","unstructured":"Wu, J., Zhou, W., Wang, Q., & Li, Y. (2023). Deep reinforcement learning with attention mechanisms for autonomous driving. IEEE Transactions on Vehicular Technology, 72(6), 6789\u20136801.","journal-title":"IEEE Transactions on Vehicular Technology"},{"issue":"5","key":"6887_CR37","doi-asserted-by":"crossref","first-page":"4523","DOI":"10.1109\/TIV.2023.3260007","volume":"8","author":"Z Yang","year":"2023","unstructured":"Yang, Z., Wang, Y., & Chen, X. (2023). End-to-end autonomous driving: State of the art and future perspectives. IEEE Transactions on Intelligent Vehicles, 8(5), 4523\u20134542.","journal-title":"IEEE Transactions on Intelligent Vehicles"},{"issue":"2","key":"6887_CR38","doi-asserted-by":"crossref","first-page":"1612","DOI":"10.1109\/TIV.2022.3224679","volume":"8","author":"Z Yang","year":"2023","unstructured":"Yang, Z., Zhang, Y., Wang, J., & Li, S. E. (2023). Deep reinforcement learning for autonomous driving: Methods, challenges, and future directions. IEEE Transactions on Intelligent Vehicles, 8(2), 1612\u20131635.","journal-title":"IEEE Transactions on Intelligent Vehicles"},{"key":"6887_CR39","doi-asserted-by":"publisher","first-page":"58443","DOI":"10.1109\/ACCESS.2020.2983149","volume":"8","author":"E Yurtsever","year":"2020","unstructured":"Yurtsever, E., Lambert, J., Carballo, A., & Takeda, K. (2020). A survey of autonomous driving: Common practices and emerging technologies. IEEE Access, 8, 58443\u201358469.","journal-title":"IEEE Access"},{"key":"6887_CR40","first-page":"130","volume":"521","author":"J Zhang","year":"2023","unstructured":"Zhang, J., Li, X., & He, F. (2023). Survey on deep learning for autonomous driving. Neurocomputing, 521, 130\u2013152.","journal-title":"Neurocomputing"},{"issue":"4","key":"6887_CR41","first-page":"1744","volume":"34","author":"L Zhang","year":"2023","unstructured":"Zhang, L., Wang, S., & Liu, B. (2023). Autonomous driving with deep reinforcement learning: A systematic review. IEEE Transactions on Neural Networks and Learning Systems, 34(4), 1744\u20131767.","journal-title":"IEEE Transactions on Neural Networks and Learning Systems"},{"issue":"7","key":"6887_CR42","doi-asserted-by":"crossref","first-page":"8234","DOI":"10.1109\/TPAMI.2022.3232211","volume":"45","author":"H Zhao","year":"2023","unstructured":"Zhao, H., Zhang, X., & Liu, M. (2023). Fusion strategies for multimodal data in autonomous driving. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(7), 8234\u20138253.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"issue":"2","key":"6887_CR43","first-page":"1620","volume":"24","author":"X Zhao","year":"2023","unstructured":"Zhao, X., Hou, Y., Zhang, M., & Wang, K. (2023). A comprehensive review of deep learning-based autonomous driving systems. IEEE Transactions on Intelligent Transportation Systems, 24(2), 1620\u20131649.","journal-title":"IEEE Transactions on Intelligent Transportation Systems"},{"issue":"4","key":"6887_CR44","doi-asserted-by":"crossref","first-page":"3312","DOI":"10.1109\/TIV.2023.3257962","volume":"8","author":"H Zhou","year":"2023","unstructured":"Zhou, H., Li, W., & Zhang, Y. (2023). Attention mechanisms for autonomous driving: A comprehensive review. IEEE Transactions on Intelligent Vehicles, 8(4), 3312\u20133329.","journal-title":"IEEE Transactions on Intelligent Vehicles"},{"issue":"5","key":"6887_CR45","first-page":"5420","volume":"72","author":"M Zhu","year":"2023","unstructured":"Zhu, M., Wang, X., & Wang, Y. (2023). Survey of deep reinforcement learning for autonomous driving decision-making. IEEE Transactions on Vehicular Technology, 72(5), 5420\u20135437.","journal-title":"IEEE Transactions on Vehicular Technology"}],"container-title":["Machine Learning"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10994-025-06887-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10994-025-06887-x\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10994-025-06887-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,12,2]],"date-time":"2025-12-02T14:29:54Z","timestamp":1764685794000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10994-025-06887-x"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,10,14]]},"references-count":45,"journal-issue":{"issue":"11","published-print":{"date-parts":[[2025,11]]}},"alternative-id":["6887"],"URL":"https:\/\/doi.org\/10.1007\/s10994-025-06887-x","relation":{},"ISSN":["0885-6125","1573-0565"],"issn-type":[{"type":"print","value":"0885-6125"},{"type":"electronic","value":"1573-0565"}],"subject":[],"published":{"date-parts":[[2025,10,14]]},"assertion":[{"value":"21 December 2024","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"31 July 2025","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"2 September 2025","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"14 October 2025","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that there are no conflicts of interest regarding the publication of this paper.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Competing interests"}},{"value":"This paper was done by the authors, and no human participants other than the authors were involved in it, and informed consent was obtained from all authors.","order":3,"name":"Ethics","group":{"name":"EthicsHeading","label":"Ethical approval and informed consent for data used"}}],"article-number":"245"}}