{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,6,28]],"date-time":"2025-06-28T06:24:36Z","timestamp":1751091876234,"version":"3.28.0"},"reference-count":28,"publisher":"IEEE","license":[{"start":{"date-parts":[[2024,7,15]],"date-time":"2024-07-15T00:00:00Z","timestamp":1721001600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2024,7,15]],"date-time":"2024-07-15T00:00:00Z","timestamp":1721001600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2024,7,15]]},"DOI":"10.1109\/aim55361.2024.10637099","type":"proceedings-article","created":{"date-parts":[[2024,8,22]],"date-time":"2024-08-22T17:52:35Z","timestamp":1724349155000},"page":"1378-1385","source":"Crossref","is-referenced-by-count":1,"title":["Efficient Design Space Exploration with Multi-Task Reinforcement Learning"],"prefix":"10.1109","author":[{"given":"Patrick","family":"Hoffmann","sequence":"first","affiliation":[{"name":"Robert Bosch GmbH,Corporate Sector Research and Advance Engineering,Renningen,Germany,71272"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Kirill","family":"Gorelik","sequence":"additional","affiliation":[{"name":"Robert Bosch GmbH,Corporate Sector Research and Advance Engineering,Renningen,Germany,71272"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Valentin","family":"Ivanov","sequence":"additional","affiliation":[{"name":"Technische Universit&#x00E4;t Ilmenau,Department of Computer Science,Ilmenau,Germany,98693"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"article-title":"Automotive software and electronics 2030 - mapping the sectors future landscape","year":"2019","author":"Burkacky","key":"ref1"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.4271\/10-07-01-0006"},{"journal-title":"Standard ISO 26262","article-title":"Road vehicles - functional safety","year":"2018","key":"ref3"},{"key":"ref4","first-page":"812575","article-title":"Functional safety assessment of a generic electric power steering system with active steering and four-wheel steering features","volume-title":"Technical Report DOT HS","author":"Becker","year":"2018"},{"key":"ref5","first-page":"562","article-title":"Comparison of reinforcement learning and model predictive control for over-actuated systems","volume-title":"15th International Symposium on Advanced Vehicle Control (AVEC \u201822)","author":"Hoffmann"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-60990-0"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/SSCI52147.2023.10371864"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.4271\/10-07-03-0018"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.20485\/jsaeijae.15.1_19"},{"article-title":"Reinforcement Learning: An Introduction","year":"2018","author":"Sutton","key":"ref10"},{"key":"ref11","article-title":"Proximal policy optimization algorithms","author":"Schulman","year":"2017","journal-title":"arXiv: 1707.06347"},{"key":"ref12","article-title":"High-dimensional continuous control using generalized advantage estimation","author":"Schulman","year":"2015","journal-title":"arXiv: 1506.02438"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-8348-9789-3"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1016\/b978-0-7506-6918-4.x5000-x"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1023\/A:1007379606734"},{"key":"ref16","article-title":"An overview of multi-task learning in deep neural networks","author":"Ruder","year":"2017","journal-title":"arXiv: 1706.05098"},{"key":"ref17","article-title":"Adashare: Learning what to share for efficient deep multi-task learning","author":"Sun","year":"2019","journal-title":"arXiv: 1911.12423"},{"key":"ref18","article-title":"Distral: Robust multitask reinforcement learning","volume":"30","author":"Teh","year":"2017","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref19","article-title":"MERL: Multi-head reinforcement learning","author":"Flet-Berliac","year":"2019","journal-title":"arXiv: 1909.11939"},{"article-title":"Multi-task reinforcement learning with task representation method","volume-title":"ICLR 2022 Workshop on Generalizable Policy Learning in Physical World","author":"Cho","key":"ref20"},{"key":"ref21","article-title":"Multi-task learning with deep neural networks: A survey","author":"Crawshaw","year":"2020","journal-title":"arXiv: 2009.09796"},{"key":"ref22","first-page":"4767","article-title":"Multi-task reinforcement learning with soft modularization","volume":"33","author":"Yang","year":"2020","journal-title":"Advances in Neural Information Processing Systems"},{"key":"ref23","article-title":"Multi-task reinforcement learn ing with context-based representations","author":"Sodhani","year":"2021","journal-title":"arXiv: 2102.06177"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/IV47402.2020.9304542"},{"key":"ref25","article-title":"Passenger cars - test track for a severe lane-change manoeuvre - part 1: Double lane-change","volume":"38881","year":"2018","journal-title":"Standard ISO"},{"key":"ref26","article-title":"Road vehicles - vehicle dynamics test methods - part 1: General conditions for passenger cars","volume":"150371","year":"2019","journal-title":"Standard ISO"},{"article-title":"TF-Agents: A library for reinforcement learning in tensorflow","year":"2018","author":"Guadarrama","key":"ref27"},{"journal-title":"arXiv: 2109.11978,2021","article-title":"Learning to walk in minutes using massively parallel deep reinforcement learning","author":"Rudin","key":"ref28"}],"event":{"name":"2024 IEEE\/ASME International Conference on Advanced Intelligent Mechatronics (AIM)","start":{"date-parts":[[2024,7,15]]},"location":"Boston, MA, USA","end":{"date-parts":[[2024,7,19]]}},"container-title":["2024 IEEE International Conference on Advanced Intelligent Mechatronics (AIM)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/10636941\/10636942\/10637099.pdf?arnumber=10637099","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,9,4]],"date-time":"2024-09-04T06:12:51Z","timestamp":1725430371000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10637099\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,7,15]]},"references-count":28,"URL":"https:\/\/doi.org\/10.1109\/aim55361.2024.10637099","relation":{},"subject":[],"published":{"date-parts":[[2024,7,15]]}}}