{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,28]],"date-time":"2026-04-28T15:33:47Z","timestamp":1777390427977,"version":"3.51.4"},"reference-count":26,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","issue":"2","license":[{"start":{"date-parts":[[2025,2,1]],"date-time":"2025-02-01T00:00:00Z","timestamp":1738368000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2025,2,1]],"date-time":"2025-02-01T00:00:00Z","timestamp":1738368000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,2,1]],"date-time":"2025-02-01T00:00:00Z","timestamp":1738368000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62276028"],"award-info":[{"award-number":["62276028"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["U20A20167"],"award-info":[{"award-number":["U20A20167"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100003787","name":"Natural Science Foundation of Hebei Province","doi-asserted-by":"publisher","award":["F202103079"],"award-info":[{"award-number":["F202103079"]}],"id":[{"id":"10.13039\/501100003787","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Hebei Province Central Leading Local Science and Technology Development Project","award":["236Z1811G"],"award-info":[{"award-number":["236Z1811G"]}]},{"name":"Hebei Province Central Leading Local Science and Technology Development Project","award":["246Z1817G"],"award-info":[{"award-number":["246Z1817G"]}]},{"name":"Innovation Capability Improvement Plan Project of Hebei Province","award":["22567626H"],"award-info":[{"award-number":["22567626H"]}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Robot. Autom. Lett."],"published-print":{"date-parts":[[2025,2]]},"DOI":"10.1109\/lra.2024.3522842","type":"journal-article","created":{"date-parts":[[2024,12,25]],"date-time":"2024-12-25T14:38:20Z","timestamp":1735137500000},"page":"1649-1655","source":"Crossref","is-referenced-by-count":1,"title":["DASP: Hierarchical Offline Reinforcement Learning via Diffusion Autodecoder and Skill Primitive"],"prefix":"10.1109","volume":"10","author":[{"ORCID":"https:\/\/orcid.org\/0009-0007-9866-6431","authenticated-orcid":false,"given":"Sicheng","family":"Liu","sequence":"first","affiliation":[{"name":"School of Information Science and Engineering, Yanshan University, Qinhuangdao, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yunchuan","family":"Zhang","sequence":"additional","affiliation":[{"name":"School of Information Science and Engineering, Yanshan University, Qinhuangdao, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7683-2776","authenticated-orcid":false,"given":"Wenbai","family":"Chen","sequence":"additional","affiliation":[{"name":"School of Automation, Beijing Information Science and Technology University, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-1228-2757","authenticated-orcid":false,"given":"Peiliang","family":"Wu","sequence":"additional","affiliation":[{"name":"School of Information Science and Engineering, Yanshan University, Qinhuangdao, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","first-page":"1","article-title":"STORM: Efficient stochastic transformer based world models for reinforcement learning","volume-title":"Proc. Conf. Neural Inf. Process. Syst.","author":"Zhang","year":"2023"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1016\/j.asoc.2024.111503"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1007\/s11257-023-09364-z"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/TRO.2024.3400838"},{"key":"ref5","first-page":"9902","article-title":"Planning with diffusion for flexible behavior synthesis","volume-title":"Proc. Int. Conf. Mach. Learn.","author":"Janner","year":"2022"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52688.2022.01036"},{"key":"ref7","first-page":"28954","article-title":"COMBO: Conservative offline model-based policy optimization","volume":"34","author":"Yu","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2023.3243618"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.01558"},{"key":"ref10","first-page":"2012","article-title":"PlayFusion: Skill acquisition via diffusion from language-annotated play","volume-title":"Proc. Conf. Robot Learn.","author":"Chen","year":"2023"},{"key":"ref11","first-page":"1838","article-title":"Latent plans for task-agnostic offline reinforcement learning","volume-title":"Proc. Conf. Robot Learn.","author":"Rosete-Beas","year":"2023"},{"key":"ref12","first-page":"1","article-title":"Skill-based meta-reinforcement learning","volume-title":"Proc. Int. Conf. Learn. Representations","author":"Nam","year":"2022"},{"key":"ref13","first-page":"1","article-title":"OPAL: Offline primitive discovery for accelerating offline reinforcement learning","volume-title":"Proc. Int. Conf. Learn. Representations","author":"Ajay","year":"2021"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TNNLS.2023.3250269"},{"key":"ref15","article-title":"D4rl: Datasets for deep data-driven reinforcement learning","author":"Fu","year":"2020"},{"key":"ref16","first-page":"11918","article-title":"Generative modeling by estimating gradients of the data distribution","volume-title":"Proc. 33 rd Int. Conf. Neural Inf. Process. Syst.","author":"Song","year":"2019"},{"key":"ref17","first-page":"1","article-title":"Denoising diffusion implicit models","volume-title":"Proc. Int. Conf. Learn. Representations","author":"Song","year":"2021"},{"key":"ref18","first-page":"10299","article-title":"Believe what you see: Implicit constraint approach for offline multi-agent reinforcement learning","volume":"34","author":"Yang","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref19","first-page":"11784","article-title":"Stabilizing off-policy Q-learning via bootstrapping error reduction","volume":"32","author":"Kumar","year":"2019","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref20","first-page":"2052","article-title":"Off-policy deep reinforcement learning without exploration","volume-title":"Proc. Int. Conf. Mach. Learn.","author":"Fujimoto","year":"2019"},{"key":"ref21","first-page":"1","article-title":"Decision transformer: Reinforcement learning via sequence modeling","volume-title":"Proc. Adv. Neural Inf. Process. Syst.","volume":"34","author":"Chen","year":"2021"},{"key":"ref22","first-page":"20132","article-title":"A minimalist approach to offline reinforcement learning","volume":"34","author":"Fujimoto","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref23","article-title":"Offline reinforcement learning with implicit Q-learning","author":"Kostrikov","year":"2021"},{"key":"ref24","first-page":"1179","article-title":"Conservative Q-learning for offline reinforcement learning","volume":"33","author":"Kumar","year":"2020","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref25","first-page":"1711","article-title":"Mildly conservative Q-learning for offline reinforcement learning","volume":"35","author":"Lyu","year":"2022","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref26","article-title":"IDQL: Implicit Q-learning as an actor-critic method with diffusion policies","author":"Hansen-Estruch","year":"2023"}],"container-title":["IEEE Robotics and Automation Letters"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/7083369\/10805214\/10816163.pdf?arnumber=10816163","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,1,27]],"date-time":"2026-01-27T06:03:44Z","timestamp":1769493824000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10816163\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,2]]},"references-count":26,"journal-issue":{"issue":"2"},"URL":"https:\/\/doi.org\/10.1109\/lra.2024.3522842","relation":{},"ISSN":["2377-3766","2377-3774"],"issn-type":[{"value":"2377-3766","type":"electronic"},{"value":"2377-3774","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025,2]]}}}