{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,23]],"date-time":"2026-04-23T20:46:15Z","timestamp":1776977175539,"version":"3.51.4"},"reference-count":35,"publisher":"IEEE","license":[{"start":{"date-parts":[[2026,2,24]],"date-time":"2026-02-24T00:00:00Z","timestamp":1771891200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2026,2,24]],"date-time":"2026-02-24T00:00:00Z","timestamp":1771891200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100003725","name":"National Research Foundation of Korea (NRF)","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100003725","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/100009122","name":"Ministry of Education","doi-asserted-by":"publisher","award":["NRF-2023R1A2C1003143,NRF-2018R1A6A1A03025526"],"award-info":[{"award-number":["NRF-2023R1A2C1003143,NRF-2018R1A6A1A03025526"]}],"id":[{"id":"10.13039\/100009122","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2026,2,24]]},"DOI":"10.1109\/icaiic68212.2026.11454260","type":"proceedings-article","created":{"date-parts":[[2026,3,31]],"date-time":"2026-03-31T19:50:24Z","timestamp":1774986624000},"page":"1443-1448","source":"Crossref","is-referenced-by-count":0,"title":["Flow Matching Integrated Decision Transformer for Offline Reinforcement Learning"],"prefix":"10.1109","author":[{"given":"Asel Nurlanbek","family":"Kyzy","sequence":"first","affiliation":[{"name":"Korea University of Technology and Education,Future Convergence Engineering,Cheonan,South Korea"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Chang-Hun","family":"Ji","sequence":"additional","affiliation":[{"name":"Korea University of Technology and Education,Future Convergence Engineering,Cheonan,South Korea"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Min-Jun","family":"Kim","sequence":"additional","affiliation":[{"name":"Korea University of Technology and Education,Future Convergence Engineering,Cheonan,South Korea"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Youn-Hee","family":"Han","sequence":"additional","affiliation":[{"name":"Korea University of Technology and Education,Future Convergence Engineering,Cheonan,South Korea"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","article-title":"Offline reinforcement learning: Tutorial, review, and perspectives on open problems","author":"Levine","year":"2020","journal-title":"arXiv"},{"key":"ref2","article-title":"Challenges of realworld reinforcement learning","author":"Dulac-Arnold","year":"2019","journal-title":"arXiv"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/tnnls.2023.3250269"},{"key":"ref4","article-title":"ALVINN: An autonomous land vehicle in a neural network","author":"Pomerleau","year":"1989","journal-title":"NeurIPS"},{"key":"ref5","article-title":"Batch-constrained deep Qlearning","author":"Fujimoto","year":"2019","journal-title":"ICML"},{"key":"ref6","article-title":"Conservative Q-learning for offline reinforcement learning","author":"Kumar","year":"2020","journal-title":"NeurIPS"},{"key":"ref7","article-title":"Behavior-regularized actor-critic","author":"Wu","year":"2019","journal-title":"NeurIPS"},{"key":"ref8","article-title":"AWAC: Accelerating online reinforcement learning with offline datasets","author":"Nair","year":"2020","journal-title":"arXiv"},{"key":"ref9","article-title":"Offline reinforcement learning with implicit Q-learning","author":"Kostrikov","year":"2021","journal-title":"NeurIPS"},{"key":"ref10","article-title":"MOPO: Model-based Offline Policy Optimization","author":"Yu","year":"2020","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref11","article-title":"COMBO: Conservative Offline Model-Based Policy Optimization","author":"Yu","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref12","article-title":"Decision Transformer: Reinforcement learning via sequence modeling","author":"Chen","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref13","article-title":"Multi-Game Decision Transformers","author":"Lee","year":"2022","journal-title":"Int. Conf. Learn. Represent."},{"key":"ref14","article-title":"Prompt-based Decision Transformer","author":"Liu","year":"2023","journal-title":"Int. Conf. Learn. Represent."},{"key":"ref15","article-title":"Constrained Decision Transformer","author":"Xu","year":"2022","journal-title":"Int. Conf. Learn. Represent."},{"key":"ref16","article-title":"Graph Decision Transformer","author":"Li","year":"2023","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref17","article-title":"Online Decision Transformer","author":"Zheng","year":"2022","journal-title":"arXiv preprint"},{"key":"ref18","article-title":"DODT: Enhanced Online Decision Transformer Learning through Dreamer\u2019s Actor-Critic Trajectory Forecasting","author":"Jiang","year":"2024","journal-title":"arXiv preprint"},{"key":"ref19","article-title":"Flow matching for generative modeling","author":"Lipman","year":"2023","journal-title":"arXiv preprint"},{"key":"ref20","article-title":"Neural Ordinary Differential Equations","author":"Chen","year":"2018","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref21","article-title":"Flow Matching Guide and Code","author":"Lipman","year":"2024","journal-title":"arXiv preprint"},{"key":"ref22","article-title":"Flow Q-Learning","author":"Park","year":"2025","journal-title":"Int. Conf. Mach. Learn."},{"key":"ref23","article-title":"Flow Matching Policy Gradients","author":"McAllister","year":"2025","journal-title":"Int. Conf. Mach. Learn."},{"key":"ref24","article-title":"ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning","author":"Zhang","year":"2025","journal-title":"arXiv preprint"},{"key":"ref25","article-title":"Flow matching in latent space","author":"Dao","year":"2023","journal-title":"arXiv preprint"},{"key":"ref26","article-title":"Generative adversarial imitation learning","author":"Ho","year":"2016","journal-title":"Advances in Neural Information Processing Systems (NeurIPS)"},{"key":"ref27","article-title":"A reduction of imitation learning and structured prediction to no-regret online learning","author":"Ross","year":"2011","journal-title":"AISTATS"},{"key":"ref28","article-title":"Attention is all you need","author":"Vaswani","year":"2017","journal-title":"NeurIPS"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1002\/9781119121534"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1007\/BF01446807"},{"key":"ref31","first-page":"435","article-title":"Beitrag zur n\u00e4herungsweisen Integration totaler Differentialgleichungen","volume":"46","author":"Kutta","year":"1901","journal-title":"Zeitschrift f\u00fcr Mathematik und Physik"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v32i1.11671"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2012.6386109"},{"issue":"2","key":"ref34","first-page":"2591","article-title":"RoboMimic: A benchmark for imitation learning and offline reinforcement learning","volume":"6","author":"Mandlekar","year":"2021","journal-title":"IEEE Robotics and Automation Letters"},{"key":"ref35","article-title":"Minari: A standard format for offline reinforcement learning datasets","author":"Younis","year":"2024","journal-title":"Zenodo"}],"event":{"name":"2026 International Conference on Artificial Intelligence in Information and Communication (ICAIIC)","location":"Tokyo, Japan","start":{"date-parts":[[2026,2,24]]},"end":{"date-parts":[[2026,2,27]]}},"container-title":["2026 International Conference on Artificial Intelligence in Information and Communication (ICAIIC)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/11454127\/11454137\/11454260.pdf?arnumber=11454260","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,4,23]],"date-time":"2026-04-23T19:56:27Z","timestamp":1776974187000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11454260\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,2,24]]},"references-count":35,"URL":"https:\/\/doi.org\/10.1109\/icaiic68212.2026.11454260","relation":{},"subject":[],"published":{"date-parts":[[2026,2,24]]}}}