{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,17]],"date-time":"2025-10-17T14:31:58Z","timestamp":1760711518269,"version":"3.38.0"},"reference-count":33,"publisher":"IEEE","license":[{"start":{"date-parts":[[2024,12,10]],"date-time":"2024-12-10T00:00:00Z","timestamp":1733788800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2024,12,10]],"date-time":"2024-12-10T00:00:00Z","timestamp":1733788800000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100001809","name":"Foundation of National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62373086,62373087"],"award-info":[{"award-number":["62373086,62373087"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2024,12,10]]},"DOI":"10.1109\/robio64047.2024.10907647","type":"proceedings-article","created":{"date-parts":[[2025,3,7]],"date-time":"2025-03-07T18:33:40Z","timestamp":1741372420000},"page":"1839-1844","source":"Crossref","is-referenced-by-count":1,"title":["OFSLMs: Offline Fine-Tuned Small Language Models Based on Hybrid Synthetic Knowledge for Robot Introspective Decision-Making"],"prefix":"10.1109","author":[{"given":"Jinbiao","family":"Zhu","sequence":"first","affiliation":[{"name":"Northeastern University,Faculty of Robot Science and Engineering,Shenyang,Liaoning Province,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Lishan","family":"Wang","sequence":"additional","affiliation":[{"name":"Northeastern University,Faculty of Robot Science and Engineering,Shenyang,Liaoning Province,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yi","family":"Guc","sequence":"additional","affiliation":[{"name":"Northeastern University,Faculty of Robot Science and Engineering,Shenyang,Liaoning Province,China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Fei","family":"Wang","sequence":"additional","affiliation":[{"name":"Northeastern University,Faculty of Robot Science and Engineering,Shenyang,Liaoning Province,China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","article-title":"Gpt-4 technical report","author":"Achiam","year":"2023","journal-title":"arXiv preprint"},{"key":"ref2","article-title":"Llama 2: Open foundation and fine-tuned chat models","author":"Touvron","year":"2023","journal-title":"arXiv preprint"},{"key":"ref3","article-title":"Gemma: Open models based on gemini research and technology","author":"Team","year":"2024","journal-title":"arXiv preprint"},{"key":"ref4","article-title":"Phi-3 technical report: A highly capable language model locally on your phone","author":"Abdin","year":"2024","journal-title":"arXiv preprint"},{"key":"ref5","article-title":"Qwen technical report","author":"Bai","year":"2023","journal-title":"arXiv preprint"},{"key":"ref6","first-page":"9118","article-title":"Language models as zero-shot planners: Extracting actionable knowledge for embodied agents","volume-title":"International conference on machine learning","author":"Huang"},{"article-title":"Do as i can, not as i say: Grounding language in robotic affordances","volume-title":"Conference on Robot Learning","author":"Ahn","key":"ref7"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/access.2024.3387941"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/LRA.2024.3357432"},{"key":"ref10","doi-asserted-by":"crossref","DOI":"10.1007\/s11370-024-00550-5","volume-title":"A survey on integration of large language models with intelligent robots","author":"Kim","year":"2024"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2023.acl-long.147"},{"key":"ref12","article-title":"React: Synergizing reasoning and acting in language models","author":"Yao","year":"2022","journal-title":"arXiv preprint"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/ROBIO58561.2023.10355013"},{"volume-title":"Mldt: Multi-level decomposition for complex long-horizon robotic task planning with open-source large language model","year":"2024","author":"Wu","key":"ref14"},{"key":"ref15","article-title":"Prompter: Utilizing large language model prompting for a data efficient embodied instruction following","author":"Inoue","year":"2022","journal-title":"arXiv preprint"},{"key":"ref16","article-title":"Tinyllama: An open-source small language model","author":"Zhang","year":"2024","journal-title":"arXiv preprint"},{"volume-title":"Deeploy: Enabling energy-efficient deployment of small language models on heterogeneous microcontrollers","year":"2024","author":"Scherer","key":"ref17"},{"volume-title":"Med42 - evaluating fine-tuning strategies for medical llms: Full-parameter vs. parameter-efficient approaches","year":"2024","author":"Christophe","key":"ref18"},{"volume-title":"Fingpt: Open-source financial large language models","year":"2023","author":"Yang","key":"ref19"},{"volume-title":"Alpaca: A strong, replicable instruction-following model","year":"2023","key":"ref20"},{"volume-title":"Alfworld: Aligning text and embodied environments for interactive learning","year":"2021","author":"Shridhar","key":"ref21"},{"volume-title":"Qlora: Efficient finetuning of quantized llms","year":"2023","author":"Dettmers","key":"ref22"},{"key":"ref23","first-page":"74","article-title":"Rouge: A package for automatic evaluation of summaries","author":"Lin","year":"2004","journal-title":"Text summarization branches out"},{"issue":"4","key":"ref24","first-page":"35","article-title":"Modern information retrieval: A brief overview","volume":"24","author":"Singhal","year":"2001","journal-title":"IEEE Data Eng. Bull."},{"key":"ref25","article-title":"Sentence-bert: Sentence embeddings using siamese bert-networks","volume-title":"Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing","volume":"11","author":"Reimers"},{"volume-title":"Codebleu: a method for automatic evaluation of code synthesis","year":"2020","author":"Ren","key":"ref26"},{"key":"ref27","article-title":"The llama 3 herd of models","author":"Dubey","year":"2024","journal-title":"arXiv preprint"},{"key":"ref28","first-page":"24824","article-title":"Chain-of-thought prompting elicits reasoning in large language models","volume":"35","author":"Wei","year":"2022","journal-title":"Advances in neural information processing systems"},{"key":"ref29","article-title":"Understanding the planning of llm agents: A survey","author":"Huang","year":"2024","journal-title":"arXiv preprint"},{"volume-title":"Decoupled weight decay regularization","year":"2019","author":"Loshchilov","key":"ref30"},{"volume-title":"Umap: Uniform manifold approximation and projection for dimension reduction","year":"2020","author":"McInnes","key":"ref31"},{"key":"ref32","article-title":"tinybenchmarks: evaluating llms with fewer examples","author":"Polo","year":"2023","journal-title":"arXiv preprint"},{"volume-title":"August4293cs_qa. datasets at hugging face","year":"2024","key":"ref33"}],"event":{"name":"2024 IEEE International Conference on Robotics and Biomimetics (ROBIO)","start":{"date-parts":[[2024,12,10]]},"location":"Bangkok, Thailand","end":{"date-parts":[[2024,12,14]]}},"container-title":["2024 IEEE International Conference on Robotics and Biomimetics (ROBIO)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/10906779\/10907273\/10907647.pdf?arnumber=10907647","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,3,8]],"date-time":"2025-03-08T07:55:23Z","timestamp":1741420523000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10907647\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,12,10]]},"references-count":33,"URL":"https:\/\/doi.org\/10.1109\/robio64047.2024.10907647","relation":{},"subject":[],"published":{"date-parts":[[2024,12,10]]}}}