{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,19]],"date-time":"2026-06-19T01:15:12Z","timestamp":1781831712203,"version":"3.54.5"},"reference-count":134,"publisher":"Springer Science and Business Media LLC","issue":"33","license":[{"start":{"date-parts":[[2025,10,16]],"date-time":"2025-10-16T00:00:00Z","timestamp":1760572800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by-nc-nd\/4.0"},{"start":{"date-parts":[[2025,10,16]],"date-time":"2025-10-16T00:00:00Z","timestamp":1760572800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by-nc-nd\/4.0"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Neural Comput &amp; Applic"],"published-print":{"date-parts":[[2025,11]]},"DOI":"10.1007\/s00521-025-11666-9","type":"journal-article","created":{"date-parts":[[2025,10,16]],"date-time":"2025-10-16T03:41:48Z","timestamp":1760586108000},"page":"28191-28267","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":23,"title":["A survey on retrieval-augmentation generation (RAG) models for healthcare applications"],"prefix":"10.1007","volume":"37","author":[{"ORCID":"https:\/\/orcid.org\/0009-0005-4775-6790","authenticated-orcid":false,"given":"Mohamed","family":"Abo El-Enen","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Sally","family":"Saad","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Taymoor","family":"Nazmy","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2025,10,16]]},"reference":[{"key":"11666_CR1","doi-asserted-by":"crossref","unstructured":"Floridi L, Chiriatti M (2020) Gpt-3: its nature, scope, limits, and consequences","DOI":"10.2139\/ssrn.3827044"},{"key":"11666_CR2","unstructured":"Achiam J et al (2023) Gpt-4 technical report"},{"key":"11666_CR3","unstructured":"Singhal K et al (2023) Towards expert-level medical question answering with large language models. arXiv preprint arXiv:2305.09617"},{"key":"11666_CR4","first-page":"1","volume":"6","author":"P Lee","year":"2023","unstructured":"Lee P, Dai H, Liu T et al (2023) Clinical text summarization: adapting large language models can outperform human experts. Nat Digit Med 6:1\u201312","journal-title":"Nat Digit Med"},{"key":"11666_CR5","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1145\/3571730","volume":"55","author":"Z Ji","year":"2023","unstructured":"Ji Z, Lee N, Frieske R et al (2023) Survey of hallucination in natural language generation. ACM Comput Surv 55:1\u201338","journal-title":"ACM Comput Surv"},{"key":"11666_CR6","first-page":"1","volume":"8","author":"AE Johnson","year":"2021","unstructured":"Johnson AE, Pollard TJ, Berkowitz SJ et al (2021) MIMIC-CXR-JPG: a large publicly available database of labeled chest radiographs. Sci Data 8:1\u20137","journal-title":"Sci Data"},{"key":"11666_CR7","volume":"25","author":"Y Liu","year":"2023","unstructured":"Liu Y, Han T, Ma S et al (2023) Towards trustworthy AI in healthcare: a systematic review of foundation models for medical applications. J Med Internet Res 25:e47189","journal-title":"J Med Internet Res"},{"key":"11666_CR8","first-page":"9459","volume":"33","author":"P Lewis","year":"2020","unstructured":"Lewis P et al (2020) Retrieval-augmented generation for knowledge-intensive NLP tasks. Adv Neural Inf Process Syst 33:9459\u20139474","journal-title":"Adv Neural Inf Process Syst"},{"key":"11666_CR9","volume":"9","author":"Z Kraljevic","year":"2021","unstructured":"Kraljevic Z, Searle T, Shek A et al (2021) Biomedical and clinical language models for Spanish: on the benefits of domain-specific pretraining in a mid-resource scenario. JMIR Med Inform 9:e29335","journal-title":"JMIR Med Inform"},{"key":"11666_CR10","unstructured":"Jin D, Pan E, Oufattole N et al (2021) Disease knowledge distillation in medical dialogue generation. arXiv preprint arXiv:2109.00704"},{"key":"11666_CR11","unstructured":"Wu C, Zhang X, Zhang Y et al (2023) PMC-llama: towards building open-source language models for medicine. arXiv preprint arXiv:2304.14454"},{"key":"11666_CR12","unstructured":"Aggarwal R, Singhal K, Tu T et al (2022) Med-palm: a large language model for medical question answering. arXiv preprint arXiv:2212.13138"},{"key":"11666_CR13","doi-asserted-by":"crossref","first-page":"172","DOI":"10.1038\/s41586-023-06291-2","volume":"620","author":"K Singhal","year":"2023","unstructured":"Singhal K, Tu T, Gottweis J et al (2023) Large language models encode clinical knowledge. Nature 620:172\u2013180","journal-title":"Nature"},{"key":"11666_CR14","unstructured":"Zhao WX, Zhou K, Li J et al (2023) A survey of large language models for healthcare: from data, technology, and applications to accountability and ethics. arXiv preprint arXiv:2310.05694"},{"key":"11666_CR15","unstructured":"Cheng M et al (2025) A survey on knowledge-oriented retrieval-augmented generation. arXiv preprint arXiv:2503.10677"},{"key":"11666_CR16","unstructured":"Sharma C (2025) Retrieval-augmented generation: a comprehensive survey of architectures, enhancements, and robustness frontiers. arXiv preprint arXiv:2506.00054"},{"key":"11666_CR17","doi-asserted-by":"crossref","first-page":"299","DOI":"10.1007\/s10462-024-10921-0","volume":"57","author":"D Wang","year":"2024","unstructured":"Wang D, Zhang S (2024) Large language models in medical and healthcare fields: applications, advances, and challenges. Artif Intell Rev 57:299","journal-title":"Artif Intell Rev"},{"key":"11666_CR18","doi-asserted-by":"crossref","first-page":"205520762513371","DOI":"10.1177\/20552076251337177","volume":"11","author":"OK Gargari","year":"2025","unstructured":"Gargari OK, Habibi G (2025) Enhancing medical AI with retrieval-augmented generation: a mini narrative review. Digital health 11:20552076251337176","journal-title":"Digital health"},{"key":"11666_CR19","unstructured":"Gao Y et al (2023) Retrieval-augmented generation for large language models: a survey. arXiv preprint arXiv:2312.10997 2"},{"key":"11666_CR20","doi-asserted-by":"crossref","unstructured":"Xiong G, Jin Q, Lu Z, Zhang A (2024) Benchmarking retrieval-augmented generation for medicine. arXiv preprint arXiv:2402.13178","DOI":"10.18653\/v1\/2024.findings-acl.372"},{"key":"11666_CR21","unstructured":"Li S, Stenzel L, Eickhoff C, Bahrainian SA (2024) Enhancing retrieval-augmented generation: a study of best practices. arXiv preprint arXiv:2501.07391"},{"key":"11666_CR22","doi-asserted-by":"crossref","unstructured":"Jiang Z et al (2023) Active retrieval augmented generation. arXiv preprint arXiv:2305.06983","DOI":"10.18653\/v1\/2023.emnlp-main.495"},{"key":"11666_CR23","unstructured":"Asai A, Wu Z, Wang Y, Sil A, Hajishirzi H (2023) Self-rag: learning to retrieve, generate, and critique through self-reflection. arXiv preprint arXiv:2310.11511"},{"key":"11666_CR24","unstructured":"Hendrycks D et al (2020) Measuring massive multitask language understanding. arXiv preprint arXiv:2009.03300"},{"key":"11666_CR25","unstructured":"Pal A, Umapathi LK, Sankarasubbu M (2022) MEDMCQA: a large-scale multi-subject multi-choice dataset for medical domain question answering 248\u2013260"},{"key":"11666_CR26","doi-asserted-by":"crossref","unstructured":"Jin Q, Dhingra B, Liu Z, Cohen W, Lu X (2019) PubMedQA: a dataset for biomedical research question answering 2567\u20132577","DOI":"10.18653\/v1\/D19-1259"},{"key":"11666_CR27","unstructured":"M\u00f6ller T, Reina A, Jayakumar R, Pietsch M (2020) COVID-QA: a question answering dataset for covid-19"},{"key":"11666_CR28","unstructured":"Han T et al (2023) Medalpaca\u2014an open-source collection of medical conversational AI models and training data. arXiv preprint arXiv:2304.08247"},{"key":"11666_CR29","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1186\/s12859-019-3119-4","volume":"20","author":"A Ben Abacha","year":"2019","unstructured":"Ben Abacha A, Demner-Fushman D (2019) A question-entailment approach to question answering. BMC Bioinform 20:1\u201323","journal-title":"BMC Bioinform"},{"key":"11666_CR30","doi-asserted-by":"crossref","unstructured":"Li Y et al (2023) Chatdoctor: a medical chat model fine-tuned on a large language model meta-AI (llama) using medical domain knowledge. Cureus 15","DOI":"10.7759\/cureus.40895"},{"key":"11666_CR31","unstructured":"Touvron H et al (2023) Llama: open and efficient foundation language models. arXiv preprint arXiv:2302.13971"},{"key":"11666_CR32","doi-asserted-by":"crossref","DOI":"10.3389\/frai.2021.691626","volume":"4","author":"P Rogers","year":"2021","unstructured":"Rogers P, Wang D, Lu Z (2021) Medical information mart for intensive care: a foundation for the fusion of artificial intelligence and real-world data. Front Artif Intell 4:691626","journal-title":"Front Artif Intell"},{"key":"11666_CR33","doi-asserted-by":"crossref","unstructured":"Wen Z, Lu XH, Reddy S (2020) Medal: medical abbreviation disambiguation dataset for natural language understanding pretraining. arXiv preprint arXiv:2012.13978","DOI":"10.18653\/v1\/2020.clinicalnlp-1.15"},{"key":"11666_CR34","doi-asserted-by":"crossref","unstructured":"Li Y et al (2023) CLEVA: chinese language models evaluation platform. arXiv preprint arXiv:2308.04813","DOI":"10.18653\/v1\/2023.emnlp-demo.17"},{"key":"11666_CR35","volume":"138","author":"Y Gao","year":"2023","unstructured":"Gao Y et al (2023) Dr. bench: diagnostic reasoning benchmark for clinical natural language processing. J Biomed Inform 138:104286","journal-title":"J Biomed Inform"},{"key":"11666_CR36","doi-asserted-by":"crossref","first-page":"688","DOI":"10.1038\/s41597-024-03496-6","volume":"11","author":"J R\u00fcckert","year":"2024","unstructured":"R\u00fcckert J et al (2024) Rocov2: radiology objects in context version 2, an updated multimodal image dataset. Sci Data 11:688","journal-title":"Sci Data"},{"key":"11666_CR37","doi-asserted-by":"crossref","unstructured":"Pelka O, Koitka S, R\u00fcckert J, Nensa F, Friedrich CM (2018) Radiology objects in context (ROCO): a multimodal image dataset 180\u2013189","DOI":"10.1007\/978-3-030-01364-6_20"},{"key":"11666_CR38","doi-asserted-by":"crossref","first-page":"158","DOI":"10.1038\/s41597-023-02036-y","volume":"10","author":"D Gupta","year":"2023","unstructured":"Gupta D, Attal K, Demner-Fushman D (2023) A dataset for medical instructional video classification and question answering. Sci Data 10:158","journal-title":"Sci Data"},{"key":"11666_CR39","unstructured":"Ben Abacha A, Sarrouti M, Demner-Fushman D, Hasan SA, M\u00fcller H (2021) Overview of the VQA-med task at imageclef 2021: visual question answering and generation in the medical domain"},{"key":"11666_CR40","doi-asserted-by":"crossref","unstructured":"Liu B et al (2021) Slake: a semantically-labeled knowledge-enhanced dataset for medical visual question answering 1650\u20131654","DOI":"10.1109\/ISBI48211.2021.9434010"},{"key":"11666_CR41","unstructured":"Sarrouti M (2020) NLM at VQA-med 2020: Visual question answering and generation in the medical domain"},{"key":"11666_CR42","doi-asserted-by":"crossref","unstructured":"He X (2021) Towards visual question answering on pathology images. 2","DOI":"10.18653\/v1\/2021.acl-short.90"},{"key":"11666_CR43","doi-asserted-by":"crossref","unstructured":"Kovaleva O et al (2020) Towards visual dialog for radiology 60\u201369","DOI":"10.18653\/v1\/2020.bionlp-1.6"},{"key":"11666_CR44","unstructured":"Ben\u00a0Abacha A, Hasan SA, Datla VV, Demner-Fushman D, M\u00fcller H (2019) VQA-med: overview of the medical visual question answering task at imageclef 2019"},{"key":"11666_CR45","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1038\/s41597-018-0002-5","volume":"5","author":"JJ Lau","year":"2018","unstructured":"Lau JJ, Gayen S, Ben Abacha A, Demner-Fushman D (2018) A dataset of clinically generated visual questions and answers about radiology images. Sci data 5:1\u201310","journal-title":"Sci data"},{"key":"11666_CR46","doi-asserted-by":"crossref","unstructured":"Chacra DA, Zelek J (2022) The topology and language of relationships in the visual genome dataset 4860\u20134868","DOI":"10.1109\/CVPRW56347.2022.00533"},{"key":"11666_CR47","doi-asserted-by":"crossref","first-page":"417","DOI":"10.1038\/s41597-020-00756-z","volume":"7","author":"M Aubreville","year":"2020","unstructured":"Aubreville M et al (2020) A completely annotated whole slide image dataset of canine breast cancer to aid human breast cancer research. Sci data 7:417","journal-title":"Sci data"},{"key":"11666_CR48","unstructured":"Wu J et al (2021) Chest imagenome dataset. Physio Net"},{"key":"11666_CR49","unstructured":"Xie Y et al (2024) MedTrinity-25M: a large-scale multimodal dataset with multigranular annotations for medicine. arXiv preprint arXiv:2408.02900"},{"key":"11666_CR50","doi-asserted-by":"crossref","unstructured":"Papineni K, Roukos S, Ward T, Zhu W-J (2002) Bleu: a method for automatic evaluation of machine translation 311\u2013318","DOI":"10.3115\/1073083.1073135"},{"key":"11666_CR51","unstructured":"Lin C-Y (2004) Rouge: a package for automatic evaluation of summaries, pp 74\u201381"},{"key":"11666_CR52","unstructured":"Banerjee S, Lavie A (2005) Meteor: an automatic metric for MT evaluation with improved correlation with human judgments, pp 65\u201372"},{"key":"11666_CR53","doi-asserted-by":"crossref","unstructured":"Es S, James J, Anke LE, Schockaert S (2024) Ragas: automated evaluation of retrieval augmented generation, pp 150\u2013158","DOI":"10.18653\/v1\/2024.eacl-demo.16"},{"key":"11666_CR54","doi-asserted-by":"crossref","unstructured":"Tan TF et al (2024) A proposed score evaluation framework for large language models: safety, consensus, objectivity, reproducibility and explainability. arXiv preprint arXiv:2407.07666","DOI":"10.2139\/ssrn.5029562"},{"key":"11666_CR55","unstructured":"Saab K et al (2024) Capabilities of Gemini models in medicine. arXiv preprint arXiv:2404.18416"},{"key":"11666_CR56","unstructured":"Li J et al (2023) Huatuo-26m, a large-scale Chinese medical QA dataset. arXiv preprint arXiv:2305.01526"},{"key":"11666_CR57","doi-asserted-by":"crossref","unstructured":"Lu Q, Dou D, Nguyen T (2022) Clinicalt5: a generative language model for clinical text, pp 5436\u20135443","DOI":"10.18653\/v1\/2022.findings-emnlp.398"},{"key":"11666_CR58","unstructured":"Wang G, Yang G, Du Z, Fan L, Li X (2023) CLINICALGPT: large language models finetuned with diverse medical data and comprehensive evaluation. arXiv preprint arXiv:2306.09968"},{"key":"11666_CR59","doi-asserted-by":"crossref","unstructured":"Tian Y, Gan R, Song Y, Zhang J, Zhang Y (2023) Chimed-gpt: a Chinese medical large language model with full training regime and better alignment to human preferences. arXiv preprint arXiv:2311.06025","DOI":"10.18653\/v1\/2024.acl-long.386"},{"key":"11666_CR60","doi-asserted-by":"crossref","unstructured":"Luo R et\u00a0al (2022) Biogpt: generative pre-trained transformer for biomedical text generation and mining. Briefings Bioinform 23, bbac409","DOI":"10.1093\/bib\/bbac409"},{"key":"11666_CR61","unstructured":"Gu Y et al (2020) Domain-specific language model pretraining for biomedical natural language processing. arXiv:2007.15779"},{"key":"11666_CR62","unstructured":"Devlin J, Chang M-W, Lee K, Toutanova K (2018) Bert: pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805"},{"key":"11666_CR63","unstructured":"Yang X et al (2022) GatorTron: a large clinical language model to unlock patient information from unstructured electronic health records. arXiv preprint arXiv:2203.03540"},{"key":"11666_CR64","unstructured":"Bolton E et al (2024) Biomedlm: a 2.7 b parameter language model trained on biomedical text. arXiv preprint arXiv:2403.18421"},{"key":"11666_CR65","unstructured":"Toma A et al (2023) Clinical camel: an open expert-level medical language model with dialogue-based knowledge encoding. arXiv preprint arXiv:2305.12031"},{"key":"11666_CR66","unstructured":"Christophe C et al (2024) Med42-evaluating fine-tuning strategies for medical LLMS: full-parameter vs. parameter-efficient approaches. arXiv preprint arXiv:2404.14779"},{"key":"11666_CR67","unstructured":"Christophe C, Kanithi PK, Raha T, Khan S, Pimentel MA (2024) Med42-v2: a suite of clinical LLMs. arXiv preprint arXiv:2408.06142"},{"key":"11666_CR68","unstructured":"Adly AM, Samy M, Fawzy A (2025) Gazal-r1: achieving state-of-the-art medical reasoning with parameter-efficient two-stage training. arXiv preprint arXiv:2506.21594"},{"key":"11666_CR69","doi-asserted-by":"crossref","first-page":"1234","DOI":"10.1093\/bioinformatics\/btz682","volume":"36","author":"J Lee","year":"2020","unstructured":"Lee J et al (2020) Biobert: a pre-trained biomedical language representation model for biomedical text mining. Bioinformatics 36:1234\u20131240","journal-title":"Bioinformatics"},{"key":"11666_CR70","unstructured":"Huang K, Altosaar J, Ranganath R (2019) Clinicalbert: modeling clinical notes and predicting hospital readmission. arXiv preprint arXiv:1904.05342"},{"key":"11666_CR71","doi-asserted-by":"crossref","unstructured":"Beltagy I, Lo K Cohan A (2019) SciBERT: a pretrained language model for scientific text. arXiv preprint arXiv:1903.10676","DOI":"10.18653\/v1\/D19-1371"},{"key":"11666_CR72","doi-asserted-by":"crossref","unstructured":"Peng Y, Yan S, Lu Z (2019) Transfer learning in biomedical natural language processing: an Evaluation of BERT and ELMo on ten benchmarking datasets. arXiv preprint arXiv:1906.05474","DOI":"10.18653\/v1\/W19-5006"},{"key":"11666_CR73","doi-asserted-by":"crossref","unstructured":"Zhang K et al (2024) A generalist vision-language foundation model for diverse biomedical tasks. Nat Med 1\u201313","DOI":"10.1038\/s41591-024-03185-2"},{"key":"11666_CR74","unstructured":"Zhang S et al (2023) Biomedclip: a multimodal biomedical foundation model pretrained from fifteen million scientific image-text pairs. arXiv preprint arXiv:2303.00915"},{"key":"11666_CR75","unstructured":"Bianchi F et al (2023) Contrastive language-image pre-training for the Italian. arXiv preprint arXiv:2108.08688"},{"key":"11666_CR76","unstructured":"Liu J et al (2023) Clip-driven universal model for organ segmentation and tumor detection, pp 21152\u201321164"},{"key":"11666_CR77","doi-asserted-by":"crossref","unstructured":"Li P, Liu G, He J, Zhao Z, Zhong S (2023) Masked vision and language pre-training with unimodal and multimodal contrastive losses for medical visual question answering, pp 374\u2013383","DOI":"10.1007\/978-3-031-43907-0_36"},{"key":"11666_CR78","doi-asserted-by":"crossref","unstructured":"Van Sonsbeek T, Derakhshani MM, Najdenkoska I, Snoek CG, Worring M (2023) Open-ended medical visual question answering through prefix tuning of language models, pp 726\u2013736","DOI":"10.1007\/978-3-031-43904-9_70"},{"key":"11666_CR79","doi-asserted-by":"crossref","unstructured":"Li P, Liu G, Tan L, Liao J, Zhong S (2023) Self-supervised vision-language pretraining for medial visual question answering 1\u20135","DOI":"10.1109\/ISBI53787.2023.10230743"},{"key":"11666_CR80","doi-asserted-by":"crossref","unstructured":"Li C et al (2024) Llava-med: Training a large language-and-vision assistant for biomedicine in one day. Advances in Neural Information Processing Systems 36","DOI":"10.32388\/VLXB6M"},{"key":"11666_CR81","unstructured":"Liu H, Li C, Wu Q, Lee YJ (2024) Visual instruction tuning. Advances in neural information processing systems 36"},{"key":"11666_CR82","unstructured":"Eslami S, de Melo G, Meinel C (2021) Does clip benefit visual question answering in the medical domain as much as it does in the general domain? arXiv preprint arXiv:2112.13906"},{"key":"11666_CR83","doi-asserted-by":"crossref","unstructured":"Zheng S et al (2024) Benchmarking pathclip for pathology image analysis. Journal of Imaging Informatics in Medicine 1\u201317","DOI":"10.1007\/s10278-024-01128-4"},{"key":"11666_CR84","unstructured":"Gao W et al (2023) Ophglm: Training an ophthalmology large language-and-vision assistant based on instructions and dialogue. arXiv preprint arXiv:2306.12174"},{"key":"11666_CR85","doi-asserted-by":"crossref","unstructured":"Long C et al (2024) Chatent: Augmented large language model for expert knowledge retrieval in otolaryngology\u2013head and neck surgery. Otolaryngology\u2013Head and Neck Surgery","DOI":"10.2139\/ssrn.4571725"},{"key":"11666_CR86","volume":"149","author":"Y Guo","year":"2024","unstructured":"Guo Y, Qiu W, Leroy G, Wang S, Cohen T (2024) Retrieval augmentation of large language models for lay language generation. J Biomed Inform 149:104580","journal-title":"J Biomed Inform"},{"key":"11666_CR87","doi-asserted-by":"crossref","unstructured":"Ge J et al (2024) Development of a liver disease-specific large language model chat interface using retrieval augmented generation. Hepatology 10\u20131097","DOI":"10.1101\/2023.11.10.23298364"},{"key":"11666_CR88","doi-asserted-by":"crossref","first-page":"AIoa2300068","DOI":"10.1056\/AIoa2300068","volume":"1","author":"C Zakka","year":"2024","unstructured":"Zakka C et al (2024) Almanac\u2013retrieval-augmented language models for clinical medicine. NEJM AI 1:AIoa2300068","journal-title":"NEJM AI"},{"key":"11666_CR89","unstructured":"Thompson WE et al (2023) Large language models with retrieval-augmented generation for zero-shot disease phenotyping. arXiv preprint arXiv:2312.06457"},{"key":"11666_CR90","unstructured":"Agrawal AM et al (2025) Conversation ai dialog for medicare powered by finetuning and retrieval augmented generation. arXiv preprint arXiv:2502.02249"},{"key":"11666_CR91","doi-asserted-by":"crossref","DOI":"10.1016\/j.artmed.2023.102535","volume":"139","author":"D Varshney","year":"2023","unstructured":"Varshney D, Zafar A, Behera NK, Ekbal A (2023) Knowledge graph assisted end-to-end medical dialog generation. Artif Intell Med 139:102535","journal-title":"Artif Intell Med"},{"key":"11666_CR92","doi-asserted-by":"crossref","first-page":"3310","DOI":"10.1038\/s41598-023-29213-8","volume":"13","author":"D Varshney","year":"2023","unstructured":"Varshney D, Zafar A, Behera NK, Ekbal A (2023) Knowledge grounded medical dialogue generation using augmented graphs. Sci Rep 13:3310","journal-title":"Sci Rep"},{"key":"11666_CR93","volume":"308","author":"A Rau","year":"2023","unstructured":"Rau A et al (2023) A context-based chatbot surpasses radiologists and generic ChatGPT in following the ACR appropriateness guidelines. Radiology 308:e230970","journal-title":"Radiology"},{"key":"11666_CR94","doi-asserted-by":"crossref","first-page":"14215","DOI":"10.1038\/s41598-023-41512-8","volume":"13","author":"MF Russe","year":"2023","unstructured":"Russe MF et al (2023) Performance of ChatGPT, human radiologists, and context-aware ChatGPT in identifying AO codes from radiology reports. Sci Rep 13:14215","journal-title":"Sci Rep"},{"key":"11666_CR95","doi-asserted-by":"crossref","first-page":"S14","DOI":"10.1097\/BOT.0000000000000947","volume":"31","author":"KJ Schnake","year":"2017","unstructured":"Schnake KJ, Schroeder GD, Vaccaro AR, Oner C (2017) Aospine classification systems (subaxial, thoracolumbar). J Orthop Trauma 31:S14\u2013S23","journal-title":"J Orthop Trauma"},{"key":"11666_CR96","unstructured":"Yang R et al (2023) Integrating UMLS knowledge into large language models for medical question answering. arXiv e-prints arXiv:2310.02778"},{"key":"11666_CR97","doi-asserted-by":"crossref","first-page":"D267","DOI":"10.1093\/nar\/gkh061","volume":"32","author":"O Bodenreider","year":"2004","unstructured":"Bodenreider O (2004) The unified medical language system (UMLs): integrating biomedical terminology. Nucleic Acids Res 32:D267\u2013D270","journal-title":"Nucleic Acids Res"},{"key":"11666_CR98","doi-asserted-by":"crossref","unstructured":"Wang Y, Ma X, Chen W (2023) Augmenting black-box LLMs with medical textbooks for clinical question answering. arXiv preprint arXiv:2309.02233","DOI":"10.18653\/v1\/2024.findings-emnlp.95"},{"key":"11666_CR99","doi-asserted-by":"crossref","unstructured":"Jin Q et al (2023) Matching patients to clinical trials with large language models. arXiv:2307.15051","DOI":"10.1038\/s41467-024-53081-z"},{"key":"11666_CR100","unstructured":"Douze M et al (2024) The FAISS library (2024) arXiv preprint arXiv:2401.08281"},{"key":"11666_CR101","unstructured":"Manathunga SS, Illangasekara Y (2023) Retrieval augmented generation and representative vector summarization for large unstructured textual data in medical education. arXiv preprint arXiv:2308.00479"},{"key":"11666_CR102","doi-asserted-by":"crossref","first-page":"93","DOI":"10.1016\/j.infoh.2024.07.001","volume":"1","author":"C Ye","year":"2024","unstructured":"Ye C (2024) Exploring a learning-to-rank approach to enhance the retrieval augmented generation (rag)-based electronic medical records search engines. Inform Health 1:93\u201399","journal-title":"Inform Health"},{"key":"11666_CR103","doi-asserted-by":"crossref","unstructured":"Xia P et al (2024) MMed-RAG: versatile multimodal rag system for medical vision language models. arXiv preprint arXiv:2410.13085","DOI":"10.18653\/v1\/2024.emnlp-main.62"},{"key":"11666_CR104","doi-asserted-by":"crossref","first-page":"27","DOI":"10.1007\/s10791-025-09505-5","volume":"28","author":"R Upadhyay","year":"2025","unstructured":"Upadhyay R, Viviani M (2025) Enhancing health information retrieval with rag by prioritizing topical relevance and factual accuracy. Discov Comput 28:27","journal-title":"Discov Comput"},{"key":"11666_CR105","doi-asserted-by":"crossref","unstructured":"Askari A, Abolghasemi A, Pasi G, Kraaij W, Verberne S (2023) Injecting the BM25 score as text improves bert-based re-rankers, pp 66\u201383","DOI":"10.1007\/978-3-031-28244-7_5"},{"key":"11666_CR106","doi-asserted-by":"crossref","first-page":"187","DOI":"10.1038\/s41746-025-01519-z","volume":"8","author":"YH Ke","year":"2025","unstructured":"Ke YH et al (2025) Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness. NPJ Digit Med 8:187","journal-title":"NPJ Digit Med"},{"key":"11666_CR107","doi-asserted-by":"crossref","first-page":"687","DOI":"10.3390\/bioengineering12070687","volume":"12","author":"B Pingua","year":"2025","unstructured":"Pingua B et al (2025) Medical LLMs: fine-tuning vs. retrieval-augmented generation. Bioengineering 12:687","journal-title":"Bioengineering"},{"key":"11666_CR108","unstructured":"Sohn J et al (2024) Rationale-guided retrieval augmented generation for medical question answering. arXiv preprint arXiv:2411.00300"},{"key":"11666_CR109","unstructured":"Ceresa M et al (2025) Retrieval augmented generation evaluation for health documents. arXiv preprint arXiv:2505.04680"},{"key":"11666_CR110","doi-asserted-by":"crossref","DOI":"10.2196\/50209","volume":"12","author":"T Abdullahi","year":"2024","unstructured":"Abdullahi T, Mercurio L, Singh R, Eickhoff C (2024) Retrieval-based diagnostic decision support: mixed methods study. JMIR Med Inform 12:e50209","journal-title":"JMIR Med Inform"},{"key":"11666_CR111","doi-asserted-by":"crossref","first-page":"586","DOI":"10.1016\/j.procs.2024.09.467","volume":"246","author":"D Benfenati","year":"2024","unstructured":"Benfenati D, Filippis GM, Rinaldi AM, Russo C, Tommasino C (2024) A retrieval-augmented generation application for question-answering in nutrigenetics domain. Procedia Comput Sci 246:586\u2013595","journal-title":"Procedia Comput Sci"},{"key":"11666_CR112","doi-asserted-by":"crossref","unstructured":"Markey N, El-Mansouri I, Rensonnet G, van Langen C, Meier C (2025) From rags to riches: utilizing large language models to write documents for clinical trials. Clinical Trials 10.1177\/17407745251320806","DOI":"10.1177\/17407745251320806"},{"key":"11666_CR113","doi-asserted-by":"publisher","DOI":"10.1177\/19322968241253568","author":"S Mashatian","year":"2024","unstructured":"Mashatian S et al (2024) Building trustworthy generative artificial intelligence for diabetes care and limb preservation: a medical knowledge extraction case. J Diabetes Sci Technol. https:\/\/doi.org\/10.1177\/19322968241253568","journal-title":"J Diabetes Sci Technol"},{"key":"11666_CR114","doi-asserted-by":"publisher","DOI":"10.1093\/jamiaopen\/ooaf003","author":"JL Painter","year":"2024","unstructured":"Painter JL, Chalamalasetti VR, Kassekert R, Bate A (2024) Automating pharmacovigilance evidence generation: using large language models to produce context-aware structured query language. JAMIA Open. https:\/\/doi.org\/10.1093\/jamiaopen\/ooaf003","journal-title":"JAMIA Open"},{"key":"11666_CR115","doi-asserted-by":"crossref","DOI":"10.2196\/54633","volume":"8","author":"B Parmanto","year":"2024","unstructured":"Parmanto B et al (2024) A reliable and accessible caregiving language model (CALM) to support tools for caregivers: development and evaluation study. JMIR Format Res 8:e54633","journal-title":"JMIR Format Res"},{"key":"11666_CR116","doi-asserted-by":"crossref","first-page":"355","DOI":"10.1016\/j.jcms.2024.12.009","volume":"53","author":"D Steybe","year":"2025","unstructured":"Steybe D et al (2025) Evaluation of a context-aware chatbot using retrieval-augmented generation for answering clinical questions on medication-related osteonecrosis of the jaw. J Cranio-Maxillofac Surg 53:355\u2013360","journal-title":"J Cranio-Maxillofac Surg"},{"key":"11666_CR117","unstructured":"Lu K et al (2025) $$\\text{Med-} r^2$$: Crafting trustworthy LLM physicians through retrieval and reasoning of evidence-based medicine. arXiv preprint arXiv:2501.11885"},{"key":"11666_CR118","unstructured":"Bai S et al (2025) Qwen2. 5-vl technical report. arXiv preprint arXiv:2502.13923"},{"key":"11666_CR119","unstructured":"Grattafiori A et al (2024) The llama 3 herd of models. arXiv preprint arXiv:2407.21783"},{"key":"11666_CR120","doi-asserted-by":"crossref","unstructured":"Wu J, Zhu J, Qi Y (2024) Medical graph rag: towards safe medical large language model via graph retrieval-augmented generation. arXiv preprint arXiv:2408.04187","DOI":"10.18653\/v1\/2025.acl-long.1381"},{"key":"11666_CR121","doi-asserted-by":"crossref","unstructured":"Zhao X, Liu S, Yang S-Y, Miao C (2025) MedRAG: enhancing retrieval-augmented generation with knowledge graph-elicited reasoning for healthcare copilot. arXiv preprint arXiv:2502.04413","DOI":"10.1145\/3696410.3714782"},{"key":"11666_CR122","doi-asserted-by":"crossref","first-page":"1501408","DOI":"10.3389\/fpubh.2025.1501408","volume":"13","author":"Y Zheng","year":"2025","unstructured":"Zheng Y et al (2025) Integrating retrieval-augmented generation for enhanced personalized physician recommendations in web-based medical services: model development study. Front Public Health 13:1501408","journal-title":"Front Public Health"},{"key":"11666_CR123","doi-asserted-by":"crossref","unstructured":"Reimers N, Gurevych I (2019) Sentence-BERT: sentence embeddings using Siamese BERT-networks. arXiv preprint arXiv:1908.10084","DOI":"10.18653\/v1\/D19-1410"},{"key":"11666_CR124","doi-asserted-by":"crossref","unstructured":"Chen Z et al (2025) Towards OMNI-RAG: comprehensive retrieval-augmented generation for large language models in medical applications. arXiv preprint arXiv:2501.02460","DOI":"10.18653\/v1\/2025.acl-long.742"},{"key":"11666_CR125","doi-asserted-by":"crossref","first-page":"45","DOI":"10.1038\/s41746-024-01377-1","volume":"8","author":"I Lopez","year":"2025","unstructured":"Lopez I et al (2025) Clinical entity augmented retrieval for clinical information extraction. NPJ Digit Med 8:45","journal-title":"NPJ Digit Med"},{"key":"11666_CR126","doi-asserted-by":"crossref","first-page":"956","DOI":"10.1055\/a-2234-8268","volume":"196","author":"A Wollek","year":"2024","unstructured":"Wollek A et al (2024) German chexpert chest x-ray radiology report labeler. Fortschr R\u00f6ntgenstr 196:956\u2013965","journal-title":"Fortschr R\u00f6ntgenstr"},{"key":"11666_CR127","doi-asserted-by":"crossref","unstructured":"Hsu H-L et al (2025) Medplan: a two-stage rag-based system for personalized medical plan generation. arXiv preprint arXiv:2503.17900","DOI":"10.18653\/v1\/2025.acl-industry.76"},{"key":"11666_CR128","doi-asserted-by":"crossref","DOI":"10.1016\/j.jbi.2024.104662","volume":"156","author":"M Alkhalaf","year":"2024","unstructured":"Alkhalaf M, Yu P, Yin M, Deng C (2024) Applying generative AI with retrieval augmented generation to summarize and extract key clinical information from electronic health records. J Biomed Inform 156:104662","journal-title":"J Biomed Inform"},{"key":"11666_CR129","volume":"27","author":"S Das","year":"2025","unstructured":"Das S et al (2025) Two-layer retrieval-augmented generation framework for low-resource medical question answering using reddit data: proof-of-concept study. J Med Internet Res 27:e66220","journal-title":"J Med Internet Res"},{"key":"11666_CR130","doi-asserted-by":"crossref","first-page":"1512329","DOI":"10.3389\/fmed.2024.1512329","volume":"11","author":"Y Duan","year":"2025","unstructured":"Duan Y et al (2025) Research on a traditional Chinese medicine case-based question-answering system integrating large language models and knowledge graphs. Front Med 11:1512329","journal-title":"Front Med"},{"key":"11666_CR131","unstructured":"Glm T et al (2024) ChatGLM: a family of large language models from GLM-130b to GLM-4 all tools. arxiv 2024. arXiv preprint arXiv:2406.12793"},{"key":"11666_CR132","volume":"4","author":"Y Gao","year":"2025","unstructured":"Gao Y et al (2025) Leveraging medical knowledge graphs into large language models for diagnosis prediction: design and application study. JMIR AI 4:e58670","journal-title":"JMIR AI"},{"key":"11666_CR133","volume":"26","author":"D Wang","year":"2024","unstructured":"Wang D et al (2024) Enhancement of the performance of large language models in diabetes education through retrieval-augmented generation: comparative study. J Med Internet Res 26:e58041","journal-title":"J Med Internet Res"},{"key":"11666_CR134","doi-asserted-by":"crossref","first-page":"1392555","DOI":"10.3389\/fmed.2024.1392555","volume":"11","author":"Q Zhou","year":"2024","unstructured":"Zhou Q et al (2024) GastroBot: a Chinese gastrointestinal disease chatbot based on the retrieval-augmented generation. Front Med 11:1392555","journal-title":"Front Med"}],"container-title":["Neural Computing and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00521-025-11666-9.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s00521-025-11666-9\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00521-025-11666-9.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,11,1]],"date-time":"2025-11-01T16:28:05Z","timestamp":1762014485000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s00521-025-11666-9"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,10,16]]},"references-count":134,"journal-issue":{"issue":"33","published-print":{"date-parts":[[2025,11]]}},"alternative-id":["11666"],"URL":"https:\/\/doi.org\/10.1007\/s00521-025-11666-9","relation":{},"ISSN":["0941-0643","1433-3058"],"issn-type":[{"value":"0941-0643","type":"print"},{"value":"1433-3058","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025,10,16]]},"assertion":[{"value":"16 November 2024","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"9 September 2025","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"16 October 2025","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"Each author affirms that no financial, professional, or personal relationships with other people or organizations could influence the work reported in this paper.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}]}}