{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,26]],"date-time":"2026-02-26T14:58:28Z","timestamp":1772117908921,"version":"3.50.1"},"reference-count":32,"publisher":"Wiley","issue":"10","license":[{"start":{"date-parts":[[2025,4,6]],"date-time":"2025-04-06T00:00:00Z","timestamp":1743897600000},"content-version":"vor","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"content-domain":{"domain":["advanced.onlinelibrary.wiley.com"],"crossmark-restriction":true},"short-container-title":["Advanced Intelligent Systems"],"published-print":{"date-parts":[[2025,10]]},"abstract":"<jats:p>Image classification plays a pivotal role in analyzing biomedical images, serving as a cornerstone for both biological research and clinical diagnostics. It is demonstrated that large multimodal models (LMMs), like GPT\u20104, excel in one\u2010shot learning, generalization, interpretability, and text\u2010driven image classification across diverse biomedical tasks. These tasks include the classification of tissues, cell types, cellular states, and disease status. LMMs stand out from traditional single\u2010modal classification approaches, which often require large training datasets and offer limited interpretability.<\/jats:p>","DOI":"10.1002\/aisy.202400947","type":"journal-article","created":{"date-parts":[[2025,4,7]],"date-time":"2025-04-07T00:45:37Z","timestamp":1743986737000},"update-policy":"https:\/\/doi.org\/10.1002\/crossmark_policy","source":"Crossref","is-referenced-by-count":2,"title":["Assessing Large Multimodal Models for One\u2010Shot Learning and Interpretability in Biomedical Image Classification"],"prefix":"10.1002","volume":"7","author":[{"ORCID":"https:\/\/orcid.org\/0000-0003-0972-2192","authenticated-orcid":false,"given":"Wenpin","family":"Hou","sequence":"first","affiliation":[{"name":"Department of Biostatistics The Mailman School of Public Health Columbia University  New York 10032 NY USA"}]},{"given":"Qi","family":"Liu","sequence":"additional","affiliation":[{"name":"Department of Biostatistics The Mailman School of Public Health Columbia University  New York 10032 NY USA"}]},{"given":"Huifang","family":"Ma","sequence":"additional","affiliation":[{"name":"Department of Biostatistics and Bioinformatics Duke University School of Medicine  Durham 27705 NC USA"}]},{"given":"Yilong","family":"Qu","sequence":"additional","affiliation":[{"name":"Department of Biostatistics and Bioinformatics Duke University School of Medicine  Durham 27705 NC USA"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-9457-4704","authenticated-orcid":false,"given":"Zhicheng","family":"Ji","sequence":"additional","affiliation":[{"name":"Department of Biostatistics and Bioinformatics Duke University School of Medicine  Durham 27705 NC USA"}]}],"member":"311","published-online":{"date-parts":[[2025,4,6]]},"reference":[{"key":"e_1_2_9_2_1","unstructured":"OpenAI J.Achiam S.Adler S.Agarwal L.Ahmad I.Akkaya F. L.Aleman D.Almeida J.Altenschmidt S.Altman S.Anadkat R.Avila I.Babuschkin S.Balaji V.Balcom P.Baltescu H.Bao M.Bavarian J.Belgum I.Bello J.Berdine G.Bernadett\u2010Shapiro C.Berner L.Bogdonoff O.Boiko M.Boyd A.\u2010L.Brakman G.Brockman T.Brooks M.Brundage et al. GPT\u20104 technical report.arXiv preprint arXiv:2303.087742023."},{"key":"e_1_2_9_3_1","unstructured":"Gemini Team Google P.Georgiev V. I.Lei R.Burnell L.Bai A.Gulati G.Tanzer D.Vincent Z.Pan S.Wang S.Mariooryad Y.Ding X.Geng F.Alcober R.Frostig M.Omernick L.Walker C.Paduraru C.Sorokin A.Tacchetti C.Gaffney S.Daruki O.Sercinoglu Z.Gleicher J.Love P.Voigtlaender R.Jain G.Surita K.Mohamed R.Blevins J.Ahn et al. Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context.arXiv preprint arXiv:2403.055302024."},{"key":"e_1_2_9_4_1","unstructured":"Z.Yang L.Li K.Lin J.Wang C.\u2010CLin Z.Liu L.Wang The dawn of lmms: Preliminary explorations with GPT\u20104V (ision).arXiv preprint arXiv:2309.174212023 9 1."},{"key":"e_1_2_9_5_1","unstructured":"S.Yin C.Fu S.Zhao K.LiX.Sun T.Xu E.Chen A survey on multimodal large language models.arXiv preprint arXiv:2306.135492023."},{"key":"e_1_2_9_6_1","doi-asserted-by":"crossref","unstructured":"J.Wu W.Gan Z.Chen S.Wan S. Y.Philip in2023 IEEE Inter. Conf. on Big Data (BigData) IEEE Piscataway NJ2023 pp.2247\u20132256.","DOI":"10.1109\/BigData59044.2023.10386743"},{"key":"e_1_2_9_7_1","unstructured":"Z.Liu H.Jiang T.Zhong Z.Wu C.Ma Y.Li X.Yu Y.Zhang Y.Pan P.Shu Y.Lyu L.Zhang J.Yao P.Dong C.Cao Z.Xiao J.Wang H.Zhao S.Xu Y.Wei J.Chen H.Dai P.Wang H.He Z.Wang X.Wang X.Zhang L.Zhao Y.Liu K.Zhang et al. Holistic evaluation of GPT\u20104V for biomedical imaging.arXiv preprint arXiv:2312.052562023."},{"key":"e_1_2_9_8_1","doi-asserted-by":"crossref","unstructured":"M.\u2010H.Van P.Verma X.Wu in2024 IEEE\/ACM Conf. on Connected Health: Applications Systems and Engineering Technologies (CHASE) IEEE Piscataway NJ2024 pp.172\u2013176.","DOI":"10.1109\/CHASE60773.2024.00029"},{"key":"e_1_2_9_9_1","doi-asserted-by":"publisher","DOI":"10.1016\/j.metrad.2024.100099"},{"key":"e_1_2_9_10_1","unstructured":"Z.Yan K.Zhang R.Zhou L.He X.Li L.Sun Multimodal chatgpt for medical applications: an experimental study of gpt\u20104v.arXiv preprint arXiv:2310.190612023."},{"key":"e_1_2_9_11_1","unstructured":"A.Radford J. W.Kim C.Hallacy A.Ramesh G.Goh S.Agarwal G.Sastry A.Askell P.Mishkin J.Clark G.Krueger I.SutskeverinInter. Conf. on Machine Learning PMLR2021 pp.8748\u20138763."},{"key":"e_1_2_9_12_1","unstructured":"J.Li D.Li C.Xiong S.Hoi inInter. Conf. on Machine Learning PMLR BaltimoreJuly2022 pp.12888\u201312900."},{"key":"e_1_2_9_13_1","unstructured":"J.Wang Z.Yang X.Hu L.Li K.Lin Z.Gan Z.Liu C.Liu L.Wang J.Wang Git: A generative image\u2010to\u2010text transformer for vision and language.arXiv preprint arXiv:2205.14100 2022."},{"key":"e_1_2_9_14_1","unstructured":"P.Wang A.Yang R.Men J.Lin S.Bai Z.Li J.Ma C.Zhou J.Zhou H.Yang inInter. Conf. on Machine Learning PMLR BaltimoreJuly2022 pp.23318\u201323340."},{"key":"e_1_2_9_15_1","doi-asserted-by":"publisher","DOI":"10.1038\/ng.2653"},{"key":"e_1_2_9_16_1","doi-asserted-by":"publisher","DOI":"10.1038\/s41592-021-01249-6"},{"key":"e_1_2_9_17_1","doi-asserted-by":"publisher","DOI":"10.1006\/cimm.1996.0159"},{"key":"e_1_2_9_18_1","first-page":"741","volume":"71","author":"Ross R. A.","year":"1983","journal-title":"J. Natl. Cancer Inst."},{"key":"e_1_2_9_19_1","doi-asserted-by":"publisher","DOI":"10.1016\/S0092-8674(03)00401-X"},{"key":"e_1_2_9_20_1","doi-asserted-by":"publisher","DOI":"10.1186\/s13059-016-1017-x"},{"key":"e_1_2_9_21_1","doi-asserted-by":"publisher","DOI":"10.1016\/j.cell.2018.02.010"},{"key":"e_1_2_9_22_1","doi-asserted-by":"publisher","DOI":"10.1016\/j.compeleceng.2019.106532"},{"key":"e_1_2_9_23_1","doi-asserted-by":"publisher","DOI":"10.1007\/s10278-013-9622-7"},{"key":"e_1_2_9_24_1","doi-asserted-by":"crossref","unstructured":"S.Marcel Y.Rodriguez inProc. of the 18th ACM Inter. Conf. on Multimedia Firenze ItalyOctober2010 pp.1485\u20131488.","DOI":"10.1145\/1873951.1874254"},{"key":"e_1_2_9_25_1","unstructured":"A.Paszke S.Gross F.Massa A.Lerer J.Bradbury G.Chanan T.Killeen Z.Lin N.Gimelshein L.Antiga A.Desmaison A.K\u00f6pf E.Yang Z.DeVito M.Raison A.Tejani S.Chilamkurthy B.Steiner L.Fang J.Bai S.Chintala Pytorch: An imperative style high\u2010performance deep learning library.Advances in Neural Information Processing Systems 32 2019."},{"key":"e_1_2_9_26_1","unstructured":"D. P.Kingma Adam: A method for stochastic optimization.arXiv preprint arXiv:1412.69802014."},{"key":"e_1_2_9_27_1","unstructured":"G.Koch R.Zemel R.Salakhutdinov inICML Deep Learning Workshop Lille France July2015 Vol.2 pp.1\u201330."},{"key":"e_1_2_9_28_1","doi-asserted-by":"crossref","unstructured":"W.Xue W.Wang inProc. of the AAAI Conf. on Artificial Intelligence New YorkFebruary2020 Vol.34 pp.6558\u20136565.","DOI":"10.1609\/aaai.v34i04.6130"},{"key":"e_1_2_9_29_1","doi-asserted-by":"crossref","unstructured":"Y.Yang A.Panagopoulou S.Zhou D.Jin C.Callison\u2010Burch M.Yatskar Proc. of the IEEE\/CVF Conf. on Computer Vision and Pattern Recognition IEEE Piscataway NJ2023 pp.19187\u201319197.","DOI":"10.1109\/CVPR52729.2023.01839"},{"key":"e_1_2_9_30_1","unstructured":"F.Bach Convex analysis and optimization with submodular functions: a tutorial.arXiv preprint arXiv:1010.42072010."},{"key":"e_1_2_9_31_1","unstructured":"H.Wickham ggplot2: Elegant Graphics for Data Analysis. Use R! Springer International Publishing Switzerland2016."},{"key":"e_1_2_9_32_1","doi-asserted-by":"publisher","DOI":"10.1186\/1751-0473-6-7"},{"key":"e_1_2_9_33_1","doi-asserted-by":"publisher","DOI":"10.1111\/j.2517-6161.1995.tb02031.x"}],"container-title":["Advanced Intelligent Systems"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/advanced.onlinelibrary.wiley.com\/doi\/pdf\/10.1002\/aisy.202400947","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,12,2]],"date-time":"2025-12-02T10:41:44Z","timestamp":1764672104000},"score":1,"resource":{"primary":{"URL":"https:\/\/advanced.onlinelibrary.wiley.com\/doi\/10.1002\/aisy.202400947"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,4,6]]},"references-count":32,"journal-issue":{"issue":"10","published-print":{"date-parts":[[2025,10]]}},"alternative-id":["10.1002\/aisy.202400947"],"URL":"https:\/\/doi.org\/10.1002\/aisy.202400947","archive":["Portico"],"relation":{"has-preprint":[{"id-type":"doi","id":"10.1101\/2023.12.31.573796","asserted-by":"object"}]},"ISSN":["2640-4567","2640-4567"],"issn-type":[{"value":"2640-4567","type":"print"},{"value":"2640-4567","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025,4,6]]},"assertion":[{"value":"2025-01-02","order":0,"name":"received","label":"Received","group":{"name":"publication_history","label":"Publication History"}},{"value":"2025-04-06","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}],"article-number":"2400947"}}