{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T15:53:53Z","timestamp":1781538833497,"version":"3.54.5"},"publisher-location":"New York, NY, USA","reference-count":44,"publisher":"ACM","license":[{"start":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T00:00:00Z","timestamp":1781481600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/legalcode"}],"funder":[{"name":"National Natural Science Foundation of China","award":["62506230"],"award-info":[{"award-number":["62506230"]}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2026,6,16]]},"DOI":"10.1145\/3805622.3810776","type":"proceedings-article","created":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T14:42:57Z","timestamp":1781534577000},"page":"515-524","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":0,"title":["Keep the General, Inject the Specific: Structured Dialogue Fine-Tuning for Knowledge Injection without Catastrophic Forgetting"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0009-0007-6817-5586","authenticated-orcid":false,"given":"Yijie","family":"Hong","sequence":"first","affiliation":[{"name":"Shanghai Jiao Tong University, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0009-0000-7292-2184","authenticated-orcid":false,"given":"Xiaofei","family":"Yin","sequence":"additional","affiliation":[{"name":"Ant Group, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0009-0003-2082-375X","authenticated-orcid":false,"given":"Xinzhong","family":"Wang","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-9242-493X","authenticated-orcid":false,"given":"Ya","family":"Guo","sequence":"additional","affiliation":[{"name":"Ant Group, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0009-0008-5784-7225","authenticated-orcid":false,"given":"Huijia","family":"Zhu","sequence":"additional","affiliation":[{"name":"Ant Group, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-1210-8954","authenticated-orcid":false,"given":"Sufeng","family":"Duan","sequence":"additional","affiliation":[{"name":"Shanghai Jiao Tong University, Shanghai, China"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"320","published-online":{"date-parts":[[2026,6,15]]},"reference":[{"key":"e_1_3_3_1_2_2","doi-asserted-by":"crossref","unstructured":"Yuval Alaluf Elad Richardson Sergey Tulyakov Kfir Aberman and Daniel Cohen-Or. 2024. MyVLM: Personalizing VLMs for User-Specific Queries. arxiv:https:\/\/arXiv.org\/abs\/2403.14599\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2403.14599","DOI":"10.1007\/978-3-031-72624-8_5"},{"key":"e_1_3_3_1_3_2","unstructured":"Jinze Bai Shuai Bai Yunfei Chu Zeyu Cui Kai Dang Xiaodong Deng Yang Fan Wenbin Ge Yu Han Fei Huang Binyuan Hui Luo Ji Mei Li Junyang Lin Runji Lin Dayiheng Liu Gao Liu Chengqiang Lu Keming Lu Jianxin Ma Rui Men Xingzhang Ren Xuancheng Ren Chuanqi Tan Sinan Tan Jianhong Tu Peng Wang Shijie Wang Wei Wang Shengguang Wu Benfeng Xu Jin Xu An Yang Hao Yang Jian Yang Shusheng Yang Yang Yao Bowen Yu Hongyi Yuan Zheng Yuan Jianwei Zhang Xingxuan Zhang Yichang Zhang Zhenru Zhang Chang Zhou Jingren Zhou Xiaohuan Zhou and Tianhang Zhu. 2023. Qwen Technical Report. arxiv:https:\/\/arXiv.org\/abs\/2309.16609\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2309.16609"},{"key":"e_1_3_3_1_4_2","unstructured":"Andres\u00a0M Bran Sam Cox Oliver Schilter Carlo Baldassari Andrew\u00a0D White and Philippe Schwaller. 2023. ChemCrow: Augmenting large-language models with chemistry tools. arxiv:https:\/\/arXiv.org\/abs\/2304.05376\u00a0[physics.chem-ph] https:\/\/arxiv.org\/abs\/2304.05376"},{"key":"e_1_3_3_1_5_2","unstructured":"Junying Chen Chi Gui Ruyi Ouyang Anningzhe Gao Shunian Chen Guiming\u00a0Hardy Chen Xidong Wang Ruifei Zhang Zhenyang Cai Ke Ji Guangjun Yu Xiang Wan and Benyou Wang. 2024. HuatuoGPT-Vision Towards Injecting Medical Visual Knowledge into Multimodal LLMs at Scale. arxiv:https:\/\/arXiv.org\/abs\/2406.19280\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2406.19280"},{"key":"e_1_3_3_1_6_2","doi-asserted-by":"crossref","unstructured":"Zhe Chen Weiyun Wang Hao Tian Shenglong Ye Zhangwei Gao Erfei Cui Wenwen Tong Kongzhi Hu Jiapeng Luo Zheng Ma Ji Ma Jiaqi Wang Xiaoyi Dong Hang Yan Hewei Guo Conghui He Botian Shi Zhenjiang Jin Chao Xu Bin Wang Xingjian Wei Wei Li Wenjian Zhang Bo Zhang Pinlong Cai Licheng Wen Xiangchao Yan Min Dou Lewei Lu Xizhou Zhu Tong Lu Dahua Lin Yu Qiao Jifeng Dai and Wenhai Wang. 2024. How Far Are We to GPT-4V? Closing the Gap to Commercial Multimodal Models with Open-Source Suites. arxiv:https:\/\/arXiv.org\/abs\/2404.16821\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2404.16821","DOI":"10.1007\/s11432-024-4231-5"},{"key":"e_1_3_3_1_7_2","unstructured":"Daixuan Cheng Shaohan Huang Ziyu Zhu Xintong Zhang Wayne\u00a0Xin Zhao Zhongzhi Luan Bo Dai and Zhenliang Zhang. 2025. On Domain-Adaptive Post-Training for Multimodal Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2411.19930\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2411.19930"},{"key":"e_1_3_3_1_8_2","unstructured":"Chaoyou Fu Peixian Chen Yunhang Shen Yulei Qin Mengdan Zhang Xu Lin Jinrui Yang Xiawu Zheng Ke Li Xing Sun Yunsheng Wu Rongrong Ji Caifeng Shan and Ran He. 2025. MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2306.13394\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2306.13394"},{"key":"e_1_3_3_1_9_2","unstructured":"Rinon Gal Yuval Alaluf Yuval Atzmon Or Patashnik Amit\u00a0H. Bermano Gal Chechik and Daniel Cohen-Or. 2022. An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion. arxiv:https:\/\/arXiv.org\/abs\/2208.01618\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2208.01618"},{"key":"e_1_3_3_1_10_2","unstructured":"Rinon Gal Moab Arar Yuval Atzmon Amit\u00a0H. Bermano Gal Chechik and Daniel Cohen-Or. 2023. Encoder-based Domain Tuning for Fast Personalization of Text-to-Image Models. arxiv:https:\/\/arXiv.org\/abs\/2302.12228\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2302.12228"},{"key":"e_1_3_3_1_11_2","unstructured":"Yunfan Gao Yun Xiong Xinyu Gao Kangxiang Jia Jinliu Pan Yuxi Bi Yi Dai Jiawei Sun Meng Wang and Haofen Wang. 2024. Retrieval-Augmented Generation for Large Language Models: A Survey. arxiv:https:\/\/arXiv.org\/abs\/2312.10997\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2312.10997"},{"key":"e_1_3_3_1_12_2","unstructured":"Haoran Hao Jiaming Han Changsheng Li Yu-Feng Li and Xiangyu Yue. 2025. RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2410.13360\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2410.13360"},{"key":"e_1_3_3_1_13_2","unstructured":"Hulingxiao He Geng Li Zijun Geng Jinglin Xu and Yuxin Peng. 2025. Analyzing and Boosting the Power of Fine-Grained Visual Recognition for Multi-modal Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2501.15140\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2501.15140"},{"key":"e_1_3_3_1_14_2","unstructured":"Zecheng He Bo Sun Felix Juefei-Xu Haoyu Ma Ankit Ramchandani Vincent Cheung Siddharth Shah Anmol Kalia Harihar Subramanyam Alireza Zareian Li Chen Ankit Jain Ning Zhang Peizhao Zhang Roshan Sumbaly Peter Vajda and Animesh Sinha. 2024. Imagine yourself: Tuning-Free Personalized Image Generation. arxiv:https:\/\/arXiv.org\/abs\/2409.13346\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2409.13346"},{"key":"e_1_3_3_1_15_2","unstructured":"Neil Houlsby Andrei Giurgiu Stanislaw Jastrzebski Bruna Morrone Quentin de Laroussilhe Andrea Gesmundo Mona Attariyan and Sylvain Gelly. 2019. Parameter-Efficient Transfer Learning for NLP. arxiv:https:\/\/arXiv.org\/abs\/1902.00751\u00a0[cs.LG] https:\/\/arxiv.org\/abs\/1902.00751"},{"key":"e_1_3_3_1_16_2","unstructured":"Edward\u00a0J. Hu Yelong Shen Phillip Wallis Zeyuan Allen-Zhu Yuanzhi Li Shean Wang Lu Wang and Weizhu Chen. 2021. LoRA: Low-Rank Adaptation of Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2106.09685\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2106.09685"},{"key":"e_1_3_3_1_17_2","doi-asserted-by":"publisher","unstructured":"Qiao Jin Yifan Yang Qingyu Chen and Zhiyong Lu. 2024. GeneGPT: augmenting large language models with domain tools for improved access to biomedical information. Bioinformatics 40 2 (Feb. 2024). 10.1093\/bioinformatics\/btae075","DOI":"10.1093\/bioinformatics\/btae075"},{"key":"e_1_3_3_1_18_2","doi-asserted-by":"publisher","unstructured":"James Kirkpatrick Razvan Pascanu Neil Rabinowitz Joel Veness Guillaume Desjardins Andrei\u00a0A. Rusu Kieran Milan John Quan Tiago Ramalho Agnieszka Grabska-Barwinska Demis Hassabis Claudia Clopath Dharshan Kumaran and Raia Hadsell. 2017. Overcoming catastrophic forgetting in neural networks. Proceedings of the National Academy of Sciences 114 13 (March 2017) 3521\u20133526. 10.1073\/pnas.1611835114","DOI":"10.1073\/pnas.1611835114"},{"key":"e_1_3_3_1_19_2","unstructured":"Chunyuan Li Cliff Wong Sheng Zhang Naoto Usuyama Haotian Liu Jianwei Yang Tristan Naumann Hoifung Poon and Jianfeng Gao. 2023. LLaVA-Med: Training a Large Language-and-Vision Assistant for Biomedicine in One Day. arxiv:https:\/\/arXiv.org\/abs\/2306.00890\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2306.00890"},{"key":"e_1_3_3_1_20_2","unstructured":"Yifan Li Yifan Du Kun Zhou Jinpeng Wang Wayne\u00a0Xin Zhao and Ji-Rong Wen. 2023. Evaluating Object Hallucination in Large Vision-Language Models. arxiv:https:\/\/arXiv.org\/abs\/2305.10355\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2305.10355"},{"key":"e_1_3_3_1_21_2","unstructured":"Tianwei Lin Wenqiao Zhang Sijing Li Yuqian Yuan Binhe Yu Haoyuan Li Wanggui He Hao Jiang Mengze Li Xiaohui Song Siliang Tang Jun Xiao Hui Lin Yueting Zhuang and Beng\u00a0Chin Ooi. 2025. HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation. arxiv:https:\/\/arXiv.org\/abs\/2502.09838\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2502.09838"},{"key":"e_1_3_3_1_22_2","unstructured":"Haotian Liu Chunyuan Li Yuheng Li and Yong\u00a0Jae Lee. 2024. Improved Baselines with Visual Instruction Tuning. arxiv:https:\/\/arXiv.org\/abs\/2310.03744\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2310.03744"},{"key":"e_1_3_3_1_23_2","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2024\/873"},{"key":"e_1_3_3_1_24_2","unstructured":"Thao Nguyen Haotian Liu Yuheng Li Mu Cai Utkarsh Ojha and Yong\u00a0Jae Lee. 2024. Yo\u2019LLaVA: Your Personalized Language and Vision Assistant. arxiv:https:\/\/arXiv.org\/abs\/2406.09400\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2406.09400"},{"key":"e_1_3_3_1_25_2","unstructured":"OpenAI Josh Achiam Steven Adler et\u00a0al. 2024. GPT-4 Technical Report. arxiv:https:\/\/arXiv.org\/abs\/2303.08774\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2303.08774"},{"key":"e_1_3_3_1_26_2","unstructured":"Renjie Pi Jianshu Zhang Tianyang Han Jipeng Zhang Rui Pan and Tong Zhang. 2024. Personalized Visual Instruction Tuning. arxiv:https:\/\/arXiv.org\/abs\/2410.07113\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2410.07113"},{"key":"e_1_3_3_1_27_2","unstructured":"Nataniel Ruiz Yuanzhen Li Varun Jampani Yael Pritch Michael Rubinstein and Kfir Aberman. 2023. DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation. arxiv:https:\/\/arXiv.org\/abs\/2208.12242\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2208.12242"},{"key":"e_1_3_3_1_28_2","unstructured":"Jing Shi Wei Xiong Zhe Lin and Hyun\u00a0Joon Jung. 2023. InstantBooth: Personalized Text-to-Image Generation without Test-Time Finetuning. arxiv:https:\/\/arXiv.org\/abs\/2304.03411\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2304.03411"},{"key":"e_1_3_3_1_29_2","unstructured":"Amanpreet Singh Vivek Natarajan Meet Shah Yu Jiang Xinlei Chen Dhruv Batra Devi Parikh and Marcus Rohrbach. 2019. Towards VQA Models That Can Read. arxiv:https:\/\/arXiv.org\/abs\/1904.08920\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/1904.08920"},{"key":"e_1_3_3_1_30_2","unstructured":"Karan Singhal Tao Tu Juraj Gottweis Rory Sayres Ellery Wulczyn Le Hou Kevin Clark Stephen Pfohl Heather Cole-Lewis Darlene Neal Mike Schaekermann Amy Wang Mohamed Amin Sami Lachgar Philip Mansfield Sushant Prakash Bradley Green Ewa Dominowska Blaise\u00a0Aguera y Arcas Nenad Tomasev Yun Liu Renee Wong Christopher Semturs S.\u00a0Sara Mahdavi Joelle Barral Dale Webster Greg\u00a0S. Corrado Yossi Matias Shekoofeh Azizi Alan Karthikesalingam and Vivek Natarajan. 2023. Towards Expert-Level Medical Question Answering with Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2305.09617\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2305.09617"},{"key":"e_1_3_3_1_31_2","unstructured":"Kushal Tirumala Aram\u00a0H. Markosyan Luke Zettlemoyer and Armen Aghajanyan. 2022. Memorization Without Overfitting: Analyzing the Training Dynamics of Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2205.10770\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2205.10770"},{"key":"e_1_3_3_1_32_2","unstructured":"David Wan Jaemin Cho Elias Stengel-Eskin and Mohit Bansal. 2024. Contrastive Region Guidance: Improving Grounding in Vision-Language Models without Training. arxiv:https:\/\/arXiv.org\/abs\/2403.02325\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2403.02325"},{"key":"e_1_3_3_1_33_2","unstructured":"Ruize Wang Duyu Tang Nan Duan Zhongyu Wei Xuanjing Huang Jianshu ji Guihong Cao Daxin Jiang and Ming Zhou. 2020. K-Adapter: Infusing Knowledge into Pre-Trained Models with Adapters. arxiv:https:\/\/arXiv.org\/abs\/2002.01808\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2002.01808"},{"key":"e_1_3_3_1_34_2","unstructured":"Xiao Wang Tianze Chen Qiming Ge Han Xia Rong Bao Rui Zheng Qi Zhang Tao Gui and Xuanjing Huang. 2023. Orthogonal Subspace Learning for Language Model Continual Learning. arxiv:https:\/\/arXiv.org\/abs\/2310.14152\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2310.14152"},{"key":"e_1_3_3_1_35_2","unstructured":"Jason Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter Fei Xia Ed Chi Quoc Le and Denny Zhou. 2023. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2201.11903\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2201.11903"},{"key":"e_1_3_3_1_36_2","unstructured":"Chaoyi Wu Weixiong Lin Xiaoman Zhang Ya Zhang Yanfeng Wang and Weidi Xie. 2023. PMC-LLaMA: Towards Building Open-source Language Models for Medicine. arxiv:https:\/\/arXiv.org\/abs\/2304.14454\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2304.14454"},{"key":"e_1_3_3_1_37_2","unstructured":"Shijie Wu Ozan Irsoy Steven Lu Vadim Dabravolski Mark Dredze Sebastian Gehrmann Prabhanjan Kambadur David Rosenberg and Gideon Mann. 2023. BloombergGPT: A Large Language Model for Finance. arxiv:https:\/\/arXiv.org\/abs\/2303.17564\u00a0[cs.LG] https:\/\/arxiv.org\/abs\/2303.17564"},{"key":"e_1_3_3_1_38_2","unstructured":"Peng Xia Kangyu Zhu Haoran Li Tianze Wang Weijia Shi Sheng Wang Linjun Zhang James Zou and Huaxiu Yao. 2025. MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models. arxiv:https:\/\/arXiv.org\/abs\/2410.13085\u00a0[cs.LG] https:\/\/arxiv.org\/abs\/2410.13085"},{"key":"e_1_3_3_1_39_2","unstructured":"Jianwei Yang Hao Zhang Feng Li Xueyan Zou Chunyuan Li and Jianfeng Gao. 2023. Set-of-Mark Prompting Unleashes Extraordinary Visual Grounding in GPT-4V. arxiv:https:\/\/arXiv.org\/abs\/2310.11441\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2310.11441"},{"key":"e_1_3_3_1_40_2","unstructured":"Hu Ye Jun Zhang Sibo Liu Xiao Han and Wei Yang. 2023. IP-Adapter: Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models. arxiv:https:\/\/arXiv.org\/abs\/2308.06721\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2308.06721"},{"key":"e_1_3_3_1_41_2","unstructured":"Xiaofei Yin Yijie Hong Ya Guo Yi Tu Weiqiang Wang Gongshen Liu and Huijia zhu. 2025. InsightVision: A Comprehensive Multi-Level Chinese-based Benchmark for Evaluating Implicit Visual Semantics in Large Vision Language Models. arxiv:https:\/\/arXiv.org\/abs\/2502.15812\u00a0[cs.LG] https:\/\/arxiv.org\/abs\/2502.15812"},{"key":"e_1_3_3_1_42_2","unstructured":"Yu Zeng Vishal\u00a0M. Patel Haochen Wang Xun Huang Ting-Chun Wang Ming-Yu Liu and Yogesh Balaji. 2024. JeDi: Joint-Image Diffusion Models for Finetuning-Free Personalized Text-to-Image Generation. arxiv:https:\/\/arXiv.org\/abs\/2407.06187\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2407.06187"},{"key":"e_1_3_3_1_43_2","doi-asserted-by":"crossref","unstructured":"Boyu Zhang Hongyang Yang and Xiao-Yang Liu. 2023. Instruct-FinGPT: Financial Sentiment Analysis by Instruction Tuning of General-Purpose Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2306.12659\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2306.12659","DOI":"10.2139\/ssrn.4489831"},{"key":"e_1_3_3_1_44_2","doi-asserted-by":"crossref","unstructured":"Sheng Zhang Yanbo Xu Naoto Usuyama Hanwen Xu Jaspreet Bagga Robert Tinn Sam Preston Rajesh Rao Mu Wei Naveen Valluri Cliff Wong Andrea Tupini Yu Wang Matt Mazzola Swadheen Shukla Lars Liden Jianfeng Gao Angela Crabtree Brian Piening Carlo Bifulco Matthew\u00a0P. Lungren Tristan Naumann Sheng Wang and Hoifung Poon. 2025. BiomedCLIP: a multimodal biomedical foundation model pretrained from fifteen million scientific image-text pairs. arxiv:https:\/\/arXiv.org\/abs\/2303.00915\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2303.00915","DOI":"10.1056\/AIoa2400640"},{"key":"e_1_3_3_1_45_2","doi-asserted-by":"publisher","unstructured":"Da-Wei Zhou Yuanhan Zhang Yan Wang Jingyi Ning Han-Jia Ye De-Chuan Zhan and Ziwei Liu. 2025. Learning Without Forgetting for Vision-Language Models. IEEE Transactions on Pattern Analysis and Machine Intelligence 47 6 (2025) 4489\u20134504. 10.1109\/tpami.2025.3540889","DOI":"10.1109\/tpami.2025.3540889"}],"event":{"name":"ICMR '26: International Conference on Multimedia Retrieval","location":"Amsterdam The Netherlands","acronym":"ICMR '26","sponsor":["SIGMM ACM Special Interest Group on Multimedia"]},"container-title":["Proceedings of the 2026 International Conference on Multimedia Retrieval"],"original-title":[],"deposited":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T14:55:11Z","timestamp":1781535311000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3805622.3810776"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,6,15]]},"references-count":44,"alternative-id":["10.1145\/3805622.3810776","10.1145\/3805622"],"URL":"https:\/\/doi.org\/10.1145\/3805622.3810776","relation":{},"subject":[],"published":{"date-parts":[[2026,6,15]]},"assertion":[{"value":"2026-06-15","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}