{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,4]],"date-time":"2026-04-04T17:46:24Z","timestamp":1775324784159,"version":"3.50.1"},"publisher-location":"Cham","reference-count":33,"publisher":"Springer Nature Switzerland","isbn-type":[{"value":"9783031720826","type":"print"},{"value":"9783031720833","type":"electronic"}],"license":[{"start":{"date-parts":[[2024,1,1]],"date-time":"2024-01-01T00:00:00Z","timestamp":1704067200000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,1,1]],"date-time":"2024-01-01T00:00:00Z","timestamp":1704067200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2024]]},"DOI":"10.1007\/978-3-031-72083-3_18","type":"book-chapter","created":{"date-parts":[[2024,10,13]],"date-time":"2024-10-13T18:01:42Z","timestamp":1728842502000},"page":"189-199","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":17,"title":["HistGen: Histopathology Report Generation via\u00a0Local-Global Feature Encoding and\u00a0Cross-Modal Context Interaction"],"prefix":"10.1007","author":[{"given":"Zhengrui","family":"Guo","sequence":"first","affiliation":[]},{"given":"Jiabo","family":"Ma","sequence":"additional","affiliation":[]},{"given":"Yingxue","family":"Xu","sequence":"additional","affiliation":[]},{"given":"Yihui","family":"Wang","sequence":"additional","affiliation":[]},{"given":"Liansheng","family":"Wang","sequence":"additional","affiliation":[]},{"given":"Hao","family":"Chen","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2024,10,14]]},"reference":[{"key":"18_CR1","doi-asserted-by":"crossref","unstructured":"Anderson, P., He, X., Buehler, C., Teney, D., Johnson, M., Gould, S., Zhang, L.: Bottom-up and top-down attention for image captioning and visual question answering. In: Proc. IEEE Conf. Comput. Vis. Pattern Recogn. pp. 6077\u20136086 (2018)","DOI":"10.1109\/CVPR.2018.00636"},{"issue":"11","key":"18_CR2","doi-asserted-by":"publisher","DOI":"10.23915\/distill.00021","volume":"4","author":"A Araujo","year":"2019","unstructured":"Araujo, A., Norris, W., Sim, J.: Computing receptive fields of convolutional neural networks. Distill 4(11), \u00a0e21 (2019)","journal-title":"Distill"},{"issue":"2","key":"18_CR3","doi-asserted-by":"publisher","first-page":"550","DOI":"10.1109\/TMI.2018.2867350","volume":"38","author":"P Bandi","year":"2018","unstructured":"Bandi, P., Geessink, O., Manson, Q., Van\u00a0Dijk, M., Balkenhol, M., Hermsen, M., Bejnordi, B.E., Lee, B., Paeng, K., Zhong, A., et\u00a0al.: From detection of individual metastases to classification of lymph node status at the patient level: the camelyon17 challenge. IEEE Trans. Med. Imaging 38(2), 550\u2013560 (2018)","journal-title":"IEEE Trans. Med. Imaging"},{"issue":"22","key":"18_CR4","doi-asserted-by":"publisher","first-page":"2199","DOI":"10.1001\/jama.2017.14585","volume":"318","author":"BE Bejnordi","year":"2017","unstructured":"Bejnordi, B.E., Veta, M., Van\u00a0Diest, P.J., Van\u00a0Ginneken, B., Karssemeijer, N., Litjens, G., Van Der\u00a0Laak, J.A., Hermsen, M., Manson, Q.F., Balkenhol, M., et\u00a0al.: Diagnostic assessment of deep learning algorithms for detection of lymph node metastases in women with breast cancer. Jama 318(22), 2199\u20132210 (2017)","journal-title":"Jama"},{"key":"18_CR5","doi-asserted-by":"crossref","unstructured":"Campanella, G., Hanna, M.G., Geneslaw, L., Miraflor, A., Werneck Krauss\u00a0Silva, V., Busam, K.J., Brogi, E., Reuter, V.E., Klimstra, D.S., Fuchs, T.J.: Clinical-grade computational pathology using weakly supervised deep learning on whole slide images. Nat. Med. 25(8), 1301\u20131309 (2019)","DOI":"10.1038\/s41591-019-0508-1"},{"key":"18_CR6","doi-asserted-by":"crossref","unstructured":"Chen, P., Li, H., Zhu, C., Zheng, S., Yang, L.: Mi-gen: Multiple instance generation of pathology reports for gigapixel whole-slide images. arXiv preprint arXiv:2311.16480 (2023)","DOI":"10.1007\/978-3-031-72083-3_51"},{"key":"18_CR7","doi-asserted-by":"crossref","unstructured":"Chen, Z., Shen, Y., Song, Y., Wan, X.: Cross-modal memory networks for radiology report generation. arXiv preprint arXiv:2204.13258 (2022)","DOI":"10.18653\/v1\/2021.acl-long.459"},{"key":"18_CR8","doi-asserted-by":"crossref","unstructured":"Chen, Z., Song, Y., Chang, T.H., Wan, X.: Generating radiology reports via memory-driven transformer. arXiv preprint arXiv:2010.16056 (2020)","DOI":"10.18653\/v1\/2020.emnlp-main.112"},{"key":"18_CR9","doi-asserted-by":"crossref","unstructured":"Cornia, M., Stefanini, M., Baraldi, L., Cucchiara, R.: Meshed-memory transformer for image captioning. In: Proc. IEEE Conf. Comput. Vis. Pattern Recogn. pp. 10578\u201310587 (2020)","DOI":"10.1109\/CVPR42600.2020.01059"},{"issue":"2","key":"18_CR10","doi-asserted-by":"publisher","first-page":"304","DOI":"10.1093\/jamia\/ocv080","volume":"23","author":"D Demner-Fushman","year":"2016","unstructured":"Demner-Fushman, D., Kohli, M.D., Rosenman, M.B., Shooshan, S.E., Rodriguez, L., Antani, S., Thoma, G.R., McDonald, C.J.: Preparing a collection of radiology examinations for distribution and retrieval. J. Am. Med. Inform. Assoc. 23(2), 304\u2013310 (2016)","journal-title":"J. Am. Med. Inform. Assoc."},{"key":"18_CR11","unstructured":"Denkowski, M., Lavie, A.: Meteor 1.3: Automatic metric for reliable optimization and evaluation of machine translation systems. In: Proceedings of the sixth workshop on statistical machine translation. pp. 85\u201391 (2011)"},{"key":"18_CR12","doi-asserted-by":"crossref","unstructured":"Feng, J., Zhou, Z.H.: Deep miml network. In: AAAI Conf. Artif. Intell. vol.\u00a031 (2017)","DOI":"10.1609\/aaai.v31i1.10890"},{"key":"18_CR13","doi-asserted-by":"crossref","unstructured":"Gamper, J., Rajpoot, N.: Multiple instance captioning: Learning representations from histopathology textbooks and articles. In: Proc. IEEE Conf. Comput. Vis. Pattern Recogn. pp. 16549\u201316559 (2021)","DOI":"10.1109\/CVPR46437.2021.01628"},{"key":"18_CR14","unstructured":"Guevara, B.C., Marini, N., Marchesin, S., Aswolinskiy, W., Schlimbach, R.J., Podareanu, D., Ciompi, F.: Caption generation from histopathology whole-slide images using pre-trained transformers. In: Medical Imaging with Deep Learning, short paper track (2023)"},{"key":"18_CR15","doi-asserted-by":"crossref","unstructured":"Huang, Z., Bianchi, F., Yuksekgonul, M., Montine, T.J., Zou, J.: A visual\u2013language foundation model for pathology image analysis using medical twitter. Nat. Med. 29(9), 2307\u20132316 (2023)","DOI":"10.1038\/s41591-023-02504-3"},{"key":"18_CR16","unstructured":"Ilse, M., Tomczak, J., Welling, M.: Attention-based deep multiple instance learning. In: Proc. Int. Conf. Mach. Learn. pp. 2127\u20132136. PMLR (2018)"},{"key":"18_CR17","doi-asserted-by":"crossref","unstructured":"Johnson, A.E., Pollard, T.J., Berkowitz, S.J., Greenbaum, N.R., Lungren, M.P., Deng, C.y., Mark, R.G., Horng, S.: Mimic-cxr, a de-identified publicly available database of chest radiographs with free-text reports. Sci. Data 6(1), \u00a01\u20138 (2019)","DOI":"10.1038\/s41597-019-0322-0"},{"issue":"1","key":"18_CR18","doi-asserted-by":"publisher","first-page":"11579","DOI":"10.1038\/s41598-021-90444-8","volume":"11","author":"M Khened","year":"2021","unstructured":"Khened, M., Kori, A., Rajkumar, H., Krishnamurthi, G., Srinivasan, B.: A generalized deep learning framework for whole-slide image segmentation and analysis. Scientific reports 11(1), 11579 (2021)","journal-title":"Scientific reports"},{"key":"18_CR19","doi-asserted-by":"crossref","unstructured":"Li, B., Li, Y., Eliceiri, K.W.: Dual-stream multiple instance learning network for whole slide image classification with self-supervised contrastive learning. In: Proc. IEEE Conf. Comput. Vis. Pattern Recogn. pp. 14318\u201314328 (2021)","DOI":"10.1109\/CVPR46437.2021.01409"},{"key":"18_CR20","unstructured":"Lin, C.Y.: Rouge: A package for automatic evaluation of summaries. In: Text summarization branches out. pp. 74\u201381 (2004)"},{"key":"18_CR21","doi-asserted-by":"crossref","unstructured":"Lu, M.Y., Chen, B., Zhang, A., Williamson, D.F., Chen, R.J., Ding, T., Le, L.P., Chuang, Y.S., Mahmood, F.: Visual language pretrained multiple instance zero-shot transfer for histopathology images. In: Proc. IEEE Conf. Comput. Vis. Pattern Recogn. pp. 19764\u201319775 (2023)","DOI":"10.1109\/CVPR52729.2023.01893"},{"key":"18_CR22","doi-asserted-by":"publisher","DOI":"10.1016\/j.artmed.2023.102633","volume":"144","author":"A Nicolson","year":"2023","unstructured":"Nicolson, A., Dowling, J., Koopman, B.: Improving chest x-ray report generation by leveraging warm starting. Artificial intelligence in medicine 144, 102633 (2023)","journal-title":"Artificial intelligence in medicine"},{"key":"18_CR23","unstructured":"Oquab, M., Darcet, T., Moutakanni, T., Vo, H., Szafraniec, M., Khalidov, V., Fernandez, P., Haziza, D., Massa, F., El-Nouby, A., et\u00a0al.: Dinov2: Learning robust visual features without supervision. arXiv preprint arXiv:2304.07193 (2023)"},{"key":"18_CR24","doi-asserted-by":"crossref","unstructured":"Papineni, K., Roukos, S., Ward, T., Zhu, W.J.: Bleu: a method for automatic evaluation of machine translation. In: Proceedings of the 40th annual meeting of the Association for Computational Linguistics. pp. 311\u2013318 (2002)","DOI":"10.3115\/1073083.1073135"},{"key":"18_CR25","doi-asserted-by":"crossref","unstructured":"Sengupta, S., Brown, D.E.: Automatic report generation for histopathology images using pre-trained vision transformers. arXiv preprint arXiv:2311.06176 (2023)","DOI":"10.1109\/ISBI56570.2024.10635175"},{"key":"18_CR26","first-page":"2136","volume":"34","author":"Z Shao","year":"2021","unstructured":"Shao, Z., Bian, H., Chen, Y., Wang, Y., Zhang, J., Ji, X., et\u00a0al.: Transmil: Transformer based correlated multiple instance learning for whole slide image classification. Proc. Adv. Neural Inf. Process. Syst. 34, 2136\u20132147 (2021)","journal-title":"Proc. Adv. Neural Inf. Process. Syst."},{"issue":"1","key":"18_CR27","doi-asserted-by":"publisher","first-page":"68","DOI":"10.5114\/wo.2014.47136","volume":"2015","author":"K Tomczak","year":"2015","unstructured":"Tomczak, K., Czerwi\u0144ska, P., Wiznerowicz, M.: Review the cancer genome atlas (tcga): an immeasurable source of knowledge. Contemporary Oncology\/Wsp\u00f3\u0142czesna Onkologia 2015(1), 68\u201377 (2015)","journal-title":"Contemporary Oncology\/Wsp\u00f3\u0142czesna Onkologia"},{"key":"18_CR28","unstructured":"Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, \u0141., Polosukhin, I.: Attention is all you need. Adv Neural Inf Process Syst 30 (2017)"},{"key":"18_CR29","doi-asserted-by":"publisher","first-page":"111","DOI":"10.1016\/j.media.2019.02.012","volume":"54","author":"M Veta","year":"2019","unstructured":"Veta, M., Heng, Y.J., Stathonikos, N., Bejnordi, B.E., Beca, F., Wollmann, T., Rohr, K., Shah, M.A., Wang, D., Rousson, M., et\u00a0al.: Predicting breast tumor proliferation from whole-slide images: the tupac16 challenge. Med. Image Anal. 54, 111\u2013121 (2019)","journal-title":"Med. Image Anal."},{"key":"18_CR30","doi-asserted-by":"crossref","unstructured":"Vinyals, O., Toshev, A., Bengio, S., Erhan, D.: Show and tell: A neural image caption generator. In: Proc. IEEE Conf. Comput. Vis. Pattern Recogn. pp. 3156\u20133164 (2015)","DOI":"10.1109\/CVPR.2015.7298935"},{"key":"18_CR31","doi-asserted-by":"crossref","unstructured":"Wang, N., Xie, J., Wu, J., Jia, M., Li, L.: Controllable image captioning via prompting. In: AAAI Conf. Artif. Intell. vol.\u00a037, pp. 2617\u20132625 (2023)","DOI":"10.1609\/aaai.v37i2.25360"},{"key":"18_CR32","doi-asserted-by":"publisher","DOI":"10.1016\/j.media.2022.102559","volume":"81","author":"X Wang","year":"2022","unstructured":"Wang, X., Yang, S., Zhang, J., Wang, M., Zhang, J., Yang, W., Huang, J., Han, X.: Transformer-based unsupervised contrastive learning for histopathological image classification. Med. Image Anal. 81, 102559 (2022)","journal-title":"Med. Image Anal."},{"key":"18_CR33","doi-asserted-by":"crossref","unstructured":"Zhang, H., Meng, Y., Zhao, Y., Qiao, Y., Yang, X., Coupland, S.E., Zheng, Y.: Dtfd-mil: Double-tier feature distillation multiple instance learning for histopathology whole slide image classification. In: Proc. IEEE Conf. Comput. Vis. Pattern Recogn. pp. 18802\u201318812 (2022)","DOI":"10.1109\/CVPR52688.2022.01824"}],"container-title":["Lecture Notes in Computer Science","Medical Image Computing and Computer Assisted Intervention \u2013 MICCAI 2024"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-031-72083-3_18","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,11,29]],"date-time":"2024-11-29T15:36:25Z","timestamp":1732894585000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-031-72083-3_18"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024]]},"ISBN":["9783031720826","9783031720833"],"references-count":33,"URL":"https:\/\/doi.org\/10.1007\/978-3-031-72083-3_18","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"value":"0302-9743","type":"print"},{"value":"1611-3349","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024]]},"assertion":[{"value":"14 October 2024","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"The authors have no competing interests to declare that are relevant to the content of this article.","order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Disclosure of Interests"}},{"value":"MICCAI","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Medical Image Computing and Computer-Assisted Intervention","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Marrakesh","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Morocco","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2024","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"7 October 2024","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"11 October 2024","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"27","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"miccai2024","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/conferences.miccai.org\/2024\/en\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}