{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,3]],"date-time":"2025-11-03T23:04:24Z","timestamp":1762211064909,"version":"3.41.0"},"reference-count":55,"publisher":"Springer Science and Business Media LLC","issue":"5-6","license":[{"start":{"date-parts":[[2024,12,11]],"date-time":"2024-12-11T00:00:00Z","timestamp":1733875200000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,12,11]],"date-time":"2024-12-11T00:00:00Z","timestamp":1733875200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Int. J. Mach. Learn. &amp; Cyber."],"published-print":{"date-parts":[[2025,6]]},"DOI":"10.1007\/s13042-024-02485-w","type":"journal-article","created":{"date-parts":[[2024,12,11]],"date-time":"2024-12-11T21:56:24Z","timestamp":1733954184000},"page":"3843-3864","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":5,"title":["Diffusion-based data augmentation methodology for improved performance in ocular disease diagnosis using retinography images"],"prefix":"10.1007","volume":"16","author":[{"given":"Burak","family":"Aktas","sequence":"first","affiliation":[]},{"given":"Doga Deniz","family":"Ates","sequence":"additional","affiliation":[]},{"given":"Okan","family":"Duzyel","sequence":"additional","affiliation":[]},{"given":"Abdurrahman","family":"Gumus","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2024,12,11]]},"reference":[{"doi-asserted-by":"crossref","unstructured":"Rombach R, Blattmann A, Lorenz D, Esser P, Ommer B (2022) High-resolution image synthesis with latent diffusion models. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 10684\u201310695","key":"2485_CR1","DOI":"10.1109\/CVPR52688.2022.01042"},{"doi-asserted-by":"crossref","unstructured":"Galatolo FA, Cimino MG, Vaglini G (2021) Generating images from caption and vice versa via clip-guided generative latent space search. arXiv preprint arXiv:2102.01645","key":"2485_CR2","DOI":"10.5220\/0010503701660174"},{"unstructured":"Azizi S, Kornblith S, Saharia C, Norouzi M, Fleet DJ (2023) Synthetic data from diffusion models improves imagenet classification. arXiv preprint arXiv:2304.08466","key":"2485_CR3"},{"key":"2485_CR4","first-page":"36479","volume":"35","author":"C Saharia","year":"2022","unstructured":"Saharia C, Chan W, Saxena S, Li L, Whang J, Denton EL, Ghasemipour K, Gontijo Lopes R, Karagol Ayan B, Salimans T (2022) Photorealistic text-to-image diffusion models with deep language understanding. Adv Neural Inform Process Syst 35:36479\u201336494","journal-title":"Adv Neural Inform Process Syst"},{"key":"2485_CR5","first-page":"6840","volume":"33","author":"J Ho","year":"2020","unstructured":"Ho J, Jain A, Abbeel P (2020) Denoising diffusion probabilistic models. Adv Neural Inform Process Syst 33:6840\u20136851","journal-title":"Adv Neural Inform Process Syst"},{"unstructured":"Watson D, Chan W, Ho J, Norouzi M(2022) Learning fast samplers for diffusion models by differentiating through sample quality. arXiv preprint arXiv:2202.05830","key":"2485_CR6"},{"key":"2485_CR7","first-page":"8780","volume":"34","author":"P Dhariwal","year":"2021","unstructured":"Dhariwal P, Nichol A (2021) Diffusion models beat gans on image synthesis. Adv Neural Inform Process Syst 34:8780\u20138794","journal-title":"Adv Neural Inform Process Syst"},{"unstructured":"Nichol AQ, Dhariwal P (2021) Improved denoising diffusion probabilistic models. In: International Conference on Machine Learning, pp. 8162\u20138171. PMLR","key":"2485_CR8"},{"unstructured":"Song J, Meng C, Ermon S (2020) Denoising diffusion implicit models. arXiv preprint arXiv:2010.02502","key":"2485_CR9"},{"doi-asserted-by":"crossref","unstructured":"Liu N, Li S, Du Y, Torralba A, Tenenbaum JB (2022) Compositional visual generation with composable diffusion models. In: European Conference on Computer Vision, pp. 423\u2013439. Springer","key":"2485_CR10","DOI":"10.1007\/978-3-031-19790-1_26"},{"key":"2485_CR11","first-page":"12533","volume":"34","author":"A Sinha","year":"2021","unstructured":"Sinha A, Song J, Meng C, Ermon S (2021) D2c: Diffusion-decoding models for few-shot conditional generation. Adv Neural Inform Process Syst 34:12533\u201312548","journal-title":"Adv Neural Inform Process Syst"},{"key":"2485_CR12","first-page":"1415","volume":"34","author":"Y Song","year":"2021","unstructured":"Song Y, Durkan C, Murray I, Ermon S (2021) Maximum likelihood training of score-based diffusion models. Adv Neural Inform Process Syst 34:1415\u20131428","journal-title":"Adv Neural Inform Process Syst"},{"unstructured":"Nichol A, Dhariwal P, Ramesh A, Shyam P, Mishkin P, McGrew B, Sutskever I, Chen M (2021) Glide: Towards photorealistic image generation and editing with text-guided diffusion models. arXiv preprint arXiv:2112.10741","key":"2485_CR13"},{"key":"2485_CR14","first-page":"12438","volume":"33","author":"Y Song","year":"2020","unstructured":"Song Y, Ermon S (2020) Improved techniques for training score-based generative models. Adv Neural Inform Processing Syst 33:12438\u201312448","journal-title":"Adv Neural Inform Processing Syst"},{"doi-asserted-by":"crossref","unstructured":"Chung H, Sim B, Ye JC (2022) Come-closer-diffuse-faster: Accelerating conditional diffusion models for inverse problems through stochastic contraction. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 12413\u201312422","key":"2485_CR15","DOI":"10.1109\/CVPR52688.2022.01209"},{"doi-asserted-by":"crossref","unstructured":"Lugmayr A, Danelljan M, Romero A, Yu F, Timofte R, Van\u00a0Gool L (2022) Repaint: Inpainting using denoising diffusion probabilistic models. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 11461\u201311471","key":"2485_CR16","DOI":"10.1109\/CVPR52688.2022.01117"},{"unstructured":"Batzolis G, Stanczuk J, Sch\u00f6nlieb C-B, Etmann C. (2021) Conditional image generation with score-based diffusion models. arXiv preprint arXiv:2111.13606","key":"2485_CR17"},{"doi-asserted-by":"crossref","unstructured":"Saharia C, Chan W, Chang H, Lee C, Ho J, Salimans T, Fleet D, Norouzi M (2022) Palette: Image-to-image diffusion models. In: ACM SIGGRAPH 2022 Conference Proceedings, pp. 1\u201310","key":"2485_CR18","DOI":"10.1145\/3528233.3530757"},{"unstructured":"Wang T, Zhang T, Zhang B, Ouyang H, Chen D, Chen Q, Wen F (2022) Pretraining is all you need for image-to-image translation. arXiv preprint arXiv:2205.12952","key":"2485_CR19"},{"doi-asserted-by":"crossref","unstructured":"Choi J, Kim S, Jeong Y, Gwon Y, Yoon S (2021) Ilvr: Conditioning method for denoising diffusion probabilistic models. arXiv preprint arXiv:2108.02938","key":"2485_CR20","DOI":"10.1109\/ICCV48922.2021.01410"},{"doi-asserted-by":"crossref","unstructured":"Li B, Xue K, Liu B, Lai Y-K (2022) Vqbb: Image-to-image translation with vector quantized brownian bridge. arXiv preprint arXiv:2205.07680","key":"2485_CR21","DOI":"10.1109\/CVPR52729.2023.00194"},{"doi-asserted-by":"crossref","unstructured":"Akrout M, Gyepesi B, Holl\u00f3 P, Po\u00f3r A, Kincs\u0151 B, Solis S, Cirone K, Kawahara J, Slade D, Abid L (2023) et al.: Diffusion-based data augmentation for skin disease classification: Impact across original medical datasets to fully synthetic images. arXiv preprint arXiv:2301.04802","key":"2485_CR22","DOI":"10.1007\/978-3-031-53767-7_10"},{"doi-asserted-by":"crossref","unstructured":"Ktena I, Wiles O, Albuquerque I, Rebuffi S-A, Tanno R, Roy AG, Azizi S, Belgrave D, Kohli P, Karthikesalingam A (2023) et al.: Generative models improve fairness of medical classifiers under distribution shifts. arXiv preprint arXiv:2304.09218","key":"2485_CR23","DOI":"10.21203\/rs.3.rs-2976332\/v1"},{"unstructured":"Sagers LW, Diao JA, Melas-Kyriazi L, Groh M, Rajpurkar P, Adamson AS, Rotemberg V, Daneshjou R, Manrai AK (2023) Augmenting medical image classifiers with synthetic data from latent diffusion models. arXiv preprint arXiv:2308.12453","key":"2485_CR24"},{"unstructured":"Sagers LW, Diao JA, Groh M, Rajpurkar P, Adamson AS, Manrai AK (2022)Improving dermatology classifiers across populations using images generated by large diffusion models. arXiv preprint arXiv:2211.13352","key":"2485_CR25"},{"doi-asserted-by":"crossref","unstructured":"Rajotte J-F, Bergen R, Buckeridge DL, El\u00a0Emam K, Ng R, Strome E (2022) Synthetic data as an enabler for machine learning applications in medicine. Iscience 25(11)","key":"2485_CR26","DOI":"10.1016\/j.isci.2022.105331"},{"issue":"6","key":"2485_CR27","doi-asserted-by":"publisher","first-page":"493","DOI":"10.1038\/s41551-021-00751-8","volume":"5","author":"RJ Chen","year":"2021","unstructured":"Chen RJ, Lu MY, Chen TY, Williamson DF, Mahmood F (2021) Synthetic data in machine learning for medicine and healthcare. Nat Biomed Eng 5(6):493\u2013497","journal-title":"Nat Biomed Eng"},{"doi-asserted-by":"crossref","unstructured":"Fang H, Han B, Zhang S, Zhou S, Hu C, Ye W-M (2024) Data augmentation for object detection via controllable diffusion models. In: Proceedings of the IEEE\/CVF Winter Conference on Applications of Computer Vision, pp. 1257\u20131266","key":"2485_CR28","DOI":"10.1109\/WACV57701.2024.00129"},{"doi-asserted-by":"crossref","unstructured":"Feng C-M, Yu K, Liu Y, Khan S, Zuo W (2023) Diverse data augmentation with diffusions for effective test-time prompt tuning. In: Proceedings of the IEEE\/CVF International Conference on Computer Vision, pp. 2704\u20132714","key":"2485_CR29","DOI":"10.1109\/ICCV51070.2023.00255"},{"unstructured":"Fu Y, Chen C, Qiao Y, Yu Y (2024) Dreamda: Generative data augmentation with diffusion models. arXiv preprint arXiv:2403.12803","key":"2485_CR30"},{"unstructured":"Bennett B (2022) Synthetic Image Datasets with Stable Diffusion and Data Augmentation","key":"2485_CR31"},{"issue":"4","key":"2485_CR32","first-page":"81","volume":"9","author":"A Kebaili","year":"2023","unstructured":"Kebaili A, Lapuyade-Lahorgue J, Ruan S (2023) Deep learning approaches for data augmentation in medical imaging: a review. J Image 9(4):81","journal-title":"J Image"},{"issue":"1","key":"2485_CR33","doi-asserted-by":"publisher","first-page":"59","DOI":"10.1007\/s42979-021-00945-6","volume":"3","author":"A Smitha","year":"2022","unstructured":"Smitha A, Jidesh P (2022) Classification of multiple retinal disorders from enhanced fundus images using semi-supervised gan. SN Comput Sci 3(1):59","journal-title":"SN Comput Sci"},{"doi-asserted-by":"crossref","unstructured":"Gobinath C, Gopinath M (2022) Deep classification of fundus images using semi supervised gan. In: 2022 International Conference on Advanced Computing Technologies and Applications (ICACTA), pp. 1\u20134 . IEEE","key":"2485_CR34","DOI":"10.1109\/ICACTA54488.2022.9752893"},{"unstructured":"Peking University International Competition on Ocular Disease Intelligent Recognition (ODIR-2019). https:\/\/odir2019.grand-challenge.org\/. Accessed: 2022-02-10 (2019)","key":"2485_CR35"},{"unstructured":"Mostaque E (2022) Stable diffusion public release. Stability AI","key":"2485_CR36"},{"doi-asserted-by":"crossref","unstructured":"Mascarenhas S, Agarwal M (2021) A comparison between vgg16, vgg19 and resnet50 architecture frameworks for image classification. In: 2021 International Conference on Disruptive Technologies for Multi-disciplinary Research and Applications (CENTCON), vol. 1, pp. 96\u201399. IEEE","key":"2485_CR37","DOI":"10.1109\/CENTCON52345.2021.9687944"},{"unstructured":"Maaten L, Hinton G (2008) Visualizing data using t-sne. Journal of machine learning research 9(11)","key":"2485_CR38"},{"unstructured":"D\u00fczyel O (2023) A comparative study of gan-generated handwriting images and mnist images using t-sne visualization. arXiv preprint arXiv:2305.09786","key":"2485_CR39"},{"issue":"11","key":"2485_CR40","doi-asserted-by":"publisher","first-page":"12561","DOI":"10.1007\/s10462-023-10453-z","volume":"56","author":"E Goceri","year":"2023","unstructured":"Goceri E (2023) Medical image data augmentation: techniques, comparisons and interpretations. Artificial Intell Rev 56(11):12561\u201312605","journal-title":"Artificial Intell Rev"},{"key":"2485_CR41","doi-asserted-by":"publisher","first-page":"169","DOI":"10.1109\/RBME.2010.2084567","volume":"3","author":"MD Abr\u00e0moff","year":"2010","unstructured":"Abr\u00e0moff MD, Garvin MK, Sonka M (2010) Retinal imaging and image analysis. IEEE Rev Biomed Eng 3:169\u2013208","journal-title":"IEEE Rev Biomed Eng"},{"unstructured":"Ramesh A, Pavlov M, Goh G, Gray S, Voss C, Radford A, Chen M, Sutskever I (2021) Zero-shot text-to-image generation. In: International Conference on Machine Learning, pp. 8821\u20138831. PMLR","key":"2485_CR42"},{"doi-asserted-by":"crossref","unstructured":"Ruiz N, Li Y, Jampani V, Pritch Y, Rubinstein M, Aberman K (2023) Dreambooth: Fine tuning text-to-image diffusion models for subject-driven generation. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 22500\u201322510","key":"2485_CR43","DOI":"10.1109\/CVPR52729.2023.02155"},{"unstructured":"Radford A, Kim JW, Hallacy C, Ramesh A, Goh G, Agarwal S, Sastry G, Askell A, Mishkin P, Clark J (2021) Learning transferable visual models from natural language supervision. In: International Conference on Machine Learning, pp. 8748\u20138763 . PMLR","key":"2485_CR44"},{"unstructured":"AI S (2024) Stable Diffusion. https:\/\/github.com\/Stability-AI\/stablediffusion. Accessed: 2024-11-05","key":"2485_CR45"},{"doi-asserted-by":"crossref","unstructured":"Wang J, Liu Z, Zhao L, Wu Z, Ma C, Yu S, Dai H, Yang Q, Liu Y, Zhang S (2023) et al.: Review of large vision models and visual prompt engineering. arXiv preprint arXiv:2307.00855","key":"2485_CR46","DOI":"10.1016\/j.metrad.2023.100047"},{"unstructured":"Oppenlaender J (2022) Prompt engineering for text-based generative art. arXiv preprint arXiv:2204.13988","key":"2485_CR47"},{"unstructured":"Witteveen S, Andrews M (2022) Investigating prompt engineering in diffusion models. arXiv preprint arXiv:2211.15462","key":"2485_CR48"},{"key":"2485_CR49","doi-asserted-by":"publisher","first-page":"211","DOI":"10.1007\/s11263-015-0816-y","volume":"115","author":"O Russakovsky","year":"2015","unstructured":"Russakovsky O, Deng J, Su H, Krause J, Satheesh S, Ma S, Huang Z, Karpathy A, Khosla A, Bernstein M (2015) Imagenet large scale visual recognition challenge. Int J Comput Vis 115:211\u2013252","journal-title":"Int J Comput Vis"},{"issue":"7","key":"2485_CR50","doi-asserted-by":"publisher","first-page":"2664","DOI":"10.1080\/01431161.2019.1694725","volume":"41","author":"S Bera","year":"2020","unstructured":"Bera S, Shrivastava VK (2020) Analysis of various optimizers on deep convolutional neural network model in the application of hyperspectral remote sensing image classification. Int J Remote Sens 41(7):2664\u20132683","journal-title":"Int J Remote Sens"},{"unstructured":"Goodfellow I (2016) Deep learning. MIT press","key":"2485_CR51"},{"issue":"4","key":"2485_CR52","doi-asserted-by":"publisher","first-page":"427","DOI":"10.1016\/j.ipm.2009.03.002","volume":"45","author":"M Sokolova","year":"2009","unstructured":"Sokolova M, Lapalme G (2009) A systematic analysis of performance measures for classification tasks. Inform Process Manag 45(4):427\u2013437. https:\/\/doi.org\/10.1016\/j.ipm.2009.03.002","journal-title":"Inform Process Manag"},{"unstructured":"Powers DM (2020) Evaluation: from precision, recall and f-measure to roc, informedness, markedness and correlation. arXiv preprint arXiv:2010.16061","key":"2485_CR53"},{"doi-asserted-by":"crossref","unstructured":"Mumuni A, Mumuni F (2022) Data augmentation: A comprehensive survey of modern approaches. Array, 100258","key":"2485_CR54","DOI":"10.1016\/j.array.2022.100258"},{"doi-asserted-by":"crossref","unstructured":"Miko\u0142ajczyk A, Grochowski M (2018) Data augmentation for improving deep learning in image classification problem. In: 2018 International Interdisciplinary PhD Workshop (IIPhDW), pp. 117\u2013122 . IEEE","key":"2485_CR55","DOI":"10.1109\/IIPHDW.2018.8388338"}],"container-title":["International Journal of Machine Learning and Cybernetics"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s13042-024-02485-w.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s13042-024-02485-w\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s13042-024-02485-w.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,7]],"date-time":"2025-06-07T04:32:29Z","timestamp":1749270749000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s13042-024-02485-w"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,12,11]]},"references-count":55,"journal-issue":{"issue":"5-6","published-print":{"date-parts":[[2025,6]]}},"alternative-id":["2485"],"URL":"https:\/\/doi.org\/10.1007\/s13042-024-02485-w","relation":{},"ISSN":["1868-8071","1868-808X"],"issn-type":[{"type":"print","value":"1868-8071"},{"type":"electronic","value":"1868-808X"}],"subject":[],"published":{"date-parts":[[2024,12,11]]},"assertion":[{"value":"2 February 2024","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"27 November 2024","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"11 December 2024","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors have no relevant financial or non-financial interests to disclose.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}},{"value":"This article does not contain any studies with human participants or animals performed by any of the authors.","order":3,"name":"Ethics","group":{"name":"EthicsHeading","label":"Ethics approval"}},{"value":"Not applicable.","order":4,"name":"Ethics","group":{"name":"EthicsHeading","label":"Consent to participate"}},{"value":"Not applicable.","order":5,"name":"Ethics","group":{"name":"EthicsHeading","label":"Consent for publication"}}]}}