{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,13]],"date-time":"2026-05-13T07:15:40Z","timestamp":1778656540648,"version":"3.51.4"},"publisher-location":"New York, NY, USA","reference-count":41,"publisher":"ACM","license":[{"start":{"date-parts":[[2026,4,12]],"date-time":"2026-04-12T00:00:00Z","timestamp":1775952000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/legalcode"}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2026,4,12]]},"DOI":"10.1145\/3786178.3788327","type":"proceedings-article","created":{"date-parts":[[2026,5,13]],"date-time":"2026-05-13T06:56:01Z","timestamp":1778655361000},"page":"1-8","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":0,"title":["Flaky Tests in a Large Industrial Database Management System: An Empirical Study of Fixed Issue Reports for SAP HANA"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0009-0009-5248-6405","authenticated-orcid":false,"given":"Alexander","family":"Berndt","sequence":"first","affiliation":[{"name":"Heidelberg University, Heidelberg, Germany"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-9993-2814","authenticated-orcid":false,"given":"Thomas","family":"Bach","sequence":"additional","affiliation":[{"name":"SAP, Walldorf, Germany"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-2442-7522","authenticated-orcid":false,"given":"Sebastian","family":"Baltes","sequence":"additional","affiliation":[{"name":"Heidelberg University, Heidelberg, Germany"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2026,5,12]]},"reference":[{"key":"e_1_3_3_2_2_2","doi-asserted-by":"publisher","DOI":"10.1109\/MSR66628.2025.00086"},{"key":"e_1_3_3_2_3_2","doi-asserted-by":"publisher","unstructured":"Thomas Bach Artur Andrzejak Changyun Seo Christian Bierstedt Christian Lemke Daniel Ritter Dongwon Hwang Erda Sheshi Felix Schabernack Frank Renkes Gordon Gaumnitz Jakob Martens Lars H\u00f6mke Michael Felderer Michael Rudolf Neetha Jambigi Norman May Robin Joy Ruben Scheja Sascha Schwedes Sebastian Seibel Sebastian Seifert Stefan Haas Stephan Kraft Thomas Kroll Tobias Scheuer and Wolfgang Lehner. 2022. Testing Very Large Database Management Systems: The Case of SAP HANA. Datenbank-Spektrum 22 3 (2022) 195\u2013215. doi:10.1007\/S13222-022-00426-X","DOI":"10.1007\/S13222-022-00426-X"},{"key":"e_1_3_3_2_4_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICSE-COMPANION.2019.00093"},{"key":"e_1_3_3_2_5_2","unstructured":"Sebastian Baltes Florian Angermeir Chetan Arora Marvin\u00a0Mu\u00f1oz Bar\u00f3n Chunyang Chen Lukas B\u00f6hme Fabio Calefato Neil Ernst Davide Falessi Brian Fitzgerald Davide Fucci Marcos Kalinowski Stefano Lambiase Daniel Russo Mircea Lungu Lutz Prechelt Paul Ralph Rijnard van Tonder Christoph Treude and Stefan Wagner. 2025. Guidelines for Empirical Studies in Software Engineering involving Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2508.15503\u00a0[cs.SE] https:\/\/arxiv.org\/abs\/2508.15503"},{"key":"e_1_3_3_2_6_2","doi-asserted-by":"publisher","DOI":"10.1145\/3674805.3695407"},{"key":"e_1_3_3_2_7_2","doi-asserted-by":"publisher","DOI":"10.1145\/3639477.3639741"},{"key":"e_1_3_3_2_8_2","doi-asserted-by":"publisher","DOI":"10.1109\/ESEM56168.2023.10304860"},{"key":"e_1_3_3_2_9_2","doi-asserted-by":"publisher","DOI":"10.1145\/3650212.3680369"},{"key":"e_1_3_3_2_10_2","doi-asserted-by":"publisher","DOI":"10.1145\/3338906.3338945"},{"key":"e_1_3_3_2_11_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICSE-SEIP55303.2022.9793941"},{"key":"e_1_3_3_2_12_2","doi-asserted-by":"publisher","unstructured":"Sakina Fatima Hadi Hemmati and Lionel\u00a0C. Briand. 2024. FlakyFix: Using Large Language Models for Predicting Flaky Test Fix Categories and Test Code Repair. IEEE Trans. Software Eng. 50 12 (2024) 3146\u20133171. doi:10.1109\/TSE.2024.3472476","DOI":"10.1109\/TSE.2024.3472476"},{"key":"e_1_3_3_2_13_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICST53961.2022.00020"},{"key":"e_1_3_3_2_14_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICST49551.2021.00026"},{"key":"e_1_3_3_2_15_2","doi-asserted-by":"publisher","DOI":"10.1145\/3691620.3695261"},{"key":"e_1_3_3_2_16_2","doi-asserted-by":"publisher","DOI":"10.1109\/SCAM.2018.00009"},{"key":"e_1_3_3_2_17_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICSE.2015.66"},{"key":"e_1_3_3_2_18_2","doi-asserted-by":"publisher","DOI":"10.1145\/3643656.3643896"},{"key":"e_1_3_3_2_19_2","doi-asserted-by":"publisher","DOI":"10.1145\/3293882.3330570"},{"key":"e_1_3_3_2_20_2","doi-asserted-by":"publisher","DOI":"10.1109\/ISSRE5003.2020.00045"},{"key":"e_1_3_3_2_21_2","doi-asserted-by":"crossref","unstructured":"J\u00a0Richard Landis and Gary\u00a0G Koch. 1977. The Measurement of Observer Agreement for Categorical Data. biometrics (1977) 159\u2013174.","DOI":"10.2307\/2529310"},{"key":"e_1_3_3_2_22_2","doi-asserted-by":"publisher","DOI":"10.1145\/3589334.3645628"},{"key":"e_1_3_3_2_23_2","doi-asserted-by":"publisher","DOI":"10.1145\/2635868.2635920"},{"key":"e_1_3_3_2_24_2","doi-asserted-by":"publisher","unstructured":"Benjamin Magill and Phil McMinn. 2025. deflake.rs: Detect Flaky Tests in Rust Projects using Execution Data. J. Open Source Softw. 10 113 (2025) 8757. doi:10.21105\/JOSS.08757","DOI":"10.21105\/JOSS.08757"},{"key":"e_1_3_3_2_25_2","doi-asserted-by":"publisher","DOI":"10.1145\/3722212.3724452"},{"key":"e_1_3_3_2_26_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICSE-SEIP.2017.16"},{"key":"e_1_3_3_2_27_2","doi-asserted-by":"publisher","DOI":"10.1109\/FTW66604.2025.00009"},{"key":"e_1_3_3_2_28_2","doi-asserted-by":"publisher","unstructured":"Shuyin Ouyang Jie\u00a0M. Zhang Mark Harman and Meng Wang. 2025. An Empirical Study of the Non-Determinism of ChatGPT in Code Generation. ACM Trans. Softw. Eng. Methodol. 34 2 (2025) 42:1\u201342:28. doi:10.1145\/3697010","DOI":"10.1145\/3697010"},{"key":"e_1_3_3_2_29_2","doi-asserted-by":"publisher","DOI":"10.1145\/3524481.3527227"},{"key":"e_1_3_3_2_30_2","doi-asserted-by":"publisher","unstructured":"Owain Parry Gregory\u00a0M. Kapfhammer Michael Hilton and Phil McMinn. 2022. A Survey of Flaky Tests. ACM Trans. Softw. Eng. Methodol. 31 1 (2022) 17:1\u201317:74. doi:10.1145\/3476105","DOI":"10.1145\/3476105"},{"key":"e_1_3_3_2_31_2","doi-asserted-by":"publisher","unstructured":"Owain Parry Gregory\u00a0M. Kapfhammer Michael Hilton and Phil McMinn. 2025. Systemic Flakiness: An Empirical Analysis of Co-Occurring Flaky Test Failures. CoRR abs\/2504.16777 (2025). arXiv:https:\/\/arXiv.org\/abs\/2504.16777doi:10.48550\/ARXIV.2504.16777","DOI":"10.48550\/ARXIV.2504.16777"},{"key":"e_1_3_3_2_32_2","doi-asserted-by":"publisher","DOI":"10.1109\/AST.2019.000-1"},{"key":"e_1_3_3_2_33_2","unstructured":"The\u00a0Chromium Project. 2020. Test Flakiness - One of the Main Challenges of Automated Testing. https:\/\/testing.googleblog.com\/2020\/12\/test-flakiness-one-of-main-challenges.html Accessed 2025-10-18."},{"key":"e_1_3_3_2_34_2","unstructured":"The\u00a0Chromium Project. 2025. Fixing Flaky Unit Tests - Developer Guidelines. https:\/\/www.chromium.org\/developers\/testing\/fixing-flaky-tests\/fixing_flaky_unittests\/ Accessed 2025-10-18."},{"key":"e_1_3_3_2_35_2","doi-asserted-by":"publisher","unstructured":"Shanto Rahman Saikat Dutta and August Shi. 2025. Understanding and Improving Flaky Test Classification. Proc. ACM Program. Lang. 9 OOPSLA2 Article 320 (Oct. 2025) 27\u00a0pages. doi:10.1145\/3763098","DOI":"10.1145\/3763098"},{"key":"e_1_3_3_2_36_2","doi-asserted-by":"publisher","DOI":"10.1145\/3597503.3639115"},{"key":"e_1_3_3_2_37_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICSE43902.2021.00141"},{"key":"e_1_3_3_2_38_2","doi-asserted-by":"publisher","DOI":"10.1109\/FTW66604.2025.00010"},{"key":"e_1_3_3_2_39_2","doi-asserted-by":"crossref","unstructured":"Julius Sim and Chris\u00a0C Wright. 2005. The Kappa Statistic in Reliability Studies: Use Interpretation and Sample Size Requirements. Physical therapy 85 3 (2005) 257\u2013268.","DOI":"10.1093\/ptj\/85.3.257"},{"key":"e_1_3_3_2_40_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICSME.2018.00062"},{"key":"e_1_3_3_2_41_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICSM.2015.7332456"},{"key":"e_1_3_3_2_42_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICSE43902.2021.00018"}],"event":{"name":"FTW '26: 3rd International Flaky Tests Workshop 2026","location":"Rio de Janeiro Brazil","acronym":"FTW '26","sponsor":["SIGSOFT ACM Special Interest Group on Software Engineering"]},"container-title":["Proceedings of the 2026 IEEE\/ACM 3rd International Flaky Tests Workshop"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3786178.3788327","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,5,13]],"date-time":"2026-05-13T06:56:16Z","timestamp":1778655376000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3786178.3788327"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,4,12]]},"references-count":41,"alternative-id":["10.1145\/3786178.3788327","10.1145\/3786178"],"URL":"https:\/\/doi.org\/10.1145\/3786178.3788327","relation":{},"subject":[],"published":{"date-parts":[[2026,4,12]]},"assertion":[{"value":"2026-05-12","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}