{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,26]],"date-time":"2026-06-26T12:51:50Z","timestamp":1782478310316,"version":"3.54.5"},"publisher-location":"Cham","reference-count":23,"publisher":"Springer Nature Switzerland","isbn-type":[{"value":"9783032297433","type":"print"},{"value":"9783032297440","type":"electronic"}],"license":[{"start":{"date-parts":[[2026,6,27]],"date-time":"2026-06-27T00:00:00Z","timestamp":1782518400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2026,6,27]],"date-time":"2026-06-27T00:00:00Z","timestamp":1782518400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2027]]},"DOI":"10.1007\/978-3-032-29744-0_19","type":"book-chapter","created":{"date-parts":[[2026,6,26]],"date-time":"2026-06-26T12:42:05Z","timestamp":1782477725000},"page":"279-293","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["From Slides to\u00a0Exams: A Multi-agent Human-AI System for\u00a0Collaborative Assessment Design"],"prefix":"10.1007","author":[{"ORCID":"https:\/\/orcid.org\/0009-0004-3590-1578","authenticated-orcid":false,"given":"Khiem Hoang","family":"Truong","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-3893-8582","authenticated-orcid":false,"given":"Duc-Tuan","family":"Luu","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-3136-0661","authenticated-orcid":false,"given":"Duong Ngoc","family":"Hao","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-8340-1405","authenticated-orcid":false,"given":"Dang Van","family":"Thin","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-3931-849X","authenticated-orcid":false,"given":"Ngan Luu-Thuy","family":"Nguyen","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2026,6,27]]},"reference":[{"key":"19_CR1","doi-asserted-by":"crossref","unstructured":"Biancini, G., Ferrato, A., Limongelli, C.: Multiple-choice question generation using large language models: methodology and educator insights. In: Adjunct Proceedings of the 32nd ACM Conference on User Modeling, Adaptation and Personalization, pp. 584\u2013590 (2024)","DOI":"10.1145\/3631700.3665233"},{"issue":"3","key":"19_CR2","doi-asserted-by":"publisher","first-page":"297","DOI":"10.1007\/BF02310555","volume":"16","author":"LJ Cronbach","year":"1951","unstructured":"Cronbach, L.J.: Coefficient alpha and the internal structure of tests. Psychometrika 16(3), 297\u2013334 (1951)","journal-title":"Psychometrika"},{"issue":"19","key":"19_CR3","doi-asserted-by":"publisher","first-page":"9125","DOI":"10.3390\/app14199125","volume":"14","author":"S Hadzhikoleva","year":"2024","unstructured":"Hadzhikoleva, S., Rachovski, T., Ivanov, I., Hadzhikolev, E., Dimitrov, G.: Automated test creation using large language models: a practical application. Appl. Sci. 14(19), 9125 (2024)","journal-title":"Appl. Sci."},{"key":"19_CR4","doi-asserted-by":"crossref","unstructured":"Hegde, S., Fazli, P., Seifi, H.: ChartQA-X: generating explanations for charts. arXiv preprint arXiv:2504.13275 (2025)","DOI":"10.1109\/WACV61042.2026.00624"},{"issue":"2","key":"19_CR5","doi-asserted-by":"publisher","first-page":"211","DOI":"10.1007\/BF02289618","volume":"28","author":"S Henrysson","year":"1963","unstructured":"Henrysson, S.: Correction of item-total correlations in item analysis. Psychometrika 28(2), 211\u2013218 (1963)","journal-title":"Psychometrika"},{"issue":"1","key":"19_CR6","doi-asserted-by":"publisher","first-page":"17","DOI":"10.1037\/h0057123","volume":"30","author":"TL Kelley","year":"1939","unstructured":"Kelley, T.L.: The selection of upper and lower groups for the validation of test items. J. Educ. Psychol. 30(1), 17 (1939)","journal-title":"J. Educ. Psychol."},{"key":"19_CR7","doi-asserted-by":"crossref","unstructured":"Kim, G., et al.: OCR-free document understanding transformer. In: European Conference on Computer Vision, pp. 498\u2013517. Springer (2022)","DOI":"10.1007\/978-3-031-19815-1_29"},{"issue":"1","key":"19_CR8","doi-asserted-by":"publisher","first-page":"208","DOI":"10.1186\/s12909-025-06796-6","volume":"25","author":"AK Law","year":"2025","unstructured":"Law, A.K., et al.: AI versus human-generated multiple-choice questions for medical education: a cohort study in a high-stakes examination. BMC Med. Educ. 25(1), 208 (2025)","journal-title":"BMC Med. Educ."},{"key":"19_CR9","unstructured":"Lin, C.Y.: ROUGE: a package for automatic evaluation of summaries. In: Text Summarization Branches Out, Barcelona, Spain, pp. 74\u201381. Association for Computational Linguistics (2004). https:\/\/aclanthology.org\/W04-1013\/"},{"key":"19_CR10","doi-asserted-by":"crossref","unstructured":"Masry, A., Long, D.X., Tan, J.Q., Joty, S., Hoque, E.: ChartQA: a benchmark for question answering about charts with visual and logical reasoning. arXiv preprint arXiv:2203.10244 (2022)","DOI":"10.18653\/v1\/2022.findings-acl.177"},{"key":"19_CR11","doi-asserted-by":"crossref","unstructured":"Meissner, R., et al.: LLM-generated competence-based e-assessment items for higher education mathematics: methodology and evaluation. In: Frontiers in Education, vol.\u00a09, p. 1427502. Frontiers Media SA (2024)","DOI":"10.3389\/feduc.2024.1427502"},{"key":"19_CR12","doi-asserted-by":"crossref","unstructured":"Mucciaccia, S.S., Paix\u00e3o, T.M., Mutz, F.W., Badue, C.S., de\u00a0Souza, A.F., Oliveira-Santos, T.: Automatic multiple-choice question generation and evaluation systems based on LLM: a study case with university resolutions. In: Proceedings of the 31st International Conference on Computational Linguistics, pp. 2246\u20132260 (2025)","DOI":"10.5753\/jbcs.2025.5801"},{"issue":"14","key":"19_CR13","doi-asserted-by":"publisher","first-page":"2835","DOI":"10.3390\/electronics14142835","volume":"14","author":"I Papachristou","year":"2025","unstructured":"Papachristou, I., Dimitroulakos, G., Vassilakis, C.: Automated test generation and marking using LLMs. Electronics 14(14), 2835 (2025)","journal-title":"Electronics"},{"key":"19_CR14","unstructured":"Pathak, Y., Pawar, S., Tilekar, C., Pujari, V., Shaikh, I.M.: Automatic question paper generation with marks allocation using Bloom\u2019s taxonomy. Int. Res. J. Modern. Eng. Technol. Sci. 5(11) (2023). https:\/\/www.irjmets.com\/uploadedfiles\/paper\/issue_11_november_2023\/46284\/final\/fin_irjmets1700193238.pdf"},{"issue":"4","key":"19_CR15","doi-asserted-by":"publisher","first-page":"373","DOI":"10.1080\/00031305.2016.1141708","volume":"70","author":"D Quarfoot","year":"2016","unstructured":"Quarfoot, D., Levine, R.A.: How robust are multirater interrater reliability indices to changes in frequency distribution? Am. Stat. 70(4), 373\u2013384 (2016)","journal-title":"Am. Stat."},{"key":"19_CR16","first-page":"573","volume":"10","author":"P Thigale","year":"2021","unstructured":"Thigale, P., Nadkar, S., Kokle, B., Bhole, N., Ghodichor, F.: Automatic question paper generator system by keyword based shuffling algorithm using randomization technique. IJARCCE 10, 573\u2013577 (2021)","journal-title":"IJARCCE"},{"key":"19_CR17","doi-asserted-by":"crossref","unstructured":"Vu, S.T., Truong, H.T., Do, O.T., Le, T.A., Mai, T.T.: A chatGPT-based approach for questions generation in higher education. In: Proceedings of the 1st ACM Workshop on AI-Powered Q&A Systems for Multimedia, pp. 13\u201318 (2024)","DOI":"10.1145\/3643479.3662056"},{"issue":"1","key":"19_CR18","doi-asserted-by":"publisher","first-page":"61","DOI":"10.1186\/1471-2288-13-61","volume":"13","author":"N Wongpakaran","year":"2013","unstructured":"Wongpakaran, N., Wongpakaran, T., Wedding, D., Gwet, K.L.: A comparison of Cohen\u2019s kappa and Gwet\u2019s AC1 when calculating inter-rater reliability coefficients: a study conducted with personality disorder samples. BMC Med. Res. Methodol. 13(1), 61 (2013)","journal-title":"BMC Med. Res. Methodol."},{"key":"19_CR19","unstructured":"Wu, Q., et\u00a0al.: AutoGEN: enabling next-gen LLM applications via multi-agent conversations. In: First Conference on Language Modeling (2024)"},{"key":"19_CR20","unstructured":"Yuan, S., Song, K., Chen, J., Tan, X., Li, D., Yang, D.: EvoAgent: towards automatic multi-agent generation via evolutionary algorithms. arXiv preprint arXiv:2406.14228 (2024)"},{"key":"19_CR21","doi-asserted-by":"crossref","unstructured":"Zeeshan, M., et al.: A comparative analysis of psychometric properties in AI-generated and teacher-made MCQs test (2024)","DOI":"10.53555\/ks.v12i4.3653"},{"key":"19_CR22","unstructured":"Zhang, T., Kishore, V., Wu, F., Weinberger, K.Q., Artzi, Y.: BERTScore: evaluating text generation with BERT. arXiv preprint arXiv:1904.09675 (2019)"},{"issue":"6","key":"19_CR23","doi-asserted-by":"publisher","first-page":"3055","DOI":"10.3390\/app15063055","volume":"15","author":"Q Zhuge","year":"2025","unstructured":"Zhuge, Q., Wang, H., Chen, X.: TwinStar: a novel design for enhanced test question generation using dual-LLM engine. Appl. Sci. 15(6), 3055 (2025)","journal-title":"Appl. Sci."}],"container-title":["Lecture Notes in Computer Science","Artificial Intelligence in Education"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-032-29744-0_19","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,6,26]],"date-time":"2026-06-26T12:42:25Z","timestamp":1782477745000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-032-29744-0_19"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,6,27]]},"ISBN":["9783032297433","9783032297440"],"references-count":23,"URL":"https:\/\/doi.org\/10.1007\/978-3-032-29744-0_19","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"value":"0302-9743","type":"print"},{"value":"1611-3349","type":"electronic"}],"subject":[],"published":{"date-parts":[[2026,6,27]]},"assertion":[{"value":"27 June 2026","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"The authors have no competing interests to declare that are relevant to the content of this article.","order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Disclosure of Interests"}},{"value":"AIED","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Artificial Intelligence in Education","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Seoul","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Korea (Republic of)","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2026","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"29 June 2026","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"3 July 2026","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"27","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"aied2026","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/www.aied-conference.org\/2026","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}