{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,1,16]],"date-time":"2026-01-16T13:24:43Z","timestamp":1768569883954,"version":"3.49.0"},"reference-count":62,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/legalcode"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Access"],"published-print":{"date-parts":[[2025]]},"DOI":"10.1109\/access.2025.3530949","type":"journal-article","created":{"date-parts":[[2025,1,17]],"date-time":"2025-01-17T18:38:47Z","timestamp":1737139127000},"page":"13312-13328","source":"Crossref","is-referenced-by-count":2,"title":["Machine Reading Comprehension for the Tamil Language With Translated SQuAD"],"prefix":"10.1109","volume":"13","author":[{"given":"Anton","family":"Vijeevaraj Ann Sinthusha","sequence":"first","affiliation":[{"name":"University of Colombo School of Computing, Colombo, Sri Lanka"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-0678-3486","authenticated-orcid":false,"given":"Eugene Y. A.","family":"Charles","sequence":"additional","affiliation":[{"name":"Department of Computer Science, University of Jaffna, Jaffna, Sri Lanka"}]},{"given":"Ruvan","family":"Weerasinghe","sequence":"additional","affiliation":[{"name":"University of Colombo School of Computing, Colombo, Sri Lanka"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/ICICCS48265.2020.9121015"},{"key":"ref2","article-title":"BERT: Pre-training of deep bidirectional transformers for language understanding","author":"Devlin","year":"2018","journal-title":"arXiv:1810.04805"},{"key":"ref3","article-title":"Language models are few-shot learners","author":"Brown","year":"2020","journal-title":"arXiv:2005.14165"},{"key":"ref4","article-title":"GPT-4 technical report","volume-title":"arXiv:2303.08774","author":"Achiam","year":"2023"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1007\/s10462-023-10583-4"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1080\/24751839.2020.1833136"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-021-11228-w"},{"key":"ref8","article-title":"UQuAD1.0: Development of an Urdu question answering training data for machine reading comprehension","author":"Kazi","year":"2021","journal-title":"arXiv:2111.01543"},{"key":"ref9","article-title":"A survey on recent approaches for natural language processing in low-resource scenarios","author":"Hedderich","year":"2020","journal-title":"arXiv:2010.12309"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D16-1264"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P18-2124"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P17-1147"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1007\/s10489-022-04052-8"},{"key":"ref14","first-page":"2358","article-title":"XQA: A cross-lingual open-domain question answering dataset","volume-title":"Proc. 57th Annu. Meeting Assoc. Comput. Linguistics","author":"Liu"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/SCSE61872.2024.10550544"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.acl-main.653"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.acl-main.421"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/ACMI53878.2021.9528178"},{"issue":"43","key":"ref19","first-page":"10176","article-title":"Development of question answering system in Marathi language","volume":"1","author":"Shelke","year":"2022","journal-title":"Specialusis Ugdymas"},{"key":"ref20","first-page":"4171","article-title":"BERT: Pre-training of deep bidirectional transformers for language understanding","volume-title":"Proc. Conf. North Amer. Chapter Assoc. Comput. Linguistics, Human Lang. Technol.","author":"Devlin"},{"key":"ref21","article-title":"DistilBERT, a distilled version of BERT: Smaller, faster, cheaper and lighter","author":"Sanh","year":"2019","journal-title":"arXiv:1910.01108"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.48550\/ARXIV.1907.11692"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.acl-main.747"},{"key":"ref24","article-title":"MuRIL: Multilingual representations for Indian languages","author":"Khanuja","year":"2021","journal-title":"arXiv:2103.10730"},{"key":"ref25","article-title":"Rethinking embedding coupling in pre-trained language models","author":"Chung","year":"2020","journal-title":"arXiv:2010.12821"},{"key":"ref26","article-title":"A survey on neural machine reading comprehension","author":"Qiu","year":"2019","journal-title":"arXiv:1906.03824"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.13052\/jwe1540-9589.1785"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.3115\/1117595.1117598"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/IIH-MSP.2007.59"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1145\/511446.511500"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/FSKD.2010.5569607"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.3115\/1220575.1220614"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v34i05.6282"},{"key":"ref34","article-title":"Survey on publicly available Sinhala natural language processing tools and research","author":"de Silva","year":"2019","journal-title":"arXiv:1906.02358"},{"key":"ref35","volume-title":"COQA: A Conversational  Question Answering Challenge","author":"Reddy","year":"2024"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D17-1082"},{"key":"ref37","article-title":"Read + verify: Machine reading comprehension with unanswerable questions","author":"Hu","year":"2018","journal-title":"arXiv:1808.05759"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.findings-emnlp.107"},{"key":"ref39","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D19-1600"},{"key":"ref40","article-title":"KorQuAD1.0: Korean QA dataset for machine reading comprehension","author":"Lim","year":"2019","journal-title":"arXiv:1909.07005"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1109\/ICAIS56108.2023.10073689"},{"key":"ref42","first-page":"1","article-title":"Hindirc: A dataset for reading comprehension in Hindi","volume-title":"Proc. 20th Int. Conf. Comput. Linguistics Intelligent Text Process.","author":"Anuranjana"},{"key":"ref43","article-title":"Mintaka: A complex, natural, and multilingual dataset for end-to-end question answering","author":"Sen","year":"2022","journal-title":"arXiv:2210.01613"},{"key":"ref44","doi-asserted-by":"publisher","DOI":"10.1162\/tacl_a_00317"},{"key":"ref45","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2021.naacl-main.46"},{"key":"ref46","first-page":"309","article-title":"Development of Marathi language database for question answering system","volume":"8","author":"Nirpal","year":"2017","journal-title":"Adv. Comput. Res."},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1007\/978-981-10-8569-7_4"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.1145\/3371158.3371193"},{"key":"ref49","article-title":"Predicting the performance of multilingual NLP models","author":"Srinivasan","year":"2021","journal-title":"arXiv:2110.08875"},{"key":"ref50","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2024.vardial-1.2"},{"key":"ref51","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2022.blackboxnlp-1.11"},{"key":"ref52","article-title":"SeaLLMs\u2014Large language models for Southeast Asia","author":"Nguyen","year":"2023","journal-title":"arXiv:2312.00738"},{"key":"ref53","doi-asserted-by":"publisher","DOI":"10.1007\/s12046-021-01765-3"},{"key":"ref54","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2022.dravidianlangtech-1.3"},{"key":"ref55","article-title":"Extractive question answering on queries in Hindi and Tamil","author":"Thirumala","year":"2022","journal-title":"arXiv:2210.06356"},{"key":"ref56","volume-title":"Tamil Short Story Dataset for Tamil MRC","author":"Alstan","year":"2024"},{"key":"ref57","doi-asserted-by":"publisher","DOI":"10.1145\/3664646.3664765"},{"key":"ref58","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2023.findings-emnlp.826"},{"key":"ref59","article-title":"Language ranker: A metric for quantifying LLM performance across high and low-resource languages","author":"Li","year":"2024","journal-title":"arXiv:2404.11553"},{"key":"ref60","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2024.vardial-1.2"},{"key":"ref61","article-title":"BERTScore: Evaluating text generation with BERT","author":"Zhang","year":"2019","journal-title":"arXiv:1904.09675"},{"key":"ref62","volume-title":"Spacy 2: Industrial-strength Natural Language Processing in Python","year":"2020"}],"container-title":["IEEE Access"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/6287639\/10820123\/10844269.pdf?arnumber=10844269","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,1,25]],"date-time":"2025-01-25T05:24:06Z","timestamp":1737782646000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10844269\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025]]},"references-count":62,"URL":"https:\/\/doi.org\/10.1109\/access.2025.3530949","relation":{},"ISSN":["2169-3536"],"issn-type":[{"value":"2169-3536","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025]]}}}