{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,20]],"date-time":"2026-04-20T10:12:51Z","timestamp":1776679971445,"version":"3.51.2"},"publisher-location":"Singapore","reference-count":41,"publisher":"Springer Nature Singapore","isbn-type":[{"value":"9789819570775","type":"print"},{"value":"9789819570782","type":"electronic"}],"license":[{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2026]]},"DOI":"10.1007\/978-981-95-7078-2_34","type":"book-chapter","created":{"date-parts":[[2026,4,20]],"date-time":"2026-04-20T09:30:15Z","timestamp":1776677415000},"page":"530-546","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["Understanding Cross-Lingual Generalization of\u00a0English-Centric LLMs: The Role of\u00a0Representation Similarity and\u00a0Data Exposure"],"prefix":"10.1007","author":[{"given":"Suchun","family":"Xie","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Shota","family":"Sasaki","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Hwichan","family":"Kim","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yunmeng","family":"Li","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Reina","family":"Akama","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jun","family":"Suzuki","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2026,4,21]]},"reference":[{"key":"34_CR1","doi-asserted-by":"crossref","unstructured":"Bach et al.: Promptsource: an integrated development environment and repository for natural language prompts. arXiv:2202.01279 (2022)","DOI":"10.18653\/v1\/2022.acl-demo.9"},{"key":"34_CR2","doi-asserted-by":"crossref","unstructured":"Bandarkar et\u00a0al.: The belebele benchmark: a parallel reading comprehension dataset in 122 language variants. arXiv:2308.16884 (2023)","DOI":"10.18653\/v1\/2024.acl-long.44"},{"key":"34_CR3","doi-asserted-by":"crossref","unstructured":"Bojanowski et al.: Enriching word vectors with subword information. Trans. Assoc. Comput. Linguist. 5, 135\u2013146 (2017)","DOI":"10.1162\/tacl_a_00051"},{"key":"34_CR4","doi-asserted-by":"crossref","unstructured":"Chirkova, N., Nikoulina, V.: Zero-shot cross-lingual transfer in instruction tuning of large language models (2024)","DOI":"10.18653\/v1\/2024.inlg-main.53"},{"key":"34_CR5","doi-asserted-by":"crossref","unstructured":"Conneau et\u00a0al.: XNLI: evaluating cross-lingual sentence representations. In: Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing, pp. 2475\u20132485. Association for Computational Linguistics, Brussels, Belgium (2018)","DOI":"10.18653\/v1\/D18-1269"},{"key":"34_CR6","doi-asserted-by":"crossref","unstructured":"Gowda et\u00a0al.: Many-to-English machine translation tools, data, and pretrained models. In: Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: System Demonstrations, pp. 306\u2013316. Association for Computational Linguistics, Online (2021)","DOI":"10.18653\/v1\/2021.acl-demo.37"},{"key":"34_CR7","doi-asserted-by":"crossref","unstructured":"Hasan et\u00a0al.: XL-sum: large-scale multilingual abstractive summarization for 44 languages. In: Findings of the Association for Computational Linguistics (ACL-IJCNLP) (2021)","DOI":"10.18653\/v1\/2021.findings-acl.413"},{"key":"34_CR8","unstructured":"Hu et\u00a0al.: LoRA: low-rank adaptation of large language models. In: International Conference on Learning Representations (ICLR) (2022)"},{"key":"34_CR9","unstructured":"Hu et\u00a0al.: XTREME: a massively multilingual multi-task benchmark for evaluating cross-lingual generalisation. In: Proceedings of the 37th International Conference on Machine Learning. Proceedings of Machine Learning Research, vol.\u00a0119, pp. 4411\u20134421. PMLR (2020)"},{"key":"34_CR10","doi-asserted-by":"crossref","unstructured":"Huo et\u00a0al.: Enhancing non-english capabilities of english-centric large language models through deep supervision fine-tuning (2025)","DOI":"10.1609\/aaai.v39i23.34594"},{"key":"34_CR11","doi-asserted-by":"crossref","unstructured":"Kew, T., Schottmann, F., Sennrich, R.: Turning English-centric LLMs into polyglots: how much multilinguality is needed? In: Findings of the Association for Computational Linguistics: EMNLP 2024, pp. 13097\u201313124. Association for Computational Linguistics, Miami, Florida, USA (2024)","DOI":"10.18653\/v1\/2024.findings-emnlp.766"},{"key":"34_CR12","unstructured":"Kumar et\u00a0al.: Bridging the language gap: dynamic learning strategies for improving multilingual performance in LLMs. In: Proceedings of the 31st International Conference on Computational Linguistics, pp. 9209\u20139223. Association for Computational Linguistics, Abu Dhabi, UAE (2025)"},{"key":"34_CR13","doi-asserted-by":"crossref","unstructured":"Lauscher et\u00a0al.: From zero to hero: on the limitations of zero-shot language transfer with multilingual Transformers. In: Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), pp. 4483\u20134499. Association for Computational Linguistics, Online (2020)","DOI":"10.18653\/v1\/2020.emnlp-main.363"},{"key":"34_CR14","doi-asserted-by":"crossref","unstructured":"Lee, J., Jung, Y., Hwang, S.W.: COMMIT: code-mixing English-centric large language model for multilingual instruction tuning. In: Findings of the Association for Computational Linguistics: NAACL 2024, pp. 3130\u20133137. Association for Computational Linguistics, Mexico City, Mexico (2024)","DOI":"10.18653\/v1\/2024.findings-naacl.198"},{"key":"34_CR15","doi-asserted-by":"crossref","unstructured":"Li, T., Murray, K.: Why does zero-shot cross-lingual generation fail? An explanation and a solution. In: Findings of the Association for Computational Linguistics: ACL 2023, pp. 12461\u201312476. Association for Computational Linguistics, Toronto, Canada (2023)","DOI":"10.18653\/v1\/2023.findings-acl.789"},{"key":"34_CR16","doi-asserted-by":"crossref","unstructured":"Lin et\u00a0al.: Few-shot learning with multilingual generative language models. In: Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing, pp. 9019\u20139052. Association for Computational Linguistics, Abu Dhabi, United Arab Emirates (2022)","DOI":"10.18653\/v1\/2022.emnlp-main.616"},{"key":"34_CR17","unstructured":"MOP-LIWU Community, MNBVC Team: MNBVC: Massive never-ending BT vast Chinese corpus (2023). https:\/\/github.com\/esbatmop\/MNBVC"},{"key":"34_CR18","doi-asserted-by":"crossref","unstructured":"Muller et\u00a0al.: First align, then predict: understanding the cross-lingual ability of multilingual BERT. In: Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume, pp. 2214\u20132231. Association for Computational Linguistics, Online (2021)","DOI":"10.18653\/v1\/2021.eacl-main.189"},{"key":"34_CR19","unstructured":"Nie et\u00a0al.: Decomposed prompting: unveiling multilingual linguistic structure knowledge in english-centric large language models. arXiv:2402.18397 (2024)"},{"key":"34_CR20","unstructured":"OpenAI et\u00a0al.: GPT-4o system card. arXiv:2410.21276 (2024)"},{"key":"34_CR21","doi-asserted-by":"crossref","unstructured":"Ortiz\u00a0Su\u00e1rez, P.J., Romary, L., Sagot, B.: A monolingual approach to contextualized word embeddings for mid-resource languages. In: Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pp. 1703\u20131714. Association for Computational Linguistics, Online (2020)","DOI":"10.18653\/v1\/2020.acl-main.156"},{"key":"34_CR22","doi-asserted-by":"crossref","unstructured":"Patil, V., Talukdar, P., Sarawagi, S.: Overlap-based vocabulary generation improves cross-lingual transfer among related languages. In: Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pp. 219\u2013233. Association for Computational Linguistics, Dublin, Ireland (2022)","DOI":"10.18653\/v1\/2022.acl-long.18"},{"key":"34_CR23","doi-asserted-by":"crossref","unstructured":"Philippy, F., Guo, S., Haddadan, S.: Towards a common understanding of contributing factors for cross-lingual transfer in multilingual language models: a review. In: Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pp. 5877\u20135891. Association for Computational Linguistics, Toronto, Canada (2023)","DOI":"10.18653\/v1\/2023.acl-long.323"},{"key":"34_CR24","doi-asserted-by":"crossref","unstructured":"Pires, T., Schlinger, E., Garrette, D.: How multilingual is multilingual BERT? In: Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 4996\u20135001. Association for Computational Linguistics, Florence, Italy (2019)","DOI":"10.18653\/v1\/P19-1493"},{"key":"34_CR25","doi-asserted-by":"crossref","unstructured":"Saji et\u00a0al.: Romanlens: the role of latent romanization in multilinguality in LLMs. arXiv:2502.07424 (2025)","DOI":"10.18653\/v1\/2025.findings-acl.1354"},{"key":"34_CR26","doi-asserted-by":"crossref","unstructured":"Sellam, T., Das, D., Parikh, A.: BLEURT: learning robust metrics for text generation. In: Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pp. 7881\u20137892. Association for Computational Linguistics, Online (2020)","DOI":"10.18653\/v1\/2020.acl-main.704"},{"key":"34_CR27","unstructured":"Touvron et\u00a0al.: Llama: open and efficient foundation language models. arXiv:2302.13971 (2023)"},{"key":"34_CR28","unstructured":"Touvron et\u00a0al.: Llama 2: open foundation and fine-tuned chat models (2023)"},{"key":"34_CR29","unstructured":"Wei et\u00a0al.: Finetuned language models are zero-shot learners. arXiv:2109.01652 (2022)"},{"key":"34_CR30","unstructured":"Xu et\u00a0al.: Wizardlm: empowering large pre-trained language models to follow complex instructions (2025)"},{"key":"34_CR31","doi-asserted-by":"crossref","unstructured":"Xu et\u00a0al.: Baize: an open-source chat model with parameter-efficient tuning on self-chat data. In: Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, pp. 6268\u20136278. Association for Computational Linguistics, Singapore (2023)","DOI":"10.18653\/v1\/2023.emnlp-main.385"},{"key":"34_CR32","doi-asserted-by":"crossref","unstructured":"Xu et\u00a0al.: Are structural concepts universal in transformer language models? Towards interpretable cross-lingual generalization. In: Findings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP2023 Findings) (2023)","DOI":"10.18653\/v1\/2023.findings-emnlp.931"},{"key":"34_CR33","unstructured":"Yang et\u00a0al.: Enhancing cross-lingual transfer by manifold mixup (2022)"},{"key":"34_CR34","doi-asserted-by":"crossref","unstructured":"Yang et\u00a0al.: PAWS-X: a cross-lingual adversarial dataset for paraphrase identification. In: Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), pp. 3687\u20133692. Association for Computational Linguistics, Hong Kong, China (2019)","DOI":"10.18653\/v1\/D19-1382"},{"key":"34_CR35","unstructured":"Ye, J., Tao, X., Kong, L.: Language versatilists vs. specialists: an empirical revisiting on multilingual transfer ability. arXiv:2306.06688 (2023)"},{"key":"34_CR36","doi-asserted-by":"crossref","unstructured":"Yuan et\u00a0al.: How vocabulary sharing facilitates multilingualism in LLaMA? In: Findings of the Association for Computational Linguistics: ACL 2024, pp. 12111\u201312130. Association for Computational Linguistics, Bangkok, Thailand (2024)","DOI":"10.18653\/v1\/2024.findings-acl.721"},{"key":"34_CR37","unstructured":"Zeman et\u00a0al.: CoNLL 2017 shared task: multilingual parsing from raw text to universal dependencies. In: Proceedings of the CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies, pp. 1\u201319. Association for Computational Linguistics, Vancouver, Canada (2017)"},{"key":"34_CR38","unstructured":"Zhao et\u00a0al.: Unveiling a core linguistic region in large language models. arXiv:2310.14928 (2023)"},{"key":"34_CR39","unstructured":"Zhao et\u00a0al.: How do large language models handle multilingualism? arXiv:2402.18815 (2024)"},{"key":"34_CR40","doi-asserted-by":"crossref","unstructured":"Zhong et\u00a0al.: Beyond english-centric LLMs: what language do multilingual language models think in? arXiv:2408.10811 (2024)","DOI":"10.18653\/v1\/2025.findings-acl.1350"},{"key":"34_CR41","unstructured":"Zhu et\u00a0al.: Extrapolating large language models to non-english by aligning languages. arXiv:2308.04948 (2023)"}],"container-title":["Lecture Notes in Computer Science","PRICAI 2025: Trends in Artificial Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-981-95-7078-2_34","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,4,20]],"date-time":"2026-04-20T09:30:58Z","timestamp":1776677458000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-981-95-7078-2_34"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026]]},"ISBN":["9789819570775","9789819570782"],"references-count":41,"URL":"https:\/\/doi.org\/10.1007\/978-981-95-7078-2_34","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"value":"0302-9743","type":"print"},{"value":"1611-3349","type":"electronic"}],"subject":[],"published":{"date-parts":[[2026]]},"assertion":[{"value":"21 April 2026","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"PRICAI","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Pacific Rim International Conference on Artificial Intelligence","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Wellington","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"New Zealand","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2025","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"17 November 2025","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"21 November 2025","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"22","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"pricai2025","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/www.pricai.org\/2025\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}