{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,22]],"date-time":"2025-11-22T11:41:46Z","timestamp":1763811706277,"version":"build-2065373602"},"publisher-location":"New York, NY, USA","reference-count":46,"publisher":"ACM","license":[{"start":{"date-parts":[[2025,5,8]],"date-time":"2025-05-08T00:00:00Z","timestamp":1746662400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2025,5,8]]},"DOI":"10.1145\/3701716.3717660","type":"proceedings-article","created":{"date-parts":[[2025,5,23]],"date-time":"2025-05-23T16:12:56Z","timestamp":1748016776000},"page":"2071-2077","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":1,"title":["KG-UQ: Knowledge Graph-Based Uncertainty Quantification for Long Text in Large Language Models"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0009-0000-2640-9240","authenticated-orcid":false,"given":"Yingqing","family":"Yuan","sequence":"first","affiliation":[{"name":"University of Sydney, Sydney, Australia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-8848-0189","authenticated-orcid":false,"given":"Linwei","family":"Tao","sequence":"additional","affiliation":[{"name":"University of Sydney, Sydney, Australia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-5338-156X","authenticated-orcid":false,"given":"Haohui","family":"Lu","sequence":"additional","affiliation":[{"name":"University of Sydney, Sydney, Australia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7792-2327","authenticated-orcid":false,"given":"Matloob","family":"Khushi","sequence":"additional","affiliation":[{"name":"Brunel University of London, London, United Kingdom"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-3930-6600","authenticated-orcid":false,"given":"Imran","family":"Razzak","sequence":"additional","affiliation":[{"name":"MBZUAI, Abu Dhabi, United Arab Emirates and University of New South Wales, Sydney, Australia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-9908-7182","authenticated-orcid":false,"given":"Mark","family":"Dras","sequence":"additional","affiliation":[{"name":"Macquarie University, Sydney, Australia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-4408-1952","authenticated-orcid":false,"given":"Jian","family":"Yang","sequence":"additional","affiliation":[{"name":"Macquarie University, Sydney, Australia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-0191-7171","authenticated-orcid":false,"given":"Usman","family":"Naseem","sequence":"additional","affiliation":[{"name":"Macquarie University, Sydney, Australia"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2025,5,23]]},"reference":[{"key":"e_1_3_2_2_1_1","volume-title":"Diogo Almeida, Janko Altenschmidt, Sam Altman, Shyamal Anadkat, et al.","author":"Achiam Josh","year":"2023","unstructured":"Josh Achiam, Steven Adler, Sandhini Agarwal, Lama Ahmad, Ilge Akkaya, Florencia Leoni Aleman, Diogo Almeida, Janko Altenschmidt, Sam Altman, Shyamal Anadkat, et al. 2023. Gpt-4 technical report. arXiv preprint arXiv:2303.08774 (2023)."},{"key":"e_1_3_2_2_2_1","volume-title":"2025 a. Can LLM Agents Maintain a Persona in Discourse? arXiv preprint arXiv:2502.11843","author":"Bhandari Pranav","year":"2025","unstructured":"Pranav Bhandari, Nicolas Fay, Michael Wise, Amitava Datta, Stephanie Meek, Usman Naseem, and Mehwish Nasim. 2025 a. Can LLM Agents Maintain a Persona in Discourse? arXiv preprint arXiv:2502.11843 (2025)."},{"key":"e_1_3_2_2_3_1","volume-title":"2025 b. Evaluating Personality Traits in Large Language Models: Insights from Psychological Questionnaires. arXiv preprint arXiv:2502.05248","author":"Bhandari Pranav","year":"2025","unstructured":"Pranav Bhandari, Usman Naseem, Amitava Datta, Nicolas Fay, and Mehwish Nasim. 2025 b. Evaluating Personality Traits in Large Language Models: Insights from Psychological Questionnaires. arXiv preprint arXiv:2502.05248 (2025)."},{"key":"e_1_3_2_2_4_1","volume-title":"Shoaib Jameel, Usman Naseem, Basem Suleiman, Flora D Salim, Hakim Hacid, and Imran Razzak.","author":"Chen Shijing","year":"2025","unstructured":"Shijing Chen, Mohamed Reda Bouadjenek, Shoaib Jameel, Usman Naseem, Basem Suleiman, Flora D Salim, Hakim Hacid, and Imran Razzak. 2025. Leveraging Taxonomy and LLMs for Improved Multimodal Hierarchical Classification. arXiv preprint arXiv:2501.06827 (2025)."},{"key":"e_1_3_2_2_5_1","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v33i01.33013363"},{"key":"e_1_3_2_2_6_1","volume-title":"Xing","author":"Chiang Wei-Lin","year":"2023","unstructured":"Wei-Lin Chiang, Zhuohan Li, Zi Lin, Ying Sheng, Zhanghao Wu, Hao Zhang, Lianmin Zheng, Siyuan Zhuang, Yonghao Zhuang, Joseph E. Gonzalez, Ion Stoica, and Eric P. Xing. 2023. Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality. https:\/\/lmsys.org\/blog\/2023-03--30-vicuna\/"},{"key":"e_1_3_2_2_7_1","volume-title":"Aleatory or epistemic? Does it matter? Structural safety","author":"Kiureghian Armen Der","year":"2009","unstructured":"Armen Der Kiureghian and Ove Ditlevsen. 2009. Aleatory or epistemic? Does it matter? Structural safety, Vol. 31, 2 (2009), 105--112."},{"key":"e_1_3_2_2_8_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2024.acl-long.276"},{"key":"e_1_3_2_2_9_1","unstructured":"Abhimanyu Dubey Abhinav Jauhri Abhinav Pandey Abhishek Kadian Ahmad Al-Dahle Aiesha Letman Akhil Mathur Alan Schelten Amy Yang Angela Fan et al. 2024. The llama 3 herd of models. arXiv preprint arXiv:2407.21783 (2024)."},{"key":"e_1_3_2_2_10_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICPR56361.2022.9956231"},{"key":"e_1_3_2_2_11_1","doi-asserted-by":"crossref","unstructured":"Ekaterina Fadeeva Roman Vashurin Akim Tsvigun Artem Vazhentsev Sergey Petrakov Kirill Fedyanin Daniil Vasilev Elizaveta Goncharova Alexander Panchenko Maxim Panov Timothy Baldwin and Artem Shelmanov. 2023. LM-Polygraph: Uncertainty Estimation for Language Models. arxiv: 2311.07383 [cs.CL] https:\/\/arxiv.org\/abs\/2311.07383","DOI":"10.18653\/v1\/2023.emnlp-demo.41"},{"key":"e_1_3_2_2_12_1","doi-asserted-by":"publisher","DOI":"10.1038\/s41586-024-07421-0"},{"key":"e_1_3_2_2_13_1","volume-title":"Unsupervised Quality Estimation for Neural Machine Translation. arxiv","author":"Fomicheva Marina","year":"2005","unstructured":"Marina Fomicheva, Shuo Sun, Lisa Yankovskaya, Fr\u00c3\u00a9d\u00c3\u00a9ric Blain, Francisco Guzm\u00c3\u00a1n, Mark Fishel, Nikolaos Aletras, Vishrav Chaudhary, and Lucia Specia. 2020. Unsupervised Quality Estimation for Neural Machine Translation. arxiv: 2005.10608 [cs.CL] https:\/\/arxiv.org\/abs\/2005.10608"},{"key":"e_1_3_2_2_14_1","volume-title":"SPUQ: Perturbation-Based Uncertainty Quantification for Large Language Models. In Proceedings of the 18th Conference of the European","author":"Gao Xiang","year":"2024","unstructured":"Xiang Gao, Jiaxin Zhang, Lalla Mouatadid, and Kamalika Das. 2024. SPUQ: Perturbation-Based Uncertainty Quantification for Large Language Models. In Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics (Volume 1: Long Papers), Yvette Graham and Matthew Purver (Eds.). Association for Computational Linguistics, St. Julian's, Malta, 2336--2346. https:\/\/aclanthology.org\/2024.eacl-long.143"},{"key":"e_1_3_2_2_15_1","doi-asserted-by":"publisher","DOI":"10.1007\/s10462-023-10562-9"},{"key":"e_1_3_2_2_16_1","doi-asserted-by":"publisher","DOI":"10.1016\/S0951-8320(96)00077-4"},{"key":"e_1_3_2_2_17_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2021.findings-emnlp.204"},{"key":"e_1_3_2_2_18_1","volume-title":"Aleatoric and epistemic uncertainty in machine learning: An introduction to concepts and methods. Machine learning","author":"H\u00fcllermeier Eyke","year":"2021","unstructured":"Eyke H\u00fcllermeier and Willem Waegeman. 2021. Aleatoric and epistemic uncertainty in machine learning: An introduction to concepts and methods. Machine learning, Vol. 110, 3 (2021), 457--506."},{"key":"e_1_3_2_2_19_1","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2022.3162081"},{"key":"e_1_3_2_2_20_1","unstructured":"Saurav Kadavath Tom Conerly Amanda Askell Tom Henighan Dawn Drain Ethan Perez Nicholas Schiefer Zac Hatfield-Dodds Nova DasSarma Eli Tran-Johnson Scott Johnston Sheer El-Showk Andy Jones Nelson Elhage Tristan Hume Anna Chen Yuntao Bai Sam Bowman Stanislav Fort Deep Ganguli Danny Hernandez Josh Jacobson Jackson Kernion Shauna Kravec Liane Lovitt Kamal Ndousse Catherine Olsson Sam Ringer Dario Amodei Tom Brown Jack Clark Nicholas Joseph Ben Mann Sam McCandlish Chris Olah and Jared Kaplan. 2022. Language Models (Mostly) Know What They Know. arxiv: 2207.05221 [cs.CL] https:\/\/arxiv.org\/abs\/2207.05221"},{"key":"e_1_3_2_2_21_1","volume-title":"Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907","author":"Kipf Thomas N","year":"2016","unstructured":"Thomas N Kipf and Max Welling. 2016. Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907 (2016)."},{"key":"e_1_3_2_2_22_1","volume-title":"Semantic uncertainty: Linguistic invariances for uncertainty estimation in natural language generation. arXiv preprint arXiv:2302.09664","author":"Kuhn Lorenz","year":"2023","unstructured":"Lorenz Kuhn, Yarin Gal, and Sebastian Farquhar. 2023a. Semantic uncertainty: Linguistic invariances for uncertainty estimation in natural language generation. arXiv preprint arXiv:2302.09664 (2023)."},{"key":"e_1_3_2_2_23_1","volume-title":"Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation. arxiv: 2302.09664 [cs.CL] https:\/\/arxiv.org\/abs\/2302.09664","author":"Kuhn Lorenz","year":"2023","unstructured":"Lorenz Kuhn, Yarin Gal, and Sebastian Farquhar. 2023b. Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation. arxiv: 2302.09664 [cs.CL] https:\/\/arxiv.org\/abs\/2302.09664"},{"key":"e_1_3_2_2_24_1","volume-title":"Generating with Confidence: Uncertainty Quantification for Black-box Large Language Models. Transactions on Machine Learning Research","author":"Lin Zhen","year":"2024","unstructured":"Zhen Lin, Shubhendu Trivedi, and Jimeng Sun. 2024. Generating with Confidence: Uncertainty Quantification for Black-box Large Language Models. Transactions on Machine Learning Research (2024). https:\/\/openreview.net\/forum?id=DWkJCSxKU5"},{"key":"e_1_3_2_2_25_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2024.naacl-long.184"},{"key":"e_1_3_2_2_26_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2024.emnlp-main.980"},{"key":"e_1_3_2_2_27_1","volume-title":"A simple baseline for bayesian uncertainty in deep learning. Advances in neural information processing systems","author":"Maddox Wesley J","year":"2019","unstructured":"Wesley J Maddox, Pavel Izmailov, Timur Garipov, Dmitry P Vetrov, and Andrew Gordon Wilson. 2019. A simple baseline for bayesian uncertainty in deep learning. Advances in neural information processing systems, Vol. 32 (2019)."},{"key":"e_1_3_2_2_28_1","volume-title":"Uncertainty Estimation in Autoregressive Structured Prediction. arxiv","author":"Malinin Andrey","year":"2002","unstructured":"Andrey Malinin and Mark Gales. 2021. Uncertainty Estimation in Autoregressive Structured Prediction. arxiv: 2002.07650 [stat.ML] https:\/\/arxiv.org\/abs\/2002.07650"},{"key":"e_1_3_2_2_29_1","volume-title":"Pang Wei Koh, Mohit Iyyer, Luke Zettlemoyer, and Hannaneh Hajishirzi.","author":"Min Sewon","year":"2023","unstructured":"Sewon Min, Kalpesh Krishna, Xinxi Lyu, Mike Lewis, Wen tau Yih, Pang Wei Koh, Mohit Iyyer, Luke Zettlemoyer, and Hannaneh Hajishirzi. 2023a. FActScore: Fine-grained Atomic Evaluation of Factual Precision in Long Form Text Generation. arxiv: 2305.14251 [cs.CL] https:\/\/arxiv.org\/abs\/2305.14251"},{"key":"e_1_3_2_2_30_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2023.emnlp-main.741"},{"key":"e_1_3_2_2_31_1","volume-title":"Correcting length bias in neural machine translation. arXiv preprint arXiv:1808.10006","author":"Murray Kenton","year":"2018","unstructured":"Kenton Murray and David Chiang. 2018. Correcting length bias in neural machine translation. arXiv preprint arXiv:1808.10006 (2018)."},{"key":"e_1_3_2_2_32_1","doi-asserted-by":"publisher","DOI":"10.1016\/j.ijmedinf.2025.105800"},{"key":"e_1_3_2_2_33_1","volume-title":"Proceedings of the 1st Workshop on NLP for Languages Using Arabic Script. 95--103","author":"Alharbi Abdulsalam","year":"2025","unstructured":"Abdulsalam obaid Alharbi, Abdullah Alsuhaibani, Abdulrahman Abdullah Alalawi, Usman Naseem, Shoaib Jameel, Salil Kanhere, and Imran Razzak. 2025. Evaluating Large Language Models on Health-Related Claims Across Arabic Dialects. In Proceedings of the 1st Workshop on NLP for Languages Using Arabic Script. 95--103."},{"key":"e_1_3_2_2_34_1","unstructured":"OpenAI. 2022. Introducing ChatGPT. https:\/\/openai.com\/index\/chatgpt\/"},{"key":"e_1_3_2_2_35_1","unstructured":"OpenAI. 2024. Hello GPT-4o. https:\/\/openai.com\/index\/hello-gpt-4o\/"},{"key":"e_1_3_2_2_36_1","doi-asserted-by":"publisher","DOI":"10.1109\/tkde.2024.3352100"},{"key":"e_1_3_2_2_37_1","volume-title":"Competing LLM Agents in a Non-Cooperative Game of Opinion Polarisation. arXiv preprint arXiv:2502.11649","author":"Qasmi Amin","year":"2025","unstructured":"Amin Qasmi, Usman Naseem, and Mehwish Nasim. 2025. Competing LLM Agents in a Non-Cooperative Game of Opinion Polarisation. arXiv preprint arXiv:2502.11649 (2025)."},{"key":"e_1_3_2_2_38_1","volume-title":"Hermina Petric Maretic, and Juba Nait Saada","author":"Sansford Hannah","year":"2024","unstructured":"Hannah Sansford, Nicholas Richardson, Hermina Petric Maretic, and Juba Nait Saada. 2024. GraphEval: A Knowledge-Graph Based LLM Hallucination Evaluation Framework. arxiv: 2407.10793 [cs.CL] https:\/\/arxiv.org\/abs\/2407.10793"},{"key":"e_1_3_2_2_39_1","volume-title":"International Conference on Machine Learning. PMLR, 33833--33849","author":"Tao Linwei","year":"2023","unstructured":"Linwei Tao, Minjing Dong, and Chang Xu. 2023. Dual focal loss for calibration. In International Conference on Machine Learning. PMLR, 33833--33849."},{"key":"e_1_3_2_2_40_1","volume-title":"Consistency Calibration: Improving Uncertainty Calibration via Consistency among Perturbed Neighbors. arXiv preprint arXiv:2410.12295","author":"Tao Linwei","year":"2024","unstructured":"Linwei Tao, Haolan Guo, Minjing Dong, and Chang Xu. 2024. Consistency Calibration: Improving Uncertainty Calibration via Consistency among Perturbed Neighbors. arXiv preprint arXiv:2410.12295 (2024)."},{"key":"e_1_3_2_2_41_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2023.findings-acl.93"},{"key":"e_1_3_2_2_42_1","volume-title":"LUQ: Long-text Uncertainty Quantification for LLMs. arXiv preprint arXiv:2403.20279","author":"Zhang Caiqi","year":"2024","unstructured":"Caiqi Zhang, Fangyu Liu, Marco Basaldella, and Nigel Collier. 2024a. LUQ: Long-text Uncertainty Quantification for LLMs. arXiv preprint arXiv:2403.20279 (2024)."},{"key":"e_1_3_2_2_43_1","volume-title":"LUQ: Long-text Uncertainty Quantification for LLMs. arxiv: 2403.20279 [cs.CL] https:\/\/arxiv.org\/abs\/2403.20279","author":"Zhang Caiqi","year":"2024","unstructured":"Caiqi Zhang, Fangyu Liu, Marco Basaldella, and Nigel Collier. 2024b. LUQ: Long-text Uncertainty Quantification for LLMs. arxiv: 2403.20279 [cs.CL] https:\/\/arxiv.org\/abs\/2403.20279"},{"key":"e_1_3_2_2_44_1","volume-title":"Proceedings of the 31st International Conference on Computational Linguistics: System Demonstrations. 54--62","author":"Zhang Zhihao","year":"2025","unstructured":"Zhihao Zhang, Carrie-Ann Wilson, Rachel Hay, Yvette Everingham, and Usman Naseem. 2025. BeefBot: Harnessing Advanced LLM and RAG Techniques for Providing Scientific and Technology Solutions to Beef Producers. In Proceedings of the 31st International Conference on Computational Linguistics: System Demonstrations. 54--62."},{"key":"e_1_3_2_2_45_1","unstructured":"Wayne Xin Zhao Kun Zhou Junyi Li Tianyi Tang Xiaolei Wang Yupeng Hou Yingqian Min Beichen Zhang Junjie Zhang Zican Dong Yifan Du Chen Yang Yushuo Chen Zhipeng Chen Jinhao Jiang Ruiyang Ren Yifan Li Xinyu Tang Zikang Liu Peiyu Liu Jian-Yun Nie and Ji-Rong Wen. 2024. A Survey of Large Language Models. arxiv: 2303.18223 [cs.CL] https:\/\/arxiv.org\/abs\/2303.18223"},{"key":"e_1_3_2_2_46_1","volume-title":"Mitigating Object Hallucinations in Large Vision-Language Models via Attention Calibration. arXiv preprint arXiv:2502.01969","author":"Zhu Younan","year":"2025","unstructured":"Younan Zhu, Linwei Tao, Minjing Dong, and Chang Xu. 2025. Mitigating Object Hallucinations in Large Vision-Language Models via Attention Calibration. arXiv preprint arXiv:2502.01969 (2025)."}],"event":{"name":"WWW '25: The ACM Web Conference 2025","sponsor":["SIGWEB ACM Special Interest Group on Hypertext, Hypermedia, and Web"],"location":"Sydney NSW Australia","acronym":"WWW '25"},"container-title":["Companion Proceedings of the ACM on Web Conference 2025"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3701716.3717660","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3701716.3717660","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,10,8]],"date-time":"2025-10-08T03:00:02Z","timestamp":1759892402000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3701716.3717660"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,5,8]]},"references-count":46,"alternative-id":["10.1145\/3701716.3717660","10.1145\/3701716"],"URL":"https:\/\/doi.org\/10.1145\/3701716.3717660","relation":{},"subject":[],"published":{"date-parts":[[2025,5,8]]},"assertion":[{"value":"2025-05-23","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}