{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,4]],"date-time":"2026-05-04T03:32:09Z","timestamp":1777865529582,"version":"3.51.4"},"reference-count":54,"publisher":"IEEE","license":[{"start":{"date-parts":[[2025,10,19]],"date-time":"2025-10-19T00:00:00Z","timestamp":1760832000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,10,19]],"date-time":"2025-10-19T00:00:00Z","timestamp":1760832000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025,10,19]]},"DOI":"10.1109\/iccv51701.2025.00161","type":"proceedings-article","created":{"date-parts":[[2026,4,29]],"date-time":"2026-04-29T19:45:49Z","timestamp":1777491949000},"page":"1644-1654","source":"Crossref","is-referenced-by-count":0,"title":["GRAB: A Challenging Graph Analysis Benchmark for Large Multimodal Models"],"prefix":"10.1109","author":[{"given":"Jonathan","family":"Roberts","sequence":"first","affiliation":[{"name":"University of Cambridge"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Kai","family":"Han","sequence":"additional","affiliation":[{"name":"The University of Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Samuel","family":"Albanie","sequence":"additional","affiliation":[{"name":"University of Cambridge"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","volume-title":"Yi","year":"2023"},{"key":"ref2","volume-title":"Reka AI API","author":"AI","year":"2024"},{"key":"ref3","volume-title":"Introducing the next generation of Claude","year":"2024"},{"key":"ref4","article-title":"Anthropic","volume-title":"Claude 3.5 Sonnet","year":"2024"},{"key":"ref5","article-title":"Anthropic","volume-title":"Claude 3.7 Sonnet System Card","year":"2025"},{"key":"ref6","article-title":"Qwen-VL: A frontier large vision-language model with versatile abilities","author":"Bai","year":"2023","journal-title":"arXiv preprint"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/WACV45572.2020.9093269"},{"key":"ref8","article-title":"Figure captioning with reasoning and sequence-level training","author":"Chen","journal-title":"arXiv preprint"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.52202\/079017-0850"},{"key":"ref10","article-title":"Mme: A comprehensive evaluation benchmark for multimodal large language models","author":"Fu","year":"2023","journal-title":"arXiv preprint"},{"key":"ref11","article-title":"Gemini: a family of highly capable multimodal models","author":"Team","year":"2023","journal-title":"arXiv preprint"},{"key":"ref12","volume-title":"Vertex AI","year":"2024"},{"key":"ref13","article-title":"Gemini 2.0 Flash Model Card","year":"2025"},{"key":"ref14","article-title":"Gemini 2.5 Flash Model Card","year":"2025"},{"key":"ref15","first-page":"arXiv","article-title":"HALLUSIONBENCH: An Advanced Diagnostic Suite for Entangled Language Hallucination & Visual Illusion in Large VisionLanguage Models","author":"Guan","year":"2023","journal-title":"arXiv e-prints"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/MCSE.2007.55"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00592"},{"key":"ref18","article-title":"Figureqa: An annotated figure dataset for visual reasoning","author":"Ebrahimi Kahou","year":"2017","journal-title":"arXiv preprint"},{"key":"ref19","article-title":"SEED- Bench: Benchmarking multimodal LLMs with generative comprehension","author":"Li","year":"2023","journal-title":"arXiv preprint"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.01263"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.02484"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-72658-3_13"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1007\/s11432-024-4235-6"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.52202\/068431-0182"},{"key":"ref25","article-title":"Mathvista: Evaluating mathemati-cal reasoning of foundation models in visual contexts","author":"Lu","year":"2023","journal-title":"arXiv preprint"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2022.findings-acl.177"},{"key":"ref27","article-title":"Meta-Llama-3.1\u20138B-Instruct","volume-title":"Meta","year":"2024"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1109\/WACV45572.2020.9093523"},{"key":"ref29","article-title":"Pervasive label errors in test sets destabilize machine learning benchmarks","author":"Northcutt","year":"2021","journal-title":"arXiv preprint"},{"key":"ref30","volume-title":"GPT-4V(ision) System Card","year":"2023"},{"key":"ref31","article-title":"OpenAI","volume-title":"Hello GPT-4o","year":"2024"},{"key":"ref32","volume-title":"GPT-4o mini: advancing cost-efficient intelligence","year":"2024"},{"key":"ref33","article-title":"Learning to reason with LLMs","year":"2024"},{"key":"ref34","article-title":"OpenAI","volume-title":"OpenAI o1: A Large Language Model for Complex Reasoning. OpenAI website","year":"2024"},{"key":"ref35","volume-title":"API Reference","year":"2024"},{"key":"ref36","article-title":"OpenAI","volume-title":"simple-evals","year":"2024"},{"key":"ref37","volume-title":"OmniLMM","year":"2024"},{"key":"ref38","volume-title":"OpenCompass: A Universal Evaluation Platform for Foundation Models","author":"Contributors","year":"2023"},{"key":"ref39","article-title":"Reka Core, Flash, and Edge: A Series of Powerful Multimodal Language Models","author":"Ormazabal","year":"2024","journal-title":"arXiv preprint"},{"key":"ref40","article-title":"Vibe-Eval: A hard evaluation suite for measuring progress of multimodal language models","author":"Padlewski","year":"2024","journal-title":"arXiv preprint"},{"key":"ref41","article-title":"PCIResearch","volume-title":"TransCore-M","year":"2023"},{"key":"ref42","article-title":"Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context","author":"Reid","year":"2024","journal-title":"arXiv preprint"},{"key":"ref43","article-title":"SATIN: A multi-task metadataset for classifying satellite imagery using vision-language models","author":"Roberts","year":"2023","journal-title":"arXiv preprint"},{"key":"ref44","article-title":"Charting New Territories: Exploring the geographic and geospatial capabilities of multimodal LLMs","author":"Roberts","year":"2023","journal-title":"arXiv preprint"},{"key":"ref45","article-title":"SciFIBench: Benchmarking Large Multimodal Models for Scientific Figure Interpretation","author":"Roberts","year":"2024","journal-title":"arXiv preprint"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-46478-7_41"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.emnlp-main.264"},{"key":"ref48","article-title":"CogVLM: Visual Expert for Pretrained Language Models","author":"Wang","year":"2023","journal-title":"arXiv preprint"},{"key":"ref49","doi-asserted-by":"publisher","DOI":"10.21105\/joss.03021"},{"key":"ref50","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.emnlp-demos.6"},{"key":"ref51","doi-asserted-by":"publisher","DOI":"10.1109\/tpami.2024.3507000"},{"key":"ref52","article-title":"Chartbench: A benchmark for complex visual reasoning in charts","author":"Xu","year":"2023","journal-title":"arXiv preprint"},{"key":"ref53","article-title":"Mm-vet: Evaluating large multimodal models for integrated capabilities","author":"Yu","year":"2023","journal-title":"arXiv preprint"},{"key":"ref54","doi-asserted-by":"publisher","DOI":"10.1109\/cvpr52733.2024.00913"}],"event":{"name":"2025 IEEE\/CVF International Conference on Computer Vision (ICCV)","location":"Honolulu, HI, USA","start":{"date-parts":[[2025,10,19]]},"end":{"date-parts":[[2025,10,25]]}},"container-title":["2025 IEEE\/CVF International Conference on Computer Vision (ICCV)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/11443115\/11443287\/11444813.pdf?arnumber=11444813","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,4,30]],"date-time":"2026-04-30T06:46:32Z","timestamp":1777531592000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11444813\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,10,19]]},"references-count":54,"URL":"https:\/\/doi.org\/10.1109\/iccv51701.2025.00161","relation":{},"subject":[],"published":{"date-parts":[[2025,10,19]]}}}