{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,6,8]],"date-time":"2025-06-08T04:02:35Z","timestamp":1749355355529,"version":"3.41.0"},"publisher-location":"Stroudsburg, PA, USA","reference-count":0,"publisher":"Association for Computational Linguistics","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025]]},"DOI":"10.18653\/v1\/2025.findings-naacl.254","type":"proceedings-article","created":{"date-parts":[[2025,6,7]],"date-time":"2025-06-07T12:33:56Z","timestamp":1749299636000},"page":"4506-4520","source":"Crossref","is-referenced-by-count":0,"title":["Improving Reward Models with Synthetic Critiques"],"prefix":"10.18653","author":[{"given":"Zihuiwen","family":"Ye","sequence":"first","affiliation":[]},{"given":"Fraser David","family":"Greenlee","sequence":"additional","affiliation":[]},{"given":"Max","family":"Bartolo","sequence":"additional","affiliation":[]},{"given":"Phil","family":"Blunsom","sequence":"additional","affiliation":[]},{"given":"Jon Ander","family":"Campos","sequence":"additional","affiliation":[]},{"given":"Matthias","family":"Gall\u00e9","sequence":"additional","affiliation":[]}],"member":"1643","event":{"name":"Findings of the Association for Computational Linguistics: NAACL 2025","location":"Albuquerque, New Mexico","start":{"date-parts":[[2025,4]]},"end":{"date-parts":[[2025,4]]}},"container-title":["Findings of the Association for Computational Linguistics: NAACL 2025"],"original-title":[],"deposited":{"date-parts":[[2025,6,7]],"date-time":"2025-06-07T12:37:10Z","timestamp":1749299830000},"score":1,"resource":{"primary":{"URL":"https:\/\/aclanthology.org\/2025.findings-naacl.254"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025]]},"references-count":0,"URL":"https:\/\/doi.org\/10.18653\/v1\/2025.findings-naacl.254","relation":{},"subject":[],"published":{"date-parts":[[2025]]}}}