{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T15:57:35Z","timestamp":1781539055186,"version":"3.54.5"},"publisher-location":"New York, NY, USA","reference-count":27,"publisher":"ACM","license":[{"start":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T00:00:00Z","timestamp":1781481600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/legalcode"}],"funder":[{"name":"Ningbo Youth Science and Technology Innovation Leading Talent Project","award":["2024QL044"],"award-info":[{"award-number":["2024QL044"]}]},{"name":"Ningbo Key R&D Program","award":["2025Z047"],"award-info":[{"award-number":["2025Z047"]}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2026,6,16]]},"DOI":"10.1145\/3805622.3810627","type":"proceedings-article","created":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T14:42:57Z","timestamp":1781534577000},"page":"215-222","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":0,"title":["DyCa-GRPO:Calibrated and Efficient Learning-to-Rank for Multimodal Retrieval with Human Feedback"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0009-0006-4277-6511","authenticated-orcid":false,"given":"Ning","family":"Han","sequence":"first","affiliation":[{"name":"School of Software Technology, Zhejiang University, Ningbo, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-4749-5552","authenticated-orcid":false,"given":"Xiubo","family":"Liang","sequence":"additional","affiliation":[{"name":"School of Software Technology, Zhejiang University, Ningbo, China"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"320","published-online":{"date-parts":[[2026,6,15]]},"reference":[{"key":"e_1_3_3_1_2_2","volume-title":"ICLR","author":"Cui L.","year":"2023","unstructured":"L. Cui et\u00a0al. 2023. Robust Preference Optimization under Noisy Feedback. In ICLR."},{"key":"e_1_3_3_1_3_2","unstructured":"A. Frome G.\u00a0S. Corrado J. Shlens S. Bengio and T. Mikolov. 2013. DeViSE: A Deep Visual-Semantic Embedding Model. Curran Associates Inc. (2013)."},{"key":"e_1_3_3_1_4_2","volume-title":"ICML","author":"Guo Chuan","year":"2017","unstructured":"Chuan Guo, Geoff Pleiss, Yu Sun, and Kilian\u00a0Q Weinberger. 2017. On calibration of modern neural networks. In ICML."},{"key":"e_1_3_3_1_5_2","doi-asserted-by":"publisher","unstructured":"Daya Guo Dejian Yang Haowei Zhang Junxiao Song Peiyi Wang Qihao Zhu Runxin Xu Ruoyu Zhang Shirong Ma Xiao Bi Xiaokang Zhang et\u00a0al. 2025. DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning. Nature 645 8081 (Sept. 2025) 633\u2013638. 10.1038\/s41586-025-09422-z","DOI":"10.1038\/s41586-025-09422-z"},{"key":"e_1_3_3_1_6_2","doi-asserted-by":"crossref","unstructured":"Raia Hadsell Sumit Chopra and Yann LeCun. 2006. Dimensionality Reduction by Learning an Invariant Mapping. 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR\u201906) 2 (2006) 1735\u20131742. https:\/\/api.semanticscholar.org\/CorpusID:8281592","DOI":"10.1109\/CVPR.2006.100"},{"key":"e_1_3_3_1_7_2","volume-title":"Advances in Neural Information Processing Systems","author":"Han Bo","year":"2018","unstructured":"Bo Han, Quanming Yao, Xingrui Yu, Gang Niu, Miao Xu, Weihua Hu, Ivor Tsang, and Masashi Sugiyama. 2018. Co-teaching: Robust training of deep neural networks with extremely noisy labels. In Advances in Neural Information Processing Systems , S.\u00a0Bengio, H.\u00a0Wallach, H.\u00a0Larochelle, K.\u00a0Grauman, N.\u00a0Cesa-Bianchi, and R.\u00a0Garnett (Eds.), Vol.\u00a031. Curran Associates, Inc.https:\/\/proceedings.neurips.cc\/paper_files\/paper\/2018\/file\/a19744e268754fb0148b017647355b7b-Paper.pdf"},{"key":"e_1_3_3_1_8_2","unstructured":"Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu Pham Quoc\u00a0V. Le Yunhsuan Sung Zhen Li and Tom Duerig. 2021. Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision. arxiv:https:\/\/arXiv.org\/abs\/2102.05918\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2102.05918"},{"key":"e_1_3_3_1_9_2","unstructured":"Andrej Karpathy and Li Fei-Fei. 2015. Deep Visual-Semantic Alignments for Generating Image Descriptions. arxiv:https:\/\/arXiv.org\/abs\/1412.2306\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/1412.2306"},{"key":"e_1_3_3_1_10_2","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.emnlp-main.550"},{"key":"e_1_3_3_1_11_2","unstructured":"Nathan Lambert Jacob Morrison Valentina Pyatkin Shengyi Huang Hamish Ivison Faeze Brahman Lester James\u00a0V. Miranda Alisa Liu Nouha Dziri Shane Lyu et\u00a0al. 2025. Tulu 3: Pushing Frontiers in Open Language Model Post-Training. arxiv:https:\/\/arXiv.org\/abs\/2411.15124\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2411.15124"},{"key":"e_1_3_3_1_12_2","unstructured":"Wen Li et\u00a0al. 2017. WebVision Database: Visual Learning and Understanding from Web Data. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/1708.02862 (2017)."},{"key":"e_1_3_3_1_13_2","doi-asserted-by":"crossref","unstructured":"Zheng Lian Haiyang Sun Licai Sun Zhuofan Wen Siyuan Zhang Shun Chen Hao Gu Jinming Zhao Ziyang Ma Xie Chen Jiangyan Yi Rui Liu Kele Xu Bin Liu Erik Cambria Guoying Zhao Bj\u00f6rn\u00a0W. Schuller and Jianhua Tao. 2024. MER 2024: Semi-Supervised Learning Noise Robustness and Open-Vocabulary Multimodal Emotion Recognition. arXiv:arXiv:2404.17113","DOI":"10.1145\/3689092.3689959"},{"key":"e_1_3_3_1_14_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-10602-1_48"},{"key":"e_1_3_3_1_15_2","doi-asserted-by":"publisher","DOI":"10.1145\/3583780.3615228"},{"key":"e_1_3_3_1_16_2","doi-asserted-by":"crossref","unstructured":"Mahdi\u00a0Pakdaman Naeini Gregory\u00a0F Cooper and Milos Hauskrecht. 2015. Obtaining Well Calibrated Probabilities Using Bayesian Binning. Proceedings of the AAAI Conference on Artificial Intelligence 2015 (2015) 2901\u20132907.","DOI":"10.1609\/aaai.v29i1.9602"},{"key":"e_1_3_3_1_17_2","unstructured":"OpenAI : Aaron Jaech Adam Kalai Adam Lerer Adam Richardson Ahmed El-Kishky Aiden Low et\u00a0al. 2024. OpenAI o1 System Card. arxiv:https:\/\/arXiv.org\/abs\/2412.16720\u00a0[cs.AI] https:\/\/arxiv.org\/abs\/2412.16720"},{"key":"e_1_3_3_1_18_2","unstructured":"Giorgio Patrini Alessandro Rozza Aditya Menon Richard Nock and Lizhen Qu. 2017. Making Deep Neural Networks Robust to Label Noise: a Loss Correction Approach. arxiv:https:\/\/arXiv.org\/abs\/1609.03683\u00a0[stat.ML] https:\/\/arxiv.org\/abs\/1609.03683"},{"key":"e_1_3_3_1_19_2","unstructured":"Alec Radford Jong\u00a0Wook Kim Chris Hallacy Aditya Ramesh Gabriel Goh Sandhini Agarwal Girish Sastry Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger and Ilya Sutskever. 2021. Learning Transferable Visual Models From Natural Language Supervision. arxiv:https:\/\/arXiv.org\/abs\/2103.00020\u00a0[cs.CV] https:\/\/arxiv.org\/abs\/2103.00020"},{"key":"e_1_3_3_1_20_2","volume-title":"NeurIPS","author":"Rafailov Rafael","year":"2023","unstructured":"Rafael Rafailov, Archit Sharma, Eric Mitchell, Stefano Ermon, Christopher\u00a0D Manning, and Chelsea Finn. 2023. Direct Preference Optimization: Your Language Model is Secretly a Reward Model. In NeurIPS."},{"key":"e_1_3_3_1_21_2","unstructured":"Mengye Ren Wenyuan Zeng Bin Yang and Raquel Urtasun. 2018. Learning to Reweight Examples for Robust Deep Learning. (2018)."},{"key":"e_1_3_3_1_22_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2015.7298682"},{"key":"e_1_3_3_1_23_2","unstructured":"John Schulman Filip Wolski Prafulla Dhariwal Alec Radford and Oleg Klimov. 2017. Proximal Policy Optimization Algorithms. arxiv:https:\/\/arXiv.org\/abs\/1707.06347\u00a0[cs.LG] https:\/\/arxiv.org\/abs\/1707.06347"},{"key":"e_1_3_3_1_24_2","unstructured":"Burr Settles. 2009. Active Learning Literature Survey. University of Wisconsinmadison (2009)."},{"key":"e_1_3_3_1_25_2","unstructured":"Zhihong Shao Peiyi Wang Qihao Zhu Runxin Xu Junxiao Song Xiao Bi Haowei Zhang Mingchuan Zhang Y.\u00a0K. Li Y. Wu and Daya Guo. 2024. DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models. arxiv:https:\/\/arXiv.org\/abs\/2402.03300\u00a0[cs.CL] https:\/\/arxiv.org\/abs\/2402.03300"},{"key":"e_1_3_3_1_26_2","unstructured":"Jun Wang Meng Fang Ziyu Wan Muning Wen Jiachen Zhu Anjie Liu Ziqin Gong Yan Song Lei Chen Lionel\u00a0M. Ni Linyi Yang Ying Wen and Weinan Zhang. 2024. OpenR: An Open Source Framework for Advanced Reasoning with Large Language Models. arxiv:https:\/\/arXiv.org\/abs\/2410.09671\u00a0[cs.AI] https:\/\/arxiv.org\/abs\/2410.09671"},{"key":"e_1_3_3_1_27_2","unstructured":"Jianhao Yan Yafu Li Zican Hu Zhi Wang Ganqu Cui Xiaoye Qu Yu Cheng and Yue Zhang. 2025. Learning to Reason under Off-Policy Guidance. arxiv:https:\/\/arXiv.org\/abs\/2504.14945\u00a0[cs.LG] https:\/\/arxiv.org\/abs\/2504.14945"},{"key":"e_1_3_3_1_28_2","volume-title":"SIGIR","author":"Zhang Wei","year":"2022","unstructured":"Wei Zhang et\u00a0al. 2022. Calibrated Rankers for Web Search. In SIGIR."}],"event":{"name":"ICMR '26: International Conference on Multimedia Retrieval","location":"Amsterdam The Netherlands","acronym":"ICMR '26","sponsor":["SIGMM ACM Special Interest Group on Multimedia"]},"container-title":["Proceedings of the 2026 International Conference on Multimedia Retrieval"],"original-title":[],"deposited":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T15:40:40Z","timestamp":1781538040000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3805622.3810627"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,6,15]]},"references-count":27,"alternative-id":["10.1145\/3805622.3810627","10.1145\/3805622"],"URL":"https:\/\/doi.org\/10.1145\/3805622.3810627","relation":{},"subject":[],"published":{"date-parts":[[2026,6,15]]},"assertion":[{"value":"2026-06-15","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}