{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,8]],"date-time":"2026-03-08T01:54:42Z","timestamp":1772934882036,"version":"3.50.1"},"reference-count":58,"publisher":"IEEE","license":[{"start":{"date-parts":[[2025,12,8]],"date-time":"2025-12-08T00:00:00Z","timestamp":1765152000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,12,8]],"date-time":"2025-12-08T00:00:00Z","timestamp":1765152000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025,12,8]]},"DOI":"10.1109\/bigdata66926.2025.11401978","type":"proceedings-article","created":{"date-parts":[[2026,3,6]],"date-time":"2026-03-06T20:57:57Z","timestamp":1772830677000},"page":"638-646","source":"Crossref","is-referenced-by-count":0,"title":["Multi-Identifier Leveraging Text-Visual Construction for Multimodal Generative Recommendation"],"prefix":"10.1109","author":[{"given":"Zizhong","family":"Zhu","sequence":"first","affiliation":[{"name":"School of New Media and Communication, Tianjin University,Tianjin,China"}]},{"given":"Xiaowang","family":"Zhang","sequence":"additional","affiliation":[{"name":"School of Computer Software, Tianjin University,Tianjin,China"}]},{"given":"Zhiyong","family":"Feng","sequence":"additional","affiliation":[{"name":"School of Computer Software, Tianjin University,Tianjin,China"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1145\/3626772.3657762"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ICDE55515.2023.00226"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2020\/418"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1145\/3485447.3512116"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1145\/3533725"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/ICDM.2016.0030"},{"key":"ref7","article-title":"Session-based recommendations with recurrent neural networks","volume-title":"4th International Conference on Learning Representations","author":"Hidasi"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1145\/3159652.3159656"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1145\/3503161.3548072"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1145\/3357384.3357895"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/ICDM.2018.00035"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1145\/3340531.3411954"},{"key":"ref13","article-title":"A survey of large language models[J]","volume":"abs\/2303.18223","author":"Zhao","year":"2023","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.52202\/075280-2010"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.52202\/068431-1587"},{"key":"ref16","article-title":"Beyond unimodal boundaries: Generative recommendation with multimodal semantics[J]","volume":"abs\/2503.23333","author":"Zhu","year":"2025","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1145\/3626772.3657690"},{"key":"ref18","article-title":"Genrec: Generative personalized sequential recommendation[J]","volume":"abs\/2407.21191","author":"Cao","year":"2024","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref19","article-title":"Image is all you need: Towards efficient and effective large language model-based recommender systems[J]","volume":"abs\/2503.06238","author":"Kim","year":"2025","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref20","first-page":"140:1","article-title":"Exploring the limits of transfer learning with a unified text-to-text transformer[J]","volume":"21","author":"Raffel","year":"2020","journal-title":"Journal of Machine Learning Research"},{"key":"ref21","article-title":"Language models are few-shot learners","volume-title":"Advances in Neural Information Processing Systems 33","author":"Brown"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1145\/3543507.3583434"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1145\/3109859.3109877"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/TKDE.2020.3007194"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1016\/j.engappai.2024.109471"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2019\/600"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1145\/3485447.3512111"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v38i5.28270"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1145\/3539618.3591663"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.52202\/075280-1054"},{"key":"ref31","article-title":"A survey of foundation model-powered recommender systems: From feature-based, generative to agentic paradigms[J]","volume":"abs\/2504.16420","author":"Huang","year":"2025","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1145\/3604915.3608857"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1145\/3523227.3546767"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1145\/3604915.3610639"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1145\/3624918.3625339"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1145\/3626772.3657821"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.52202\/075280-0452"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2021.3129994"},{"key":"ref39","doi-asserted-by":"publisher","DOI":"10.1145\/3627673.3679569"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1109\/ICDE60146.2024.00118"},{"key":"ref41","article-title":"Pre-training generative recommender with multi-identifier item tokenization","volume":"abs\/2504.04400","author":"Zheng","year":"2025","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref42","article-title":"ActionPiece: Contextually tokenizing action sequences for generative recommendation","volume-title":"Forty-second International Conference on Machine Learning","author":"Hou"},{"key":"ref43","article-title":"A survey on multimodal recommender systems: Recent advances and future directions","volume":"abs\/2502.15711","author":"Xu","year":"2025","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref44","doi-asserted-by":"publisher","DOI":"10.1145\/3477495.3531896"},{"key":"ref45","doi-asserted-by":"publisher","DOI":"10.1145\/3534678.3539381"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1145\/3583780.3614978"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1007\/978-981-97-5555-4_12"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2024.findings-emnlp.786"},{"key":"ref49","article-title":"Molar: Multimodal LLMs with collaborative filtering alignment for enhanced sequential recommendation","volume":"abs\/2412.18176","author":"Luo","year":"2024","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref50","article-title":"Multimodal quantitative language for generative recommendation","volume-title":"The Thirteenth International Conference on Learning Representations","author":"Zhai"},{"key":"ref51","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2010.57"},{"key":"ref52","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2013.240"},{"key":"ref53","article-title":"Differential transformer","volume-title":"The Thirteenth International Conference on Learning Representations","author":"Ye"},{"key":"ref54","article-title":"Better & faster large language models via multi-token prediction","volume-title":"Forty-first International Conference on Machine Learning","author":"Gloeckle"},{"key":"ref55","doi-asserted-by":"publisher","DOI":"10.1145\/3292500.3330984"},{"key":"ref56","article-title":"Actions speak louder than words: Trillionparameter sequential transducers for generative recommendations","volume-title":"Forty-first International Conference on Machine Learning","author":"Zhai"},{"key":"ref57","article-title":"Multi-modal hypergraph enhanced LLM learning for recommendation","volume":"abs\/2504.10541","author":"Guo","year":"2025","journal-title":"Computing Research Repository (CoRR)"},{"key":"ref58","article-title":"Decoupled weight decay regularization","volume-title":"7th International Conference on Learning Representations","author":"Loshchilov"}],"event":{"name":"2025 IEEE International Conference on Big Data (BigData)","location":"Macau, China","start":{"date-parts":[[2025,12,8]]},"end":{"date-parts":[[2025,12,11]]}},"container-title":["2025 IEEE International Conference on Big Data (BigData)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/11400704\/11400712\/11401978.pdf?arnumber=11401978","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,3,7]],"date-time":"2026-03-07T07:19:21Z","timestamp":1772867961000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11401978\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,12,8]]},"references-count":58,"URL":"https:\/\/doi.org\/10.1109\/bigdata66926.2025.11401978","relation":{},"subject":[],"published":{"date-parts":[[2025,12,8]]}}}