{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,22]],"date-time":"2025-12-22T21:00:01Z","timestamp":1766437201515,"version":"3.48.0"},"reference-count":63,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2025,1,1]],"date-time":"2025-01-01T00:00:00Z","timestamp":1735689600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/legalcode"}],"funder":[{"DOI":"10.13039\/501100003410","name":"Department of Education, Fujian Province, China","doi-asserted-by":"publisher","award":["FBJG20210123"],"award-info":[{"award-number":["FBJG20210123"]}],"id":[{"id":"10.13039\/501100003410","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100003410","name":"Department of Education, Fujian Province, China","doi-asserted-by":"publisher","award":["JAT231173"],"award-info":[{"award-number":["JAT231173"]}],"id":[{"id":"10.13039\/501100003410","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Access"],"published-print":{"date-parts":[[2025]]},"DOI":"10.1109\/access.2025.3637590","type":"journal-article","created":{"date-parts":[[2025,11,26]],"date-time":"2025-11-26T19:05:14Z","timestamp":1764183914000},"page":"207348-207366","source":"Crossref","is-referenced-by-count":0,"title":["A Multimodal Feature Fusion Model for User Interest Prediction in Social Networks"],"prefix":"10.1109","volume":"13","author":[{"ORCID":"https:\/\/orcid.org\/0009-0006-0315-1666","authenticated-orcid":false,"given":"Wenbo","family":"Wu","sequence":"first","affiliation":[{"name":"Faculty of Computing, Universiti Teknologi Malaysia, Johor Bahru, Malaysia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-5720-175X","authenticated-orcid":false,"given":"Masitah","family":"Ghazali","sequence":"additional","affiliation":[{"name":"Faculty of Computing, Universiti Teknologi Malaysia, Johor Bahru, Malaysia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-7591-7249","authenticated-orcid":false,"given":"Sharin Hazlin","family":"Huspi","sequence":"additional","affiliation":[{"name":"Faculty of Computing, Universiti Teknologi Malaysia, Johor Bahru, Malaysia"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/access.2024.3430987"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v37i8.26138"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v38i8.28677"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1007\/s13278-024-01296-9"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v38i2.27835"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/cvpr42600.2020.01469"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1109\/tcss.2023.3275428"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/access.2023.3322162"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1145\/3591106.3592246"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-023-17181-0"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/tcss.2023.3267766"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.3390\/app10175957"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-94822-1_55"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1007\/s11760-022-02259-3"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/cvpr46437.2021.00422"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.5755\/j01.itc.52.4.34079"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/tkde.2019.2913394"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.5220\/0010986100003122"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1089\/cyber.2018.0670"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1007\/s10791-018-9338-x"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1108\/ijwis-12-2016-0069"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1016\/j.fss.2020.05.006"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1007\/s10844-018-0534-3"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/icedeg.2019.8734365"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.53106\/160792642022112306019"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.5539\/ass.v20n2p35"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/access.2021.3059312"},{"key":"ref28","article-title":"BERT: Pre-training of deep bidirectional transformers for language understanding","author":"Devlin","year":"2018","journal-title":"arXiv:1810.04805"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1016\/j.knosys.2021.108024"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-021-11780-5"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/i2ct51068.2021.9418126"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1145\/3366423.3380052"},{"issue":"1","key":"ref33","first-page":"1","article-title":"A comprehensive review of deep learning architectures for computer vision applications","volume":"77","author":"Sarraf","year":"2021","journal-title":"Am. Sci. Res. J. Eng. Technol. Sci."},{"key":"ref34","article-title":"Very deep convolutional networks for large-scale image recognition","author":"Simonyan","year":"2014","journal-title":"arXiv:1409.1556"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1016\/j.asoc.2023.110035"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.3390\/rs16020259"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/cvpr.2016.90"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.3390\/electronics14010075"},{"key":"ref39","doi-asserted-by":"publisher","DOI":"10.1371\/journal.pone.0317999"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1109\/cvpr.2017.243"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.3390\/app12094232"},{"key":"ref42","doi-asserted-by":"publisher","DOI":"10.1038\/s41598-024-58421-z"},{"key":"ref43","doi-asserted-by":"publisher","DOI":"10.1016\/j.sigpro.2015.10.032"},{"key":"ref44","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-58808-3_9"},{"key":"ref45","doi-asserted-by":"publisher","DOI":"10.5120\/ijca2018917395"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1007\/s00607-019-00768-7"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1088\/1742-6596\/2171\/1\/012021"},{"key":"ref48","article-title":"DistilBERT, a distilled version of BERT: Smaller, faster, cheaper and lighter","author":"Sanh","year":"2019","journal-title":"arXiv:1910.01108"},{"key":"ref49","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-022-13685-3"},{"key":"ref50","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/d16-1044"},{"key":"ref51","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2021.semeval-1.145"},{"key":"ref52","article-title":"How to find a good image-text embedding for remote sensing visual question answering?","author":"Chappuis","year":"2021","journal-title":"arXiv:2109.11848"},{"key":"ref53","doi-asserted-by":"publisher","DOI":"10.1109\/tnnls.2018.2817340"},{"key":"ref54","first-page":"1736","article-title":"BIT mesra at ImageCLEF 2023: Fusion of blended image and text features for medical VQA","volume-title":"Proc. CLEF Conf. Labs Eval. Forum","author":"Upadhyay"},{"key":"ref55","article-title":"ViLBERT: Pretraining taskagnostic visiolinguistic representations for vision-and-language tasks","author":"Lu","year":"2019","journal-title":"arXiv:1908.02265"},{"key":"ref56","article-title":"Visual-BERT: A simple and performant baseline for vision and language","author":"Li","year":"2019","journal-title":"arXiv:1908.03557"},{"key":"ref57","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/d19-1514"},{"key":"ref58","article-title":"Supervised multimodal bitransformers for classifying images and text","author":"Kiela","year":"2019","journal-title":"arXiv:1909.02950"},{"key":"ref59","first-page":"8748","article-title":"Learning transferable visual models from natural language supervision","volume-title":"Proc. Int. Conf. Mach. Learn.","author":"Radford"},{"key":"ref60","first-page":"12888","article-title":"BLIP: Bootstrapping languageimage pre-training for unified vision-language understanding and generation","volume-title":"Proc. Int. Conf. Mach. Learn.","author":"Li"},{"key":"ref61","first-page":"23716","article-title":"Flamingo: A visual language model for fewshot learning","volume-title":"Proc. Adv. Neural Inf. Process. Syst.","volume":"35","author":"Alayrac"},{"key":"ref62","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-023-14806-2"},{"key":"ref63","doi-asserted-by":"publisher","DOI":"10.7812\/tpp\/18.307"}],"container-title":["IEEE Access"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/6287639\/10820123\/11269805.pdf?arnumber=11269805","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,12,22]],"date-time":"2025-12-22T18:43:11Z","timestamp":1766428991000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11269805\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025]]},"references-count":63,"URL":"https:\/\/doi.org\/10.1109\/access.2025.3637590","relation":{},"ISSN":["2169-3536"],"issn-type":[{"type":"electronic","value":"2169-3536"}],"subject":[],"published":{"date-parts":[[2025]]}}}