{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,29]],"date-time":"2025-11-29T07:15:59Z","timestamp":1764400559663,"version":"3.46.0"},"reference-count":27,"publisher":"IEEE","license":[{"start":{"date-parts":[[2025,10,22]],"date-time":"2025-10-22T00:00:00Z","timestamp":1761091200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2025,10,22]],"date-time":"2025-10-22T00:00:00Z","timestamp":1761091200000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025,10,22]]},"DOI":"10.1109\/apsipaasc65261.2025.11249407","type":"proceedings-article","created":{"date-parts":[[2025,11,28]],"date-time":"2025-11-28T18:40:26Z","timestamp":1764355226000},"page":"1916-1921","source":"Crossref","is-referenced-by-count":0,"title":["Incorporating Semantic Visual Content into Click-Through Rate Prediction for Video Advertisements"],"prefix":"10.1109","author":[{"given":"Yoshiaki","family":"Tanabe","sequence":"first","affiliation":[{"name":"The University of Tokyo,Japan"}]},{"given":"Shuntaro","family":"Masuda","sequence":"additional","affiliation":[{"name":"The University of Tokyo,Japan"}]},{"given":"Gakumatsu","family":"Ryu","sequence":"additional","affiliation":[{"name":"Septeni Japan, Inc.,Japan"}]},{"given":"Naoto","family":"Tanji","sequence":"additional","affiliation":[{"name":"Septeni Japan, Inc.,Japan"}]},{"given":"Hiroyuki","family":"Seshime","sequence":"additional","affiliation":[{"name":"Septeni Japan, Inc.,Japan"}]},{"given":"Ling","family":"Xiao","sequence":"additional","affiliation":[{"name":"The University of Tokyo,Japan"}]},{"given":"Toshihiko","family":"Yamasaki","sequence":"additional","affiliation":[{"name":"The University of Tokyo,Japan"}]}],"member":"263","reference":[{"year":"2025","journal-title":"Digital Video Advertising Market Analysis North America, APAC, Europe, South America, Middle East and Africa - US, China, UK, Germany, Japan Size and Forecast 2024-2028","key":"ref1"},{"year":"2025","journal-title":"Nielsen Study Reveals Majority of Consumers Actively Avoid Ads Across Podcasts, Streaming, and Live TV Platforms","key":"ref2"},{"doi-asserted-by":"publisher","key":"ref3","DOI":"10.1016\/j.ipm.2021.102853"},{"doi-asserted-by":"publisher","key":"ref4","DOI":"10.1145\/3459637.3482327"},{"doi-asserted-by":"publisher","key":"ref5","DOI":"10.1109\/ICPR48806.2021.9412666"},{"doi-asserted-by":"publisher","key":"ref6","DOI":"10.1145\/3678004"},{"doi-asserted-by":"publisher","key":"ref7","DOI":"10.1145\/1242572.1242643"},{"doi-asserted-by":"publisher","key":"ref8","DOI":"10.1145\/2487575.2488200"},{"doi-asserted-by":"publisher","key":"ref9","DOI":"10.1145\/3219819.3219823"},{"doi-asserted-by":"publisher","key":"ref10","DOI":"10.48550\/ARXIV.1706.03762"},{"key":"ref11","first-page":"1877","article-title":"Language Models Are Few-Shot Learners","author":"Brown","year":"2020","journal-title":"NeurIPS"},{"doi-asserted-by":"publisher","key":"ref12","DOI":"10.18653\/v1\/D19-1250"},{"key":"ref13","first-page":"4171","article-title":"BERT: Pre-Training of Deep Bidirectional Transformers for Language Understanding","author":"Devlin","year":"2019","journal-title":"NAACL"},{"doi-asserted-by":"publisher","key":"ref14","DOI":"10.1145\/3626772.3657974"},{"doi-asserted-by":"publisher","key":"ref15","DOI":"10.1145\/3589334.3645396"},{"doi-asserted-by":"publisher","key":"ref16","DOI":"10.18653\/v1\/2023.emnlp-main.176"},{"key":"ref17","article-title":"MiniGPT4-Video: Advancing Multimodal LLMs for Video Understanding with Interleaved Visual-Textual Tokens","author":"Ataallah","year":"2024","journal-title":"arXiv preprint"},{"volume-title":"Gemini assistant","year":"2025","author":"Deep Mind","key":"ref18"},{"year":"2025","journal-title":"Hello gpt-4o","key":"ref19"},{"doi-asserted-by":"publisher","key":"ref20","DOI":"10.1109\/ACCESS.2018.2802206"},{"doi-asserted-by":"publisher","key":"ref21","DOI":"10.1016\/j.im.2022.103708"},{"key":"ref22","first-page":"3","article-title":"Emotion Regulation: Conceptual and Empirical Foundations","volume":"2","author":"Gross","year":"2014","journal-title":"Handbook of Emotion Regulation"},{"doi-asserted-by":"publisher","key":"ref23","DOI":"10.1509\/jmr.10.0207"},{"doi-asserted-by":"publisher","key":"ref24","DOI":"10.1145\/3560815"},{"volume-title":"Tohoku-nlp\/bert-base-japanesev3","year":"2025","key":"ref25"},{"key":"ref26","article-title":"An Image Is Worth 16x16 Words: Transformers for Image Recognition at Scale","author":"Dosovitskiy","year":"2021","journal-title":"ICLR"},{"doi-asserted-by":"publisher","key":"ref27","DOI":"10.1145\/3292500.3330701"}],"event":{"name":"2025 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)","start":{"date-parts":[[2025,10,22]]},"location":"Singapore, Singapore","end":{"date-parts":[[2025,10,24]]}},"container-title":["2025 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/11248853\/11248968\/11249407.pdf?arnumber=11249407","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,11,29]],"date-time":"2025-11-29T07:11:06Z","timestamp":1764400266000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11249407\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,10,22]]},"references-count":27,"URL":"https:\/\/doi.org\/10.1109\/apsipaasc65261.2025.11249407","relation":{},"subject":[],"published":{"date-parts":[[2025,10,22]]}}}