{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,14]],"date-time":"2025-11-14T07:36:05Z","timestamp":1763105765166,"version":"3.45.0"},"publisher-location":"New York, NY, USA","reference-count":40,"publisher":"ACM","content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2025,11,15]]},"DOI":"10.1145\/3768292.3770368","type":"proceedings-article","created":{"date-parts":[[2025,11,14]],"date-time":"2025-11-14T07:24:26Z","timestamp":1763105066000},"page":"960-968","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":0,"title":["Vision, Voice, and Text: Pioneering Zero-shot Multimodal LLMs for Sentiment-driven Investment"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0009-0005-3081-7446","authenticated-orcid":false,"given":"Su","family":"Tan","sequence":"first","affiliation":[{"name":"City University of Hong Kong, Hong Kong, Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0002-4486-0830","authenticated-orcid":false,"given":"Chi Chiu","family":"So","sequence":"additional","affiliation":[{"name":"The Hong Kong Polytechnic University, Hong Kong, Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0005-3951-6981","authenticated-orcid":false,"given":"Yueyue","family":"Sun","sequence":"additional","affiliation":[{"name":"Beijing Institute of Technology, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-7482-9386","authenticated-orcid":false,"given":"Jun-Min","family":"Wang","sequence":"additional","affiliation":[{"name":"Beijing Institute of Technology, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-2759-3198","authenticated-orcid":false,"given":"Wai Keung Anthony","family":"Loh","sequence":"additional","affiliation":[{"name":"The Hong Kong Polytechnic University, Hong Kong, Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-1583-2953","authenticated-orcid":false,"given":"Siu Pang","family":"Yung","sequence":"additional","affiliation":[{"name":"The University of Hong Kong, Hong Kong, Hong Kong"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2025,11,14]]},"reference":[{"key":"e_1_3_3_2_2_2","doi-asserted-by":"crossref","unstructured":"Gagan Bhatia El\u00a0Moatez\u00a0Billah Nagoudi Hasan Cavusoglu and Muhammad Abdul-Mageed. 2024. Fintral: A family of gpt-4 level multimodal financial large language models. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2402.10986 (2024).","DOI":"10.18653\/v1\/2024.findings-acl.774"},{"key":"e_1_3_3_2_3_2","unstructured":"Gheorghe Comanici Eric Bieber Mike Schaekermann Ice Pasupat Noveen Sachdeva Inderjit Dhillon Marcel Blistein Ori Ram Dan Zhang Evan Rosen et\u00a0al. 2025. Gemini 2.5: Pushing the frontier with advanced reasoning multimodality long context and next generation agentic capabilities. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2507.06261 (2025)."},{"key":"e_1_3_3_2_4_2","doi-asserted-by":"publisher","unstructured":"Jiaying Deng Mingwen Yang Matthias Pelster and Yong Tan. 2023. Social Trading Communication and Networks. Information Systems Research (2023). 10.1287\/isre.2021.0143","DOI":"10.1287\/isre.2021.0143"},{"key":"e_1_3_3_2_5_2","unstructured":"Shehzaad Dhuliawala Mojtaba Komeili Jing Xu Roberta Raileanu Xian Li Asli Celikyilmaz and Jason Weston. 2023. Chain-of-verification reduces hallucination in large language models. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2309.11495 (2023)."},{"key":"e_1_3_3_2_6_2","doi-asserted-by":"publisher","unstructured":"Wei Dong Shaoyi Liao and Zhongju Zhang. 2018. Leveraging Financial Social Media Data for Corporate Fraud Detection. Journal of Management Information Systems 35 2 (2018) 461\u2013487. 10.1080\/07421222.2018.1451954","DOI":"10.1080\/07421222.2018.1451954"},{"key":"e_1_3_3_2_7_2","unstructured":"Hugging Face. 2023. Hugging face\u2019s transformer models. https:\/\/huggingface.co"},{"key":"e_1_3_3_2_8_2","doi-asserted-by":"publisher","DOI":"10.1145\/3664647.3681488"},{"key":"e_1_3_3_2_9_2","unstructured":"Jimin Huang Mengxi Xiao Dong Li Zihao Jiang Yuzhe Yang Yifei Zhang Lingfei Qian Yan Wang Xueqing Peng Yang Ren et\u00a0al. 2024. Open-finllms: Open multimodal large language models for financial applications. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2408.11878 (2024)."},{"key":"e_1_3_3_2_10_2","doi-asserted-by":"crossref","unstructured":"Lei Huang Weijiang Yu Weitao Ma Weihong Zhong Zhangyin Feng Haotian Wang Qianglong Chen Weihua Peng Xiaocheng Feng Bing Qin et\u00a0al. 2025. A survey on hallucination in large language models: Principles taxonomy challenges and open questions. ACM Transactions on Information Systems 43 2 (2025) 1\u201355.","DOI":"10.1145\/3703155"},{"key":"e_1_3_3_2_11_2","doi-asserted-by":"publisher","DOI":"10.1145\/3677052.3698696"},{"key":"e_1_3_3_2_12_2","doi-asserted-by":"crossref","unstructured":"Jessica James. 2003. Simple trend-following strategies in currency trading. Quantitative Finance 3 4 (2003).","DOI":"10.1088\/1469-7688\/3\/4\/604"},{"key":"e_1_3_3_2_13_2","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2023.findings-emnlp.123"},{"key":"e_1_3_3_2_14_2","unstructured":"Saurav Kadavath Tom Conerly Amanda Askell Tom Henighan Dawn Drain Ethan Perez Nicholas Schiefer Zac Hatfield-Dodds Nova DasSarma Eli Tran-Johnson et\u00a0al. 2022. Language models (mostly) know what they know. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2207.05221 (2022)."},{"key":"e_1_3_3_2_15_2","doi-asserted-by":"publisher","DOI":"10.1145\/3677052.3698636"},{"key":"e_1_3_3_2_16_2","unstructured":"Aixin Liu Bei Feng Bing Xue Bingxuan Wang Bochao Wu Chengda Lu Chenggang Zhao Chengqi Deng Chenyu Zhang Chong Ruan et\u00a0al. 2024. Deepseek-v3 technical report. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2412.19437 (2024)."},{"key":"e_1_3_3_2_17_2","doi-asserted-by":"crossref","unstructured":"Chao Liu Yuxia Miao Qi Zhao Chao Wang and Xiangyu Zhu. 2025. Multimodal stock market emotion recognition model trained with a large language model. Engineering Applications of Artificial Intelligence 154 (2025) 111035.","DOI":"10.1016\/j.engappai.2025.111035"},{"key":"e_1_3_3_2_18_2","unstructured":"Xiao-Yang Liu Guoxuan Wang Hongyang Yang and Daochen Zha. 2023. Fingpt: Democratizing internet-scale data for financial large language models. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2307.10485 (2023)."},{"key":"e_1_3_3_2_19_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-43458-7_34"},{"key":"e_1_3_3_2_20_2","doi-asserted-by":"publisher","DOI":"10.1145\/3503161.3548380"},{"key":"e_1_3_3_2_21_2","doi-asserted-by":"publisher","DOI":"10.1109\/CSCE60160.2023.00073"},{"key":"e_1_3_3_2_22_2","doi-asserted-by":"crossref","unstructured":"Yusaku Nishimura and Bianxia Sun. 2025. Impacts of Donald Trump\u2019s tweets on volatilities in the European stock markets. Finance Research Letters 72 (2025) 106491.","DOI":"10.1016\/j.frl.2024.106491"},{"key":"e_1_3_3_2_23_2","unstructured":"OpenAI. 2023. GPT-4 Technical Report. arxiv:https:\/\/arXiv.org\/abs\/2303.08774\u00a0[cs.CL]"},{"key":"e_1_3_3_2_24_2","unstructured":"Kun Ouyang Yi Liu Shicheng Li Ruihan Bao Keiko Harimoto and Xu Sun. 2024. Modal-adaptive knowledge-enhanced graph-based financial prediction from monetary policy conference calls with LLM. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2403.16055 (2024)."},{"key":"e_1_3_3_2_25_2","doi-asserted-by":"publisher","DOI":"10.1002\/9781119219149"},{"key":"e_1_3_3_2_26_2","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P19-1038"},{"key":"e_1_3_3_2_27_2","doi-asserted-by":"crossref","unstructured":"Mohammad Soleymani David Garcia Brendan Jou Bj\u00f6rn Schuller Shih-Fu Chang and Maja Pantic. 2017. A survey of multimodal sentiment analysis. Image and Vision Computing 65 (2017) 3\u201314.","DOI":"10.1016\/j.imavis.2017.08.003"},{"key":"e_1_3_3_2_28_2","doi-asserted-by":"crossref","unstructured":"Andrew\u00a0C Szakmary Qian Shen and Subhash\u00a0C Sharma. 2010. Trend-following trading strategies in commodity futures: A re-examination. Journal of Banking & Finance 34 2 (2010) 409\u2013426.","DOI":"10.1016\/j.jbankfin.2009.08.004"},{"key":"e_1_3_3_2_29_2","unstructured":"Hugo Touvron Thibaut Lavril Gautier Izacard Xavier Martinet Marie-Anne Lachaux Timoth\u00e9e Lacroix Baptiste Rozi\u00e8re Naman Goyal Eric Hambro Faisal Azhar et\u00a0al. 2023. Llama: Open and efficient foundation language models (2023). arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2302.13971 (2023)."},{"key":"e_1_3_3_2_30_2","unstructured":"Xuezhi Wang Jason Wei Dale Schuurmans Quoc Le Ed Chi Sharan Narang Aakanksha Chowdhery and Denny Zhou. 2022. Self-consistency improves chain of thought reasoning in language models. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2203.11171 (2022)."},{"key":"e_1_3_3_2_31_2","volume-title":"Forty-first International Conference on Machine Learning","author":"Wu Shengqiong","year":"2024","unstructured":"Shengqiong Wu, Hao Fei, Leigang Qu, Wei Ji, and Tat-Seng Chua. 2024. Next-gpt: Any-to-any multimodal llm. In Forty-first International Conference on Machine Learning."},{"key":"e_1_3_3_2_32_2","unstructured":"Shijie Wu Ozan Irsoy Steven Lu Vadim Dabravolski Mark Dredze Sebastian Gehrmann Prabhanjan Kambadur David Rosenberg and Gideon Mann. 2024. BloombergGPT: A large language model for finance 2023. URL https:\/\/arxiv. org\/abs\/2303.17564 (2024)."},{"key":"e_1_3_3_2_33_2","doi-asserted-by":"crossref","unstructured":"Frank Xing. 2025. Designing heterogeneous llm agents for financial sentiment analysis. ACM Transactions on Management Information Systems 16 1 (2025) 1\u201324.","DOI":"10.1145\/3688399"},{"key":"e_1_3_3_2_34_2","doi-asserted-by":"publisher","unstructured":"Frank Xing Erik Cambria and Yue Zhang. 2019. Sentiment-aware volatility forecasting. Knowledge Based Systems 176 (2019) 68\u201376. 10.1016\/j.knosys.2019.03.029","DOI":"10.1016\/j.knosys.2019.03.029"},{"key":"e_1_3_3_2_35_2","unstructured":"Selene\u00a0Yue Xu and CU Berkely. 2014. Stock price forecasting using information from Yahoo finance and Google trend. UC Brekley (2014) 1\u201322."},{"key":"e_1_3_3_2_36_2","doi-asserted-by":"publisher","DOI":"10.1145\/3366423.3380128"},{"key":"e_1_3_3_2_37_2","doi-asserted-by":"publisher","unstructured":"Yi Yang Yu Qin Yangyang Fan and Zhongju Zhang. 2023. Unlocking the Power of Voice for Financial Risk Prediction: A Theory-Driven Deep Learning Design Approach. MIS Quarterly 47 1 (2023) 63\u201396. 10.25300\/misq\/2022\/17062","DOI":"10.25300\/misq\/2022\/17062"},{"key":"e_1_3_3_2_38_2","unstructured":"Xiao-Yang\u00a0Liu Yanglet Yupeng Cao and Li Deng. 2025. Multimodal financial foundation models (mffms): Progress prospects and challenges. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2506.01973 (2025)."},{"key":"e_1_3_3_2_39_2","unstructured":"Jun Zhan Junqi Dai Jiasheng Ye Yunhua Zhou Dong Zhang Zhigeng Liu Xin Zhang Ruibin Yuan Ge Zhang Linyang Li et\u00a0al. 2024. Anygpt: Unified multimodal llm with discrete sequence modeling. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2402.12226 (2024)."},{"key":"e_1_3_3_2_40_2","doi-asserted-by":"crossref","unstructured":"Chao Zhang Zichao Yang Xiaodong He and Li Deng. 2020. Multimodal intelligence: Representation learning information fusion and applications. IEEE Journal of Selected Topics in Signal Processing 14 3 (2020) 478\u2013493.","DOI":"10.1109\/JSTSP.2020.2987728"},{"key":"e_1_3_3_2_41_2","doi-asserted-by":"publisher","DOI":"10.1145\/3637528.3671801"}],"event":{"name":"ICAIF '25: 6th ACM International Conference on AI in Finance","location":"Singapore Singapore","acronym":"ICAIF '25"},"container-title":["Proceedings of the 6th ACM International Conference on AI in Finance"],"original-title":[],"deposited":{"date-parts":[[2025,11,14]],"date-time":"2025-11-14T07:25:51Z","timestamp":1763105151000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3768292.3770368"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,11,14]]},"references-count":40,"alternative-id":["10.1145\/3768292.3770368","10.1145\/3768292"],"URL":"https:\/\/doi.org\/10.1145\/3768292.3770368","relation":{},"subject":[],"published":{"date-parts":[[2025,11,14]]},"assertion":[{"value":"2025-11-14","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}