{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,6,18]],"date-time":"2025-06-18T04:21:23Z","timestamp":1750220483288,"version":"3.41.0"},"publisher-location":"New York, NY, USA","reference-count":29,"publisher":"ACM","license":[{"start":{"date-parts":[[2021,9,24]],"date-time":"2021-09-24T00:00:00Z","timestamp":1632441600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.acm.org\/publications\/policies\/copyright_policy#Background"}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2021,9,24]]},"DOI":"10.1145\/3488933.3489004","type":"proceedings-article","created":{"date-parts":[[2022,2,25]],"date-time":"2022-02-25T11:36:59Z","timestamp":1645789019000},"page":"561-566","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":0,"title":["Multi-Head Attention with Disagreement Regularization for Multimodal Sentiment Analysis"],"prefix":"10.1145","author":[{"given":"Hao","family":"Ai","sequence":"first","affiliation":[{"name":"Xi'an University of Posts and Telecommunications, China"}]},{"given":"Ying","family":"Liu","sequence":"additional","affiliation":[{"name":"Xi'an University of Posts and Telecommunications, China"}]},{"given":"Jie","family":"Fang","sequence":"additional","affiliation":[{"name":"Xi'an University of Posts and Telecommunications, China"}]}],"member":"320","published-online":{"date-parts":[[2022,2,25]]},"reference":[{"key":"e_1_3_2_1_1_1","doi-asserted-by":"publisher","DOI":"10.1145\/3178876.3186015"},{"key":"e_1_3_2_1_2_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D19-1551"},{"key":"e_1_3_2_1_3_1","first-page":"13","article-title":"Hierarchical transformer network for utterance-level emotion recognition","volume":"10","author":"Li Qingbiao","year":"2020","unstructured":"Qingbiao Li , Chunhua Wu , Zhe Wang and Kangfeng Zhen . 2020 . Hierarchical transformer network for utterance-level emotion recognition . Applied Sciences 10 , 13 (June 2020), 4447-4460. https:\/\/doi.org\/10.3390\/app10134447 Qingbiao Li, Chunhua Wu, Zhe Wang and Kangfeng Zhen. 2020. Hierarchical transformer network for utterance-level emotion recognition. Applied Sciences 10, 13 (June 2020), 4447-4460. https:\/\/doi.org\/10.3390\/app10134447","journal-title":"Applied Sciences"},{"key":"e_1_3_2_1_4_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2019.8683163"},{"key":"e_1_3_2_1_5_1","first-page":"141","article-title":"Local occlusion facial expression recognition based on improved GAN","volume":"56","author":"Wang Haiyong","year":"2020","unstructured":"Haiyong Wang and Hongzhu Liang . 2020 . Local occlusion facial expression recognition based on improved GAN . Computer Engineering and Application 56 , 5 (2020), 141 - 146 . Haiyong Wang and Hongzhu Liang. 2020. Local occlusion facial expression recognition based on improved GAN. Computer Engineering and Application 56, 5 (2020), 141-146.","journal-title":"Computer Engineering and Application"},{"key":"e_1_3_2_1_6_1","first-page":"865","article-title":"Robust facial expression recognition based on Generative adversary Network","volume":"44","author":"Yao Naiming","year":"2018","unstructured":"Naiming Yao , Qingpei Guo and Fengchun Qiao . 2018 . Robust facial expression recognition based on Generative adversary Network . Acta Automatica Sinica 44 , 5 (2018), 865 - 877 . Naiming Yao, Qingpei Guo and Fengchun Qiao. 2018. Robust facial expression recognition based on Generative adversary Network. Acta Automatica Sinica 44, 5 (2018), 865-877.","journal-title":"Acta Automatica Sinica"},{"key":"e_1_3_2_1_7_1","doi-asserted-by":"publisher","DOI":"10.1145\/3065386"},{"key":"e_1_3_2_1_8_1","doi-asserted-by":"publisher","DOI":"10.3390\/a9020041"},{"key":"e_1_3_2_1_9_1","volume-title":"Erik Cambria and Louis-Philippe Analysis","author":"Zadeh Amir","year":"2017","unstructured":"Amir Zadeh , Minghai Chen , Soujanya Poria , Erik Cambria and Louis-Philippe Analysis . 2017 . Tensor fusion network for multimodal sentiment analysis. arXiv preprint arXiv:1707.07250(2017). Amir Zadeh, Minghai Chen, Soujanya Poria, Erik Cambria and Louis-Philippe Analysis. 2017. Tensor fusion network for multimodal sentiment analysis. arXiv preprint arXiv:1707.07250(2017)."},{"key":"e_1_3_2_1_10_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P17-1081"},{"key":"e_1_3_2_1_11_1","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v33i01.33016818"},{"key":"e_1_3_2_1_12_1","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2021.3049898"},{"key":"e_1_3_2_1_13_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D18-1382"},{"key":"e_1_3_2_1_14_1","unstructured":"Ashish Vaswani Noam Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Lukasz Kaiser 2017. Attention is all you need. Advances in neural information processing systems. 5998-6008.  Ashish Vaswani Noam Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Lukasz Kaiser 2017. Attention is all you need. Advances in neural information processing systems. 5998-6008."},{"key":"e_1_3_2_1_15_1","doi-asserted-by":"publisher","DOI":"10.3115\/v1\/D14-1162"},{"key":"e_1_3_2_1_16_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2014.6853739"},{"key":"e_1_3_2_1_17_1","volume-title":"John Berkowitz and Charles Elkan","author":"Lipton Zachary C.","year":"2015","unstructured":"Zachary C. Lipton , John Berkowitz and Charles Elkan . 2015 . A critical review of recurrent neural networks for sequence learning. arXiv preprint arXiv:1506.00019(2015). Zachary C. Lipton, John Berkowitz and Charles Elkan. 2015. A critical review of recurrent neural networks for sequence learning. arXiv preprint arXiv:1506.00019(2015)."},{"key":"e_1_3_2_1_18_1","volume-title":"Long short-term memory. Neural computation 9, 8 (November","author":"Hochreiter Sepp","year":"1997","unstructured":"Sepp Hochreiter and J\u00fcrgen Schmidhuber . 1997. Long short-term memory. Neural computation 9, 8 (November 1997 ), 1735-1780. Sepp Hochreiter and J\u00fcrgen Schmidhuber. 1997. Long short-term memory. Neural computation 9, 8 (November 1997), 1735-1780."},{"key":"e_1_3_2_1_19_1","volume-title":"Caglar Gulcehre, Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk and Yoshua Bengio.","author":"Cho Kyunghyun","year":"2014","unstructured":"Kyunghyun Cho , Bart Van Merri\u00ebnboer , Caglar Gulcehre, Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk and Yoshua Bengio. 2014 . Learning phrase representations using RNN encoder-decoder for statistical machine translation. arXiv preprint arXiv:1406.1078(2014). Kyunghyun Cho, Bart Van Merri\u00ebnboer, Caglar Gulcehre, Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk and Yoshua Bengio. 2014. Learning phrase representations using RNN encoder-decoder for statistical machine translation. arXiv preprint arXiv:1406.1078(2014)."},{"key":"e_1_3_2_1_20_1","doi-asserted-by":"publisher","DOI":"10.1109\/MIS.2016.94"},{"key":"e_1_3_2_1_21_1","volume-title":"Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics. 2236-2246","author":"Zadeh Amir","year":"2018","unstructured":"Amir Zadeh , Paul Pu Liang , Jonathan Vanbriesen , Soujanya Poria , Edmund Tong , Erik Cambria , Minghai Chen , 2018 . Multimodal language analysis in the wild: Cmu-mosei dataset and interpretable dynamic fusion graph . Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics. 2236-2246 . Amir Zadeh, Paul Pu Liang, Jonathan Vanbriesen, Soujanya Poria, Edmund Tong, Erik Cambria, Minghai Chen, 2018. Multimodal language analysis in the wild: Cmu-mosei dataset and interpretable dynamic fusion graph. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics. 2236-2246."},{"key":"e_1_3_2_1_22_1","volume-title":"Lyu and Tong Zhang","author":"Li Jian","year":"2018","unstructured":"Jian Li , Zhaopeng Tu , Baosong Yang , Michael R. Lyu and Tong Zhang . 2018 . Multi-head attention with disagreement regularization. arXiv preprint arXiv:1810.10183(2018). Jian Li, Zhaopeng Tu, Baosong Yang, Michael R. Lyu and Tong Zhang. 2018. Multi-head attention with disagreement regularization. arXiv preprint arXiv:1810.10183(2018)."},{"key":"e_1_3_2_1_23_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P17-1081"},{"key":"e_1_3_2_1_24_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICDM.2017.134"},{"key":"e_1_3_2_1_25_1","doi-asserted-by":"publisher","DOI":"10.1145\/3136755.3136801"},{"key":"e_1_3_2_1_26_1","volume-title":"Thirty-Second AAAI Conference on Artificial Intelligence. 5642-5649","author":"Zadeh Amir","year":"2018","unstructured":"Amir Zadeh , Paul Pu Liang , Soujanya Poria , Prateek Vij , Erik Cambria and Louis-Philippe Morency . 2018 . Multi-attention recurrent network for human communication comprehension . Thirty-Second AAAI Conference on Artificial Intelligence. 5642-5649 . Amir Zadeh, Paul Pu Liang, Soujanya Poria, Prateek Vij, Erik Cambria and Louis-Philippe Morency. 2018. Multi-attention recurrent network for human communication comprehension. Thirty-Second AAAI Conference on Artificial Intelligence. 5642-5649."},{"key":"e_1_3_2_1_27_1","volume-title":"Proceedings of the AAAI Conference on Artificial Intelligence. 5634-5641","author":"Zadeh Amir","year":"2018","unstructured":"Amir Zadeh , Paul Pu Liang , Navonil Mazumder , Soujanva Poria , Erik Cambria and Louis-Philippe Morency . 2018 . Memory fusion network for multi-view sequential learning . Proceedings of the AAAI Conference on Artificial Intelligence. 5634-5641 . Amir Zadeh, Paul Pu Liang, Navonil Mazumder, Soujanva Poria, Erik Cambria and Louis-Philippe Morency. 2018. Memory fusion network for multi-view sequential learning. Proceedings of the AAAI Conference on Artificial Intelligence. 5634-5641."},{"key":"e_1_3_2_1_28_1","volume-title":"Ming Yang and Kai Yu","author":"Ji Shuiwang","year":"2012","unstructured":"Shuiwang Ji , Wei Xu , Ming Yang and Kai Yu . 2012 . 3D convolutional neural networks for human action recognition. IEEE transactions on pattern analysis and machine intelligence 35, 1 (March 2012), 221-231. Shuiwang Ji, Wei Xu, Ming Yang and Kai Yu. 2012. 3D convolutional neural networks for human action recognition. IEEE transactions on pattern analysis and machine intelligence 35, 1 (March 2012), 221-231."},{"key":"e_1_3_2_1_29_1","volume-title":"Asif Ekbal.","author":"Khtar Md Shad","year":"2020","unstructured":"Md Shad A Khtar , Dushyant Singh Chauhan , Asif Ekbal. 2020 . A deep multi-task contextual attention framework for multi-modal affect analysis. ACM Transactions on Knowledge Discovery from Data (TKDD) 14, 3 (May 2020), 1-27. Md Shad AKhtar, Dushyant Singh Chauhan, Asif Ekbal. 2020. A deep multi-task contextual attention framework for multi-modal affect analysis. ACM Transactions on Knowledge Discovery from Data (TKDD) 14, 3 (May 2020), 1-27."}],"event":{"name":"AIPR 2021: 2021 4th International Conference on Artificial Intelligence and Pattern Recognition","acronym":"AIPR 2021","location":"Xiamen China"},"container-title":["2021 4th International Conference on Artificial Intelligence and Pattern Recognition"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3488933.3489004","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3488933.3489004","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,17]],"date-time":"2025-06-17T20:49:00Z","timestamp":1750193340000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3488933.3489004"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,9,24]]},"references-count":29,"alternative-id":["10.1145\/3488933.3489004","10.1145\/3488933"],"URL":"https:\/\/doi.org\/10.1145\/3488933.3489004","relation":{},"subject":[],"published":{"date-parts":[[2021,9,24]]},"assertion":[{"value":"2022-02-25","order":2,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}