{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,16]],"date-time":"2026-04-16T03:17:26Z","timestamp":1776309446261,"version":"3.50.1"},"reference-count":48,"publisher":"MDPI AG","issue":"1","license":[{"start":{"date-parts":[[2026,1,4]],"date-time":"2026-01-04T00:00:00Z","timestamp":1767484800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"funder":[{"name":"MOE (Ministry of Education in China) Liberal Arts and Social Sciences Foundation","award":["23YJCZH336"],"award-info":[{"award-number":["23YJCZH336"]}]},{"DOI":"10.13039\/501100003819","name":"Hubei Provincial Natural Science Foundation","doi-asserted-by":"crossref","award":["2025AFC023"],"award-info":[{"award-number":["2025AFC023"]}],"id":[{"id":"10.13039\/501100003819","id-type":"DOI","asserted-by":"crossref"}]},{"name":"Hubei Provincial Department of Education Philosophy and Social Science","award":["23G057"],"award-info":[{"award-number":["23G057"]}]},{"name":"China Postdoctoral Science Foundation General Funding","award":["2025M773206"],"award-info":[{"award-number":["2025M773206"]}]},{"name":"Hubei Provincial Natural Science Foundation Youth Project","award":["2025AFB140"],"award-info":[{"award-number":["2025AFB140"]}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["J. Imaging"],"abstract":"<jats:p>Facial expression recognition (FER) technology has progressively matured over time. However, existing FER methods are primarily optimized for frontal face images, and their recognition accuracy significantly degrades when processing profile or large-angle rotated facial images. Consequently, this limitation hinders the practical deployment of FER systems. To mitigate the interference caused by large pose variations and improve recognition accuracy, we propose a FER method based on profile-to-frontal transformation and multimodal learning. Specifically, we first leverage the visual understanding and generation capabilities of Qwen-Image-Edit that transform profile images to frontal viewpoints, preserving key expression features while standardizing facial poses. Second, we introduce the CLIP model to enhance the semantic representation capability of expression features through vision\u2013language joint learning. The qualitative and quantitative experiments on the RAF (89.39%), EXPW (67.17%), and AffectNet-7 (62.66%) datasets demonstrate that our method outperforms the existing approaches.<\/jats:p>","DOI":"10.3390\/jimaging12010024","type":"journal-article","created":{"date-parts":[[2026,1,5]],"date-time":"2026-01-05T10:03:48Z","timestamp":1767607428000},"page":"24","update-policy":"https:\/\/doi.org\/10.3390\/mdpi_crossmark_policy","source":"Crossref","is-referenced-by-count":1,"title":["LLM-Based Pose Normalization and Multimodal Fusion for Facial Expression Recognition in Extreme Poses"],"prefix":"10.3390","volume":"12","author":[{"given":"Bohan","family":"Chen","sequence":"first","affiliation":[{"name":"School of Information Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Bowen","family":"Qu","sequence":"additional","affiliation":[{"name":"School of Information Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yu","family":"Zhou","sequence":"additional","affiliation":[{"name":"School of Information Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Han","family":"Huang","sequence":"additional","affiliation":[{"name":"School of Management, Wuhan University of Technology, Wuhan 430070, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jianing","family":"Guo","sequence":"additional","affiliation":[{"name":"School of Information Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yanning","family":"Xian","sequence":"additional","affiliation":[{"name":"School of Information Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Longxiang","family":"Ma","sequence":"additional","affiliation":[{"name":"School of Information Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jinxuan","family":"Yu","sequence":"additional","affiliation":[{"name":"School of Information Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-9941-8033","authenticated-orcid":false,"given":"Jingyu","family":"Chen","sequence":"additional","affiliation":[{"name":"School of Information Engineering, Zhongnan University of Economics and Law, Wuhan 430073, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"1968","published-online":{"date-parts":[[2026,1,4]]},"reference":[{"key":"ref_1","doi-asserted-by":"crossref","first-page":"451","DOI":"10.1109\/TAFFC.2020.3031602","article-title":"Facial expression recognition in the wild using multi-level features and attention mechanisms","volume":"14","author":"Li","year":"2020","journal-title":"IEEE Trans. Affect. Comput."},{"key":"ref_2","doi-asserted-by":"crossref","unstructured":"Xu, Q., and Zhao, N. (2020, January 12\u201314). A Facial Expression Recognition Algorithm based on CNN and LBP Feature. Proceedings of the 2020 IEEE 4th Information Technology, Networking, Electronic and Automation Control Conference (ITNEC), Chongqing, China.","DOI":"10.1109\/ITNEC48623.2020.9084763"},{"key":"ref_3","doi-asserted-by":"crossref","first-page":"5130","DOI":"10.1109\/TVCG.2024.3434386","article-title":"FACEMUG: A Multimodal Generative and Fusion Framework for Local Facial Editing","volume":"31","author":"Lu","year":"2025","journal-title":"IEEE Trans. Vis. Comput. Graph."},{"key":"ref_4","doi-asserted-by":"crossref","first-page":"1236","DOI":"10.1109\/TAFFC.2021.3122146","article-title":"Facial expression recognition with visual transformers and attentional selective fusion","volume":"14","author":"Ma","year":"2021","journal-title":"IEEE Trans. Affect. Comput."},{"key":"ref_5","doi-asserted-by":"crossref","first-page":"4190","DOI":"10.1109\/TKDE.2021.3136606","article-title":"Region attention enhanced unsupervised cross-domain facial emotion recognition","volume":"35","author":"Ji","year":"2021","journal-title":"IEEE Trans. Knowl. Data Eng."},{"key":"ref_6","unstructured":"Gowrishankar, J., Deepak, S., and Srivastava, M. (2024, January 27\u201328). Countering the Rise of AI-Generated Content with Innovative Detection Strategies and Large Language Models. Proceedings of the 2024 International Conference on Advances in Computing Research on Science Engineering and Technology (ACROSET), Indore, India."},{"key":"ref_7","doi-asserted-by":"crossref","unstructured":"Wu, Y., Meng, Y., Hu, Z., Li, L., Wu, H., Zhou, K., Xu, W., and Yu, X. (2024, January 16\u201322). Text-Guided 3D Face Synthesis\u2014From Generation to Editing. Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA.","DOI":"10.1109\/CVPR52733.2024.00126"},{"key":"ref_8","doi-asserted-by":"crossref","unstructured":"Luo, Y., Wu, J., Zhang, Z., Zhao, H., and Shu, Z. (2023, January 29\u201331). Design of Facial Expression Recognition Algorithm Based on CNN Model. Proceedings of the 2023 IEEE 3rd International Conference on Power, Electronics and Computer Applications (ICPECA), Shenyang, China.","DOI":"10.1109\/ICPECA56706.2023.10075779"},{"key":"ref_9","doi-asserted-by":"crossref","first-page":"169263","DOI":"10.1109\/ACCESS.2024.3496506","article-title":"Face Expression Recognition With Vision Transformer and Local Mutual Information Maximization","volume":"12","author":"Dou","year":"2024","journal-title":"IEEE Access"},{"key":"ref_10","doi-asserted-by":"crossref","first-page":"1244","DOI":"10.1109\/ACCESS.2022.3233362","article-title":"Facial Expression Recognition Using Multi-Branch Attention Convolutional Neural Network","volume":"11","author":"He","year":"2023","journal-title":"IEEE Access"},{"key":"ref_11","doi-asserted-by":"crossref","unstructured":"She, J., Hu, Y., Shi, H., Wang, J., Shen, Q., and Mei, T. (2021, January 19\u201325). Dive into ambiguity: Latent distribution mining and pairwise uncertainty estimation for facial expression recognition. Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, Virtual.","DOI":"10.1109\/CVPR46437.2021.00618"},{"key":"ref_12","doi-asserted-by":"crossref","first-page":"173","DOI":"10.1109\/TAFFC.2023.3263886","article-title":"Unconstrained Facial Expression Recognition with No-Reference De-Elements Learning","volume":"15","author":"Li","year":"2023","journal-title":"IEEE Trans. Affect. Comput."},{"key":"ref_13","first-page":"17616","article-title":"Relative uncertainty learning for facial expression recognition","volume":"34","author":"Zhang","year":"2021","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref_14","doi-asserted-by":"crossref","unstructured":"Nguyen, L.P., Abdelkawy, H., and Othmani, A. (2025, January 14\u201317). Emomamba: Advancing Dynamic Facial Expression Recognition with Visual and Textual Fusion. Proceedings of the 2025 IEEE International Conference on Image Processing (ICIP), Anchorage, AK, USA.","DOI":"10.1109\/ICIP55913.2025.11084654"},{"key":"ref_15","doi-asserted-by":"crossref","first-page":"1927","DOI":"10.1109\/TAFFC.2022.3156920","article-title":"Probabilistic attribute tree structured convolutional neural networks for facial expression recognition in the wild","volume":"14","author":"Cai","year":"2022","journal-title":"IEEE Trans. Affect. Comput."},{"key":"ref_16","doi-asserted-by":"crossref","first-page":"9887","DOI":"10.1109\/TPAMI.2021.3131222","article-title":"Cross-domain facial expression recognition: A unified evaluation benchmark and adversarial graph learning","volume":"44","author":"Chen","year":"2021","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"ref_17","doi-asserted-by":"crossref","unstructured":"Wang, L., Jia, G., Jiang, N., Wu, H., and Yang, J. (2022, January 10\u201314). Ease: Robust facial expression recognition via emotion ambiguity-sensitive cooperative networks. Proceedings of the 30th ACM International Conference on Multimedia, Lisboa, Portugal.","DOI":"10.1145\/3503161.3548005"},{"key":"ref_18","doi-asserted-by":"crossref","first-page":"593","DOI":"10.1109\/TAFFC.2023.3285231","article-title":"Transformer-augmented network with online label correction for facial expression recognition","volume":"15","author":"Ma","year":"2023","journal-title":"IEEE Trans. Affect. Comput."},{"key":"ref_19","doi-asserted-by":"crossref","first-page":"9946","DOI":"10.1109\/TNNLS.2025.3548669","article-title":"Learning Sequential Variation Information for Dynamic Facial Expression Recognition","volume":"36","author":"Pan","year":"2025","journal-title":"IEEE Trans. Neural Netw. Learn. Syst."},{"key":"ref_20","doi-asserted-by":"crossref","unstructured":"Dordinejad, G.G., and \u00c7evikalp, H. (2022, January 15\u201318). Face Frontalization for Image Set Based Face Recognition. Proceedings of the 2022 30th Signal Processing and Communications Applications Conference (SIU), Safranbolu, Turkey.","DOI":"10.1109\/SIU55565.2022.9864911"},{"key":"ref_21","doi-asserted-by":"crossref","unstructured":"Makhanov, N., Amirgaliyev, B., Islamgozhayev, T., and Yedilkhan, D. (2025). Federated Self-Supervised Few-Shot Face Recognition. J. Imaging, 11.","DOI":"10.3390\/jimaging11100370"},{"key":"ref_22","doi-asserted-by":"crossref","first-page":"455","DOI":"10.1007\/s11263-021-01556-7","article-title":"Adaptive Deep Disturbance-Disentangled Learning for Facial Expression Recognition","volume":"130","author":"Ruan","year":"2022","journal-title":"Int. J. Comput. Vis."},{"key":"ref_23","doi-asserted-by":"crossref","first-page":"6544","DOI":"10.1109\/TIP.2021.3093397","article-title":"Learning deep global multi-scale and local attention features for facial expression recognition in the wild","volume":"30","author":"Zhao","year":"2021","journal-title":"IEEE Trans. Image Process."},{"key":"ref_24","doi-asserted-by":"crossref","unstructured":"Ezerceli, \u00d6., and Eskil, M.T. (2022, January 16\u201318). Convolutional Neural Network (CNN) Algorithm Based Facial Emotion Recognition (FER) System for FER-2013 Dataset. Proceedings of the 2022 International Conference on Electrical, Computer, Communications and Mechatronics Engineering (ICECCME), Male, Maldives.","DOI":"10.1109\/ICECCME55909.2022.9988371"},{"key":"ref_25","first-page":"8748","article-title":"Learning Transferable Visual Models From Natural Language Supervision","volume":"Volume 139","author":"Meila","year":"2021","journal-title":"Proceedings of the 38th International Conference on Machine Learning"},{"key":"ref_26","doi-asserted-by":"crossref","unstructured":"Chen, J., Gong, W., Xiao, R., and Zhou, Z. (2024, January 21\u201324). Face Frontalization Method with 3D Technology and a Side-Face-Alignment Generative Adversarial Networks. Proceedings of the 2024 IEEE 12th International Conference on Information, Communication and Networks (ICICN), Guilin, China.","DOI":"10.1109\/ICICN62625.2024.10761569"},{"key":"ref_27","doi-asserted-by":"crossref","first-page":"5573","DOI":"10.1109\/ACCESS.2020.3046715","article-title":"A Lightweight Convolutional Neural Network for Real-Time Facial Expression Detection","volume":"9","author":"Zhou","year":"2021","journal-title":"IEEE Access"},{"key":"ref_28","doi-asserted-by":"crossref","unstructured":"Xie, Y., Gao, Y., Lin, J., and Chen, T. (2022, January 21\u201325). Learning consistent global-local representation for cross-domain facial expression recognition. Proceedings of the 2022 26th International Conference on Pattern Recognition (ICPR), Montreal, QC, Canada.","DOI":"10.1109\/ICPR56361.2022.9956069"},{"key":"ref_29","doi-asserted-by":"crossref","first-page":"472","DOI":"10.1016\/j.ins.2022.06.092","article-title":"HistNet: Histogram-based convolutional neural network with Chi-squared deep metric learning for facial expression recognition","volume":"608","author":"Sadeghi","year":"2022","journal-title":"Inf. Sci."},{"key":"ref_30","doi-asserted-by":"crossref","unstructured":"Zeng, J., Shan, S., and Chen, X. (2018, January 8\u201314). Facial expression recognition with inconsistently annotated datasets. Proceedings of the European conference on computer vision (ECCV), Munich, Germany.","DOI":"10.1007\/978-3-030-01261-8_14"},{"key":"ref_31","unstructured":"Wu, C., Li, J., Zhou, J., Lin, J., Gao, K., Yan, K., Yin, S., Bai, S., Xu, X., and Chen, Y. (2025). Qwen-Image Technical Report. arXiv."},{"key":"ref_32","doi-asserted-by":"crossref","first-page":"6253","DOI":"10.1109\/TCSVT.2022.3165321","article-title":"Adaptive multilayer perceptual attention network for facial expression recognition","volume":"32","author":"Liu","year":"2022","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"ref_33","doi-asserted-by":"crossref","first-page":"3848","DOI":"10.1109\/TCSVT.2023.3234312","article-title":"Multi-relations aware network for in-the-wild facial expression recognition","volume":"33","author":"Chen","year":"2023","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"ref_34","doi-asserted-by":"crossref","first-page":"14","DOI":"10.1186\/s42492-022-00109-0","article-title":"Robust facial expression recognition system in higher poses","volume":"5","author":"Owusu","year":"2022","journal-title":"Vis. Comput. Ind. Biomed. Art"},{"key":"ref_35","doi-asserted-by":"crossref","first-page":"2531","DOI":"10.1109\/TMM.2023.3301209","article-title":"Uncertain facial expression recognition via multi-task assisted correction","volume":"26","author":"Liu","year":"2023","journal-title":"IEEE Trans. Multimed."},{"key":"ref_36","doi-asserted-by":"crossref","unstructured":"Zhao, Z., Liu, Q., and Zhou, F. (2021, January 19\u201321). Robust lightweight facial expression recognition network with label distribution training. Proceedings of the AAAI Conference on Artificial Intelligence, Virtually.","DOI":"10.1609\/aaai.v35i4.16465"},{"key":"ref_37","doi-asserted-by":"crossref","first-page":"2033","DOI":"10.1109\/TCSVT.2022.3220669","article-title":"Toward facial expression recognition in the wild via noise-tolerant network","volume":"33","author":"Gu","year":"2022","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"ref_38","first-page":"1647","article-title":"Conditional adversarial domain adaptation","volume":"31","author":"Long","year":"2018","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"ref_39","doi-asserted-by":"crossref","first-page":"2439","DOI":"10.1109\/TIP.2018.2886767","article-title":"Occlusion aware facial expression recognition using CNN with attention mechanism","volume":"28","author":"Li","year":"2018","journal-title":"IEEE Trans. Image Process."},{"key":"ref_40","doi-asserted-by":"crossref","unstructured":"Lee, C.Y., Batra, T., Baig, M.H., and Ulbricht, D. (2019, January 15\u201320). Sliced wasserstein discrepancy for unsupervised domain adaptation. Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition, Long Beach, CA, USA.","DOI":"10.1109\/CVPR.2019.01053"},{"key":"ref_41","doi-asserted-by":"crossref","first-page":"1800","DOI":"10.1109\/TMM.2021.3072786","article-title":"Weakly-supervised facial expression recognition in the wild with noisy data","volume":"24","author":"Zhang","year":"2021","journal-title":"IEEE Trans. Multimed."},{"key":"ref_42","doi-asserted-by":"crossref","first-page":"4057","DOI":"10.1109\/TIP.2019.2956143","article-title":"Region attention networks for pose and occlusion robust facial expression recognition","volume":"29","author":"Wang","year":"2020","journal-title":"IEEE Trans. Image Process."},{"key":"ref_43","doi-asserted-by":"crossref","first-page":"550","DOI":"10.1007\/s11263-017-1055-1","article-title":"From Facial Expression Recognition to Interpersonal Relation Prediction","volume":"126","author":"Zhang","year":"2018","journal-title":"Int. J. Comput. Vis."},{"key":"ref_44","doi-asserted-by":"crossref","unstructured":"Wang, K., Peng, X., Yang, J., Lu, S., and Qiao, Y. (2020, January 13\u201319). Suppressing Uncertainties for Large-Scale Facial Expression Recognition. Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA.","DOI":"10.1109\/CVPR42600.2020.00693"},{"key":"ref_45","doi-asserted-by":"crossref","unstructured":"Xu, R., Li, G., Yang, J., and Lin, L. (2019, January 27\u201328). Larger norm more transferable: An adaptive feature norm approach for unsupervised domain adaptation. Proceedings of the IEEE\/CVF International Conference on Computer Vision, Seoul, Republic of Korea.","DOI":"10.1109\/ICCV.2019.00151"},{"key":"ref_46","doi-asserted-by":"crossref","unstructured":"Shao, J., Wu, Z., Luo, Y., Huang, S., Pu, X., and Ren, Y. (2022, January 10\u201314). Self-paced label distribution learning for in-the-wild facial expression recognition. Proceedings of the 30th ACM International Conference on Multimedia, Lisboa, Portugal.","DOI":"10.1145\/3503161.3547960"},{"key":"ref_47","doi-asserted-by":"crossref","unstructured":"Shen, L., and Jin, X. (2024). VaBTFER: An Effective Variant Binary Transformer for Facial Expression Recognition. Sensors, 24.","DOI":"10.3390\/s24010147"},{"key":"ref_48","unstructured":"Wallach, H., Larochelle, H., Beygelzimer, A., d\u2019Alch\u00e9-Buc, F., Fox, E., and Garnett, R. (2019, January 8\u201314). ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language Tasks. Proceedings of the Advances in Neural Information Processing Systems, Vancouver, BC, Canada."}],"container-title":["Journal of Imaging"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/www.mdpi.com\/2313-433X\/12\/1\/24\/pdf","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,1,6]],"date-time":"2026-01-06T05:23:19Z","timestamp":1767676999000},"score":1,"resource":{"primary":{"URL":"https:\/\/www.mdpi.com\/2313-433X\/12\/1\/24"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,1,4]]},"references-count":48,"journal-issue":{"issue":"1","published-online":{"date-parts":[[2026,1]]}},"alternative-id":["jimaging12010024"],"URL":"https:\/\/doi.org\/10.3390\/jimaging12010024","relation":{},"ISSN":["2313-433X"],"issn-type":[{"value":"2313-433X","type":"electronic"}],"subject":[],"published":{"date-parts":[[2026,1,4]]}}}