{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,20]],"date-time":"2026-02-20T15:16:07Z","timestamp":1771600567181,"version":"3.50.1"},"reference-count":37,"publisher":"Springer Science and Business Media LLC","issue":"1","license":[{"start":{"date-parts":[[2026,2,15]],"date-time":"2026-02-15T00:00:00Z","timestamp":1771113600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by-nc-nd\/4.0"},{"start":{"date-parts":[[2026,2,20]],"date-time":"2026-02-20T00:00:00Z","timestamp":1771545600000},"content-version":"vor","delay-in-days":5,"URL":"https:\/\/creativecommons.org\/licenses\/by-nc-nd\/4.0"}],"funder":[{"name":"Research on the Construction Path of AI Virtual Human-Based Science and Technology Popularization in Zhejiang Province","award":["2025C35083"],"award-info":[{"award-number":["2025C35083"]}]},{"name":"Research on the Construction Path of AI Virtual Human-Based Science and Technology Popularization in Zhejiang Province","award":["2025C35083"],"award-info":[{"award-number":["2025C35083"]}]},{"name":"Research on the Construction Path of AI Virtual Human-Based Science and Technology Popularization in Zhejiang Province","award":["2025C35083"],"award-info":[{"award-number":["2025C35083"]}]},{"name":"Research on the Construction Path of AI Virtual Human-Based Science and Technology Popularization in Zhejiang Province","award":["2025C35083"],"award-info":[{"award-number":["2025C35083"]}]},{"name":"Research on AI Virtual Humans Empowering Live-Streaming E-commerce Marketing in Zhejiang","award":["SZYYB202402"],"award-info":[{"award-number":["SZYYB202402"]}]},{"name":"Research on AI Virtual Humans Empowering Live-Streaming E-commerce Marketing in Zhejiang","award":["SZYYB202402"],"award-info":[{"award-number":["SZYYB202402"]}]},{"name":"Research on AI Virtual Humans Empowering Live-Streaming E-commerce Marketing in Zhejiang","award":["SZYYB202402"],"award-info":[{"award-number":["SZYYB202402"]}]},{"name":"Research on AI Virtual Humans Empowering Live-Streaming E-commerce Marketing in Zhejiang","award":["SZYYB202402"],"award-info":[{"award-number":["SZYYB202402"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Int J Comput Intell Syst"],"DOI":"10.1007\/s44196-026-01183-5","type":"journal-article","created":{"date-parts":[[2026,2,15]],"date-time":"2026-02-15T01:23:07Z","timestamp":1771118587000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["Interactive AI Virtual Human Image Recognition Based on Computer Vision"],"prefix":"10.1007","volume":"19","author":[{"given":"Huichao","family":"Guo","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Runhua","family":"Huang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zhe","family":"Wu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ming","family":"Lei","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2026,2,15]]},"reference":[{"issue":"8","key":"1183_CR1","doi-asserted-by":"publisher","first-page":"2939","DOI":"10.1007\/s00371-021-02166-7","volume":"38","author":"K Bayoudh","year":"2022","unstructured":"Bayoudh, K., Knani, R., Hamdaoui, F., et al.: A survey on deep multimodal learning for computer vision: advances, trends, applications, and datasets. Visual Comput. 38(8), 2939\u20132970 (2022)","journal-title":"Visual Comput."},{"issue":"3","key":"1183_CR2","doi-asserted-by":"publisher","first-page":"1797","DOI":"10.1007\/s10055-023-00773-4","volume":"27","author":"X Li","year":"2023","unstructured":"Li, X., Chen, H., He, S., et al.: Action recognition based on multimode fusion for VR online platform. Virtual Real. 27(3), 1797\u20131812 (2023)","journal-title":"Virtual Real."},{"issue":"8","key":"1183_CR3","doi-asserted-by":"publisher","first-page":"9320","DOI":"10.1007\/s11227-022-05026-w","volume":"79","author":"A Moin","year":"2023","unstructured":"Moin, A., Aadil, F., Ali, Z., et al.: Emotion recognition framework using multiple modalities for an effective human\u2013computer interaction. J. Supercomputing. 79(8), 9320\u20139349 (2023)","journal-title":"J. Supercomputing"},{"issue":"1","key":"1183_CR4","doi-asserted-by":"publisher","first-page":"1581","DOI":"10.1007\/s40747-023-01173-6","volume":"10","author":"J Qi","year":"2024","unstructured":"Qi, J., Ma, L., Cui, Z., et al.: Computer vision-based hand gesture recognition for human-robot interaction: a review. Complex. Intell. Syst. 10(1), 1581\u20131606 (2024)","journal-title":"Complex. Intell. Syst."},{"issue":"18","key":"1183_CR5","doi-asserted-by":"publisher","first-page":"56039","DOI":"10.1007\/s11042-023-17347-w","volume":"83","author":"X Zhu","year":"2024","unstructured":"Zhu, X., Huang, Y., Wang, X., et al.: Emotion recognition based on brain-like multimodal hierarchical perception. Multimedia Tools Appl. 83(18), 56039\u201356057 (2024)","journal-title":"Multimedia Tools Appl."},{"key":"1183_CR6","doi-asserted-by":"publisher","first-page":"47070","DOI":"10.1109\/ACCESS.2023.3274744","volume":"11","author":"F Alzamzami","year":"2023","unstructured":"Alzamzami, F., El Saddik, A.: Transformer-based feature fusion approach for multimodal visual sentiment recognition using tweets in the wild. IEEE Access. 11, 47070\u201347079 (2023)","journal-title":"IEEE Access."},{"issue":"2","key":"1183_CR7","doi-asserted-by":"publisher","first-page":"1459","DOI":"10.1080\/10447318.2024.2316376","volume":"41","author":"Y Wang","year":"2025","unstructured":"Wang, Y., Wang, L., Siau, K.L.: Human-centered interaction in virtual worlds: a new era of generative artificial intelligence and metaverse. Int. J. Human\u2013Computer Interact. 41(2), 1459\u20131501 (2025)","journal-title":"Int. J. Human\u2013Computer Interact."},{"issue":"27","key":"1183_CR8","doi-asserted-by":"publisher","first-page":"69111","DOI":"10.1007\/s11042-023-18096-6","volume":"83","author":"Z Ding","year":"2024","unstructured":"Ding, Z., Ji, Y., Gan, Y., et al.: Current status and trends of technology, methods, and applications of Human\u2013Computer intelligent interaction (HCII): a bibliometric research. Multimedia Tools Appl. 83(27), 69111\u201369144 (2024)","journal-title":"Multimedia Tools Appl."},{"issue":"14","key":"1183_CR9","doi-asserted-by":"publisher","first-page":"9980","DOI":"10.1021\/acsnano.3c11281","volume":"18","author":"T Wang","year":"2024","unstructured":"Wang, T., Jin, T., Lin, W., et al.: Multimodal sensors enabled autonomous soft robotic system with self-adaptive manipulation. ACS Nano. 18(14), 9980\u20139996 (2024)","journal-title":"ACS Nano"},{"issue":"2","key":"1183_CR10","doi-asserted-by":"publisher","first-page":"67","DOI":"10.1109\/MMUL.2021.3068387","volume":"28","author":"T Mittal","year":"2021","unstructured":"Mittal, T., Bera, A., Manocha, D.: Multimodal and context-aware emotion perception model with multiplicative fusion. IEEE MultiMedia. 28(2), 67\u201375 (2021)","journal-title":"IEEE MultiMedia"},{"issue":"4","key":"1183_CR11","doi-asserted-by":"publisher","first-page":"817","DOI":"10.1109\/JSAC.2023.3345431","volume":"42","author":"X Zhou","year":"2024","unstructured":"Zhou, X., Yang, Q., Zheng, X., et al.: Personalized federated learning with model-contrastive learning for multi-modal user modeling in human-centric metaverse. IEEE J. Sel. Areas Commun. 42(4), 817\u2013831 (2024)","journal-title":"IEEE J. Sel. Areas Commun."},{"issue":"12","key":"1183_CR12","doi-asserted-by":"publisher","first-page":"10028","DOI":"10.1109\/TNNLS.2022.3163771","volume":"34","author":"Q Song","year":"2022","unstructured":"Song, Q., Sun, B., Li, S.: Multimodal sparse transformer network for audio-visual speech recognition. IEEE Trans. Neural Networks Learn. Syst. 34(12), 10028\u201310038 (2022)","journal-title":"IEEE Trans. Neural Networks Learn. Syst."},{"issue":"9","key":"1183_CR13","doi-asserted-by":"publisher","first-page":"1773","DOI":"10.1038\/s41591-022-01981-2","volume":"28","author":"JN Acosta","year":"2022","unstructured":"Acosta, J.N., Falcone, G.J., Rajpurkar, P., et al.: Multimodal biomedical AI. Nat. Med. 28(9), 1773\u20131784 (2022)","journal-title":"Nat. Med."},{"issue":"4","key":"1183_CR14","doi-asserted-by":"publisher","first-page":"338","DOI":"10.1080\/23335777.2022.2104379","volume":"9","author":"G Abbattista","year":"2023","unstructured":"Abbattista, G., Chimienti, M., Dentamaro, V., Giglio, P., Impedovo, D., Pirlo, G., Rosato, G.: A biometric-based system for unsupervised anomaly behaviour detection at the pawn shop. Cyber-Phys. Syst. 9(4), 338\u2013356 (2023)","journal-title":"Cyber-Physical Syst."},{"issue":"4","key":"1183_CR15","doi-asserted-by":"publisher","first-page":"1374","DOI":"10.1109\/TCDS.2024.3357618","volume":"16","author":"R Wang","year":"2024","unstructured":"Wang, R., Jo, W., Zhao, D., et al.: Husformer: A multimodal transformer for multimodal human state recognition. IEEE Trans. Cogn. Dev. Syst. 16(4), 1374\u20131390 (2024)","journal-title":"IEEE Trans. Cogn. Dev. Syst."},{"issue":"5","key":"1183_CR16","doi-asserted-by":"publisher","first-page":"4145","DOI":"10.1007\/s00521-022-07937-4","volume":"35","author":"G Saleem","year":"2023","unstructured":"Saleem, G., Bajwa, U.I., Raza, R.H.: Toward human activity recognition: a survey. Neural Comput. Appl. 35(5), 4145\u20134182 (2023)","journal-title":"Neural Comput. Appl."},{"issue":"12","key":"1183_CR17","doi-asserted-by":"publisher","first-page":"15098","DOI":"10.1109\/TPAMI.2023.3305243","volume":"45","author":"F Zhan","year":"2023","unstructured":"Zhan, F., Yu, Y., Wu, R., et al.: Multimodal image synthesis and editing:the generative AI era. IEEE Trans. Pattern Anal. Mach. Intell. 45(12), 15098\u201315119 (2023)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"issue":"6","key":"1183_CR18","doi-asserted-by":"publisher","first-page":"1346","DOI":"10.1007\/s11263-023-01761-6","volume":"131","author":"H Chen","year":"2023","unstructured":"Chen, H., Shi, H., Liu, X., et al.: Smg: a micro-gesture dataset towards spontaneous body gestures for emotional stress state analysis. Int. J. Comput. Vision. 131(6), 1346\u20131366 (2023)","journal-title":"Int. J. Comput. Vision"},{"issue":"2","key":"1183_CR19","doi-asserted-by":"publisher","first-page":"023102","DOI":"10.1117\/1.OE.62.2.023102","volume":"62","author":"R Kumar","year":"2023","unstructured":"Kumar, R., Kumar, S.: Survey on artificial intelligence-based human action recognition in video sequences. Opt. Eng. 62(2), 023102\u2013023102 (2023)","journal-title":"Opt. Eng."},{"issue":"4","key":"1183_CR20","doi-asserted-by":"publisher","first-page":"447","DOI":"10.1007\/s11633-022-1410-8","volume":"20","author":"X Wang","year":"2023","unstructured":"Wang, X., Chen, G., Qian, G., et al.: Large-scale multi-modal pre-trained models: a comprehensive survey. Mach. Intell. Res. 20(4), 447\u2013482 (2023)","journal-title":"Mach. Intell. Res."},{"issue":"10","key":"1183_CR21","first-page":"1","volume":"56","author":"PP Liang","year":"2024","unstructured":"Liang, P.P., Zadeh, A., Morency, L.P.: Foundations & trends in multimodal machine learning: principles, challenges, and open questions. ACM Comput. Surveys. 56(10), 1\u201342 (2024)","journal-title":"ACM Comput. Surveys"},{"issue":"4","key":"1183_CR22","doi-asserted-by":"publisher","first-page":"341","DOI":"10.52783\/pst.196","volume":"47","author":"NVN Vemuri","year":"2023","unstructured":"Vemuri, N.V.N., Thaneeru, N.: Enhancing human-robot collaboration in industry 4.0 with AI-driven HRI. Power Syst. Technol. 47(4), 341\u2013358 (2023)","journal-title":"Power Syst. Technol."},{"issue":"3","key":"1183_CR23","doi-asserted-by":"publisher","first-page":"2339","DOI":"10.1109\/TASE.2021.3074873","volume":"19","author":"W Wang","year":"2021","unstructured":"Wang, W., Li, R., Chen, Y., et al.: Predicting human intentions in human\u2013robot hand-over tasks through multimodal learning. IEEE Trans. Autom. Sci. Eng. 19(3), 2339\u20132353 (2021)","journal-title":"IEEE Trans. Autom. Sci. Eng."},{"issue":"9","key":"1183_CR24","doi-asserted-by":"publisher","first-page":"2332","DOI":"10.1080\/09588221.2021.1879162","volume":"35","author":"RR Divekar","year":"2022","unstructured":"Divekar, R.R., Drozdal, J., Chabot, S., et al.: Foreign language acquisition via artificial intelligence and extended reality: design and evaluation. Comput. Assist. Lang. Learn. 35(9), 2332\u20132360 (2022)","journal-title":"Comput. Assist. Lang. Learn."},{"issue":"20","key":"1183_CR25","doi-asserted-by":"publisher","first-page":"6847","DOI":"10.1080\/00207543.2022.2138611","volume":"61","author":"JM Ro\u017eanec","year":"2023","unstructured":"Ro\u017eanec, J.M., Novalija, I., Zajec, P., et al.: Human-centric artificial intelligence architecture for industry 5.0 applications. Int. J. Prod. Res. 61(20), 6847\u20136872 (2023)","journal-title":"Int. J. Prod. Res."},{"issue":"4","key":"1183_CR26","doi-asserted-by":"publisher","first-page":"3048","DOI":"10.1109\/TAFFC.2022.3230672","volume":"14","author":"S Song","year":"2022","unstructured":"Song, S., Shao, Z., Jaiswal, S., et al.: Learning person-specific cognition from facial reactions for automatic personality recognition. IEEE Trans. Affect. Comput. 14(4), 3048\u20133065 (2022)","journal-title":"IEEE Trans. Affect. Comput."},{"issue":"15","key":"1183_CR27","doi-asserted-by":"publisher","first-page":"16515","DOI":"10.1109\/JSEN.2023.3285214","volume":"23","author":"L Yue","year":"2023","unstructured":"Yue, L., Zongxing, L., Hui, D., et al.: How to achieve human\u2013machine interaction by foot gesture recognition: a review. IEEE Sens. J. 23(15), 16515\u201316528 (2023)","journal-title":"IEEE Sens. J."},{"issue":"3","key":"1183_CR28","doi-asserted-by":"publisher","first-page":"1833","DOI":"10.1007\/s10462-022-10210-8","volume":"56","author":"K Hu","year":"2023","unstructured":"Hu, K., Jin, J., Zheng, F., et al.: Overview of behavior recognition based on deep learning. Artif. Intell. Rev. 56(3), 1833\u20131865 (2023)","journal-title":"Artif. Intell. Rev."},{"issue":"5","key":"1183_CR29","doi-asserted-by":"publisher","first-page":"4557","DOI":"10.1007\/s10462-022-10294-2","volume":"56","author":"H Liu","year":"2023","unstructured":"Liu, H., Zhou, Y., Liu, B., et al.: Incremental learning with neural networks for computer vision: a survey. Artif. Intell. Rev. 56(5), 4557\u20134589 (2023)","journal-title":"Artif. Intell. Rev."},{"issue":"3","key":"1183_CR30","doi-asserted-by":"publisher","first-page":"688","DOI":"10.1109\/TETC.2022.3231746","volume":"12","author":"L Jia","year":"2023","unstructured":"Jia, L., Ma, T., Rong, H., et al.: Affective region recognition and fusion network for target-level multimodal sentiment classification. IEEE Trans. Emerg. Top. Comput. 12(3), 688\u2013699 (2023)","journal-title":"IEEE Trans. Emerg. Top. Comput."},{"issue":"9","key":"1183_CR31","doi-asserted-by":"publisher","first-page":"13954","DOI":"10.1109\/TITS.2021.3127217","volume":"23","author":"Z Tan","year":"2021","unstructured":"Tan, Z., Dai, N., Su, Y., et al.: Human\u2013machine interaction in intelligent and connected vehicles: a review of status quo, issues, and opportunities. IEEE Trans. Intell. Transp. Syst. 23(9), 13954\u201313975 (2021)","journal-title":"IEEE Trans. Intell. Transp. Syst."},{"issue":"6","key":"1183_CR32","doi-asserted-by":"publisher","first-page":"59","DOI":"10.1109\/MSP.2021.3106895","volume":"38","author":"S Zhao","year":"2021","unstructured":"Zhao, S., Jia, G., Yang, J., et al.: Emotion recognition from multiple modalities: fundamentals and methodologies. IEEE. Signal. Process. Mag. 38(6), 59\u201373 (2021)","journal-title":"IEEE. Signal. Process. Mag."},{"issue":"12","key":"1183_CR33","doi-asserted-by":"publisher","first-page":"7659","DOI":"10.1109\/TCYB.2022.3195739","volume":"53","author":"T Zhang","year":"2022","unstructured":"Zhang, T., Li, S., Chen, B., et al.: Aia-net: adaptive interactive attention network for text\u2013audio emotion recognition. IEEE Trans. Cybernetics. 53(12), 7659\u20137671 (2022)","journal-title":"IEEE Trans. Cybernetics"},{"issue":"2","key":"1183_CR34","doi-asserted-by":"publisher","first-page":"715","DOI":"10.1109\/TKDE.2022.3224228","volume":"36","author":"X Zhu","year":"2022","unstructured":"Zhu, X., Li, Z., Wang, X., et al.: Multi-modal knowledge graph construction and application: a survey. IEEE Trans. Knowl. Data Eng. 36(2), 715\u2013735 (2022)","journal-title":"IEEE Trans. Knowl. Data Eng."},{"issue":"9","key":"1183_CR35","doi-asserted-by":"publisher","first-page":"5318","DOI":"10.1109\/TCSVT.2023.3247822","volume":"33","author":"M Hou","year":"2023","unstructured":"Hou, M., Zhang, Z., Liu, C., et al.: Semantic alignment network for multi-modal emotion recognition. IEEE Trans. Circuits Syst. Video Technol. 33(9), 5318\u20135329 (2023)","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"issue":"1","key":"1183_CR36","doi-asserted-by":"publisher","first-page":"302","DOI":"10.1007\/s11263-022-01702-9","volume":"131","author":"K Vo","year":"2023","unstructured":"Vo, K., Truong, S., Yamazaki, K., et al.: Aoe-net: entities interactions modeling with adaptive attention mechanism for Temporal action proposals generation. Int. J. Comput. Vision. 131(1), 302\u2013323 (2023)","journal-title":"Int. J. Comput. Vision"},{"issue":"5","key":"1183_CR37","doi-asserted-by":"publisher","first-page":"1057","DOI":"10.1111\/bjet.13325","volume":"54","author":"S J\u00e4rvel\u00e4","year":"2023","unstructured":"J\u00e4rvel\u00e4, S., Nguyen, A., Hadwin, A.: Human and artificial intelligence collaboration for socially shared regulation in learning. Br. J. Edu. Technol. 54(5), 1057\u20131076 (2023)","journal-title":"Br. J. Edu. Technol."}],"container-title":["International Journal of Computational Intelligence Systems"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s44196-026-01183-5","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s44196-026-01183-5.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s44196-026-01183-5.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,2,20]],"date-time":"2026-02-20T14:38:32Z","timestamp":1771598312000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s44196-026-01183-5"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,2,15]]},"references-count":37,"journal-issue":{"issue":"1","published-online":{"date-parts":[[2026,12]]}},"alternative-id":["1183"],"URL":"https:\/\/doi.org\/10.1007\/s44196-026-01183-5","relation":{},"ISSN":["1875-6883"],"issn-type":[{"value":"1875-6883","type":"electronic"}],"subject":[],"published":{"date-parts":[[2026,2,15]]},"assertion":[{"value":"5 July 2025","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"13 January 2026","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"21 January 2026","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"15 February 2026","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that there are no conflicts of interest regarding the publication of this article.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}],"article-number":"87"}}