{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,29]],"date-time":"2025-11-29T08:03:36Z","timestamp":1764403416813,"version":"3.40.3"},"publisher-location":"Cham","reference-count":38,"publisher":"Springer Nature Switzerland","isbn-type":[{"type":"print","value":"9783031781278"},{"type":"electronic","value":"9783031781285"}],"license":[{"start":{"date-parts":[[2024,11,30]],"date-time":"2024-11-30T00:00:00Z","timestamp":1732924800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,11,30]],"date-time":"2024-11-30T00:00:00Z","timestamp":1732924800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025]]},"DOI":"10.1007\/978-3-031-78128-5_26","type":"book-chapter","created":{"date-parts":[[2024,11,30]],"date-time":"2024-11-30T07:42:03Z","timestamp":1732952523000},"page":"400-417","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":1,"title":["Hand over\u00a0Face Gesture Classification with\u00a0Feature Driven Vision Transformer and\u00a0Supervised Contrastive Learning"],"prefix":"10.1007","author":[{"ORCID":"https:\/\/orcid.org\/0000-0003-1296-7748","authenticated-orcid":false,"given":"Kankana","family":"Roy","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-5185-3156","authenticated-orcid":false,"given":"Aparna","family":"Mohanty","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-0820-0616","authenticated-orcid":false,"given":"Rajiv","family":"Ranjan Sahay","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2024,11,30]]},"reference":[{"key":"26_CR1","unstructured":"https:\/\/www.indiabix.com\/body-language\/hand-to-face-gestures\/ (2019). Accessed 19 July 2008"},{"key":"26_CR2","unstructured":"Chen, T., Kornblith, S., Norouzi, M., Hinton, G.: A simple framework for contrastive learning of visual representations. In: International Conference on Machine Learning, pp. 1597\u20131607. PMLR (2020)"},{"key":"26_CR3","unstructured":"Dosovitskiy, A., et\u00a0al.: An image is worth 16$$\\times $$16 words: transformers for image recognition at scale. arXiv preprint arXiv:2010.11929 (2020)"},{"key":"26_CR4","unstructured":"El\u00a0Sayed, A.S., Tsuji, A., Terada, K.: Classification of hand over face gestures using deep learning. In: Proceedings of International Conference on Quality Control Artificial Vision, vol. 11172, pp. 319\u2013324. SPIE (2019)"},{"key":"26_CR5","doi-asserted-by":"publisher","first-page":"26756","DOI":"10.1109\/ACCESS.2022.3156598","volume":"10","author":"AP Fard","year":"2022","unstructured":"Fard, A.P., Mahoor, M.H.: Ad-corre: adaptive correlation-based loss for facial expression recognition in the wild. IEEE Access 10, 26756\u201326768 (2022)","journal-title":"IEEE Access"},{"key":"26_CR6","doi-asserted-by":"crossref","unstructured":"Gunes, H., Piccardi, M.: A bimodal face and body gesture database for automatic analysis of human nonverbal affective behavior. In: International Conference on Pattern Recogition, vol.\u00a01, pp. 1148\u20131153. IEEE (2006)","DOI":"10.1109\/ICPR.2006.39"},{"key":"26_CR7","unstructured":"Jia, C., et al.: Scaling up visual and vision-language representation learning with noisy text supervision. In: International. Conference on Machine Learning, pp. 4904\u20134916. PMLR (2021)"},{"key":"26_CR8","unstructured":"Khaireddin, Y., Chen, Z.: Facial emotion recognition: state of the art performance on FER2013. arXiv preprint arXiv:2105.03588 (2021)"},{"key":"26_CR9","first-page":"18661","volume":"33","author":"P Khosla","year":"2020","unstructured":"Khosla, P., et al.: Supervised contrastive learning. Neur. Inf. Process. Syst. 33, 18661\u201318673 (2020)","journal-title":"Neur. Inf. Process. Syst."},{"key":"26_CR10","doi-asserted-by":"crossref","unstructured":"Kollias, D.: Multi-label compound expression recognition: C-EXPR database & network. In: IEEE International Conference on Computer Vision and Pattern Recogition, pp. 5589\u20135598 (2023)","DOI":"10.1109\/CVPR52729.2023.00541"},{"key":"26_CR11","unstructured":"Kollias, D., Sharmanska, V., Zafeiriou, S.: Distribution matching for heterogeneous multi-task learning: a large-scale face study. arXiv preprint arXiv:2105.03790 (2021)"},{"key":"26_CR12","doi-asserted-by":"crossref","unstructured":"Kollias, D., Sharmanska, V., Zafeiriou, S.: Distribution matching for multi-task learning of classification tasks: a large-scale study on faces & beyond. In: AAAI Conference on Artificial Intelligence, vol.\u00a038, pp. 2813\u20132821 (2024)","DOI":"10.1609\/aaai.v38i3.28061"},{"key":"26_CR13","doi-asserted-by":"crossref","unstructured":"Li, S., Deng, W., Du, J.: Reliable crowdsourcing and deep locality-preserving learning for expression recognition in the wild. In: IEEE International Conference on Computer Vision Pattern Recogition, pp. 2852\u20132861 (2017)","DOI":"10.1109\/CVPR.2017.277"},{"key":"26_CR14","doi-asserted-by":"crossref","unstructured":"Li, T., Chen, X., Zhang, S., Dong, Z., Keutzer, K.: Cross-domain sentiment classification with contrastive learning and mutual information maximization. In: International Conference on Acoustics Speech Signal Processing, pp. 8203\u20138207. IEEE (2021)","DOI":"10.1109\/ICASSP39728.2021.9414930"},{"issue":"5","key":"26_CR15","doi-asserted-by":"publisher","first-page":"2439","DOI":"10.1109\/TIP.2018.2886767","volume":"28","author":"Y Li","year":"2018","unstructured":"Li, Y., Zeng, J., Shan, S., Chen, X.: Occlusion aware facial expression recognition using CNN with attention mechanism. IEEE Trans. Image Process. 28(5), 2439\u20132450 (2018)","journal-title":"IEEE Trans. Image Process."},{"issue":"2","key":"26_CR16","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/2946796","volume":"6","author":"M Mahmoud","year":"2016","unstructured":"Mahmoud, M., Baltru\u0161aitis, T., Robinson, P.: Automatic analysis of naturalistic hand-over-face gestures. ACM Trans. Interactive Intell. Syst. 6(2), 1\u201318 (2016)","journal-title":"ACM Trans. Interactive Intell. Syst."},{"key":"26_CR17","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"205","DOI":"10.1007\/978-3-642-24600-5_24","volume-title":"Affective Computing and Intelligent Interaction","author":"M Mahmoud","year":"2011","unstructured":"Mahmoud, M., Baltru\u0161aitis, T., Robinson, P., Riek, L.D.: 3D corpus of spontaneous complex mental states. In: D\u2019Mello, S., Graesser, A., Schuller, B., Martin, J.-C. (eds.) ACII 2011. LNCS, vol. 6974, pp. 205\u2013214. Springer, Heidelberg (2011). https:\/\/doi.org\/10.1007\/978-3-642-24600-5_24"},{"key":"26_CR18","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"481","DOI":"10.1007\/978-3-642-02611-9_48","volume-title":"Image Analysis and Recognition","author":"M Mahmoud","year":"2009","unstructured":"Mahmoud, M., El-Kaliouby, R., Goneid, A.: Towards communicative face occlusions: machine detection of hand-over-face gestures. In: Kamel, M., Campilho, A. (eds.) ICIAR 2009. LNCS, vol. 5627, pp. 481\u2013490. Springer, Heidelberg (2009). https:\/\/doi.org\/10.1007\/978-3-642-02611-9_48"},{"key":"26_CR19","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"248","DOI":"10.1007\/978-3-642-24571-8_27","volume-title":"Affective Computing and Intelligent Interaction","author":"M Mahmoud","year":"2011","unstructured":"Mahmoud, M., Robinson, P.: Interpreting hand-over-face gestures. In: D\u2019Mello, S., Graesser, A., Schuller, B., Martin, J.-C. (eds.) ACII 2011. LNCS, vol. 6975, pp. 248\u2013255. Springer, Heidelberg (2011). https:\/\/doi.org\/10.1007\/978-3-642-24571-8_27"},{"key":"26_CR20","doi-asserted-by":"crossref","unstructured":"Mahmoud, M.M., Baltru\u0161aitis, T., Robinson, P.: Automatic detection of naturalistic hand-over-face gesture descriptors. In: Proceedings of International Conference on Multimodal Interaction, pp. 319\u2013326 (2014)","DOI":"10.1145\/2663204.2663258"},{"issue":"9","key":"26_CR21","doi-asserted-by":"publisher","first-page":"3046","DOI":"10.3390\/s21093046","volume":"21","author":"S Minaee","year":"2021","unstructured":"Minaee, S., Minaei, M., Abdolrashidi, A.: Deep-emotion: facial expression recognition using attentional convolutional network. Sensors 21(9), 3046 (2021)","journal-title":"Sensors"},{"key":"26_CR22","doi-asserted-by":"publisher","first-page":"80","DOI":"10.1016\/j.patcog.2017.10.033","volume":"76","author":"JC Nunez","year":"2018","unstructured":"Nunez, J.C., Cabido, R., Pantrigo, J.J., Montemayor, A.S., Velez, J.F.: Convolutional neural networks and long short-term memory for skeleton-based human activity and hand gesture recognition. Pattern Recogit. 76, 80\u201394 (2018)","journal-title":"Pattern Recogit."},{"key":"26_CR23","doi-asserted-by":"crossref","unstructured":"Patii, J., Patei, R., Kothiya, S.: Human mental states recognition under face occlusion. In: Proceedings of International Conference Innovations and Information Embedded Communication System, pp.\u00a01\u20135. IEEE (2017)","DOI":"10.1109\/ICIIECS.2017.8275993"},{"key":"26_CR24","unstructured":"Pease, B., Pease, A.: The definitive book of body language: The hidden meaning behind people\u2019s gestures and expressions. Bantam (2008)"},{"key":"26_CR25","unstructured":"Pham, H., et\u00a0al.: Combined scaling for open-vocabulary image classification. arXiv preprint arXiv:2111.10050 (2021)"},{"key":"26_CR26","doi-asserted-by":"crossref","unstructured":"Pham, L., Vu, T.H., Tran, T.A.: Facial expression recognition using residual masking network. In: International Conference on Pattern Recongition, pp. 4513\u20134519. IEEE (2021)","DOI":"10.1109\/ICPR48806.2021.9411919"},{"key":"26_CR27","unstructured":"Radford, A., et\u00a0al.: Learning transferable visual models from natural language supervision. In: International Conference on Machine Learning, pp. 8748\u20138763. PMLR (2021)"},{"key":"26_CR28","doi-asserted-by":"crossref","unstructured":"Ridnik, T., Lawen, H., Noy, A., Ben\u00a0Baruch, E., Sharir, G., Friedman, I.: Tresnet: high performance gpu-dedicated architecture. In: Proceedings of IEEE\/CVF Winter Conference on Application of Computer Vision, pp. 1400\u20131409 (2021)","DOI":"10.1109\/WACV48630.2021.00144"},{"key":"26_CR29","unstructured":"Ridnik, T., Sharir, G., Ben-Cohen, A., Ben-Baruch, E., Noy, A.: Ml-decoder: scalable and versatile classification head. arXiv preprint arXiv:2111.12933 (2021)"},{"key":"26_CR30","doi-asserted-by":"publisher","first-page":"211","DOI":"10.1007\/s11263-015-0816-y","volume":"115","author":"O Russakovsky","year":"2015","unstructured":"Russakovsky, O., et al.: Imagenet large scale visual recognition challenge. Intl. J. Comput. Vis. 115, 211\u2013252 (2015)","journal-title":"Intl. J. Comput. Vis."},{"key":"26_CR31","doi-asserted-by":"crossref","unstructured":"Song, W., Han, J., Song, H.: Contrastive embedding learning method for respiratory sound classification. In: International Conference on Acoustics Speech Signal Processing, pp. 1275\u20131279. IEEE (2021)","DOI":"10.1109\/ICASSP39728.2021.9414385"},{"issue":"12","key":"26_CR32","doi-asserted-by":"publisher","first-page":"1753","DOI":"10.1109\/LSP.2019.2942138","volume":"26","author":"Y Tian","year":"2019","unstructured":"Tian, Y., Cheng, J., Li, Y., Wang, S.: Secondary information aware facial expression recognition. IEEE Sig. Process. Lett. 26(12), 1753\u20131757 (2019)","journal-title":"IEEE Sig. Process. Lett."},{"key":"26_CR33","doi-asserted-by":"crossref","unstructured":"Vulpe-Grigora\u015fi, A., Grigore, O.: Convolutional neural network hyperparameters optimization for facial emotion recognition. In: International Symposium on Advanced Topics Electrical Engineering, pp.\u00a01\u20135. IEEE (2021)","DOI":"10.1109\/ATEE52255.2021.9425073"},{"key":"26_CR34","doi-asserted-by":"publisher","first-page":"4057","DOI":"10.1109\/TIP.2019.2956143","volume":"29","author":"K Wang","year":"2020","unstructured":"Wang, K., Peng, X., Yang, J., Meng, D., Qiao, Y.: Region attention networks for pose and occlusion robust facial expression recognition. IEEE Trans. Image Process. 29, 4057\u20134069 (2020)","journal-title":"IEEE Trans. Image Process."},{"key":"26_CR35","doi-asserted-by":"crossref","unstructured":"Wu, K., Peng, H., Chen, M., Fu, J., Chao, H.: Rethinking and improving relative position encoding for vision transformer. In: Proceedings of IEEE\/CVF International Conference on Computer Vision, pp. 10033\u201310041 (2021)","DOI":"10.1109\/ICCV48922.2021.00988"},{"issue":"7","key":"26_CR36","doi-asserted-by":"publisher","first-page":"1319","DOI":"10.1109\/TMM.2016.2557721","volume":"18","author":"J Yan","year":"2016","unstructured":"Yan, J., Zheng, W., Xu, Q., Lu, G., Li, H., Wang, B.: Sparse kernel reduced-rank regression for bimodal emotion recognition from facial expression and speech. IEEE Trans. Multimedia 18(7), 1319\u20131329 (2016)","journal-title":"IEEE Trans. Multimedia"},{"key":"26_CR37","unstructured":"Yu, J., Wang, Z., Vasudevan, V., Yeung, L., Seyedhosseini, M., Wu, Y.: Coca: contrastive captioners are image-text foundation models. arXiv preprint arXiv:2205.01917 (2022)"},{"key":"26_CR38","unstructured":"Yuan, L., et\u00a0al.: Florence: a new foundation model for computer vision. arXiv preprint arXiv:2111.11432 (2021)"}],"container-title":["Lecture Notes in Computer Science","Pattern Recognition"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-031-78128-5_26","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,11,30]],"date-time":"2024-11-30T08:06:30Z","timestamp":1732953990000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-031-78128-5_26"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,11,30]]},"ISBN":["9783031781278","9783031781285"],"references-count":38,"URL":"https:\/\/doi.org\/10.1007\/978-3-031-78128-5_26","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2024,11,30]]},"assertion":[{"value":"30 November 2024","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"ICPR","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Pattern Recognition","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Kolkata","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"India","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2024","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"1 December 2024","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"5 December 2024","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"27","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"icpr2024","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/icpr2024.org\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}