{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,1]],"date-time":"2026-05-01T11:15:28Z","timestamp":1777634128630,"version":"3.51.4"},"reference-count":49,"publisher":"Springer Science and Business Media LLC","issue":"5","license":[{"start":{"date-parts":[[2023,7,8]],"date-time":"2023-07-08T00:00:00Z","timestamp":1688774400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2023,7,8]],"date-time":"2023-07-08T00:00:00Z","timestamp":1688774400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"DOI":"10.13039\/501100004541","name":"Ministry of Education, India","doi-asserted-by":"publisher","id":[{"id":"10.13039\/501100004541","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001409","name":"Department of Science and Technology, Ministry of Science and Technology, India","doi-asserted-by":"publisher","award":["IFA17-221"],"award-info":[{"award-number":["IFA17-221"]}],"id":[{"id":"10.13039\/501100001409","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimedia Systems"],"published-print":{"date-parts":[[2023,10]]},"DOI":"10.1007\/s00530-023-01132-8","type":"journal-article","created":{"date-parts":[[2023,7,8]],"date-time":"2023-07-08T15:02:18Z","timestamp":1688828538000},"page":"2603-2614","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":6,"title":["Early-stage autism diagnosis using action videos and contrastive feature learning"],"prefix":"10.1007","volume":"29","author":[{"given":"Asha","family":"Rani","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Pankaj","family":"Yadav","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yashaswi","family":"Verma","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2023,7,8]]},"reference":[{"key":"1132_CR1","unstructured":"Chen, T., Kornblith, S., Norouzi, M., Hinton, G.: A simple framework for contrastive learning of visual representations. In: International Conference on Machine Learning (ICML) (2020)"},{"key":"1132_CR2","first-page":"18661","volume":"33","author":"P Khosla","year":"2020","unstructured":"Khosla, P., Teterwak, P., Wang, C., Sarna, A., Tian, Y., Isola, P., Maschinot, A., Liu, C., Krishnan, D.: Supervised contrastive learning. Adv. Neural Inf. Process. Syst. 33, 18661\u201318673 (2020)","journal-title":"Adv. Neural Inf. Process. Syst."},{"key":"1132_CR3","doi-asserted-by":"crossref","unstructured":"He, K., Fan, H., Wu, Y., Xie, S., Girshick, R.B.: Momentum contrast for unsupervised visual representation learning. In: CVPR (2020)","DOI":"10.1109\/CVPR42600.2020.00975"},{"key":"1132_CR4","doi-asserted-by":"crossref","unstructured":"Chen, X., He, K.: Exploring simple Siamese representation learning. In: CVPR (2021)","DOI":"10.1109\/CVPR46437.2021.01549"},{"key":"1132_CR5","doi-asserted-by":"crossref","unstructured":"Maenner, M., Shaw, K., Bakian, A., Bilder, D., Durkin, M., Esler, A., Furnier, S., Hallas- Muchow, L., Hall-Lande, J., Hudson, A., Hughes, M., Patrick, M., Pierce, K., Poyn-ter, J., Salinas, A, Shenouda J, Vehorn A, Warren Z, Constantino J, Cogswell M.: Prevalence and Characteristics of Autism Spectrum Disorder among Children Aged 8 years - Autism and Developmental Disabilities Monitoring Network, 11 sites, United States, 2018. Morbidity and mortality weekly report. Surveillance summaries (Washington, D.C. : 2002) 70, 1\u201316 (2021)","DOI":"10.15585\/mmwr.ss7011a1"},{"key":"1132_CR6","doi-asserted-by":"publisher","first-page":"888","DOI":"10.1002\/aur.1615","volume":"9","author":"W Liu","year":"2016","unstructured":"Liu, W., Li, M., Yi, L.: Identifying children with autism spectrum disorder based on their face processing abnormality: A machine learning framework. Autism Res. 9, 888\u2013898 (2016)","journal-title":"Autism Res."},{"key":"1132_CR7","doi-asserted-by":"crossref","unstructured":"Jiang, M., Zhao, Q.: Learning visual attention to identify people with autism spectrum disorder. In: 2017 IEEE International Conference on Computer Vision (ICCV), pp. 3287\u20133296 (2017)","DOI":"10.1109\/ICCV.2017.354"},{"issue":"2","key":"1132_CR8","doi-asserted-by":"publisher","first-page":"333","DOI":"10.1002\/aur.2376","volume":"14","author":"M Ruan","year":"2021","unstructured":"Ruan, M., Webster, P., Li, X., Wang, S.: Deep neural network reveals the world of autism from a first-person perspective. Autism Res. 14(2), 333\u2013342 (2021)","journal-title":"Autism Res."},{"key":"1132_CR9","doi-asserted-by":"crossref","unstructured":"Zunino, A., Morerio, P., Cavallo, A., Ansuini, C., Podda, J., Battaglia, F., Veneselli, E., Becchio, C., Murino, V.: Video gesture analysis for autism spectrum disorder detection. In: 2018 24th International Conference on Pattern Recognition (ICPR), pp. 3421\u20133426 (2018)","DOI":"10.1109\/ICPR.2018.8545095"},{"key":"1132_CR10","doi-asserted-by":"crossref","unstructured":"Tian, Y., Min, X., Zhai, G., Gao, Z.: Video-based early ASD detection via temporal pyramid networks. In: 2019 IEEE International Conference on Multimedia and Expo (ICME), pp. 272\u2013277 (2019)","DOI":"10.1109\/ICME.2019.00055"},{"key":"1132_CR11","doi-asserted-by":"crossref","unstructured":"Sun, K., Li, L., Li, L., He, N., Zhu, J.: Spatial attentional bilinear 3d convolutional network for video-based autism spectrum disorder detection. In: ICASSP 2020 - 2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 3387\u20133391 (2020)","DOI":"10.1109\/ICASSP40776.2020.9054641"},{"issue":"6","key":"1132_CR12","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1371\/journal.pone.0253094","volume":"16","author":"MNA Tawhid","year":"2021","unstructured":"Tawhid, M.N.A., Siuly, S., Wang, H., Whittaker, F., Wang, K., Zhang, Y.: A spectrogram image based intelligent technique for automatic detection of autism spectrum disorder from eeg. PLOS One 16(6), 1\u201320 (2021)","journal-title":"PLOS One"},{"key":"1132_CR13","doi-asserted-by":"publisher","DOI":"10.1016\/j.nicl.2020.102181","volume":"25","author":"M Raki\u0107","year":"2020","unstructured":"Raki\u0107, M., Cabezas, M., Kushibar, K., Oliver, A., Llad\u00f3, X.: Improving the detection of autism spectrum disorder by combining structural and functional MRI information. NeuroImage 25, 102181 (2020)","journal-title":"NeuroImage"},{"key":"1132_CR14","doi-asserted-by":"publisher","first-page":"16","DOI":"10.1016\/j.nicl.2017.08.017","volume":"17","author":"AS Heinsfeld","year":"2018","unstructured":"Heinsfeld, A.S., Franco, A.R., Craddock, R.C., Buchweitz, A., Meneguzzi, F.: Identification of autism spectrum disorder using deep learning and the abide dataset. NeuroImage 17, 16\u201323 (2018)","journal-title":"NeuroImage"},{"key":"1132_CR15","doi-asserted-by":"publisher","first-page":"1325","DOI":"10.3389\/fnins.2019.01325","volume":"13","author":"Z Sherkatghanad","year":"2019","unstructured":"Sherkatghanad, Z., Akhondzadeh, M.S., Salari, S., Zomorodi-Moghadam, M., Abdar, M., Acharya, U.R., Khosrowabadi, R., Salari, V.: Automated detection of autism spectrum disorder using a convolutional neural network. Front. Neurosci. 13, 1325 (2019)","journal-title":"Front. Neurosci."},{"key":"1132_CR16","doi-asserted-by":"publisher","first-page":"63","DOI":"10.1016\/j.neucom.2018.04.080","volume":"324","author":"Y Kong","year":"2019","unstructured":"Kong, Y., Gao, J., Xu, Y., Pan, Y., Wang, J., Liu, J.: Classification of autism spectrum disorder by combining brain connectivity and deep neural network classifier. Neurocomputing 324, 63\u201368 (2019)","journal-title":"Neurocomputing"},{"issue":"3","key":"1132_CR17","doi-asserted-by":"publisher","first-page":"403","DOI":"10.1207\/s15326942dn2703_6","volume":"27","author":"G Dawson","year":"2005","unstructured":"Dawson, G., Webb, S.J., McPartland, J.: Understanding the nature of face processing impairment in autism: insights from behavioral and electrophysiological studies. Dev. Neuropsychol. 27(3), 403\u2013424 (2005)","journal-title":"Dev. Neuropsychol."},{"issue":"3","key":"1132_CR18","doi-asserted-by":"publisher","first-page":"604","DOI":"10.1016\/j.neuron.2015.09.042","volume":"88","author":"S Wang","year":"2015","unstructured":"Wang, S., Jiang, M., Duchesne, X.M., Laugeson, E.A., Kennedy, D.P., Adolphs, R., Zhao, Q.: Atypical visual saliency in autism spectrum disorder quantified through model-based eye tracking. Neuron 88(3), 604\u2013616 (2015)","journal-title":"Neuron"},{"key":"1132_CR19","doi-asserted-by":"crossref","unstructured":"Liu, S., Deng, W.: Very deep convolutional neural network based image classification using small training sample size. In: 2015 3rd IAPR Asian Conference on Pattern Recognition (ACPR), pp. 730\u2013734 (2015)","DOI":"10.1109\/ACPR.2015.7486599"},{"key":"1132_CR20","doi-asserted-by":"publisher","DOI":"10.1016\/j.compbiomed.2021.104548","volume":"134","author":"M Baygin","year":"2021","unstructured":"Baygin, M., Dogan, S., Tuncer, T., Datta Barua, P., Faust, O., Arunkumar, N., Abdulhay, E.W., Emma Palmer, E., Rajendra Acharya, U.: Automated ASD detection using hybrid deep lightweight features extracted from EEG signals. Comput. Biol. Med. 134, 104548 (2021)","journal-title":"Comput. Biol. Med."},{"key":"1132_CR21","doi-asserted-by":"publisher","first-page":"24334","DOI":"10.1109\/ACCESS.2021.3056619","volume":"9","author":"FA Alturki","year":"2021","unstructured":"Alturki, F.A., Aljalal, M., Abdurraqeeb, A.M., Alsharabi, K., Al-Shamma\u2019a, A.A.: Common spatial pattern technique with EEG signals for diagnosis of autism and epilepsy disorders. IEEE Access 9, 24334\u201324349 (2021)","journal-title":"IEEE Access"},{"key":"1132_CR22","doi-asserted-by":"publisher","first-page":"185","DOI":"10.1016\/0004-3702(81)90024-2","volume":"17","author":"BKP Horn","year":"1981","unstructured":"Horn, B.K.P., Schunck, B.G.: Determining optical flow. Artif. Intell. 17, 185\u2013203 (1981)","journal-title":"Artif. Intell."},{"key":"1132_CR23","doi-asserted-by":"crossref","unstructured":"Wang, H., Schmid, C.: Action recognition with improved trajectories. In: ICCV, pp. 3551\u20133558 (2013)","DOI":"10.1109\/ICCV.2013.441"},{"key":"1132_CR24","unstructured":"Simonyan, K., Zisserman, A.: Two-stream convolutional networks for action recognition in videos. In: NIPS, pp. 568\u2013576 (2014)"},{"key":"1132_CR25","unstructured":"Wang, L., Wang, Z., Xiong, Y., Qiao, Y.: CUHK & SIAT submission for THUMOS\u201915 Action Recognition Challenge. In: THUMOS\u201915 Action Recognition Challenge. In Conjunction with CVPR\u201915 (2015)"},{"key":"1132_CR26","unstructured":"Soomro, K., Zamir, A.R., Shah, M.: UCF101: A dataset of 101 human actions classes from videos in the wild. CoRR arXiv:1212.0402 (2012)"},{"key":"1132_CR27","doi-asserted-by":"crossref","unstructured":"Feichtenhofer, C., Pinz, A., Zisserman, A.: Convolutional two-stream network fusion for video action recognition. In: CVPR (2016)","DOI":"10.1109\/CVPR.2016.213"},{"key":"1132_CR28","doi-asserted-by":"crossref","unstructured":"Benaim, S., Ephrat, A., Lang, O., Mosseri, I., Freeman, W.T., Rubinstein, M., Irani, M., Dekel, T.: Speednet: learning the speediness in videos. In: CVPR (2020)","DOI":"10.1109\/CVPR42600.2020.00994"},{"key":"1132_CR29","doi-asserted-by":"crossref","unstructured":"Feichtenhofer, C., Pinz, A., Wildes, R.P.: Spatiotemporal multiplier networks for video action recognition. In: CVPR (2017)","DOI":"10.1109\/CVPR.2017.787"},{"key":"1132_CR30","doi-asserted-by":"crossref","unstructured":"Wang, Y., Long, M., Wang, J., Yu, P.S.: Spatiotemporal pyramid network for video action recognition. In: CVPR (2017)","DOI":"10.1109\/CVPR.2017.226"},{"key":"1132_CR31","doi-asserted-by":"crossref","unstructured":"Wang, L., Xiong, Y., Wang, Z., Qiao, Y., Lin, D., Tang, X., Gool, L.V.: Temporal segment networks: towards good practices for deep action recognition. In: ECCV (2016)","DOI":"10.1007\/978-3-319-46484-8_2"},{"key":"1132_CR32","doi-asserted-by":"crossref","unstructured":"Zhou, B., Andonian, A., Oliva, A., Torralba, A.: Temporal relational reasoning in videos. In: ECCV (2018)","DOI":"10.1007\/978-3-030-01246-5_49"},{"key":"1132_CR33","doi-asserted-by":"crossref","unstructured":"Feichtenhofer, C., Fan, H., Malik, J., He, K.: Slowfast networks for video recognition. In: ICCV (2019)","DOI":"10.1109\/ICCV.2019.00630"},{"key":"1132_CR34","doi-asserted-by":"crossref","unstructured":"Ch\u00e9ron, G., Laptev, I., Schmid, C.: P-CNN: Pose-based CNN features for action recognition. In: ICCV (2015)","DOI":"10.1109\/ICCV.2015.368"},{"key":"1132_CR35","doi-asserted-by":"crossref","unstructured":"Zolfaghari, M., Oliveira, G.L., Sedaghat, N., Brox, T.: Chained multi-stream networks exploiting pose, motion, and appearance for action classification and detection. In: ICCV (2017)","DOI":"10.1109\/ICCV.2017.316"},{"key":"1132_CR36","doi-asserted-by":"crossref","unstructured":"Tran, D., Bourdev, L.D., Fergus, R., Torresani, L., Paluri, M.: Learning spatiotemporal features with 3D convolutional networks. In: ICCV (2015)","DOI":"10.1109\/ICCV.2015.510"},{"key":"1132_CR37","doi-asserted-by":"crossref","unstructured":"Tran, D., Wang, H., Torresani, L., Ray, J., LeCun, Y., Paluri, M.: A closer look at spatiotemporal convolutions for action recognition. In: 2018 IEEE\/CVF Conference on Computer Vision and Pattern Recognition, pp. 6450\u20136459 (2018)","DOI":"10.1109\/CVPR.2018.00675"},{"issue":"10","key":"1132_CR38","doi-asserted-by":"publisher","first-page":"2453","DOI":"10.1007\/s11263-022-01661-1","volume":"130","author":"Y Tian","year":"2022","unstructured":"Tian, Y., Yan, Y., Zhai, G., Guo, G., Gao, Z.: EAN: event adaptive network for enhanced action recognition. Int. J. Comput. Vis. 130(10), 2453\u20132471 (2022)","journal-title":"Int. J. Comput. Vis."},{"key":"1132_CR39","doi-asserted-by":"crossref","unstructured":"Tian, Y., Che, Z., Bao, W., Zhai, G., Gao, Z.: Self-supervised motion representation via scattering local motion cues. In: ECCV (2020)","DOI":"10.1007\/978-3-030-58568-6_5"},{"key":"1132_CR40","doi-asserted-by":"crossref","unstructured":"Tian, Y., Lu, G., Min, X., Che, Z., Zhai, G., Guo, G., Gao, Z.: Self-conditioned probabilistic learning of video rescaling. In: ICCV (2021)","DOI":"10.1109\/ICCV48922.2021.00445"},{"key":"1132_CR41","doi-asserted-by":"publisher","first-page":"1300","DOI":"10.1109\/TIP.2023.3242774","volume":"32","author":"Y Tian","year":"2023","unstructured":"Tian, Y., Yan, Y., Zhai, G., Chen, L., Gao, Z.: CLSA: a contrastive learning framework with selective aggregation for video rescaling. IEEE Trans. Image Process. 32, 1300\u20131314 (2023)","journal-title":"IEEE Trans. Image Process."},{"key":"1132_CR42","first-page":"690","volume":"13435","author":"C Seibold","year":"2022","unstructured":"Seibold, C., Rei\u00df, S., Sarfraz, M.S., Stiefelhagen, R., Kleesiek, J.: Breaking with fixed set pathology recognition through report-guided contrastive training. Med. Image Comput. Comput. Assist. Interv. 13435, 690\u2013700 (2022)","journal-title":"Med. Image Comput. Comput. Assist. Interv."},{"key":"1132_CR43","first-page":"356","volume":"13431","author":"C Zhao","year":"2022","unstructured":"Zhao, C., Zhan, L., Thompson, P.M., Huang, H.: Explainable contrastive multiview graph representation of brain, mind, and behavior. Med. Image Comput. Comput. Assist. Interv. 13431, 356\u2013365 (2022)","journal-title":"Med. Image Comput. Comput. Assist. Interv."},{"key":"1132_CR44","unstructured":"Sutskever, I., Vinyals, O., Le, Q.V.: Sequence to sequence learning with neural networks. In: NIPS, pp. 3104\u20133112 (2014)"},{"key":"1132_CR45","doi-asserted-by":"crossref","unstructured":"Vinyals, O., Toshev, A., Bengio, S., Erhan, D.: Show and tell: a neural image caption generator. In: CVPR, pp. 3156\u20133164 (2015)","DOI":"10.1109\/CVPR.2015.7298935"},{"key":"1132_CR46","doi-asserted-by":"crossref","unstructured":"Tran, D., Wang, H., Torresani, L., Ray, J., LeCun, Y., Paluri, M.: A closer look at spatiotemporal convolutions for action recognition. In: IEEE Conference on Computer Vision and Pattern Recognition, pp. 6450\u20136459 (2018)","DOI":"10.1109\/CVPR.2018.00675"},{"key":"1132_CR47","first-page":"463","volume":"34","author":"P Pandey","year":"2020","unstructured":"Pandey, P., Prathosh, A.P., Kohli, M., Pritchard, J.: Guided weak supervision for action recognition with scarce data to assess skills of children with autism. Proc. AAAI Conf. Artif. Intell. 34, 463\u2013470 (2020)","journal-title":"Proc. AAAI Conf. Artif. Intell."},{"key":"1132_CR48","doi-asserted-by":"crossref","unstructured":"Kuehne, H., Jhuang, H., Garrote, E., Poggio, T., Serre, T.: HMDB: a large video database for human motion recognition. In: Proceedings of the International Conference on Computer Vision (ICCV) (2011)","DOI":"10.1109\/ICCV.2011.6126543"},{"issue":"86","key":"1132_CR49","first-page":"2579","volume":"9","author":"L van der Maaten","year":"2008","unstructured":"van der Maaten, L., Hinton, G.: Visualizing data using t-sne. J. Mach. Learn. Res. 9(86), 2579\u20132605 (2008)","journal-title":"J. Mach. Learn. Res."}],"container-title":["Multimedia Systems"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-023-01132-8.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s00530-023-01132-8\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-023-01132-8.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,9,15]],"date-time":"2023-09-15T13:10:26Z","timestamp":1694783426000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s00530-023-01132-8"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2023,7,8]]},"references-count":49,"journal-issue":{"issue":"5","published-print":{"date-parts":[[2023,10]]}},"alternative-id":["1132"],"URL":"https:\/\/doi.org\/10.1007\/s00530-023-01132-8","relation":{},"ISSN":["0942-4962","1432-1882"],"issn-type":[{"value":"0942-4962","type":"print"},{"value":"1432-1882","type":"electronic"}],"subject":[],"published":{"date-parts":[[2023,7,8]]},"assertion":[{"value":"24 March 2023","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"28 June 2023","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"8 July 2023","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors have no competing interests to declare that are relevant to the content of this article.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}},{"value":"This research study was conducted retrospectively using human subject data made available by the authors of [] (Hand Gesture Dataset) and [] (Autism Dataset) via a registration process. No additional ethical approvals were required.","order":3,"name":"Ethics","group":{"name":"EthicsHeading","label":"Ethical standards"}}]}}