{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,10]],"date-time":"2026-04-10T14:42:52Z","timestamp":1775832172260,"version":"3.50.1"},"reference-count":46,"publisher":"Springer Science and Business Media LLC","issue":"3","license":[{"start":{"date-parts":[[2022,12,14]],"date-time":"2022-12-14T00:00:00Z","timestamp":1670976000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2022,12,14]],"date-time":"2022-12-14T00:00:00Z","timestamp":1670976000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Neural Process Lett"],"published-print":{"date-parts":[[2023,6]]},"DOI":"10.1007\/s11063-022-11097-w","type":"journal-article","created":{"date-parts":[[2022,12,14]],"date-time":"2022-12-14T10:02:56Z","timestamp":1671012176000},"page":"2661-2685","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":9,"title":["An End-to-End Heart Rate Estimation Scheme Using Divided Space-Time Attention"],"prefix":"10.1007","volume":"55","author":[{"given":"Xin","family":"Zhang","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-0734-0337","authenticated-orcid":false,"given":"Changqiang","family":"Yang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ruonan","family":"Yin","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Lingzhuang","family":"Meng","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2022,12,14]]},"reference":[{"key":"11097_CR1","doi-asserted-by":"publisher","unstructured":"Balakrishnan G, Durand F, Guttag J (2013) Detecting pulse from head motions in video. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 3430\u20133437. https:\/\/doi.org\/10.1109\/CVPR.2013.440","DOI":"10.1109\/CVPR.2013.440"},{"issue":"10","key":"11097_CR2","doi-asserted-by":"publisher","first-page":"2878","DOI":"10.1109\/TBME.2013.2266196","volume":"60","author":"G De Haan","year":"2013","unstructured":"De Haan G, Jeanne V (2013) Robust pulse rate from chrominance-based rppg. IEEE Trans Biomed Eng 60(10):2878\u20132886","journal-title":"IEEE Trans Biomed Eng"},{"key":"11097_CR3","doi-asserted-by":"publisher","unstructured":"Li X, Chen J, Zhao G, Pietik\u00e4inen M (2014) Remote heart rate measurement from face videos under realistic situations. In: 2014 IEEE conference on computer vision and pattern recognition, pp 4264\u20134271. https:\/\/doi.org\/10.1109\/CVPR.2014.543","DOI":"10.1109\/CVPR.2014.543"},{"issue":"10","key":"11097_CR4","doi-asserted-by":"publisher","first-page":"10762","DOI":"10.1364\/OE.18.010762","volume":"18","author":"M-Z Poh","year":"2010","unstructured":"Poh M-Z, McDuff DJ, Picard RW (2010) Non-contact, automated cardiac pulse measurements using video imaging and blind source separation. Opt Express 18(10):10762\u201310774. https:\/\/doi.org\/10.1364\/OE.18.010762","journal-title":"Opt Express"},{"issue":"1","key":"11097_CR5","doi-asserted-by":"publisher","first-page":"7","DOI":"10.1109\/TBME.2010.2086456","volume":"58","author":"M Poh","year":"2011","unstructured":"Poh M, McDuff DJ, Picard RW (2011) Advancements in noncontact, multiparameter physiological measurements using a webcam. IEEE Trans Biomed Eng 58(1):7\u201311. https:\/\/doi.org\/10.1109\/TBME.2010.2086456","journal-title":"IEEE Trans Biomed Eng"},{"issue":"26","key":"11097_CR6","doi-asserted-by":"publisher","first-page":"21434","DOI":"10.1364\/OE.16.021434","volume":"16","author":"W Verkruysse","year":"2008","unstructured":"Verkruysse W, Svaasand LO, Nelson JS (2008) Remote plethysmographic imaging using ambient light. Opt Express 16(26):21434\u201321445","journal-title":"Opt Express"},{"issue":"7","key":"11097_CR7","doi-asserted-by":"publisher","first-page":"1479","DOI":"10.1109\/TBME.2016.2609282","volume":"64","author":"W Wang","year":"2017","unstructured":"Wang W, Brinker ACd, Stuijk S, Haan Gd (2017) Algorithmic principles of remote ppg. IEEE Trans Biomed Eng 64(7):1479\u20131491. https:\/\/doi.org\/10.1109\/TBME.2016.2609282","journal-title":"IEEE Trans Biomed Eng"},{"issue":"9","key":"11097_CR8","doi-asserted-by":"publisher","first-page":"1974","DOI":"10.1109\/TBME.2015.2508602","volume":"63","author":"W Wang","year":"2016","unstructured":"Wang W, Stuijk S, Haan Gd (2016) A novel algorithm for remote photoplethysmography: Spatial subspace rotation. IEEE Trans Biomed Eng 63(9):1974\u20131984. https:\/\/doi.org\/10.1109\/TBME.2015.2508602","journal-title":"IEEE Trans Biomed Eng"},{"key":"11097_CR9","doi-asserted-by":"publisher","unstructured":"Lam A, Kuno Y (2015) Robust heart rate measurement from video using select random patches. In: 2015 IEEE international conference on computer vision (ICCV), pp 3640\u20133648. https:\/\/doi.org\/10.1109\/ICCV.2015.415","DOI":"10.1109\/ICCV.2015.415"},{"issue":"4","key":"11097_CR10","doi-asserted-by":"publisher","first-page":"1124","DOI":"10.1364\/BOE.5.001124","volume":"5","author":"S Xu","year":"2014","unstructured":"Xu S, Sun L, Rohde GK (2014) Robust efficient estimation of heart rate pulse from video. Biomed Opt Express 5(4):1124\u20131135","journal-title":"Biomed Opt Express"},{"key":"11097_CR11","doi-asserted-by":"crossref","unstructured":"Chen W, McDuff D (2018) Deepphys: video-based physiological measurement using convolutional attention networks. In: Proceedings of the European conference on computer vision (ECCV), pp 349\u2013365","DOI":"10.1007\/978-3-030-01216-8_22"},{"key":"11097_CR12","doi-asserted-by":"crossref","unstructured":"Perepelkina O, Artemyev M, Churikova M, Grinenko M (2020) Hearttrack: convolutional neural network for remote video-based heart rate monitoring. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition workshops, pp 288\u2013289","DOI":"10.1109\/CVPRW50498.2020.00152"},{"key":"11097_CR13","unstructured":"Yu Z, Li X, Zhao G (2019) Remote photoplethysmograph signal measurement from facial videos using spatio-temporal networks. arXiv preprint arXiv:1905.02419"},{"key":"11097_CR14","unstructured":"Bertasius G, Wang H, Torresani L (2021) Is space-time attention all you need for video understanding?"},{"issue":"5","key":"11097_CR15","doi-asserted-by":"publisher","first-page":"1565","DOI":"10.1364\/BOE.6.001565","volume":"6","author":"M Kumar","year":"2015","unstructured":"Kumar M, Veeraraghavan A, Sabharwal A (2015) Distanceppg: robust non-contact vital signs monitoring using a camera. Biomed Opt Express 6(5):1565\u20131588","journal-title":"Biomed Opt Express"},{"key":"11097_CR16","doi-asserted-by":"publisher","unstructured":"Tulyakov S, Alameda-Pineda X, Ricci E, Yin L, Cohn JF, Sebe N (2016) Self-adaptive matrix completion for heart rate estimation from face videos under realistic conditions. In: 2016 IEEE conference on computer vision and pattern recognition (CVPR), pp 2396\u20132404. https:\/\/doi.org\/10.1109\/CVPR.2016.263","DOI":"10.1109\/CVPR.2016.263"},{"key":"11097_CR17","doi-asserted-by":"publisher","unstructured":"Nowara EM, Marks TK, Mansour H, Veeraraghavan A (2018) Sparseppg: towards driver monitoring using camera-based vital signs estimation in near-infrared. In: 2018 IEEE\/CVF conference on computer vision and pattern recognition workshops (CVPRW), pp 1353\u2013135309. https:\/\/doi.org\/10.1109\/CVPRW.2018.00174","DOI":"10.1109\/CVPRW.2018.00174"},{"key":"11097_CR18","doi-asserted-by":"publisher","unstructured":"McDuff D, Blackford E (2019) iphys: an open non-contact imaging-based physiological measurement toolbox. In: 2019 41st annual international conference of the IEEE engineering in medicine and biology society (EMBC), pp 6521\u20136524. https:\/\/doi.org\/10.1109\/EMBC.2019.8857012","DOI":"10.1109\/EMBC.2019.8857012"},{"key":"11097_CR19","doi-asserted-by":"publisher","first-page":"2409","DOI":"10.1109\/TIP.2019.2947204","volume":"29","author":"X Niu","year":"2020","unstructured":"Niu X, Shan S, Han H, Chen X (2020) Rhythmnet: end-to-end heart rate estimation from face via spatial-temporal representation. IEEE Trans Image Process 29:2409\u20132423. https:\/\/doi.org\/10.1109\/TIP.2019.2947204","journal-title":"IEEE Trans Image Process"},{"key":"11097_CR20","doi-asserted-by":"publisher","unstructured":"Niu X, Zhao X, Han H, Das A, Dantcheva A, Shan S, Chen X (2019) Robust remote heart rate estimation from face utilizing spatial-temporal attention. In: 2019 14th IEEE international conference on automatic face & gesture recognition (FG 2019), pp 1\u20138. https:\/\/doi.org\/10.1109\/FG.2019.8756554","DOI":"10.1109\/FG.2019.8756554"},{"key":"11097_CR21","doi-asserted-by":"publisher","unstructured":"Tsou Y-Y, Lee Y-A, Hsu C-T, Chang S-H (2020) Siamese-rPPG network: remote photoplethysmography signal estimation from face videos, pp 2066\u20132073. Association for Computing Machinery, https:\/\/doi.org\/10.1145\/3341105.3373905","DOI":"10.1145\/3341105.3373905"},{"key":"11097_CR22","unstructured":"\u0160petl\u00edk R, Franc V, Matas J (2018) Visual heart rate estimation with convolutional neural network. In: Proceedings of the British machine vision conference, Newcastle, UK, pp 3\u20136"},{"key":"11097_CR23","doi-asserted-by":"publisher","unstructured":"Yu Z, Peng W, Li X, Hong X, Zhao G (2019) Remote heart rate measurement from highly compressed facial videos: an end-to-end deep learning solution with video enhancement. In: 2019 IEEE\/CVF international conference on computer vision (ICCV), pp 151\u2013160. https:\/\/doi.org\/10.1109\/ICCV.2019.00024","DOI":"10.1109\/ICCV.2019.00024"},{"key":"11097_CR24","first-page":"392","volume-title":"Meta-rppg: remote heart rate estimation using a transductive meta-learner","author":"E Lee","year":"2020","unstructured":"Lee E, Chen E, Lee C-Y (2020) Meta-rppg: remote heart rate estimation using a transductive meta-learner. Springer, Berlin, pp 392\u2013409"},{"key":"11097_CR25","unstructured":"Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez AN, Kaiser \u0141, Polosukhin I (2017) Attention is all you need. Adv Neural Inf Process Syst 30"},{"key":"11097_CR26","unstructured":"Dosovitskiy A, Beyer L, Kolesnikov A, Weissenborn D, Zhai X, Unterthiner T, Dehghani M, Minderer M, Heigold G, Gelly S, et al (2020) An image is worth 16x16 words: transformers for image recognition at scale. arXiv preprint arXiv:2010.11929"},{"key":"11097_CR27","doi-asserted-by":"crossref","unstructured":"Heo B, Yun S, Han D, Chun S, Choe J, Oh SJ (2021) Rethinking spatial dimensions of vision transformers 11936\u201311945","DOI":"10.1109\/ICCV48922.2021.01172"},{"key":"11097_CR28","doi-asserted-by":"crossref","unstructured":"Caruana R (1993) Multitask learning: a knowledge-based source of inductive bias1, Citeseer. pp 41\u201348","DOI":"10.1016\/B978-1-55860-307-3.50012-5"},{"key":"11097_CR29","doi-asserted-by":"crossref","unstructured":"Kokkinos I (2017) Ubernet: training a universal convolutional neural network for low-, mid-, and high-level vision using diverse datasets and limited memory, 6129\u20136138","DOI":"10.1109\/CVPR.2017.579"},{"issue":"1","key":"11097_CR30","doi-asserted-by":"publisher","first-page":"7","DOI":"10.1023\/A:1007327622663","volume":"28","author":"J Baxter","year":"1997","unstructured":"Baxter J (1997) A bayesian\/information theoretic model of learning to learn via multiple task sampling. Mach Learn 28(1):7\u201339","journal-title":"Mach Learn"},{"key":"11097_CR31","doi-asserted-by":"crossref","unstructured":"Duong L, Cohn T, Bird S, Cook P (2015) Low resource dependency parsing: Cross-lingual parameter sharing in a neural network parser. In: Proceedings of the 53rd annual meeting of the association for computational linguistics and the 7th international joint conference on natural language processing (volume 2: Short Papers), pp 845\u2013850","DOI":"10.3115\/v1\/P15-2139"},{"key":"11097_CR32","unstructured":"Yang Y, Hospedales TM (2016) Trace norm regularised deep multi-task learning"},{"issue":"1","key":"11097_CR33","doi-asserted-by":"publisher","first-page":"41","DOI":"10.1023\/A:1007379606734","volume":"28","author":"R Caruana","year":"1997","unstructured":"Caruana R (1997) Multitask learning. Mach Learn 28(1):41\u201375","journal-title":"Mach Learn"},{"key":"11097_CR34","unstructured":"Kendall A, Gal Y, Cipolla R (2018) Multi-task learning using uncertainty to weigh losses for scene geometry and semantics, 7482\u20137491"},{"key":"11097_CR35","unstructured":"Chen Z, Badrinarayanan V, Lee C-Y, Rabinovich A (2018) Gradnorm: gradient normalization for adaptive loss balancing in deep multitask networks, 794\u2013803. PMLR"},{"key":"11097_CR36","doi-asserted-by":"publisher","first-page":"82","DOI":"10.1016\/j.patrec.2017.10.017","volume":"124","author":"S Bobbia","year":"2019","unstructured":"Bobbia S, Macwan R, Benezeth Y, Mansouri A, Dubois J (2019) Unsupervised skin tissue segmentation for remote photoplethysmography. Pattern Recogn Lett 124:82\u201390","journal-title":"Pattern Recogn Lett"},{"key":"11097_CR37","unstructured":"Heusch G, Anjos A, Marcel S (2017) A reproducible study on remote heart rate measurement. arXiv preprint arXiv:1709.00962"},{"issue":"1","key":"11097_CR38","doi-asserted-by":"publisher","first-page":"42","DOI":"10.1109\/T-AFFC.2011.25","volume":"3","author":"M Soleymani","year":"2012","unstructured":"Soleymani M, Lichtenauer J, Pun T, Pantic M (2012) A multimodal database for affect recognition and implicit tagging. IEEE Trans Affect Comput 3(1):42\u201355. https:\/\/doi.org\/10.1109\/T-AFFC.2011.25","journal-title":"IEEE Trans Affect Comput"},{"key":"11097_CR39","unstructured":"Hendrycks D, Lee K, Mazeika M (2019) Using pre-training can improve model robustness and uncertainty. In: International conference on machine learning, pp 2712\u20132721. PMLR"},{"key":"11097_CR40","unstructured":"Kay W, Carreira J, Simonyan K, Zhang B, Zisserman A (2017) The kinetics human action video dataset"},{"key":"11097_CR41","unstructured":"Wang B, Zhao D, Lioma C, Li Q, Zhang P, Simonsen JG (2019) Encoding word order in complex embeddings"},{"key":"11097_CR42","unstructured":"Gehring J, Auli M, Grangier D, Yarats D, Dauphin YN (2017) Convolutional sequence to sequence learning. In: International conference on machine learning, pp 1243\u20131252. PMLR"},{"key":"11097_CR43","doi-asserted-by":"crossref","unstructured":"Shaw P, Uszkoreit J, Vaswani A (2018) Self-attention with relative position representations","DOI":"10.18653\/v1\/N18-2074"},{"key":"11097_CR44","unstructured":"Wei J, Ren X, Li X, Huang W, Liao Y, Wang Y, Lin J, Jiang X, Chen X, Liu Q (2019) Nezha: neural contextualized representation for chinese language understanding. arXiv preprint arXiv:1909.00204"},{"key":"11097_CR45","unstructured":"Liu X, Yu H-F, Dhillon I, Hsieh C-J (2020) Learning to encode position for transformer with continuous dynamical model. In: International conference on machine learning, pp 6327\u20136335. PMLR"},{"key":"11097_CR46","doi-asserted-by":"crossref","unstructured":"Chen X, Xie S, He K (2021) An empirical study of training self-supervised vision transformers, 9640\u20139649","DOI":"10.1109\/ICCV48922.2021.00950"}],"container-title":["Neural Processing Letters"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11063-022-11097-w.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11063-022-11097-w\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11063-022-11097-w.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,7,8]],"date-time":"2023-07-08T12:18:45Z","timestamp":1688818725000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11063-022-11097-w"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,12,14]]},"references-count":46,"journal-issue":{"issue":"3","published-print":{"date-parts":[[2023,6]]}},"alternative-id":["11097"],"URL":"https:\/\/doi.org\/10.1007\/s11063-022-11097-w","relation":{},"ISSN":["1370-4621","1573-773X"],"issn-type":[{"value":"1370-4621","type":"print"},{"value":"1573-773X","type":"electronic"}],"subject":[],"published":{"date-parts":[[2022,12,14]]},"assertion":[{"value":"30 November 2022","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"14 December 2022","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors did not receive support from any organization for the submitted work.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflicts of interest"}},{"value":"The authors have no competing interests to declare that are relevant to the content of this article.","order":3,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}]}}