{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,2,21]],"date-time":"2025-02-21T20:23:22Z","timestamp":1740169402473,"version":"3.37.3"},"reference-count":68,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2024,1,1]],"date-time":"2024-01-01T00:00:00Z","timestamp":1704067200000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by-nc-nd\/4.0\/"}],"funder":[{"name":"Researchers Supporting Project","award":["RSP2024R476"],"award-info":[{"award-number":["RSP2024R476"]}]},{"name":"King Saud University, Riyadh, Saudi Arabia"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Access"],"published-print":{"date-parts":[[2024]]},"DOI":"10.1109\/access.2024.3487414","type":"journal-article","created":{"date-parts":[[2024,10,28]],"date-time":"2024-10-28T17:39:46Z","timestamp":1730137186000},"page":"159706-159718","source":"Crossref","is-referenced-by-count":0,"title":["RealMock: Crafting Realistic Animated Portraits via Dual-Driven Landmark Editing"],"prefix":"10.1109","volume":"12","author":[{"ORCID":"https:\/\/orcid.org\/0009-0003-3524-0469","authenticated-orcid":false,"given":"Akram","family":"Abdullah","sequence":"first","affiliation":[{"name":"School of Computer Science and Engineering, Chongqing University of Technology, Chongqing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xiaoyang","family":"Liu","sequence":"additional","affiliation":[{"name":"School of Computer Science and Engineering, Chongqing University of Technology, Chongqing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-8324-9175","authenticated-orcid":false,"given":"Rizwan","family":"Abbas","sequence":"additional","affiliation":[{"name":"College of Computer Science and Technology, Zhejiang University, Hangzhou, Zhejiang, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0001-7758-4513","authenticated-orcid":false,"given":"Saleh","family":"Abdul Amir Mohammad","sequence":"additional","affiliation":[{"name":"Department of Management Science and Engineering, Dalian University of Technology, Dalian, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-1360-8640","authenticated-orcid":false,"given":"Ali A.","family":"Al-Bakhrani","sequence":"additional","affiliation":[{"name":"College of Software Engineering, Dalian University of Technology, Dalian, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-9750-3883","authenticated-orcid":false,"given":"Amerah","family":"Alabrah","sequence":"additional","affiliation":[{"name":"Department of Information Systems, College of Computer and Information Science, King Saud University, Riyadh, Saudi Arabia"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-4304-4199","authenticated-orcid":false,"given":"Gehad Abdullah","family":"Amran","sequence":"additional","affiliation":[{"name":"Department of Management Science and Engineering, Dalian University of Technology, Dalian, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/3DV62453.2024.00027"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v38i6.28364"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1145\/3641519.3657445"},{"key":"ref4","article-title":"Image synthesis with graph conditioning: CLIP-guided diffusion models for scene graphs","author":"Mishra","year":"2024","journal-title":"arXiv:2401.14111"},{"key":"ref5","article-title":"Stochastic conditional diffusion models for robust semantic image synthesis","author":"Ko","year":"2024","journal-title":"arXiv:2402.16506"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1016\/j.daach.2024.e00344"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1002\/cav.2203"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-023-16066-6"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/WACV57701.2024.00546"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-73397-0_2"},{"key":"ref11","article-title":"EmoVOCA: Speech-driven emotional 3D talking heads","author":"Nocentini","year":"2024","journal-title":"arXiv:2403.12886"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/ICIP51287.2024.10647507"},{"key":"ref13","article-title":"Talking heads: Understanding inter-layer communication in transformer language models","author":"Merullo","year":"2024","journal-title":"arXiv:2406.09519"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/TVCG.2022.3230541"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1145\/3647649.3647689"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/PCS60826.2024.10566437"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2023.3346273"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2024.3370848"},{"key":"ref19","article-title":"Lip movements information disentanglement for lip sync","author":"Wang","year":"2022","journal-title":"arXiv:2202.06198"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1016\/j.neuroimage.2022.119311"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1016\/j.neuroimage.2024.120539"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.31577\/cai_2024_2_458"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1016\/j.engappai.2023.107772"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1016\/j.iswa.2024.200339"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/TCSVT.2023.3311039"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2023.3285923"},{"key":"ref27","article-title":"AdaMesh: Personalized facial expressions and head poses for adaptive speech-driven 3D facial animation","author":"Chen","year":"2023","journal-title":"arXiv:2310.07236"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1145\/3490100.3516467"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2021.3081873"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1016\/j.eswa.2023.122266"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1145\/3641519.3657459"},{"key":"ref32","article-title":"AniPortrait: Audio-driven synthesis of photorealistic portrait animation","author":"Wei","year":"2024","journal-title":"arXiv:2403.17694"},{"key":"ref33","article-title":"MegActor: Harness the power of raw video for vivid portrait animation","author":"Yang","year":"2024","journal-title":"arXiv:2405.20851"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-019-7163-x"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2023.3272341"},{"key":"ref36","article-title":"Antithetic multilevel methods for elliptic and hypo-elliptic diffusions with applications","author":"Iguchi","year":"2024","journal-title":"arXiv:2403.13489"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2023.3307772"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1137\/21M1461034"},{"key":"ref39","doi-asserted-by":"publisher","DOI":"10.1007\/s11548-023-03030-w"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1016\/j.cmpb.2024.108103"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v38i7.28476"},{"key":"ref42","doi-asserted-by":"publisher","DOI":"10.1002\/cav.2226"},{"key":"ref43","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2021\/152"},{"key":"ref44","article-title":"DreamTalk: When emotional talking head generation meets diffusion probabilistic models","author":"Ma","year":"2023","journal-title":"arXiv:2312.09767"},{"key":"ref45","article-title":"Hallo: Hierarchical audio-driven visual synthesis for portrait image animation","author":"Xu","year":"2024","journal-title":"arXiv:2406.08801"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2024.3419159"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1016\/j.visinf.2023.12.001"},{"key":"ref48","article-title":"SC-diff: 3D shape completion with latent diffusion models","author":"Galvis","year":"2024","journal-title":"arXiv:2403.12470"},{"key":"ref49","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP49357.2023.10094298"},{"key":"ref50","article-title":"Text-to-speech synthesis based on latent variable conversion using diffusion probabilistic model and variational autoencoder","author":"Yasuda","year":"2022","journal-title":"arXiv:2212.08329"},{"key":"ref51","article-title":"LiteVAE: Lightweight and efficient variational autoencoders for latent diffusion models","author":"Sadat","year":"2024","journal-title":"arXiv:2405.14477"},{"key":"ref52","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2024.3370674"},{"key":"ref53","article-title":"ProTIP: Probabilistic robustness verification on text-to-image diffusion models against stochastic perturbation","author":"Zhang","year":"2024","journal-title":"arXiv:2402.15429"},{"key":"ref54","article-title":"Pseudo-MRI-guided PET image reconstruction method based on a diffusion probabilistic model","author":"Gan","year":"2024","journal-title":"arXiv:2403.18139"},{"key":"ref55","first-page":"1","article-title":"gDDIM: Generalized denoising diffusion implicit models","volume-title":"Proc. 11th Int. Conf. Learn. Represent. (ICLR)","author":"Zhang"},{"key":"ref56","article-title":"Towards coherent image inpainting using denoising diffusion implicit models","author":"Zhang","year":"2023","journal-title":"arXiv:2304.03322"},{"key":"ref57","first-page":"381","article-title":"Foreground detection in a multi-target fish tracking from video-recordings using U-Net based architecture","volume-title":"Proc. Artif. Intell. Res. Develop.-Current Challenges, New Trends Appl. (CCIA), 21st Int. Conf. Catalan Assoc. Artif. Intell.","volume":"308","author":"Reig-Bolano"},{"key":"ref58","doi-asserted-by":"publisher","DOI":"10.3390\/rs16050904"},{"key":"ref59","doi-asserted-by":"publisher","DOI":"10.1109\/TAFFC.2023.3258900"},{"key":"ref60","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2023.3296019"},{"key":"ref61","article-title":"Transcription and translation of videos using fine-tuned XLSR Wav2Vec2 on custom dataset and mBART","author":"Tathe","year":"2024","journal-title":"arXiv:2403.00212"},{"key":"ref62","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2023.3275106"},{"key":"ref63","doi-asserted-by":"publisher","DOI":"10.1109\/ICAIIC54071.2022.9722657"},{"key":"ref64","doi-asserted-by":"publisher","DOI":"10.1016\/j.imavis.2018.09.008"},{"key":"ref65","doi-asserted-by":"publisher","DOI":"10.1016\/j.neucom.2021.11.003"},{"key":"ref66","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR46437.2021.00366"},{"key":"ref67","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-20071-7_38"},{"key":"ref68","article-title":"MediaPipe: A framework for building perception pipelines","author":"Lugaresi","year":"2019","journal-title":"arXiv:1906.08172"}],"container-title":["IEEE Access"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/6287639\/10380310\/10737059.pdf?arnumber=10737059","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,11,27]],"date-time":"2024-11-27T03:15:03Z","timestamp":1732677303000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10737059\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024]]},"references-count":68,"URL":"https:\/\/doi.org\/10.1109\/access.2024.3487414","relation":{},"ISSN":["2169-3536"],"issn-type":[{"type":"electronic","value":"2169-3536"}],"subject":[],"published":{"date-parts":[[2024]]}}}