{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,23]],"date-time":"2026-04-23T07:56:37Z","timestamp":1776930997122,"version":"3.51.2"},"publisher-location":"New York, NY, USA","reference-count":118,"publisher":"ACM","funder":[{"name":"NSERC","award":["RGPIN-2021-04268"],"award-info":[{"award-number":["RGPIN-2021-04268"]}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2026,4,13]]},"DOI":"10.1145\/3772318.3790402","type":"proceedings-article","created":{"date-parts":[[2026,4,13]],"date-time":"2026-04-13T04:12:36Z","timestamp":1776053556000},"page":"1-19","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":0,"title":["FAME: Exploring Expressive Facial Avatars for Lyrical and Non-Lyrical Music Visualization for d\/Deaf Individuals"],"prefix":"10.1145","author":[{"ORCID":"https:\/\/orcid.org\/0000-0001-6098-9947","authenticated-orcid":false,"given":"Suhyeon","family":"Yoo","sequence":"first","affiliation":[{"name":"Computer Science, University of Toronto, Toronto, Ontario, Canada"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-5194-0359","authenticated-orcid":false,"given":"Yifang","family":"Pan","sequence":"additional","affiliation":[{"name":"Dynamic Graphics Project, University of Toronto, Toronto, Ontario, Canada"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0006-8803-9891","authenticated-orcid":false,"given":"Ashish","family":"Ajin Thomas","sequence":"additional","affiliation":[{"name":"Computer Science, University of Toronto, Toronto, Ontario, Canada"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-2232-7480","authenticated-orcid":false,"given":"Karan","family":"Singh","sequence":"additional","affiliation":[{"name":"Department of Computer Science, University of Toronto, Toronto, Ontario, Canada"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-0774-5964","authenticated-orcid":false,"given":"Khai N.","family":"Truong","sequence":"additional","affiliation":[{"name":"Computer Science, University of Toronto, Toronto, Ontario, Canada"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2026,4,13]]},"reference":[{"key":"e_1_3_3_2_2_2","unstructured":"ACE Studio. 2025. AI Singing Voice Generator. https:\/\/acestudio.ai\/ Accessed 2025-04-03."},{"key":"e_1_3_3_2_3_2","doi-asserted-by":"crossref","unstructured":"Simon Alexanderson and Jonas Beskow. 2014. Animated Lombard speech: motion capture facial animation and visual intelligibility of speech produced in adverse conditions. Computer Speech & Language 28 2 (2014) 607\u2013618.","DOI":"10.1016\/j.csl.2013.02.005"},{"key":"e_1_3_3_2_4_2","doi-asserted-by":"publisher","DOI":"10.1145\/3340555.3353744"},{"key":"e_1_3_3_2_5_2","doi-asserted-by":"publisher","DOI":"10.1145\/3544549.3583946"},{"key":"e_1_3_3_2_6_2","doi-asserted-by":"crossref","unstructured":"Taravat Anvari Kyoungju Park and Ganghyun Kim. 2023. Upper body pose estimation using deep learning for a virtual reality avatar. Applied Sciences 13 4 (2023) 2460.","DOI":"10.3390\/app13042460"},{"key":"e_1_3_3_2_7_2","doi-asserted-by":"crossref","unstructured":"Tenglong Ao Qingzhe Gao Yuke Lou Baoquan Chen and Libin Liu. 2022. Rhythmic gesticulator: Rhythm-aware co-speech gesture synthesis with hierarchical neural embeddings. ACM Transactions on Graphics (TOG) 41 6 (2022) 1\u201319.","DOI":"10.1145\/3550454.3555435"},{"key":"e_1_3_3_2_8_2","doi-asserted-by":"crossref","unstructured":"Tenglong Ao Zeyi Zhang and Libin Liu. 2023. Gesturediffuclip: Gesture diffusion model with clip latents. ACM Transactions on Graphics (TOG) 42 4 (2023) 1\u201318.","DOI":"10.1145\/3592097"},{"key":"e_1_3_3_2_9_2","doi-asserted-by":"publisher","DOI":"10.1145\/3641233.3664312"},{"key":"e_1_3_3_2_10_2","doi-asserted-by":"crossref","unstructured":"William Bauer. 2007. Louis Armstrong\u2019s Skid Dat De Dat: Timbral Organization in an Early Scat Solo. Jazz Perspectives 1 2 (2007) 133\u2013165.","DOI":"10.1080\/17494060701611809"},{"key":"e_1_3_3_2_11_2","unstructured":"William\u00a0R Bauer. 2002. Scat singing: a timbral and phonemic analysis. Columbia University (2002)."},{"key":"e_1_3_3_2_12_2","volume-title":"Deaf gain: Raising the stakes for human diversity","author":"Bauman H-Dirksen\u00a0L","year":"2014","unstructured":"H-Dirksen\u00a0L Bauman and Joseph\u00a0J Murray. 2014. Deaf gain: Raising the stakes for human diversity. U of Minnesota Press."},{"key":"e_1_3_3_2_13_2","doi-asserted-by":"publisher","DOI":"10.1145\/3234695.3236348"},{"key":"e_1_3_3_2_14_2","doi-asserted-by":"crossref","unstructured":"Lynne\u00a0E Bernstein Nicole Jordan Edward\u00a0T Auer and Silvio\u00a0P Eberhardt. 2022. Lipreading: A review of its continuing importance for speech recognition with an acquired hearing loss and possibilities for effective training. American Journal of Audiology 31 2 (2022) 453\u2013469.","DOI":"10.1044\/2021_AJA-21-00112"},{"key":"e_1_3_3_2_15_2","doi-asserted-by":"publisher","DOI":"10.1109\/MetaCom57706.2023.00058"},{"key":"e_1_3_3_2_16_2","first-page":"7187","volume-title":"Encyclopedia of quality of life and well-being research","author":"Braun Virginia","year":"2024","unstructured":"Virginia Braun and Victoria Clarke. 2024. Thematic analysis. In Encyclopedia of quality of life and well-being research. Springer, 7187\u20137193."},{"key":"e_1_3_3_2_17_2","volume-title":"14th International Symposium on Computer Music Multidisciplinary Research","author":"Br\u00e9t\u00e9ch\u00e9 Sylvain","year":"2019","unstructured":"Sylvain Br\u00e9t\u00e9ch\u00e9. 2019. Visual music? The Deaf experience. In 14th International Symposium on Computer Music Multidisciplinary Research."},{"key":"e_1_3_3_2_18_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01692-0_42"},{"key":"e_1_3_3_2_19_2","doi-asserted-by":"publisher","DOI":"10.1145\/3359852.3359892"},{"key":"e_1_3_3_2_20_2","doi-asserted-by":"crossref","unstructured":"Doga Cavdir. 2024. Development of embodied listening studies with multimodal and wearable haptic interfaces for hearing accessibility in music. Frontiers in Computer Science 5 (2024) 1162758.","DOI":"10.3389\/fcomp.2023.1162758"},{"key":"e_1_3_3_2_21_2","doi-asserted-by":"crossref","unstructured":"Gizem \u00c7elik. 2023. A new field in music production: metaverse concerts. Ege \u00dcniversitesi \u0130leti\u015fim Fak\u00fcltesi Medya ve \u0130leti\u015fim Ara\u015ft\u0131rmalar\u0131 Hakemli E-Dergisi12 (2023) 4\u201324.","DOI":"10.56075\/egemiadergisi.1230583"},{"key":"e_1_3_3_2_22_2","doi-asserted-by":"crossref","unstructured":"Vinay Chamola Gaurang Bansal Tridib\u00a0Kumar Das Vikas Hassija Siva Sai Jiacheng Wang Sherali Zeadally Amir Hussain Fei\u00a0Richard Yu Mohsen Guizani et\u00a0al. 2024. Beyond reality: The pivotal role of generative ai in the metaverse. IEEE Internet of Things Magazine 7 4 (2024) 126\u2013135.","DOI":"10.1109\/IOTM.001.2300174"},{"key":"e_1_3_3_2_23_2","doi-asserted-by":"publisher","DOI":"10.1145\/3721238.3730611"},{"key":"e_1_3_3_2_24_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52733.2024.00702"},{"key":"e_1_3_3_2_25_2","unstructured":"Zeyuan Chen Hongyi Xu Guoxian Song You Xie Chenxu Zhang Xin Chen Chao Wang Di Chang and Linjie Luo. 2025. X-dancer: Expressive music to human dance video generation. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2502.17414 (2025)."},{"key":"e_1_3_3_2_26_2","first-page":"543","volume-title":"International Conference on Robot Intelligence Technology and Applications","author":"Choi JaeHyeok","year":"2021","unstructured":"JaeHyeok Choi, Jonggwun Chong, Woojin Lee, and WonHyong Lee. 2021. VR Karaoke Using Expressive 3D Avatars. In International Conference on Robot Intelligence Technology and Applications. Springer, 543\u2013552."},{"key":"e_1_3_3_2_27_2","doi-asserted-by":"publisher","DOI":"10.1145\/3613904.3642665"},{"key":"e_1_3_3_2_28_2","doi-asserted-by":"publisher","DOI":"10.1145\/3675094.3678378"},{"key":"e_1_3_3_2_29_2","doi-asserted-by":"publisher","DOI":"10.1145\/3611659.3615682"},{"key":"e_1_3_3_2_30_2","doi-asserted-by":"crossref","unstructured":"Nicole Christoff Nikolay\u00a0N Neshov Krasimir Tonchev and Agata Manolova. 2023. Application of a 3D talking head as part of telecommunication AR VR MR system: systematic review. Electronics 12 23 (2023) 4788.","DOI":"10.3390\/electronics12234788"},{"key":"e_1_3_3_2_31_2","doi-asserted-by":"publisher","DOI":"10.1145\/1873951.1874320"},{"key":"e_1_3_3_2_32_2","doi-asserted-by":"crossref","unstructured":"Victoria Clarke and Virginia Braun. 2017. Thematic analysis. The journal of positive psychology 12 3 (2017) 297\u2013298.","DOI":"10.1080\/17439760.2016.1262613"},{"key":"e_1_3_3_2_33_2","unstructured":"Jody Cripps. 2018. Ethnomusicology & signed music: A breakthrough. Journal of American Sign Languages & Literatures 6 (2018)."},{"key":"e_1_3_3_2_34_2","unstructured":"CuteCircuit. 2025. SoundShirt. https:\/\/cutecircuit.com\/soundshirt\/ Accessed November 11 2025."},{"key":"e_1_3_3_2_35_2","doi-asserted-by":"crossref","unstructured":"Alice-Ann Darrow. 1993. The role of music in deaf culture: Implications for music educators. Journal of Research in Music Education 41 2 (1993) 93\u2013110.","DOI":"10.2307\/3345402"},{"key":"e_1_3_3_2_36_2","doi-asserted-by":"publisher","DOI":"10.1145\/3334480.3383046"},{"key":"e_1_3_3_2_37_2","doi-asserted-by":"publisher","DOI":"10.1145\/3491101.3519628"},{"key":"e_1_3_3_2_38_2","doi-asserted-by":"publisher","DOI":"10.4324\/9781003183624-1"},{"key":"e_1_3_3_2_39_2","doi-asserted-by":"crossref","unstructured":"Melanie\u00a0Pius Dsouza Ankitha Shetty Sara\u00a0Ellen Dsouza Elisha Buthello and Nachiket Gudi. 2025. Vibing the Young Consumer to Wellness: Exploring Lo-Fi Music Consumption Through the Positive Design Lens. Sage Open 15 1 (2025) 21582440251318806.","DOI":"10.1177\/21582440251318806"},{"key":"e_1_3_3_2_40_2","doi-asserted-by":"crossref","unstructured":"Pif Edwards Chris Landreth Eugene Fiume and Karan Singh. 2016. Jali: an animator-centric viseme model for expressive lip synchronization. ACM Transactions on graphics (TOG) 35 4 (2016) 1\u201311.","DOI":"10.1145\/2897824.2925984"},{"key":"e_1_3_3_2_41_2","doi-asserted-by":"crossref","unstructured":"Paul Ekman. 1992. An argument for basic emotions. Cognition & emotion 6 3-4 (1992) 169\u2013200.","DOI":"10.1080\/02699939208411068"},{"key":"e_1_3_3_2_42_2","doi-asserted-by":"publisher","DOI":"10.1145\/3491101.3519732"},{"key":"e_1_3_3_2_43_2","doi-asserted-by":"crossref","unstructured":"Joyce\u00a0Horn Fonteles Maria Andr\u00e9ia\u00a0Formico Rodrigues and Victor Emanuel\u00a0Dias Basso. 2013. Creating and evaluating a particle system for music visualization. Journal of Visual Languages & Computing 24 6 (2013) 472\u2013482.","DOI":"10.1016\/j.jvlc.2013.10.002"},{"key":"e_1_3_3_2_44_2","doi-asserted-by":"publisher","DOI":"10.1109\/TIC-STH.2009.5444364"},{"key":"e_1_3_3_2_45_2","doi-asserted-by":"crossref","unstructured":"Yuan Gan Ruijie Quan and Yawei Luo. 2024. Expavatar: High-fidelity avatar generation of unseen expressions with 3d face priors. ACM Transactions on Multimedia Computing Communications and Applications (2024).","DOI":"10.1145\/3700770"},{"key":"e_1_3_3_2_46_2","doi-asserted-by":"crossref","unstructured":"Caroline Guardino and Joanna\u00a0E Cannon. 2016. Deafness and diversity: Reflections and directions. American Annals of the Deaf 161 1 (2016) 104\u2013112.","DOI":"10.1353\/aad.2016.0016"},{"key":"e_1_3_3_2_47_2","doi-asserted-by":"crossref","unstructured":"Kaixin Han Weitao You Shuhui Shi and Lingyun Sun. 2024. Hearing with the eyes: modulating lyrics typography for music visualization. The Visual Computer 40 11 (2024) 8345\u20138361.","DOI":"10.1007\/s00371-023-03239-5"},{"key":"e_1_3_3_2_48_2","unstructured":"Louise Hickman and Shannon Finnegan. 2020. Captioning on Captioning. https:\/\/lux.org.uk\/work\/captioning-on-captioning\/ Short film on LUX (UK) website. Accessed 2025-11-11."},{"key":"e_1_3_3_2_49_2","doi-asserted-by":"publisher","DOI":"10.1145\/3373625.3416996"},{"key":"e_1_3_3_2_50_2","doi-asserted-by":"crossref","unstructured":"Jessica\u00a0A Holmes. 2017. Expert listening beyond the limits of hearing: Music and deafness. Journal of the American Musicological Society 70 1 (2017) 171\u2013220.","DOI":"10.1525\/jams.2017.70.1.171"},{"key":"e_1_3_3_2_51_2","doi-asserted-by":"crossref","unstructured":"Liwen Hu Shunsuke Saito Lingyu Wei Koki Nagano Jaewoo Seo Jens Fursund Iman Sadeghi Carrie Sun Yen-Chun Chen and Hao Li. 2017. Avatar digitization from a single image for real-time rendering. ACM Transactions on Graphics (ToG) 36 6 (2017) 1\u201314.","DOI":"10.1145\/3130800.31310887"},{"key":"e_1_3_3_2_52_2","volume-title":"Audio Engineering Society Conference: AES 2023 International Conference on Spatial and Immersive Audio","author":"Hunt Anthony","year":"2023","unstructured":"Anthony Hunt, Helena Daffern, and Gavin Kearney. 2023. Avatar representation in extended reality for immersive networked music performance. In Audio Engineering Society Conference: AES 2023 International Conference on Spatial and Immersive Audio. Audio Engineering Society."},{"key":"e_1_3_3_2_53_2","unstructured":"Industrial Designers Society of America. 2020. Music: Not Impossible. https:\/\/www.idsa.org\/awards-recognition\/idea\/idea-gallery\/music-not-impossible\/ IDEA Award Gallery. Accessed November 11 2025."},{"key":"e_1_3_3_2_54_2","doi-asserted-by":"crossref","unstructured":"Kosuke Itoh Honami Sakata Ingrid\u00a0L Kwee and Tsutomu Nakada. 2017. Musical pitch classes have rainbow hues in pitch class-color synesthesia. Scientific reports 7 1 (2017) 17781.","DOI":"10.1038\/s41598-017-18150-y"},{"key":"e_1_3_3_2_55_2","doi-asserted-by":"crossref","unstructured":"Aobo Jin Qixin Deng and Zhigang Deng. 2020. A live speech-driven avatar-mediated three-party telepresence system: design and evaluation. PRESENCE: Virtual and Augmented Reality 29 (2020) 113\u2013139.","DOI":"10.1162\/pres_a_00358"},{"key":"e_1_3_3_2_56_2","doi-asserted-by":"publisher","DOI":"10.1145\/2992138.2992146"},{"key":"e_1_3_3_2_57_2","doi-asserted-by":"publisher","DOI":"10.1145\/502390.502429"},{"key":"e_1_3_3_2_58_2","unstructured":"Luis Jure. 2012. Pitch content visualization tools for music performance analysis. International Society for Music Information Retrieval Conference (2012)."},{"key":"e_1_3_3_2_59_2","doi-asserted-by":"publisher","DOI":"10.1145\/2702123.2702140"},{"key":"e_1_3_3_2_60_2","unstructured":"Christine\u00a0Sun Kim. 2020. Artist Christine Sun Kim Rewrites Closed Captions. Pop-Up Magazine video. https:\/\/www.youtube.com\/watch?v=tfe479qL8hg Accessed 2025-11-30."},{"key":"e_1_3_3_2_61_2","first-page":"1519","volume-title":"Proceedings of the Thirteenth Language Resources and Evaluation Conference","author":"Kim Jung-Ho","year":"2022","unstructured":"Jung-Ho Kim, Eui\u00a0Jun Hwang, Sukmin Cho, Du\u00a0Hui Lee, and Jong\u00a0C Park. 2022. Sign language production with avatar layering: A critical use case over rare words. In Proceedings of the Thirteenth Language Resources and Evaluation Conference. 1519\u20131528."},{"key":"e_1_3_3_2_62_2","unstructured":"Rachel Kolb. 2017. Sensations of Sound. Interactive feature The New York Times. https:\/\/www.nytimes.com\/interactive\/2017\/multimedia\/sensations-of-sound-vr-rachel-kolb.html Accessed 2025-11-30."},{"key":"e_1_3_3_2_63_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-48050-8_22"},{"key":"e_1_3_3_2_64_2","doi-asserted-by":"publisher","DOI":"10.1145\/3373625.3417299"},{"key":"e_1_3_3_2_65_2","unstructured":"ChungHa Lee and Jin-Hyuk Hong. 2025. musicolors: Bridging Sound and Visuals For Synesthetic Creative Musical Experience. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2503.14220 (2025)."},{"key":"e_1_3_3_2_66_2","doi-asserted-by":"crossref","unstructured":"Daniel\u00a0G Lee Deborah\u00a0I Fels and John\u00a0Patrick Udo. 2007. Emotive captioning. Computers in Entertainment (CIE) 5 2 (2007) 11.","DOI":"10.1145\/1279540.1279551"},{"key":"e_1_3_3_2_67_2","doi-asserted-by":"crossref","unstructured":"Sebin Lee Geunmo Lee Seongkyu Han Seunghwa Jeong and Jungjin Lee. 2023. A simulcast system for live streaming and virtual avatar concerts. Journal of the Korea Computer Graphics Society 29 2 (2023) 21\u201330.","DOI":"10.15701\/kcgs.2023.29.2.21"},{"key":"e_1_3_3_2_68_2","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v36i2.20014"},{"key":"e_1_3_3_2_69_2","doi-asserted-by":"crossref","unstructured":"Jing Li Chuchu Wang and Mo Chen. 2025. Effects of Driving Background Complexity and Interface Opacity on Visual Cognition in AR-HUD Systems. Journal of the Society for Information Display 33 8 (2025) 919\u2013936.","DOI":"10.1002\/jsid.2096"},{"key":"e_1_3_3_2_70_2","unstructured":"Jiaman Li Yihang Yin Hang Chu Yi Zhou Tingwu Wang Sanja Fidler and Hao Li. 2020. Learning to generate diverse dance motions with transformer. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2008.08171 (2020)."},{"key":"e_1_3_3_2_71_2","doi-asserted-by":"publisher","DOI":"10.1109\/VR58804.2024.00060"},{"key":"e_1_3_3_2_72_2","unstructured":"Camillo Lugaresi Jiuqiang Tang Hadon Nash Chris McClanahan Esha Uboweja Michael Hays Fan Zhang Chuo-Ling Chang Ming\u00a0Guang Yong Juhyun Lee et\u00a0al. 2019. Mediapipe: A framework for building perception pipelines. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/1906.08172 (2019)."},{"key":"e_1_3_3_2_73_2","doi-asserted-by":"publisher","DOI":"10.1145\/3586183.3606757"},{"key":"e_1_3_3_2_74_2","doi-asserted-by":"crossref","unstructured":"Anabel Maler. 2013. Songs for hands: Analyzing interactions of sign language and music. Music theory online 19 1 (2013).","DOI":"10.30535\/mto.19.1.4"},{"key":"e_1_3_3_2_75_2","doi-asserted-by":"crossref","unstructured":"Anabel Maler. 2015. Musical expression among deaf and hearing song signers. The Oxford handbook of music and disability studies2015 (2015) 73\u201391.","DOI":"10.1093\/oxfordhb\/9780199331444.013.4"},{"key":"e_1_3_3_2_76_2","unstructured":"SM Mather and MD Clark. 2012. The effect of visual split attention in classes for deaf and Hard of Hearing students Odyssey: New Directions in Deaf Education. 2012 13: 20\u201324."},{"key":"e_1_3_3_2_77_2","doi-asserted-by":"crossref","unstructured":"Richard\u00a0E Mayer. 2005. Principles of multimedia learning based on social cues: Personalization voice and image principles. The Cambridge handbook of multimedia learning (2005) 201\u2013212.","DOI":"10.1017\/CBO9780511816819.014"},{"key":"e_1_3_3_2_78_2","doi-asserted-by":"publisher","DOI":"10.1145\/3411763.3451690"},{"key":"e_1_3_3_2_79_2","doi-asserted-by":"crossref","unstructured":"Imtiyaz\u00a0Ali Mir Moniruddin Chowdhury Rabiul\u00a0Md Islam Goh\u00a0Yee Ling Alauddin\u00a0ABM Chowdhury Zobaer\u00a0Md Hasan and Yukihito Higashi. 2021. Relaxing music reduces blood pressure and heart rate among pre-hypertensive young adults: A randomized control trial. The Journal of Clinical Hypertension 23 2 (2021) 317\u2013322.","DOI":"10.1111\/jch.14126"},{"key":"e_1_3_3_2_80_2","doi-asserted-by":"crossref","unstructured":"JaeYoung Moon Youjin Choi Jin-Hyuk Hong and Kyung-Joong Kim. 2025. Sign Dance Maker: A Generative Ai-Assisted Framework for Inclusive Music Performance Support for Sign Language Interpreters. Available at SSRN 5245083 (2025).","DOI":"10.2139\/ssrn.5245083"},{"key":"e_1_3_3_2_81_2","doi-asserted-by":"publisher","DOI":"10.1109\/TIC-STH.2009.5444362"},{"key":"e_1_3_3_2_82_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICICS.2007.4449609"},{"key":"e_1_3_3_2_83_2","doi-asserted-by":"crossref","unstructured":"Eva Naumann. 2025. Human-Like Avatar Embodiment: Advantage or Disadvantage in Digital Emotion Regulation Intervention? Available at SSRN 5440041 (2025).","DOI":"10.2139\/ssrn.5440041"},{"key":"e_1_3_3_2_84_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2008.4518089"},{"key":"e_1_3_3_2_85_2","doi-asserted-by":"publisher","DOI":"10.1145\/3517428.3550396"},{"key":"e_1_3_3_2_86_2","doi-asserted-by":"crossref","unstructured":"Yifang Pan Rishabh Agrawal and Karan Singh. 2024. S3: speech script and scene driven head and eye animation. ACM Transactions on Graphics (TOG) 43 4 (2024) 1\u201312.","DOI":"10.1145\/3658172"},{"key":"e_1_3_3_2_87_2","doi-asserted-by":"publisher","DOI":"10.1145\/3550469.3555408"},{"key":"e_1_3_3_2_88_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-642-31522-0_68"},{"key":"e_1_3_3_2_89_2","doi-asserted-by":"publisher","DOI":"10.1145\/2019406.2019426"},{"key":"e_1_3_3_2_90_2","doi-asserted-by":"crossref","unstructured":"Pablo Revuelta Tom\u00e1s Ortiz Mar\u00eda\u00a0J Luc\u00eda Bel\u00e9n Ruiz and Jos\u00e9\u00a0Manuel S\u00e1nchez-Pena. 2020. Limitations of standard accessible captioning of sounds and music for deaf and hard of hearing people: An EEG study. Frontiers in integrative neuroscience 14 (2020) 1.","DOI":"10.3389\/fnint.2020.00001"},{"key":"e_1_3_3_2_91_2","doi-asserted-by":"crossref","unstructured":"Filipa\u00a0M Rodrigues Ana\u00a0Maria Abreu Ingela Holmstr\u00f6m and Ana Mineiro. 2022. E-learning is a burden for the deaf and hard of hearing. Scientific Reports 12 1 (2022) 9346.","DOI":"10.1038\/s41598-022-13542-1"},{"key":"e_1_3_3_2_92_2","doi-asserted-by":"crossref","unstructured":"Justin Salamon and Emilia G\u00f3mez. 2012. Melody extraction from polyphonic music signals using pitch contour characteristics. IEEE transactions on audio speech and language processing 20 6 (2012) 1759\u20131770.","DOI":"10.1109\/TASL.2012.2188515"},{"key":"e_1_3_3_2_93_2","unstructured":"Patricia\u00a0A Shaw. 2008. Scat syllables and markedness theory. Toronto Working Papers in Linguistics 27 (2008)."},{"key":"e_1_3_3_2_94_2","doi-asserted-by":"crossref","unstructured":"Tracey Skelton and Gill Valentine. 2003. \u2018It feels like being Deaf is normal\u2019: an exploration into the complexities of defining D\/deafness and young D\/deaf people\u2019s identities. Canadian Geographer\/Le G\u00e9ographe Canadien 47 4 (2003) 451\u2013466.","DOI":"10.1111\/j.0008-3658.2003.00035.x"},{"key":"e_1_3_3_2_95_2","doi-asserted-by":"publisher","DOI":"10.1109\/ISMAR-Adjunct57072.2022.00092"},{"key":"e_1_3_3_2_96_2","doi-asserted-by":"publisher","DOI":"10.1145\/3334480.3375150"},{"key":"e_1_3_3_2_97_2","doi-asserted-by":"crossref","unstructured":"Zhiyao Sun Tian Lv Sheng Ye Matthieu Lin Jenny Sheng Yu-Hui Wen Minjing Yu and Yong-jin Liu. 2024. Diffposetalk: Speech-driven stylistic 3d facial animation and head pose generation via diffusion models. ACM Transactions on Graphics (TOG) 43 4 (2024) 1\u20139.","DOI":"10.1145\/3658221"},{"key":"e_1_3_3_2_98_2","doi-asserted-by":"publisher","DOI":"10.1109\/CogInfoCom.2018.8639871"},{"key":"e_1_3_3_2_99_2","doi-asserted-by":"crossref","unstructured":"Olivia Ting. 2024. Between Piano and Forte: Hearing with Aids. Leonardo 57 2 (2024) 153\u2013161.","DOI":"10.1162\/leon_a_02496"},{"key":"e_1_3_3_2_100_2","doi-asserted-by":"crossref","unstructured":"Pauline Tranchant Martha\u00a0M Shiell Marcello Giordano Alexis Nadeau Isabelle Peretz and Robert\u00a0J Zatorre. 2017. Feeling the beat: Bouncing synchronization to vibrotactile music in hearing and early deaf people. Frontiers in neuroscience 11 (2017) 507.","DOI":"10.3389\/fnins.2017.00507"},{"key":"e_1_3_3_2_101_2","doi-asserted-by":"publisher","DOI":"10.1145\/3675094.3678387"},{"key":"e_1_3_3_2_102_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR52729.2023.00051"},{"key":"e_1_3_3_2_103_2","doi-asserted-by":"crossref","unstructured":"Nancy Tye-Murray Mitchell\u00a0S Sommers and Brent Spehar. 2007. Audiovisual integration and lipreading abilities of older adults with normal and impaired hearing. Ear and hearing 28 5 (2007) 656\u2013668.","DOI":"10.1097\/AUD.0b013e31812f7185"},{"key":"e_1_3_3_2_104_2","doi-asserted-by":"crossref","unstructured":"Bavo Van\u00a0Kerrebroeck Giusy Caruso and Pieter-Jan Maes. 2021. A methodological framework for assessing social presence in music interactions in virtual reality. Frontiers in Psychology 12 (2021) 663725.","DOI":"10.3389\/fpsyg.2021.663725"},{"key":"e_1_3_3_2_105_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-540-70540-6_87"},{"key":"e_1_3_3_2_106_2","doi-asserted-by":"publisher","DOI":"10.1145\/3706598.3713688"},{"key":"e_1_3_3_2_107_2","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v37i13.26912"},{"key":"e_1_3_3_2_108_2","unstructured":"Sijing Wu Yunhao Li Weitian Zhang Jun Jia Yucheng Zhu Yichao Yan Guangtao Zhai and Xiaokang Yang. 2025. SingingHead: A large-scale 4D dataset for singing head animation. IEEE Transactions on Multimedia (2025)."},{"key":"e_1_3_3_2_109_2","doi-asserted-by":"publisher","DOI":"10.1109\/ISMAR50242.2020.00083"},{"key":"e_1_3_3_2_110_2","doi-asserted-by":"publisher","DOI":"10.1145\/3544548.3581287"},{"key":"e_1_3_3_2_111_2","doi-asserted-by":"publisher","DOI":"10.1145\/3706598.3713973"},{"key":"e_1_3_3_2_112_2","unstructured":"Kyohei Yoshikawa Takashi Machida Kiyoshi Kiyokawa and Haruo Takemura. 2004. A high presence shared space communication system using 2D background and 3D avatar. IEICE TRANSACTIONS on Information and Systems 87 12 (2004) 2532\u20132539."},{"key":"e_1_3_3_2_113_2","first-page":"1","volume-title":"European Conference on Computer Vision","author":"Yu Zhengdi","year":"2024","unstructured":"Zhengdi Yu, Shaoli Huang, Yongkang Cheng, and Tolga Birdal. 2024. Signavatars: A large-scale 3d sign language holistic motion dataset and benchmark. In European Conference on Computer Vision. Springer, 1\u201319."},{"key":"e_1_3_3_2_114_2","doi-asserted-by":"crossref","unstructured":"LUIZA ZAN and STELA DR\u0102GULIN. 2022. Vocal Depersonalization in Scat Singing. Studia UBB Musica 67 1 (2022).","DOI":"10.24193\/subbmusica.2022.1.13"},{"key":"e_1_3_3_2_115_2","doi-asserted-by":"crossref","unstructured":"Eduard Zell Carlos Aliaga Adrian Jarabo Katja Zibrek Diego Gutierrez Rachel McDonnell and Mario Botsch. 2015. To stylize or not to stylize? The effect of shape and material stylization on the perception of computer-generated faces. ACM Transactions on Graphics (TOG) 34 6 (2015) 1\u201312.","DOI":"10.1145\/2816795.2818126"},{"key":"e_1_3_3_2_116_2","doi-asserted-by":"publisher","DOI":"10.1145\/3706598.3713390"},{"key":"e_1_3_3_2_117_2","doi-asserted-by":"crossref","unstructured":"Shu Zhang Xinge Liu Xuan Yang Yezhi Shu Niqi Liu Dan Zhang and Yong-Jin Liu. 2021. The influence of key facial features on recognition of emotion in cartoon faces. Frontiers in psychology 12 (2021) 687974.","DOI":"10.3389\/fpsyg.2021.687974"},{"key":"e_1_3_3_2_118_2","doi-asserted-by":"publisher","DOI":"10.1145\/3641519.3657413"},{"key":"e_1_3_3_2_119_2","unstructured":"Kyrie\u00a0Zhixuan Zhou Weirui Peng Yuhan Liu and Rachel\u00a0F Adler. 2024. Exploring the Diversity of Music Experiences for Deaf and Hard of Hearing People. arXiv preprint arXiv:https:\/\/arXiv.org\/abs\/2401.09025 (2024)."}],"event":{"name":"CHI 2026: CHI Conference on Human Factors in Computing Systems","location":"Barcelona Spain","acronym":"CHI '26","sponsor":["SIGCHI ACM Special Interest Group on Computer-Human Interaction"]},"container-title":["Proceedings of the 2026 CHI Conference on Human Factors in Computing Systems"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3772318.3790402","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,4,15]],"date-time":"2026-04-15T10:08:01Z","timestamp":1776247681000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3772318.3790402"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,4,13]]},"references-count":118,"alternative-id":["10.1145\/3772318.3790402","10.1145\/3772318"],"URL":"https:\/\/doi.org\/10.1145\/3772318.3790402","relation":{},"subject":[],"published":{"date-parts":[[2026,4,13]]},"assertion":[{"value":"2026-04-13","order":3,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}