{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,10]],"date-time":"2026-04-10T05:56:39Z","timestamp":1775800599947,"version":"3.50.1"},"reference-count":49,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/ieeexplore.ieee.org\/Xplorehelp\/downloads\/license-information\/IEEE.html"},{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2026,1,1]],"date-time":"2026-01-01T00:00:00Z","timestamp":1767225600000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62571283"],"award-info":[{"award-number":["62571283"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Trans.Inform.Forensic Secur."],"published-print":{"date-parts":[[2026]]},"DOI":"10.1109\/tifs.2026.3671687","type":"journal-article","created":{"date-parts":[[2026,3,6]],"date-time":"2026-03-06T20:59:32Z","timestamp":1772830772000},"page":"3703-3718","source":"Crossref","is-referenced-by-count":0,"title":["DUAP: Disentanglement-Based Universal Adversarial Perturbations for Robust Multilingual Speech Privacy Protection"],"prefix":"10.1109","volume":"21","author":[{"ORCID":"https:\/\/orcid.org\/0009-0005-2060-4172","authenticated-orcid":false,"given":"Qianli","family":"Ma","sequence":"first","affiliation":[{"name":"College of Information Science and Engineering, Ningbo University, Ningbo, China"}]},{"ORCID":"https:\/\/orcid.org\/0009-0004-4401-2385","authenticated-orcid":false,"given":"Wenjie","family":"Zhang","sequence":"additional","affiliation":[{"name":"College of Information Science and Engineering, Ningbo University, Ningbo, China"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-5894-662X","authenticated-orcid":false,"given":"Jiahao","family":"Chen","sequence":"additional","affiliation":[{"name":"College of Computer Science and Technology, Zhejiang University, Hangzhou, China"}]},{"ORCID":"https:\/\/orcid.org\/0009-0009-5033-626X","authenticated-orcid":false,"given":"Jiazhen","family":"Jia","sequence":"additional","affiliation":[{"name":"College of Information Science and Engineering, Ningbo University, Ningbo, China"}]},{"given":"Rangding","family":"Wang","sequence":"additional","affiliation":[{"name":"College of Digital Technology and Engineering, Ningbo University of Finance and Economics, Ningbo, China"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-5241-7276","authenticated-orcid":false,"given":"Diqun","family":"Yan","sequence":"additional","affiliation":[{"name":"College of Information Science and Engineering, Ningbo University, Ningbo, China"}]}],"member":"263","reference":[{"key":"ref1","first-page":"28492","article-title":"Robust speech recognition via large-scale weak supervision","volume-title":"Proc. 40th Int. Conf. Mach. Learn.","author":"Radford"},{"key":"ref2","article-title":"Deep speech: Scaling up end-to-end speech recognition","author":"Hannun","year":"2014","journal-title":"arXiv:1412.5567"},{"key":"ref3","first-page":"1","article-title":"Wav2vec 2.0: A framework for self-supervised learning of speech representations","volume-title":"Proc. 34th Int. Conf. Neural Inf. Process. Syst.","author":"Baevski"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/TASLP.2021.3122291"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.21437\/interspeech.2020-3015"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2015.7178964"},{"key":"ref7","first-page":"6462","article-title":"Artie bias corpus: An open dataset for detecting demographic bias in speech applications","volume-title":"Proc. 12th Lang. Resour. Eval. Conf.","author":"Meyer"},{"key":"ref8","article-title":"Common voice: A massively-multilingual speech corpus","author":"Ardila","year":"2019","journal-title":"arXiv:1912.06670"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.21437\/CHiME.2020-1"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-99579-3_21"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1145\/3630106.3658996"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1017\/CBO9780511624971"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2023-1105"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2019-1353"},{"key":"ref15","first-page":"2667","article-title":"Devil\u2019s whisper: A general approach for physical adversarial attacks against commercial black-box speech recognition devices","volume-title":"Proc. 29th USENIX Secur. Symp.","author":"Chen"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/TIFS.2020.3026543"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/sp40001.2021.00009"},{"key":"ref18","first-page":"247","article-title":"KENKU: Towards efficient and stealthy black-box adversarial attacks against ASR systems","volume-title":"Proc. 32nd USENIX Secur. Symp. (USENIX Secur.)","author":"Wu"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/TDSC.2023.3242292"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.5121\/csit.2024.141112"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/LSP.2024.3443711"},{"key":"ref22","first-page":"7549","article-title":"Muting whisper: A universal acoustic adversarial attack on speech foundation models","volume-title":"Proc. Conf. Empirical Methods Natural Lang. Process.","author":"Raina"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/GLOCOM.2018.8647189"},{"key":"ref24","first-page":"1","article-title":"Demystifying limited adversarial transferability in automatic speech recognition systems","volume-title":"Proc. ICLR","author":"Abdullah"},{"key":"ref25","first-page":"1","article-title":"Practical hidden voice attacks against speech and speaker recognition systems","volume-title":"Proc. Netw. Distrib. Syst. Secur. Symp.","author":"Abdullah"},{"key":"ref26","first-page":"2973","article-title":"More simplicity for trainers, more opportunity for attackers: Black-box attacks on speaker recognition systems by inferring feature extractor","volume-title":"Proc. 33rd USENIX Secur. Symp. (USENIX Secur.)","author":"Ge"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP48485.2024.10447699"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-031-71391-0_9"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.48550\/arxiv.1211.3711"},{"key":"ref30","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2022.3159339"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.21437\/interspeech.2019-1819"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1145\/1143844.1143891"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2019.8683223"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP39728.2021.9414227"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.48550\/ARXIV.1706.03762"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1109\/TIFS.2023.3283915"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1007\/978-981-15-9129-7_31"},{"key":"ref38","first-page":"4643","article-title":"Whispering under the eaves: Protecting user privacy against commercial and LLM-powered automatic speech recognition systems","volume-title":"Proc. 34th USENIX Secur. Symp. (USENIX Secur.)","author":"Jin"},{"key":"ref39","doi-asserted-by":"publisher","DOI":"10.1109\/SLT61566.2024.10832273"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1145\/3716553.3750779"},{"key":"ref41","article-title":"MORE: Multi-objective adversarial attacks on speech recognition","author":"Gao","year":"2026","journal-title":"arXiv:2601.01852"},{"key":"ref42","doi-asserted-by":"publisher","DOI":"10.21437\/Interspeech.2022-571"},{"key":"ref43","first-page":"340","article-title":"Discriminative feature decoupling enhancement for speech forgery detection","volume-title":"Proc. 33rd Int. Joint Conf. Artif. Intell. (IJCAI)","author":"Bei"},{"key":"ref44","doi-asserted-by":"publisher","DOI":"10.1109\/tip.2022.3211736"},{"issue":"11","key":"ref45","first-page":"12562","article-title":"Avocodo: Generative adversarial network for artifact-free vocoder","volume-title":"Proc. AAAI Conf. Artif. Intell.","volume":"37","author":"Bak"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00957"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1109\/SLT54892.2023.10023141"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-24574-4_28"},{"key":"ref49","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.683"}],"container-title":["IEEE Transactions on Information Forensics and Security"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/10206\/11313711\/11422989.pdf?arnumber=11422989","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2026,4,10]],"date-time":"2026-04-10T05:04:27Z","timestamp":1775797467000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/11422989\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026]]},"references-count":49,"URL":"https:\/\/doi.org\/10.1109\/tifs.2026.3671687","relation":{},"ISSN":["1556-6013","1556-6021"],"issn-type":[{"value":"1556-6013","type":"print"},{"value":"1556-6021","type":"electronic"}],"subject":[],"published":{"date-parts":[[2026]]}}}