{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,7,1]],"date-time":"2025-07-01T21:40:07Z","timestamp":1751406007683,"version":"3.41.0"},"reference-count":48,"publisher":"Springer Science and Business Media LLC","issue":"7","license":[{"start":{"date-parts":[[2025,3,12]],"date-time":"2025-03-12T00:00:00Z","timestamp":1741737600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,3,12]],"date-time":"2025-03-12T00:00:00Z","timestamp":1741737600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"name":"National Key R&D Program - Basic Scientific Research Conditions and Major Scientific Instruments and Equipment Research and Development Project","award":["No 2022YFF0706400"],"award-info":[{"award-number":["No 2022YFF0706400"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Circuits Syst Signal Process"],"published-print":{"date-parts":[[2025,7]]},"DOI":"10.1007\/s00034-025-03064-2","type":"journal-article","created":{"date-parts":[[2025,3,12]],"date-time":"2025-03-12T19:29:04Z","timestamp":1741807744000},"page":"5279-5304","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["Anomalous Sound Detection Using Self-Supervised Classification Deep Hierarchical Reconstruction Network with Symmetric Fusion Attention"],"prefix":"10.1007","volume":"44","author":[{"given":"Hui","family":"Wang","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Kuan","family":"Shen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0009-0000-8702-3069","authenticated-orcid":false,"given":"Fuquan","family":"Wang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2025,3,12]]},"reference":[{"issue":"1","key":"3064_CR1","doi-asserted-by":"publisher","first-page":"46","DOI":"10.1186\/s40537-023-00727-2","volume":"10","author":"L Alzubaidi","year":"2023","unstructured":"L. Alzubaidi, J. Bai, A. Al-Sabaawi, J. Santamar\u00eda, A.S. Albahri, B.S.N. Al-dabbagh, Y. Gu, A survey on deep learning tools dealing with data scarcity: definitions, challenges, solutions, tips, and applications. J. Big Data 10(1), 46 (2023)","journal-title":"J. Big Data"},{"key":"3064_CR2","doi-asserted-by":"publisher","first-page":"103939","DOI":"10.1016\/j.dsp.2023.103939","volume":"135","author":"J Bai","year":"2023","unstructured":"J. Bai, J. Chen, M. Wang, M.S. Ayub, Q. Yan, SSDPT: Self-supervised dual-path transformer for anomalous sound detection. Digital Signal Process. 135, 103939 (2023)","journal-title":"Digital Signal Process."},{"key":"3064_CR3","doi-asserted-by":"crossref","unstructured":"A. Bendale, T.E. Boult. Towards open set deep networks. In Proceedings of the IEEE conference on computer vision and pattern Recognition (CVPR). pp. 1563\u20131572(2016)","DOI":"10.1109\/CVPR.2016.173"},{"key":"3064_CR4","doi-asserted-by":"publisher","first-page":"321","DOI":"10.1613\/jair.953","volume":"16","author":"NV Chawla","year":"2002","unstructured":"N.V. Chawla, K.W. Bowyer, L.O. Hall, W.P. Kegelmeyer, SMOTE: synthetic minority over-sampling technique. J. Artif. Intell. Res. 16, 321\u2013357 (2002)","journal-title":"J. Artif. Intell. Res."},{"key":"3064_CR5","doi-asserted-by":"crossref","unstructured":"S. Choi, J.W. Choi. Noisy-Arcmix: Additive noisy angular margin loss combined with Mixup for anomalous sound detection. In Proceedings of international conference on acoustics, speech and signal processing (ICASSP). pp. 516\u2013520(2024)","DOI":"10.1109\/ICASSP48485.2024.10447764"},{"key":"3064_CR6","unstructured":"K. Dohi, K. Imoto, N. Harada, D. Niizumi, Y. Koizumi, T. Nishida, H. Purohit, R. Tanabe, T. Endo, Y. Kawaguchi. Description and discussion on DCASE 2023 challenge task 2: First-shot unsupervised anomalous sound detection for machine condition monitoring. In Proceedings of Detection and classification of acoustic scenes and events (DCASE) Workshop. pp. 31\u201335(2023)"},{"key":"3064_CR7","unstructured":"K. Dohi, T. Nishida, H. Purohit, R. Tanabe, T. Endo, M. Yamamoto, Y Nikaido, Y. Kawaguchi. MIMII DG: Sound dataset for malfunctioning industrial machine investigation and inspection for domain generalization task. In Proceedings of detection and classification of acoustic scenes and events (DCASE) Workshop. pp. 26\u201330(2022)"},{"key":"3064_CR8","doi-asserted-by":"crossref","unstructured":"T. Fujimura, K. Imoto, T. Toda. Discriminative neighborhood smoothing for generative anomalous sound detection. arXiv:2403.11508. (2024)","DOI":"10.23919\/EUSIPCO63174.2024.10715201"},{"issue":"1","key":"3064_CR9","doi-asserted-by":"publisher","first-page":"42","DOI":"10.1186\/s13636-023-00308-4","volume":"2023","author":"J Guan","year":"2023","unstructured":"J. Guan, Y. Liu, Q. Kong, F. Xiao, Q. Zhu, J. Tian, W. Wang, Transformer-based autoencoder with ID constraint for unsupervised anomalous sound detection. EURASIP J. Audio Speech Music Process. 2023(1), 42 (2023)","journal-title":"EURASIP J. Audio Speech Music Process."},{"key":"3064_CR10","doi-asserted-by":"crossref","unstructured":"J. Guan, J. Tian, Q. Zhu, F. Xiao, H. Zhang, X. Liu. Disentangling hierarchical features for anomalous sound detection under domain shift. arXiv:2501.01604. (2025)","DOI":"10.1109\/ICASSP49660.2025.10888266"},{"key":"3064_CR11","doi-asserted-by":"crossref","unstructured":"J. Guan, F. Xiao, Y. Liu, Q. Zhu, W. Wang. Anomalous sound detection using audio representation with machine ID based contrastive learning pretraining. In proceedings of international conference on acoustics, speech and signal processing (ICASSP). pp. 1\u20135(2023)","DOI":"10.1109\/ICASSP49357.2023.10096054"},{"key":"3064_CR12","doi-asserted-by":"crossref","unstructured":"N. Harada, D. Niizumi, Y. Ohishi, D. Takeuchi, M. Yasuda. First-shot anomaly sound detection for machine condition monitoring: A domain generalization baseline. In Proceedings of European signal processing conference (EUSIPCO). pp. 191\u2013195(2023)","DOI":"10.23919\/EUSIPCO58844.2023.10289721"},{"key":"3064_CR13","unstructured":"N. Harada, D. Niizumi, D. Takeuchi, Y. Ohishi, M. Yasuda, S. Saito. ToyADMOS2: Another dataset of miniature-machine operating sounds for anomalous sound detection under domain shift conditions. In Proceedings of Detection and Classification of Acoustic Scenes and Events (DCASE) Workshop. pp. 1\u20135(2021)"},{"issue":"1","key":"3064_CR14","doi-asserted-by":"publisher","first-page":"135","DOI":"10.1186\/s40537-024-00985-8","volume":"11","author":"E Hassan","year":"2024","unstructured":"E. Hassan, S. Elbedwehy, M.Y. Shams, T. Abd El-Hafeez, N. El-Rashidy, Optimizing poultry audio signal classification with deep learning and burn layer fusion. J. Big Data. 11(1), 135 (2024)","journal-title":"J. Big Data."},{"issue":"19","key":"3064_CR15","doi-asserted-by":"publisher","first-page":"6991","DOI":"10.3390\/app10196991","volume":"10","author":"M Hong","year":"2020","unstructured":"M. Hong, H. Ahn, O. Atif, J. Lee, D. Park, Y. Chung, Field-applicable pig anomaly detection system using vocalization for embedded board implementations. Appl. Sci. 10(19), 6991 (2020)","journal-title":"Appl. Sci."},{"key":"3064_CR16","doi-asserted-by":"crossref","unstructured":"Q. Hou, D. Zhou, J. Feng. Coordinate attention for efficient mobile network design. In Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition (CVPR). pp. 13713\u201313722(2021)","DOI":"10.1109\/CVPR46437.2021.01350"},{"key":"3064_CR17","doi-asserted-by":"crossref","unstructured":"J. Hu, L. Shen, G. Sun. Squeeze-and-excitation networks. In Proceedings of the IEEE conference on computer vision and pattern recognition (CVPR). pp. 7132\u20137141(2018)","DOI":"10.1109\/CVPR.2018.00745"},{"key":"3064_CR18","unstructured":"Y. Jia, J. Bai, S. Huang, J. Chen. Unsupervised abnormal sound detection based on machine condition mixup. Technical report, DCASE2023 Challenge (2023)"},{"key":"3064_CR19","unstructured":"A. Jiang, Q. Hou, J. Liu, P. Fan, J. Ma, C. Lu, Y. Zhai, Y Deng, W Zhang. Thuee system for first-shot unsupervised anomalous sound detection for machine condition monitoring. Technical report, DCASE2023 Challenge (2023)"},{"key":"3064_CR20","doi-asserted-by":"crossref","unstructured":"A. Jiang, W.Q. Zhang, Y. Deng, P. Fan, J. Liu. Unsupervised anomaly detection and localization of machine audio: a GAN-based approach. In Proceedings of international conference on acoustics, speech, and signal Processing (ICASSP). pp. 1\u20135(2023)","DOI":"10.1109\/ICASSP49357.2023.10096813"},{"key":"3064_CR21","unstructured":"S. Kapka. ID-conditioned auto-encoder for unsupervised anomaly detection. arXiv:2007.05314. (2020)"},{"key":"3064_CR22","unstructured":"D.P. Kingma, J. Ba. Adam: A method for stochastic optimization. arXiv:1412.6980. (2014)"},{"key":"3064_CR23","doi-asserted-by":"crossref","unstructured":"H. Lan, Q. Zhu, J. Guan, Y. Wei, W. Wang. Hierarchical metadata information constrained self-supervised learning for anomalous sound detection under domain shift. In Proceedings of international conference on acoustics, speech and signal processing (ICASSP). pp. 7670\u20137674(2024)","DOI":"10.1109\/ICASSP48485.2024.10446044"},{"issue":"20","key":"3064_CR24","doi-asserted-by":"publisher","first-page":"23628","DOI":"10.1007\/s10489-023-04767-2","volume":"53","author":"J Lin","year":"2023","unstructured":"J. Lin, Y. He, W. Xu, J. Guan, J. Zhang, S. Zhou, Latent feature reconstruction for unsupervised anomaly detection. Appl. Intell. 53(20), 23628\u201323640 (2023)","journal-title":"Appl. Intell."},{"key":"3064_CR25","doi-asserted-by":"crossref","unstructured":"Y. Liu, J. Guan, Q. Zhu, W. Wang. Anomalous sound detection using spectral-temporal information fusion. In proceedings of international conference on acoustics, Speech and Signal Processing (ICASSP). pp. 816\u2013820(2022)","DOI":"10.1109\/ICASSP43922.2022.9747868"},{"key":"3064_CR26","doi-asserted-by":"crossref","unstructured":"H. Liu, F. Liu, X. Fan, D. Huang. Polarized self-attention: Towards high-quality pixel-wise regression. arXiv:2107.00782. (2021)","DOI":"10.1016\/j.neucom.2022.07.054"},{"key":"3064_CR27","unstructured":"Z. Lv, B. Han, Z. Chen, Y. Qian, J. Ding, J. Liu. Unsupervised anomalous detection based on unsupervised pretrained models. Technical report, DCASE2023 Challenge (2023)"},{"key":"3064_CR28","doi-asserted-by":"publisher","DOI":"10.1109\/LSENS.2024.3480450","author":"M Neri","year":"2024","unstructured":"M. Neri, M. Carli, Low-complexity Attention-based Unsupervised anomalous sound detection exploiting separable convolutions and angular loss. IEEE Sensors Lett. (2024). https:\/\/doi.org\/10.1109\/LSENS.2024.3480450","journal-title":"IEEE Sensors Lett."},{"key":"3064_CR29","doi-asserted-by":"crossref","unstructured":"T. Nishida, K. Dohi, T. Endo, M. Yamamoto, Y. Kawaguchi. Anomalous sound detection based on machine activity detection. In Proceedings of European Signal Processing Conference (EUSIPCO). pp. 269\u2013273(2022)","DOI":"10.23919\/EUSIPCO55093.2022.9909901"},{"key":"3064_CR30","unstructured":"T. Nishida, N. Harada, D. Niizumi, D. Albertini, R. Sannino, S. Pradolini, F. Augusti, K. Imoto, K. Dohi, H. Purohit, T. Endo, Y. Kawaguchi. Description and Discussion on DCASE 2024 Challenge Task 2: First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring. arXiv preprint arXiv:2406.07250. (2024)"},{"key":"3064_CR31","doi-asserted-by":"crossref","unstructured":"D. Ouyang, S. He, G. Zhang, M. Luo, H. Guo, J. Zhan, Z. Huang. Efficient multi-scale attention module with cross-spatial learning. In Proceedings of International Conference on Acoustics, Speech and Signal Processing (ICASSP). pp. 1\u20135(2023)","DOI":"10.1109\/ICASSP49357.2023.10096516"},{"key":"3064_CR32","unstructured":"H. Purohit, T. Nishida, K. Dohi, T. Endo, Y. Kawaguchi. MIMII-Gen: Generative Modeling Approach for Simulated Evaluation of Anomalous Sound Detection System. arXiv preprint arXiv:2409.18542. (2024)"},{"key":"3064_CR33","doi-asserted-by":"crossref","unstructured":"K. Suefusa, T. Nishida, H. Purohit, R. Tanabe, T. Endo, Y. Kawaguchi. Anomalous sound detection based on interpolation deep neural network. In Proceedings of International Conference on Acoustics, Speech, and Signal Processing (ICASSP). pp. 271\u2013275(2020)","DOI":"10.1109\/ICASSP40776.2020.9054344"},{"issue":"19","key":"3064_CR34","doi-asserted-by":"publisher","first-page":"2329","DOI":"10.3390\/electronics10192329","volume":"10","author":"Y Tagawa","year":"2021","unstructured":"Y. Tagawa, R. Maskeli\u016bnas, R. Dama\u0161evi\u010dius, Acoustic anomaly detection of mechanical failures in noisy real-life factory environments. Electronics 10(19), 2329 (2021)","journal-title":"Electronics"},{"key":"3064_CR35","doi-asserted-by":"crossref","unstructured":"R. Wakamoto, S. Mabu. Interpretable anomaly detection for lung sounds using topology. In Proceedings of International Conference on Artificial Intelligence in Information and Communication (ICAIIC). pp. 521\u2013526(2023)","DOI":"10.1109\/ICAIIC57133.2023.10067072"},{"key":"3064_CR36","unstructured":"J. Wang, J. Wang, S. Chen, Y. Sun, M. Liu. Anomalous sound detection based on self-supervised learning. Technical report, DCASE2023 Challenge (2023)"},{"key":"3064_CR37","doi-asserted-by":"crossref","unstructured":"Q. Wang, B. Wu, P. Zhu, P. Li, W. Zuo, Q. Hu. ECA-Net: Efficient channel attention for deep convolutional neural networks. In Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 11534\u201311542(2020)","DOI":"10.1109\/CVPR42600.2020.01155"},{"key":"3064_CR38","doi-asserted-by":"crossref","unstructured":"Y. Wen, K. Zhang, Z. Li, Y. Qiao. A discriminative feature learning approach for deep face recognition. In Proceedings of European Conference on Computer Vision (ECCV). pp. 499\u2013515(2016)","DOI":"10.1007\/978-3-319-46478-7_31"},{"key":"3064_CR39","doi-asserted-by":"crossref","unstructured":"G. Wichern, A. Chakrabarty, Z.Q. Wang, J. Le Roux. Anomalous sound detection using attentive neural processes. In Proceedings of Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA). pp. 186\u2013190(2021)","DOI":"10.1109\/WASPAA52581.2021.9632762"},{"key":"3064_CR40","doi-asserted-by":"crossref","unstructured":"K. Wilkinghoff. Self-supervised learning for anomalous sound detection. In Proceedings of International Conference on Acoustics, Speech and Signal Processing (ICASSP). pp. 276\u2013280(2024)","DOI":"10.1109\/ICASSP48485.2024.10447156"},{"key":"3064_CR41","unstructured":"K. Wilkinghoff. Fraunhofer FKIE submission for task 2: First-shot unsupervised anomalous sound detection for machine condition monitoring. Technical report, DCASE2023 Challenge (2023)"},{"key":"3064_CR42","doi-asserted-by":"crossref","unstructured":"K. Wilkinghoff. Design choices for learning embeddings from auxiliary tasks for domain generalization in anomalous sound detection. In Proceedings of International Conference on Acoustics, Speech and Signal Processing (ICASSP). pp. 1\u20135(2023)","DOI":"10.1109\/ICASSP49357.2023.10097176"},{"key":"3064_CR43","doi-asserted-by":"crossref","unstructured":"S. Woo, J. Park, J.Y. Lee, I.S. Kweon. Cbam: Convolutional block attention module. In Proceedings of European Conference on Computer Vision (ECCV). pp. 3\u201319(2018)","DOI":"10.1007\/978-3-030-01234-2_1"},{"key":"3064_CR44","doi-asserted-by":"crossref","unstructured":"R. Yoshihashi, W. Shao, R. Kawakami, S. You, M. Iida, T. Naemura. Classification-reconstruction learning for open-set recognition. In Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 4016\u20134025(2019)","DOI":"10.1109\/CVPR.2019.00414"},{"key":"3064_CR45","unstructured":"Z. You, L. Cui, Y. Shen, K. Yang, X. Lu, Y. Zheng, X. Le. A unified model for multi-class anomaly detection. In Proceedings of Advances in Neural Information Processing Systems. pp. 4571\u20134584(2022)"},{"issue":"3","key":"3064_CR46","doi-asserted-by":"publisher","first-page":"1427","DOI":"10.1007\/s10845-021-01862-4","volume":"34","author":"H Yun","year":"2023","unstructured":"H. Yun, H. Kim, Y.H. Jeong, M.B. Jun, Autoencoder-based anomaly detection of industrial robot arm using stethoscope based internal sound sensor. J. Intell. Manuf. 34(3), 1427\u20131444 (2023)","journal-title":"J. Intell. Manuf."},{"key":"3064_CR47","doi-asserted-by":"crossref","unstructured":"X. Zhang, R. Zhao, Y. Qiao, X. Wang, H. Li. Adacos: Adaptively scaling cosine logits for effectively learning deep face representations. In Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR). pp. 10823\u201310832(2019)","DOI":"10.1109\/CVPR.2019.01108"},{"key":"3064_CR48","unstructured":"Y. Zhou, D. Xu, H. Wei, Y. Long. Autoencoder with group-based decoder and multi-task optimization for anomalous sound detection. arXiv preprint arXiv:2311.08829. (2023)"}],"container-title":["Circuits, Systems, and Signal Processing"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00034-025-03064-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s00034-025-03064-2\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00034-025-03064-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,7,1]],"date-time":"2025-07-01T21:02:05Z","timestamp":1751403725000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s00034-025-03064-2"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,3,12]]},"references-count":48,"journal-issue":{"issue":"7","published-print":{"date-parts":[[2025,7]]}},"alternative-id":["3064"],"URL":"https:\/\/doi.org\/10.1007\/s00034-025-03064-2","relation":{},"ISSN":["0278-081X","1531-5878"],"issn-type":[{"type":"print","value":"0278-081X"},{"type":"electronic","value":"1531-5878"}],"subject":[],"published":{"date-parts":[[2025,3,12]]},"assertion":[{"value":"12 November 2024","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"21 February 2025","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"21 February 2025","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"12 March 2025","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}]}}