{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,5]],"date-time":"2026-02-05T09:46:42Z","timestamp":1770284802720,"version":"3.49.0"},"reference-count":47,"publisher":"Institute of Electrical and Electronics Engineers (IEEE)","license":[{"start":{"date-parts":[[2020,1,1]],"date-time":"2020-01-01T00:00:00Z","timestamp":1577836800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/legalcode"}],"funder":[{"DOI":"10.13039\/501100002766","name":"Beijing University of Posts and Telecommunications Basic Scientific Research Project","doi-asserted-by":"publisher","award":["2020RC26"],"award-info":[{"award-number":["2020RC26"]}],"id":[{"id":"10.13039\/501100002766","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Key Laboratory Opening Project of Xinjiang Uygur Autonomous Region","award":["2017D04009"],"award-info":[{"award-number":["2017D04009"]}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["IEEE Access"],"published-print":{"date-parts":[[2020]]},"DOI":"10.1109\/access.2020.3044446","type":"journal-article","created":{"date-parts":[[2020,12,14]],"date-time":"2020-12-14T21:05:58Z","timestamp":1607979958000},"page":"225539-225550","source":"Crossref","is-referenced-by-count":22,"title":["Double Attention for Multi-Label Image Classification"],"prefix":"10.1109","volume":"8","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-0240-4573","authenticated-orcid":false,"given":"Haiying","family":"Zhao","sequence":"first","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-9237-7205","authenticated-orcid":false,"given":"Wei","family":"Zhou","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0001-6912-873X","authenticated-orcid":false,"given":"Xiaogang","family":"Hou","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0001-6038-8674","authenticated-orcid":false,"given":"Hui","family":"Zhu","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref39","article-title":"Very deep convolutional networks for large-scale image recognition","author":"simonyan","year":"2014","journal-title":"arXiv 1409 1556"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-017-4517-0"},{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1145\/3240508.3240567"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2017.58"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2018.2812605"},{"key":"ref30","first-page":"1","article-title":"Automatic differentiation in pytorch","author":"paszke","year":"2017","journal-title":"Proc NISP"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2019.2894964"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1016\/j.neucom.2016.12.051"},{"key":"ref35","first-page":"1884","article-title":"Deep MIML network","author":"feng","year":"2017","journal-title":"Proc AAAI"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00082"},{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/CVPRW.2014.131"},{"key":"ref40","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.631"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2019.03.006"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.37"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.251"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.443"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D15-1166"},{"key":"ref16","first-page":"2048","article-title":"Show, attend and tell: Neural image caption generation with visual attention","author":"xu","year":"2015","journal-title":"Proc ICML"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00209"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2015.7298965"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.106"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1007\/s11263-009-0275-4"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2009.5206848"},{"key":"ref27","first-page":"740","article-title":"Microsoft COCO: Common objects in context","author":"lin","year":"2014","journal-title":"Proc Eur Conf Comput Vis"},{"key":"ref3","article-title":"DiCENet: Dimension-wise convolutions for efficient networks","author":"mehta","year":"2019","journal-title":"arXiv 1906 03516"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2017.324"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1145\/1646396.1646452"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00326"},{"key":"ref8","article-title":"Deep convolutional ranking for multilabel image annotation","author":"gong","year":"2013","journal-title":"arXiv 1312 4894"},{"key":"ref7","article-title":"Towards real-time action recognition on mobile devices using deep models","author":"zhang","year":"2019","journal-title":"arXiv 1906 07052"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.634"},{"key":"ref9","article-title":"CNN: Single-label to multi-label","author":"wei","year":"2014","journal-title":"arXiv 1406 5726"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.90"},{"key":"ref46","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00139"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00745"},{"key":"ref45","first-page":"9","article-title":"Semi-supervised robust deep neural networks for multi-label classification","author":"cevikalp","year":"2019","journal-title":"Proc IEEE Conf Comput Vis Pattern Recognit (CVPR Workshops)"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00314"},{"key":"ref47","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2017.74"},{"key":"ref21","first-page":"3","article-title":"Cbam: Convolutional block attention module","author":"woo","year":"2018","journal-title":"Proc Eur Conf Comput Vis (ECCV)"},{"key":"ref42","first-page":"267","article-title":"Psanet: Point-wise spatial attention network for scene parsing","author":"zhao","year":"2018","journal-title":"Proc Eur Conf Comput Vis (ECCV)"},{"key":"ref24","doi-asserted-by":"publisher","DOI":"10.1109\/CVPRW.2019.00110"},{"key":"ref41","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.635"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/ISC2.2018.8656664"},{"key":"ref44","article-title":"OCNet: Object context network for scene parsing","author":"yuan","year":"2018","journal-title":"arXiv 1809 00916"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00236"},{"key":"ref43","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2019.00069"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.219"}],"container-title":["IEEE Access"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/6287639\/8948470\/09292935.pdf?arnumber=9292935","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2021,12,17]],"date-time":"2021-12-17T19:55:33Z","timestamp":1639770933000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9292935\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020]]},"references-count":47,"URL":"https:\/\/doi.org\/10.1109\/access.2020.3044446","relation":{},"ISSN":["2169-3536"],"issn-type":[{"value":"2169-3536","type":"electronic"}],"subject":[],"published":{"date-parts":[[2020]]}}}