{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,4]],"date-time":"2026-06-04T14:51:57Z","timestamp":1780584717670,"version":"3.54.1"},"reference-count":68,"publisher":"Association for Computing Machinery (ACM)","issue":"1s","license":[{"start":{"date-parts":[[2022,1,25]],"date-time":"2022-01-25T00:00:00Z","timestamp":1643068800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.acm.org\/publications\/policies\/copyright_policy#Background"}],"funder":[{"name":"Zhejiang Provincial Natural Science Foundation of China","award":["LY19F020038"],"award-info":[{"award-number":["LY19F020038"]}]},{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"crossref","award":["61972119, 61836002, 62020106007, 61802100, 61602136"],"award-info":[{"award-number":["61972119, 61836002, 62020106007, 61802100, 61602136"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"crossref"}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":["ACM Trans. Multimedia Comput. Commun. Appl."],"published-print":{"date-parts":[[2022,2,28]]},"abstract":"<jats:p>\n            How to extract distinctive features greatly challenges the fine-grained image classification tasks. In previous models, bilinear pooling has been frequently adopted to address this problem. However, most bilinear pooling models neglect either intra or inter layer feature interaction. This insufficient interaction brings in the loss of discriminative information. In this article, we devise a novel fine-grained image classification approach named\n            <jats:bold>M<\/jats:bold>\n            ulti-scale\n            <jats:bold>S<\/jats:bold>\n            elective\n            <jats:bold>H<\/jats:bold>\n            ierarchical bi\n            <jats:bold>Q<\/jats:bold>\n            uadratic\n            <jats:bold>P<\/jats:bold>\n            ooling (MSHQP). The proposed biquadratic pooling simultaneously models intra and inter layer feature interactions and enhances part response by integrating multi-layer features. The subsequent coarse-to-fine multi-scale interaction structure captures the complementary information within features. Finally, the active interaction selection module adaptively learns the optimal interaction subset for a specific dataset. Consequently, we obtain a robust image representation with coarse-to-fine semantics. We conduct experiments on five benchmark datasets. The experimental results demonstrate that MSHQP achieves competitive or even match the state-of-the-art methods in terms of both accuracy and computational efficiency, with 89.0%, 94.9%, 93.4%, 90.4%, and 91.5% top-1 classification accuracy on CUB-200-2011, Stanford-Cars, FGVC-Aircraft, Stanford-Dog, and VegFru, respectively.\n          <\/jats:p>","DOI":"10.1145\/3492221","type":"journal-article","created":{"date-parts":[[2022,1,25]],"date-time":"2022-01-25T15:06:00Z","timestamp":1643123160000},"page":"1-23","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":37,"title":["Fine-grained Image Classification via Multi-scale Selective Hierarchical Biquadratic Pooling"],"prefix":"10.1145","volume":"18","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-1842-4050","authenticated-orcid":false,"given":"Min","family":"Tan","sequence":"first","affiliation":[{"name":"Hangzhou Dianzi University, Hangzhou, Zhejiang, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Fu","family":"Yuan","sequence":"additional","affiliation":[{"name":"Hangzhou Dianzi University, Hangzhou, Zhejiang, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jun","family":"Yu","sequence":"additional","affiliation":[{"name":"Hangzhou Dianzi University, Hangzhou, Zhejiang, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Guijun","family":"Wang","sequence":"additional","affiliation":[{"name":"Hangzhou Dianzi University, Hangzhou, Zhejiang, China"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Xiaoling","family":"Gu","sequence":"additional","affiliation":[{"name":"Hangzhou Dianzi University, Hangzhou, Zhejiang, China"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"320","published-online":{"date-parts":[[2022,1,25]]},"reference":[{"key":"e_1_3_2_2_2","first-page":"257","volume-title":"Proceedings of the ICML","author":"Amin Saadullah","year":"2020","unstructured":"Saadullah Amin, Stalin Varanasi, Katherine Ann Dunfield, and G\u00fcnter Neumann. 2020. LowFER: Low-rank bilinear pooling for link prediction. In Proceedings of the ICML. PMLR, 257\u2013268."},{"key":"e_1_3_2_3_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2017.63"},{"key":"e_1_3_2_4_2","doi-asserted-by":"publisher","DOI":"10.1109\/TIP.2020.2973812"},{"key":"e_1_3_2_5_2","doi-asserted-by":"publisher","DOI":"10.1145\/3231742"},{"key":"e_1_3_2_6_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.325"},{"key":"e_1_3_2_7_2","doi-asserted-by":"publisher","DOI":"10.1145\/3314051"},{"key":"e_1_3_2_8_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01258-8_5"},{"key":"e_1_3_2_9_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01216-8_38"},{"key":"e_1_3_2_10_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.41"},{"key":"e_1_3_2_11_2","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v34i07.6712"},{"key":"e_1_3_2_12_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00315"},{"key":"e_1_3_2_13_2","doi-asserted-by":"publisher","DOI":"10.1145\/3240508.3240550"},{"key":"e_1_3_2_14_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.90"},{"key":"e_1_3_2_15_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00065"},{"key":"e_1_3_2_16_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.775"},{"key":"e_1_3_2_17_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2017.66"},{"key":"e_1_3_2_18_2","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2020.3001510"},{"key":"e_1_3_2_19_2","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v34i04.5862"},{"key":"e_1_3_2_20_2","volume-title":"Proceedings of the CVPR Workshop on Fine-grained Visual Categorization (FGVC)","volume":"2","author":"Khosla Aditya","year":"2011","unstructured":"Aditya Khosla, Nityananda Jayadevaprakash, Bangpeng Yao, and Fei-Fei Li. 2011. Novel dataset for fine-grained image categorization: Stanford dogs. In Proceedings of the CVPR Workshop on Fine-grained Visual Categorization (FGVC), Vol. 2."},{"key":"e_1_3_2_21_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.743"},{"key":"e_1_3_2_22_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICCVW.2013.77"},{"key":"e_1_3_2_23_2","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v34i05.6334"},{"key":"e_1_3_2_24_2","doi-asserted-by":"publisher","DOI":"10.1145\/3240508.3240649"},{"key":"e_1_3_2_25_2","first-page":"1","article-title":"Detachable second-order pooling: Toward high-performance first-order networks","author":"Li Lida","year":"2021","unstructured":"Lida Li, Jiangtao Xie, Peihua Li, and Lei Zhang. 2021. Detachable second-order pooling: Toward high-performance first-order networks. IEEE Trans. Neural Netw. Learn. Syst. (2021), 1\u201315. DOI:10.1109\/TNNLS.2021.3052829","journal-title":"IEEE Trans. Neural Netw. Learn. Syst."},{"key":"e_1_3_2_26_2","doi-asserted-by":"publisher","DOI":"10.1145\/3359753"},{"key":"e_1_3_2_27_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00105"},{"key":"e_1_3_2_28_2","article-title":"Group based deep shared feature learning for fine-grained image classification","author":"Li Xuelu","year":"2020","unstructured":"Xuelu Li and Vishal Monga. 2020. Group based deep shared feature learning for fine-grained image classification. arXiv:2004.01817 (2020).","journal-title":"arXiv:2004.01817"},{"key":"e_1_3_2_29_2","doi-asserted-by":"publisher","DOI":"10.1145\/3412384"},{"key":"e_1_3_2_30_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICCVW.2017.145"},{"key":"e_1_3_2_31_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2015.170"},{"key":"e_1_3_2_32_2","doi-asserted-by":"publisher","DOI":"10.1145\/3394171.3413689"},{"key":"e_1_3_2_33_2","doi-asserted-by":"publisher","DOI":"10.1145\/3381086"},{"key":"e_1_3_2_34_2","article-title":"Fine-grained visual classification of aircraft","author":"Maji Subhransu","year":"2013","unstructured":"Subhransu Maji, Esa Rahtu, Juho Kannala, Matthew Blaschko, and Andrea Vedaldi. 2013. Fine-grained visual classification of aircraft. arXiv:1306.5151 (2013).","journal-title":"arXiv:1306.5151"},{"key":"e_1_3_2_35_2","doi-asserted-by":"publisher","DOI":"10.1145\/3338533.3366567"},{"key":"e_1_3_2_36_2","doi-asserted-by":"publisher","DOI":"10.5244\/C.30.24"},{"key":"e_1_3_2_37_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR42600.2020.00020"},{"key":"e_1_3_2_38_2","doi-asserted-by":"publisher","DOI":"10.1007\/s11263-015-0816-y"},{"key":"e_1_3_2_39_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPRW50498.2020.00442"},{"key":"e_1_3_2_40_2","article-title":"Very deep convolutional networks for large-scale image recognition","author":"Simonyan Karen","year":"2014","unstructured":"Karen Simonyan and Andrew Zisserman. 2014. Very deep convolutional networks for large-scale image recognition. arXiv:1409.1556 (2014).","journal-title":"arXiv:1409.1556"},{"key":"e_1_3_2_41_2","doi-asserted-by":"publisher","DOI":"10.1016\/j.neucom.2017.12.020"},{"key":"e_1_3_2_42_2","doi-asserted-by":"publisher","DOI":"10.1016\/j.neucom.2015.04.123"},{"key":"e_1_3_2_43_2","doi-asserted-by":"publisher","DOI":"10.1109\/TITS.2015.2506182"},{"key":"e_1_3_2_44_2","doi-asserted-by":"publisher","DOI":"10.1109\/ACCESS.2019.2936118"},{"key":"e_1_3_2_45_2","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-018-5703-4"},{"key":"e_1_3_2_46_2","doi-asserted-by":"publisher","DOI":"10.1145\/3209666"},{"key":"e_1_3_2_47_2","doi-asserted-by":"publisher","DOI":"10.1109\/TIP.2019.2921861"},{"key":"e_1_3_2_48_2","doi-asserted-by":"publisher","DOI":"10.1016\/j.ipm.2019.102186"},{"key":"e_1_3_2_49_2","unstructured":"Catherine Wah Steve Branson Peter Welinder Pietro Perona and Serge Belongie. 2011. The caltech-ucsd birds-200-2011 dataset. (2011)."},{"key":"e_1_3_2_50_2","doi-asserted-by":"publisher","DOI":"10.5555\/3326943.3327061"},{"key":"e_1_3_2_51_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.689"},{"key":"e_1_3_2_52_2","volume-title":"Proceedings of the BMVC","author":"Wang Xin","year":"2019","unstructured":"Xin Wang, Xiang Wang, Chen Wang, Xiao Bai, Jing Wu, and Edwin R. Hancock. 2019. Discriminative features matter: Multi-layer bilinear pooling for camera localization. In Proceedings of the BMVC."},{"key":"e_1_3_2_53_2","doi-asserted-by":"publisher","DOI":"10.1145\/3343031.3350976"},{"key":"e_1_3_2_54_2","doi-asserted-by":"publisher","DOI":"10.1145\/3343031.3350976"},{"key":"e_1_3_2_55_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01219-9_22"},{"key":"e_1_3_2_56_2","doi-asserted-by":"publisher","DOI":"10.1109\/TIP.2017.2688133"},{"key":"e_1_3_2_57_2","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2017.10.002"},{"key":"e_1_3_2_58_2","first-page":"1","article-title":"Multimodal cross-layer bilinear pooling for RGBT tracking","author":"Xu Qin","year":"2021","unstructured":"Qin Xu, Yiming Mei, Jinpei Liu, and Chenglong Li. 2021. Multimodal cross-layer bilinear pooling for RGBT tracking. IEEE Trans. Multimedia (2021), 1\u20131. DOI:10.1109\/TMM.2021.3055362","journal-title":"IEEE Trans. Multimedia"},{"key":"e_1_3_2_59_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01264-9_26"},{"key":"e_1_3_2_60_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01270-0_35"},{"key":"e_1_3_2_61_2","first-page":"1","article-title":"Hierarchical deep click feature prediction for fine-grained image recognition","author":"Yu Jun","year":"2019","unstructured":"Jun Yu, Min Tan, Hongyuan Zhang, Dacheng Tao, and Yong Rui. 2019. Hierarchical deep click feature prediction for fine-grained image recognition. IEEE Trans. Pattern Anal. Mach. Intell. (2019), 1\u20131. DOI:10.1109\/TPAMI.2019.2932058","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"e_1_3_2_62_2","doi-asserted-by":"publisher","DOI":"10.1109\/TCYB.2014.2336697"},{"key":"e_1_3_2_63_2","doi-asserted-by":"publisher","DOI":"10.1109\/TNNLS.2019.2908982"},{"key":"e_1_3_2_64_2","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01234-2_37"},{"key":"e_1_3_2_65_2","first-page":"3243","volume-title":"Proceedings of the AAAI","volume":"35","author":"Yu Tan","year":"2021","unstructured":"Tan Yu, Xiaoyun Li, and Ping Li. 2021. Fast and compact bilinear pooling by shifted random Maclaurin. In Proceedings of the AAAI, Vol. 35. 3243\u20133251."},{"key":"e_1_3_2_66_2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.01228"},{"key":"e_1_3_2_67_2","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2017.557"},{"key":"e_1_3_2_68_2","doi-asserted-by":"publisher","DOI":"10.5555\/3454287.3454672"},{"key":"e_1_3_2_69_2","doi-asserted-by":"publisher","DOI":"10.1109\/TMM.2020.2993960"}],"container-title":["ACM Transactions on Multimedia Computing, Communications, and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3492221","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3492221","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,17]],"date-time":"2025-06-17T19:31:07Z","timestamp":1750188667000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3492221"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,1,25]]},"references-count":68,"journal-issue":{"issue":"1s","published-print":{"date-parts":[[2022,2,28]]}},"alternative-id":["10.1145\/3492221"],"URL":"https:\/\/doi.org\/10.1145\/3492221","relation":{},"ISSN":["1551-6857","1551-6865"],"issn-type":[{"value":"1551-6857","type":"print"},{"value":"1551-6865","type":"electronic"}],"subject":[],"published":{"date-parts":[[2022,1,25]]},"assertion":[{"value":"2021-01-01","order":0,"name":"received","label":"Received","group":{"name":"publication_history","label":"Publication History"}},{"value":"2021-10-01","order":1,"name":"accepted","label":"Accepted","group":{"name":"publication_history","label":"Publication History"}},{"value":"2022-01-25","order":2,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}