{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,30]],"date-time":"2025-12-30T08:59:53Z","timestamp":1767085193608,"version":"3.40.3"},"publisher-location":"Cham","reference-count":48,"publisher":"Springer Nature Switzerland","isbn-type":[{"type":"print","value":"9783031783043"},{"type":"electronic","value":"9783031783050"}],"license":[{"start":{"date-parts":[[2024,12,4]],"date-time":"2024-12-04T00:00:00Z","timestamp":1733270400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,12,4]],"date-time":"2024-12-04T00:00:00Z","timestamp":1733270400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2025]]},"DOI":"10.1007\/978-3-031-78305-0_3","type":"book-chapter","created":{"date-parts":[[2024,12,3]],"date-time":"2024-12-03T10:12:51Z","timestamp":1733220771000},"page":"31-46","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":1,"title":["Fashion Image Retrieval with Occlusion"],"prefix":"10.1007","author":[{"given":"Jimin","family":"Sohn","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Haeji","family":"Jung","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Zhiwen","family":"Yan","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Vibha","family":"Masti","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xiang","family":"Li","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Bhiksha","family":"Raj","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2024,12,4]]},"reference":[{"key":"3_CR1","first-page":"3596","volume":"34","author":"G An","year":"2021","unstructured":"An, G., Huo, Y., Yoon, S.E.: Hypergraph propagation and community selection for objects retrieval. Adv. Neural. Inf. Process. Syst. 34, 3596\u20133608 (2021)","journal-title":"Adv. Neural. Inf. Process. Syst."},{"key":"3_CR2","unstructured":"An, X., Deng, J., Yang, K., Li, J., Feng, Z., Guo, J., Yang, J., Liu, T.: Unicom: Universal and compact representation learning for image retrieval. In: The Eleventh International Conference on Learning Representations (2022)"},{"key":"3_CR3","doi-asserted-by":"crossref","unstructured":"Arandjelovi\u0107, R., Zisserman, A.: Three things everyone should know to improve object retrieval. In: 2012 IEEE conference on computer vision and pattern recognition. pp. 2911\u20132918. IEEE (2012)","DOI":"10.1109\/CVPR.2012.6248018"},{"key":"3_CR4","unstructured":"Babenko, A., Lempitsky, V.: Efficient indexing of billion-scale datasets of deep descriptors. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. pp. 2055\u20132063 (2016)"},{"key":"3_CR5","doi-asserted-by":"crossref","unstructured":"Caron, M., Touvron, H., Misra, I., J\u00e9gou, H., Mairal, J., Bojanowski, P., Joulin, A.: Emerging properties in self-supervised vision transformers (2021), https:\/\/arxiv.org\/abs\/2104.14294","DOI":"10.1109\/ICCV48922.2021.00951"},{"key":"3_CR6","doi-asserted-by":"crossref","unstructured":"Chum, O., Philbin, J., Sivic, J., Isard, M., Zisserman, A.: Total recall: Automatic query expansion with a generative feature model for object retrieval. In: 2007 IEEE 11th International Conference on Computer Vision. pp.\u00a01\u20138. IEEE (2007)","DOI":"10.1109\/ICCV.2007.4408891"},{"key":"3_CR7","doi-asserted-by":"crossref","unstructured":"Corbiere, C., Ben-Younes, H., Ram\u00e9, A., Ollion, C.: Leveraging weakly annotated data for fashion image retrieval and label prediction. In: Proceedings of the IEEE international conference on computer vision workshops. pp. 2268\u20132274 (2017)","DOI":"10.1109\/ICCVW.2017.266"},{"key":"3_CR8","doi-asserted-by":"crossref","unstructured":"Deng, J., Guo, J., Zafeiriou, S.: Arcface: Additive angular margin loss for deep face recognition. 2019 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR) pp. 4685\u20134694 (2018), https:\/\/api.semanticscholar.org\/CorpusID:8923541","DOI":"10.1109\/CVPR.2019.00482"},{"key":"3_CR9","doi-asserted-by":"crossref","unstructured":"Deng, J., Guo, J., Xue, N., Zafeiriou, S.: Arcface: Additive angular margin loss for deep face recognition. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition. pp. 4690\u20134699 (2019)","DOI":"10.1109\/CVPR.2019.00482"},{"key":"3_CR10","unstructured":"Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., et\u00a0al.: An image is worth 16x16 words: Transformers for image recognition at scale. In: International Conference on Learning Representations (2020)"},{"key":"3_CR11","doi-asserted-by":"crossref","unstructured":"Ermolov, A., Mirvakhabova, L., Khrulkov, V., Sebe, N., Oseledets, I.: Hyperbolic vision transformers: Combining improvements in metric learning. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition. pp. 7409\u20137419 (2022)","DOI":"10.1109\/CVPR52688.2022.00726"},{"issue":"2","key":"3_CR12","doi-asserted-by":"publisher","first-page":"237","DOI":"10.1007\/s11263-017-1016-8","volume":"124","author":"A Gordo","year":"2017","unstructured":"Gordo, A., Almazan, J., Revaud, J., Larlus, D.: End-to-end learning of deep visual representations for image retrieval. Int. J. Comput. Vision 124(2), 237\u2013254 (2017)","journal-title":"Int. J. Comput. Vision"},{"key":"3_CR13","doi-asserted-by":"crossref","unstructured":"Gordo, A., Radenovic, F., Berg, T.: Attention-based query expansion learning. In: European Conference on Computer Vision. pp. 172\u2013188. Springer (2020)","DOI":"10.1007\/978-3-030-58604-1_11"},{"key":"3_CR14","doi-asserted-by":"crossref","unstructured":"Hadsell, R., Chopra, S., LeCun, Y.: Dimensionality reduction by learning an invariant mapping. In: 2006 IEEE computer society conference on computer vision and pattern recognition (CVPR\u201906). vol.\u00a02, pp. 1735\u20131742. IEEE (2006)","DOI":"10.1109\/CVPR.2006.100"},{"key":"3_CR15","doi-asserted-by":"crossref","unstructured":"He, K., Zhang, X., Ren, S., Sun, J.: Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 770\u2013778 (2016)","DOI":"10.1109\/CVPR.2016.90"},{"key":"3_CR16","doi-asserted-by":"crossref","unstructured":"Iscen, A., Tolias, G., Avrithis, Y., Chum, O.: Mining on manifolds: Metric learning without labels. 2018 IEEE\/CVF Conference on Computer Vision and Pattern Recognition pp. 7642\u20137651 (2018), https:\/\/api.semanticscholar.org\/CorpusID:4466042","DOI":"10.1109\/CVPR.2018.00797"},{"key":"3_CR17","doi-asserted-by":"crossref","unstructured":"Kan, S., Cen, Y., Li, Y., Mladenovic, V., He, Z.: Relative order analysis and optimization for unsupervised deep metric learning. 2021 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR) pp. 13994\u201314003 (2021), https:\/\/api.semanticscholar.org\/CorpusID:235691639","DOI":"10.1109\/CVPR46437.2021.01378"},{"key":"3_CR18","doi-asserted-by":"crossref","unstructured":"Kim, S., Kim, D., Cho, M., Kwak, S.: Self-taught metric learning without labels. 2022 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR) pp. 7421\u20137431 (2022), https:\/\/api.semanticscholar.org\/CorpusID:248512812","DOI":"10.1109\/CVPR52688.2022.00728"},{"key":"3_CR19","doi-asserted-by":"publisher","first-page":"185","DOI":"10.1016\/j.cag.2023.08.003","volume":"116","author":"L Li","year":"2023","unstructured":"Li, L., Zhang, T., Kang, Z., Jiang, X.: Mask-fpan: Semi-supervised face parsing in the wild with de-occlusion and uv gan. Computers & Graphics 116, 185\u2013193 (2023)","journal-title":"Computers & Graphics"},{"key":"3_CR20","doi-asserted-by":"crossref","unstructured":"Li, Y., Kan, S., He, Z.: Unsupervised deep metric learning with transformed attention consistency and contrastive clustering loss. ArXiv abs\/2008.04378 (2020), https:\/\/api.semanticscholar.org\/CorpusID:221095511","DOI":"10.1007\/978-3-030-58621-8_9"},{"key":"3_CR21","doi-asserted-by":"crossref","unstructured":"Lin, T.Y., Maire, M., Belongie, S., Bourdev, L., Girshick, R., Hays, J., Perona, P., Ramanan, D., Zitnick, C.L., Doll\u00e1r, P.: Microsoft coco: Common objects in context (2015)","DOI":"10.1007\/978-3-319-10602-1_48"},{"key":"3_CR22","doi-asserted-by":"crossref","unstructured":"Lin, Y.L., Tran, S., Davis, L.S.: Fashion outfit complementary item retrieval. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition. pp. 3311\u20133319 (2020)","DOI":"10.1109\/CVPR42600.2020.00337"},{"key":"3_CR23","doi-asserted-by":"crossref","unstructured":"Liu, Z., Mao, H., Wu, C.Y., Feichtenhofer, C., Darrell, T., Xie, S.: A convnet for the 2020s. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition. pp. 11976\u201311986 (2022)","DOI":"10.1109\/CVPR52688.2022.01167"},{"key":"3_CR24","doi-asserted-by":"crossref","unstructured":"Liu, Z., Luo, P., Qiu, S., Wang, X., Tang, X.: Deepfashion: Powering robust clothes recognition and retrieval with rich annotations. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (June 2016)","DOI":"10.1109\/CVPR.2016.124"},{"key":"3_CR25","unstructured":"Loshchilov, I., Hutter, F.: Decoupled weight decay regularization. arXiv preprint arXiv:1711.05101 (2017)"},{"issue":"11","key":"3_CR26","doi-asserted-by":"publisher","first-page":"2227","DOI":"10.1109\/TPAMI.2014.2321376","volume":"36","author":"M Muja","year":"2014","unstructured":"Muja, M., Lowe, D.G.: Scalable nearest neighbor algorithms for high dimensional data. IEEE Trans. Pattern Anal. Mach. Intell. 36(11), 2227\u20132240 (2014)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"3_CR27","doi-asserted-by":"crossref","unstructured":"Naka, R., Katsurai, M., Yanagi, K., Goto, R.: Fashion style-aware embeddings for clothing image retrieval. In: Proceedings of the 2022 International Conference on Multimedia Retrieval. pp. 49\u201353 (2022)","DOI":"10.1145\/3512527.3531433"},{"key":"3_CR28","unstructured":"Oquab, M., Darcet, T., Moutakanni, T., Vo, H., Szafraniec, M., Khalidov, V., Fernandez, P., Haziza, D., Massa, F., El-Nouby, A., et\u00a0al.: Dinov2: Learning robust visual features without supervision. arXiv preprint arXiv:2304.07193 (2023)"},{"key":"3_CR29","unstructured":"Oquab, M., Darcet, T., Moutakanni, T., Vo, H.V., Szafraniec, M., Khalidov, V., Fernandez, P., HAZIZA, D., Massa, F., El-Nouby, A., Assran, M., Ballas, N., Galuba, W., Howes, R., Huang, P.Y., Li, S.W., Misra, I., Rabbat, M., Sharma, V., Synnaeve, G., Xu, H., Jegou, H., Mairal, J., Labatut, P., Joulin, A., Bojanowski, P.: DINOv2: Learning robust visual features without supervision. Transactions on Machine Learning Research (2024), https:\/\/openreview.net\/forum?id=a68SUt6zFt"},{"key":"3_CR30","doi-asserted-by":"crossref","unstructured":"Park, S., Shin, M., Ham, S., Choe, S., Kang, Y.: Study on fashion image retrieval methods for efficient fashion visual search. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition Workshops. pp.\u00a00\u20130 (2019)","DOI":"10.1109\/CVPRW.2019.00042"},{"key":"3_CR31","doi-asserted-by":"crossref","unstructured":"Park, S., Lee, H., Yoo, J.H., Kim, G., Kim, S., et\u00a0al.: Partially occluded facial image retrieval based on a similarity measurement. Mathematical Problems in Engineering 2015 (2015)","DOI":"10.1155\/2015\/217568"},{"key":"3_CR32","doi-asserted-by":"crossref","unstructured":"Philbin, J., Zisserman, A.: Object mining using a matching graph on very large image collections. In: 2008 Sixth Indian Conference on Computer Vision, Graphics & Image Processing. pp. 738\u2013745. IEEE (2008)","DOI":"10.1109\/ICVGIP.2008.103"},{"key":"3_CR33","doi-asserted-by":"crossref","unstructured":"Qian, Q., Shang, L., Sun, B., Hu, J., Li, H., Jin, R.: Softtriple loss: Deep metric learning without triplet sampling. 2019 IEEE\/CVF International Conference on Computer Vision (ICCV) pp. 6449\u20136457 (2019), https:\/\/api.semanticscholar.org\/CorpusID:202558557","DOI":"10.1109\/ICCV.2019.00655"},{"issue":"7","key":"3_CR34","doi-asserted-by":"publisher","first-page":"1655","DOI":"10.1109\/TPAMI.2018.2846566","volume":"41","author":"F Radenovi\u0107","year":"2018","unstructured":"Radenovi\u0107, F., Tolias, G., Chum, O.: Fine-tuning cnn image retrieval with no human annotation. IEEE Trans. Pattern Anal. Mach. Intell. 41(7), 1655\u20131668 (2018)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"3_CR35","doi-asserted-by":"crossref","unstructured":"Schroff, F., Kalenichenko, D., Philbin, J.: Facenet: A unified embedding for face recognition and clustering. In: Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 815\u2013823 (2015)","DOI":"10.1109\/CVPR.2015.7298682"},{"key":"3_CR36","doi-asserted-by":"crossref","unstructured":"Shaker, A.M., Maaz, M., Rasheed, H.A., Khan, S., Yang, M., Khan, F.S.: Swiftformer: Efficient additive attention for transformer-based real-time mobile vision applications. 2023 IEEE\/CVF International Conference on Computer Vision (ICCV) pp. 17379\u201317390 (2023), https:\/\/api.semanticscholar.org\/CorpusID:257766532","DOI":"10.1109\/ICCV51070.2023.01598"},{"key":"3_CR37","doi-asserted-by":"crossref","unstructured":"Shiau, R., Wu, H.Y., Kim, E., Du, Y.L., Guo, A., Zhang, Z., Li, E., Gu, K., Rosenberg, C., Zhai, A.: Shop the look: Building a large scale visual shopping system at pinterest. In: Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. pp. 3203\u20133212 (2020)","DOI":"10.1145\/3394486.3403372"},{"key":"3_CR38","unstructured":"Sohn, K.: Improved deep metric learning with multi-class n-pair loss objective. Advances in neural information processing systems 29 (2016)"},{"key":"3_CR39","doi-asserted-by":"crossref","unstructured":"Sun, Y., Cheng, C., Zhang, Y., Zhang, C., Zheng, L., Wang, Z., Wei, Y.: Circle loss: A unified perspective of pair similarity optimization. 2020 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR) pp. 6397\u20136406 (2020), https:\/\/api.semanticscholar.org\/CorpusID:211296865","DOI":"10.1109\/CVPR42600.2020.00643"},{"key":"3_CR40","unstructured":"Tan, M., Le, Q.: EfficientNet: Rethinking model scaling for convolutional neural networks. In: Chaudhuri, K., Salakhutdinov, R. (eds.) Proceedings of the 36th International Conference on Machine Learning. Proceedings of Machine Learning Research, vol.\u00a097, pp. 6105\u20136114. PMLR (09\u201315 Jun 2019), https:\/\/proceedings.mlr.press\/v97\/tan19a.html"},{"key":"3_CR41","doi-asserted-by":"crossref","unstructured":"Tian, Y., Newsam, S., Boakye, K.: Fashion image retrieval with text feedback by additive attention compositional learning. In: Proceedings of the IEEE\/CVF Winter Conference on Applications of Computer Vision. pp. 1011\u20131021 (2023)","DOI":"10.1109\/WACV56688.2023.00107"},{"key":"3_CR42","unstructured":"Touvron, H., Cord, M., Douze, M., Massa, F., Sablayrolles, A., J\u00e9gou, H.: Training data-efficient image transformers & distillation through attention (2021), https:\/\/arxiv.org\/abs\/2012.12877"},{"key":"3_CR43","doi-asserted-by":"crossref","unstructured":"Tu, C.T., Lee, K.H.: Occluded face recovery by image retrieval. In: 2021 International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS). pp.\u00a01\u20132. IEEE (2021)","DOI":"10.1109\/ISPACS51563.2021.9650973"},{"key":"3_CR44","doi-asserted-by":"crossref","unstructured":"Voo, K.T., Jiang, L., Loy, C.C.: Delving into high-quality synthetic face occlusion segmentation datasets. In: Proceedings of the IEEE\/CVF Conference on Computer Vision and Pattern Recognition. pp. 4711\u20134720 (2022)","DOI":"10.1109\/CVPRW56347.2022.00517"},{"key":"3_CR45","doi-asserted-by":"crossref","unstructured":"Yan, C., Yan, K., Zhang, Y., Wan, Y., Zhu, D.: Attribute-guided fashion image retrieval by iterative similarity learning. In: 2022 IEEE International Conference on Multimedia and Expo (ICME). pp.\u00a01\u20136. IEEE (2022)","DOI":"10.1109\/ICME52920.2022.9859953"},{"key":"3_CR46","doi-asserted-by":"crossref","unstructured":"Yan, J., Luo, L., Deng, C., Huang, H.: Unsupervised hyperbolic metric learning. 2021 IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR) pp. 12460\u201312469 (2021), https:\/\/api.semanticscholar.org\/CorpusID:235693274","DOI":"10.1109\/CVPR46437.2021.01228"},{"key":"3_CR47","unstructured":"Zhai, A., Wu, H.Y.: Classification is a strong baseline for deep metric learning. In: British Machine Vision Conference (2018), https:\/\/api.semanticscholar.org\/CorpusID:199442350"},{"key":"3_CR48","unstructured":"Zhu, J., Huang, H., Deng, Q.: Fashion image retrieval with multi-granular alignment. arXiv preprint arXiv:2302.08902 (2023)"}],"container-title":["Lecture Notes in Computer Science","Pattern Recognition"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-031-78305-0_3","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,12,3]],"date-time":"2024-12-03T11:11:47Z","timestamp":1733224307000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-031-78305-0_3"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,12,4]]},"ISBN":["9783031783043","9783031783050"],"references-count":48,"URL":"https:\/\/doi.org\/10.1007\/978-3-031-78305-0_3","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2024,12,4]]},"assertion":[{"value":"4 December 2024","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"ICPR","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Pattern Recognition","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Kolkata","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"India","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2024","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"1 December 2024","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"5 December 2024","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"27","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"icpr2024","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/icpr2024.org\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}