{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,15]],"date-time":"2026-06-15T17:55:47Z","timestamp":1781546147355,"version":"3.54.5"},"reference-count":42,"publisher":"Springer Science and Business Media LLC","issue":"12","license":[{"start":{"date-parts":[[2018,6,29]],"date-time":"2018-06-29T00:00:00Z","timestamp":1530230400000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["61175096"],"award-info":[{"award-number":["61175096"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100010890","name":"Chinese Government Scholarship","doi-asserted-by":"crossref","award":["Scholarship"],"award-info":[{"award-number":["Scholarship"]}],"id":[{"id":"10.13039\/501100010890","id-type":"DOI","asserted-by":"crossref"}]},{"DOI":"10.13039\/501100004543","name":"China Scholarship Council","doi-asserted-by":"publisher","award":["201706035021"],"award-info":[{"award-number":["201706035021"]}],"id":[{"id":"10.13039\/501100004543","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100001659","name":"German Research Foundation","doi-asserted-by":"crossref","award":["TRR-169"],"award-info":[{"award-number":["TRR-169"]}],"id":[{"id":"10.13039\/501100001659","id-type":"DOI","asserted-by":"crossref"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Vis Comput"],"published-print":{"date-parts":[[2019,12]]},"DOI":"10.1007\/s00371-018-1573-z","type":"journal-article","created":{"date-parts":[[2018,6,29]],"date-time":"2018-06-29T14:40:06Z","timestamp":1530283206000},"page":"1783-1795","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":4,"title":["Weighted two-step aggregated VLAD for image retrieval"],"prefix":"10.1007","volume":"35","author":[{"given":"Hao","family":"Liu","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Qingjie","family":"Zhao","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jimmy T.","family":"Mbelwa","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Song","family":"Tang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jianwei","family":"Zhang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2018,6,29]]},"reference":[{"key":"1573_CR1","doi-asserted-by":"crossref","unstructured":"Arandjelovic, R., Gronat, P., Torii, A., Pajdla, T., Sivic, J.: Netvlad: CNN architecture for weakly supervised place recognition. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 5297\u20135307. IEEE (2016)","DOI":"10.1109\/CVPR.2016.572"},{"key":"1573_CR2","doi-asserted-by":"crossref","unstructured":"Arandjelovi\u0107, R., Zisserman, A.: Three things everyone should know to improve object retrieval. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 2911\u20132918. IEEE (2012)","DOI":"10.1109\/CVPR.2012.6248018"},{"key":"1573_CR3","doi-asserted-by":"crossref","unstructured":"Arandjelovic, R., Zisserman, A.: All about VLAD. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 1578\u20131585. IEEE (2013)","DOI":"10.1109\/CVPR.2013.207"},{"key":"1573_CR4","doi-asserted-by":"publisher","first-page":"404","DOI":"10.1007\/11744023_32","volume-title":"Computer Vision \u2013 ECCV 2006","author":"Herbert Bay","year":"2006","unstructured":"Bay, H., Tuytelaars, T., Van\u00a0Gool, L.: Surf: Speeded up robust features. In: Proceedings of European Conference on Computer Vision, pp. 404\u2013417 (2006)"},{"key":"1573_CR5","doi-asserted-by":"crossref","unstructured":"Cai, H., Wang, X., Wang, Y.: Compact and robust fisher descriptors for large-scale image retrieval. In: IEEE International Workshop on Machine Learning for Signal Processing, pp. 1\u20136. IEEE (2011)","DOI":"10.1109\/MLSP.2011.6064624"},{"key":"1573_CR6","doi-asserted-by":"crossref","unstructured":"Chen, D., Tsai, S., Chandrasekhar, V., Takacs, G., Chen, H., Vedantham, R., Grzeszczuk, R., Girod, B.: Residual enhanced visual vectors for on-device image matching. In: Signals, Systems and Computers, pp. 850\u2013854. IEEE (2011)","DOI":"10.1109\/ACSSC.2011.6190128"},{"key":"1573_CR7","doi-asserted-by":"crossref","unstructured":"Chisholm, E., Kolda, T.G.: New term weighting formulas for the vector space method in information retrieval. Computer Science and Mathematics Division, Oak Ridge National Laboratory (1999)","DOI":"10.2172\/5698"},{"key":"1573_CR8","doi-asserted-by":"publisher","first-page":"10479","DOI":"10.1007\/s00371-017-1371-z","volume":"33","author":"J Cho","year":"2017","unstructured":"Cho, J., Heo, J.P., Kim, T., Han, B., Yoon, S.E.: Rank-based voting with inclusion relationship for accurate image search. Vis. Comput. 33, 10479\u20131059 (2017)","journal-title":"Vis. Comput."},{"key":"1573_CR9","doi-asserted-by":"crossref","unstructured":"Chum, O., Matas, J.: Unsupervised discovery of co-occurrence in sparse high dimensional data. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 3416\u20133423. IEEE (2010)","DOI":"10.1109\/CVPR.2010.5539997"},{"key":"1573_CR10","doi-asserted-by":"crossref","unstructured":"Delhumeau, J., Gosselin, P.H., J\u00e9gou, H., P\u00e9rez, P.: Revisiting the vlad image representation. In: Proceedings of ACM international conference on Multimedia, pp. 653\u2013656. ACM (2013)","DOI":"10.1145\/2502081.2502171"},{"key":"1573_CR11","doi-asserted-by":"crossref","unstructured":"Dong, W., Wang, Z., Charikar, M., Li, K.: High-confidence near-duplicate image detection. In: Proceedings of ACM International Conference on Multimedia Retrieval, p. 1. ACM (2012)","DOI":"10.1145\/2324796.2324798"},{"key":"1573_CR12","unstructured":"Everingham, M., Van\u00a0Gool, L., Williams, C.K.I., Winn, J., Zisserman, A.: The PASCAL visual object classes challenge 2012 (VOC2012) results. http:\/\/www.pascal-network.org\/challenges\/VOC\/voc2012\/workshop\/index.html"},{"key":"1573_CR13","doi-asserted-by":"publisher","first-page":"392","DOI":"10.1007\/978-3-319-10584-0_26","volume-title":"Computer Vision \u2013 ECCV 2014","author":"Yunchao Gong","year":"2014","unstructured":"Gong, Y., Wang, L., Guo, R., Lazebnik, S.: Multi-scale orderless pooling of deep convolutional activation features. In: Proceedings of European Conference on Computer Vision, pp. 392\u2013407 (2014)"},{"key":"1573_CR14","doi-asserted-by":"publisher","first-page":"774","DOI":"10.1007\/978-3-642-33709-3_55","volume-title":"Computer Vision \u2013 ECCV 2012","author":"Herv\u00e9 J\u00e9gou","year":"2012","unstructured":"J\u00e9gou, H., Chum, O.: Negative evidences and co-occurences in image retrieval: the benefit of pca and whitening. In: Proceedings of European Conference on Computer Vision, pp. 774\u2013787 (2012)"},{"key":"1573_CR15","first-page":"304","volume-title":"Lecture Notes in Computer Science","author":"Herve Jegou","year":"2008","unstructured":"Jegou, H., Douze, M., Schmid, C.: Hamming embedding and weak geometric consistency for large scale image search. In: Proceedings of European Conference on Computer Vision, pp. 304\u2013317 (2008)"},{"key":"1573_CR16","doi-asserted-by":"crossref","unstructured":"J\u00e9gou, H., Douze, M., Schmid, C.: On the burstiness of visual elements. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 1169\u20131176. IEEE (2009)","DOI":"10.1109\/CVPR.2009.5206609"},{"key":"1573_CR17","doi-asserted-by":"crossref","unstructured":"J\u00e9gou, H., Douze, M., Schmid, C., P\u00e9rez, P.: Aggregating local descriptors into a compact image representation. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 3304\u20133311. IEEE (2010)","DOI":"10.1109\/CVPR.2010.5540039"},{"issue":"9","key":"1573_CR18","doi-asserted-by":"publisher","first-page":"1704","DOI":"10.1109\/TPAMI.2011.235","volume":"34","author":"H Jegou","year":"2012","unstructured":"Jegou, H., Perronnin, F., Douze, M., S\u00e1nchez, J., Perez, P., Schmid, C.: Aggregating local image descriptors into compact codes. IEEE Trans. Pattern Anal. Mach. Intell. 34(9), 1704\u20131716 (2012)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"1573_CR19","doi-asserted-by":"publisher","first-page":"237","DOI":"10.1016\/j.jvcir.2015.07.005","volume":"31","author":"TE Kim","year":"2015","unstructured":"Kim, T.E., Kim, M.H.: Improving the search accuracy of the vlad through weighted aggregation of local descriptors. J. Vis. Commun. Image Represent. 31, 237\u2013252 (2015)","journal-title":"J. Vis. Commun. Image Represent."},{"key":"1573_CR20","doi-asserted-by":"crossref","unstructured":"Lazebnik, S., Schmid, C., Ponce, J.: Beyond bags of features: spatial pyramid matching for recognizing natural scene categories. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, vol. 2, pp. 2169\u20132178. IEEE (2006)","DOI":"10.1109\/CVPR.2006.68"},{"issue":"10","key":"1573_CR21","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s00371-016-1232-1","volume":"32","author":"H Li","year":"2016","unstructured":"Li, H., Toyoura, M., Shimizu, K., Yang, W., Mao, X.: Retrieval of clothing images based on relevance feedback with focus on collar designs. The Visual Computer 32(10), 1\u201313 (2016)","journal-title":"The Visual Computer"},{"issue":"10","key":"1573_CR22","doi-asserted-by":"publisher","first-page":"1383","DOI":"10.1007\/s00371-014-1020-8","volume":"31","author":"Y Li","year":"2015","unstructured":"Li, Y., Ye, J., Wang, T., Huang, S.: Augmenting bag-of-words: a robust contextual representation of spatiotemporal interest points for action recognition. Vis. Comput. 31(10), 1383\u20131394 (2015)","journal-title":"Vis. Comput."},{"issue":"22","key":"1573_CR23","doi-asserted-by":"publisher","first-page":"24435","DOI":"10.1007\/s11042-016-4176-6","volume":"76","author":"H Liu","year":"2017","unstructured":"Liu, H., Zhao, Q., Wang, H., Lv, P., Chen, Y.: An image-based near-duplicate video retrieval and localization using improved edit distance. Multimed. Tools Appl. 76(22), 24435\u201324456 (2017)","journal-title":"Multimed. Tools Appl."},{"issue":"2","key":"1573_CR24","doi-asserted-by":"publisher","first-page":"375","DOI":"10.1109\/TCSVT.2015.2409693","volume":"26","author":"Z Liu","year":"2016","unstructured":"Liu, Z., Li, H., Zhou, W., Rui, T., Tian, Q.: Making residual vector distribution uniform for distinctive image representation. IEEE Trans. Circuits Syst. Video Technol. 26(2), 375\u2013384 (2016)","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"1573_CR25","doi-asserted-by":"publisher","first-page":"1183","DOI":"10.1016\/j.neucom.2015.08.076","volume":"173","author":"Z Liu","year":"2016","unstructured":"Liu, Z., Wang, S., Tian, Q.: Fine-residual vlad for image retrieval. Neurocomputing 173, 1183\u20131191 (2016)","journal-title":"Neurocomputing"},{"issue":"2","key":"1573_CR26","doi-asserted-by":"publisher","first-page":"91","DOI":"10.1023\/B:VISI.0000029664.99615.94","volume":"60","author":"DG Lowe","year":"2004","unstructured":"Lowe, D.G.: Distinctive image features from scale-invariant keypoints. Int. J. Comput. Vis. 60(2), 91\u2013110 (2004)","journal-title":"Int. J. Comput. Vis."},{"key":"1573_CR27","doi-asserted-by":"publisher","unstructured":"Ng, Y.H., Yang, F., Davis, L.S.: Exploiting local features from deep networks for image retrieval. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition Workshops, pp. 53\u201361. IEEE (2015). https:\/\/doi.org\/10.1109\/CVPRW.2015.7301272","DOI":"10.1109\/CVPRW.2015.7301272"},{"key":"1573_CR28","doi-asserted-by":"crossref","unstructured":"Nister, D., Stewenius, H.: Scalable recognition with a vocabulary tree. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, vol. 2, pp. 2161\u20132168. IEEE (2006)","DOI":"10.1109\/CVPR.2006.264"},{"key":"1573_CR29","doi-asserted-by":"crossref","unstructured":"Paulin, M., Douze, M., Harchaoui, Z., Mairal, J., Perronin, F., Schmid, C.: Local convolutional features with unsupervised training for image retrieval. In: Proceedings of IEEE International Conference on Computer Vision, pp. 91\u201399. IEEE (2015)","DOI":"10.1109\/ICCV.2015.19"},{"key":"1573_CR30","doi-asserted-by":"crossref","unstructured":"Perronnin, F., Liu, Y., S\u00e1nchez, J., Poirier, H.: Large-scale image retrieval with compressed fisher vectors. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 3384\u20133391. IEEE (2010)","DOI":"10.1109\/CVPR.2010.5540009"},{"key":"1573_CR31","doi-asserted-by":"crossref","unstructured":"Perronnin, F., S\u00e1nchez, J., Mensink, T.: Improving the fisher kernel for large-scale image classification. In: Proceedings of European Conference on Computer Vision, pp. 143\u2013156. Springer (2010)","DOI":"10.1007\/978-3-642-15561-1_11"},{"key":"1573_CR32","doi-asserted-by":"crossref","unstructured":"Philbin, J., Chum, O., Isard, M., Sivic, J., Zisserman, A.: Object retrieval with large vocabularies and fast spatial matching. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 1\u20138. IEEE (2007)","DOI":"10.1109\/CVPR.2007.383172"},{"key":"1573_CR33","doi-asserted-by":"crossref","unstructured":"Philbin, J., Chum, O., Isard, M., Sivic, J., Zisserman, A.: Lost in quantization: improving particular object retrieval in large scale image databases. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 1\u20138. IEEE (2008)","DOI":"10.1109\/CVPR.2008.4587635"},{"key":"1573_CR34","doi-asserted-by":"crossref","unstructured":"Sivic, J., Zisserman, A.: Video google: a text retrieval approach to object matching in videos. In: IEEE International Conference on Computer Vision, p. 1470. IEEE (2003)","DOI":"10.1109\/ICCV.2003.1238663"},{"issue":"6","key":"1573_CR35","doi-asserted-by":"publisher","first-page":"1713","DOI":"10.1109\/TMM.2014.2329648","volume":"16","author":"E Spyromitros-Xioufis","year":"2014","unstructured":"Spyromitros-Xioufis, E., Papadopoulos, S., Kompatsiaris, I.Y., Tsoumakas, G., Vlahavas, I.: A comprehensive study over VLAD and product quantization in large-scale image retrieval. IEEE Trans. Multimed. 16(6), 1713\u20131728 (2014)","journal-title":"IEEE Trans. Multimed."},{"key":"1573_CR36","doi-asserted-by":"crossref","unstructured":"Vedaldi, A., Fulkerson, B.: VLFeat: an open and portable library of computer vision algorithms. In: Proceedings of ACM international conference on Multimedia, pp. 1469\u20131472. ACM (2010)","DOI":"10.1145\/1873951.1874249"},{"key":"1573_CR37","doi-asserted-by":"crossref","unstructured":"Wang, J., Yang, J., Yu, K., Lv, F., Huang, T., Gong, Y.: Locality-constrained linear coding for image classification. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 3360\u20133367. IEEE (2010)","DOI":"10.1109\/CVPR.2010.5540018"},{"issue":"9","key":"1573_CR38","doi-asserted-by":"publisher","first-page":"1843","DOI":"10.1109\/TMM.2016.2585023","volume":"18","author":"WL Zhao","year":"2016","unstructured":"Zhao, W.L., Ngo, C.W., Wang, H.: Fast covariant vlad for image search. IEEE Trans. Multimed. 18(9), 1843\u20131854 (2016)","journal-title":"IEEE Trans. Multimed."},{"key":"1573_CR39","doi-asserted-by":"crossref","unstructured":"Zheng, L., Wang, S., Liu, Z., Tian, Q.: Packing and padding: coupled multi-index for accurate image retrieval. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, pp. 1939\u20131946. IEEE (2014)","DOI":"10.1109\/CVPR.2014.250"},{"issue":"99","key":"1573_CR40","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1109\/tpami.2017.2709749","volume":"PP","author":"L Zheng","year":"2017","unstructured":"Zheng, L., Yang, Y., Tian, Q.: SIFT meets CNN: a decade survey of instance retrieval. IEEE Trans. Pattern Anal. Mach. Intell. PP(99), 1\u20131 (2017). https:\/\/doi.org\/10.1109\/tpami.2017.2709749","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"issue":"8","key":"1573_CR41","doi-asserted-by":"publisher","first-page":"311","DOI":"10.3390\/e18080311","volume":"18","author":"Q Zhou","year":"2016","unstructured":"Zhou, Q., Wang, C., Liu, P., Li, Q., Wang, Y., Chen, S.: Distribution entropy boosted vlad for image retrieval. Entropy 18(8), 311 (2016)","journal-title":"Entropy"},{"key":"1573_CR42","unstructured":"Zhou, W., Li, H., Tian, Q.: Recent advance in content-based image retrieval: a literature survey. CoRR arxiv:1706.06064 (2017)"}],"container-title":["The Visual Computer"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s00371-018-1573-z.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s00371-018-1573-z\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s00371-018-1573-z.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,7,5]],"date-time":"2025-07-05T12:44:38Z","timestamp":1751719478000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s00371-018-1573-z"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,6,29]]},"references-count":42,"journal-issue":{"issue":"12","published-print":{"date-parts":[[2019,12]]}},"alternative-id":["1573"],"URL":"https:\/\/doi.org\/10.1007\/s00371-018-1573-z","relation":{},"ISSN":["0178-2789","1432-2315"],"issn-type":[{"value":"0178-2789","type":"print"},{"value":"1432-2315","type":"electronic"}],"subject":[],"published":{"date-parts":[[2018,6,29]]},"assertion":[{"value":"29 June 2018","order":1,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Compliance with ethical standards"}},{"value":"The authors declare that they have no conflict of interest.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}]}}