{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,13]],"date-time":"2025-10-13T09:10:17Z","timestamp":1760346617917,"version":"3.37.3"},"reference-count":45,"publisher":"Springer Science and Business Media LLC","issue":"6","license":[{"start":{"date-parts":[[2017,11,16]],"date-time":"2017-11-16T00:00:00Z","timestamp":1510790400000},"content-version":"unspecified","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"funder":[{"DOI":"10.13039\/501100010083","name":"Hunan Provincial Innovation Foundation for Postgraduate","doi-asserted-by":"crossref","award":["CX2014B021"],"award-info":[{"award-number":["CX2014B021"]}],"id":[{"id":"10.13039\/501100010083","id-type":"DOI","asserted-by":"crossref"}]},{"name":"Program of Foshan Innovation Team","award":["2015IT100072"],"award-info":[{"award-number":["2015IT100072"]}]},{"name":"National Natural Science Foundation of China (CN)","award":["61673125"],"award-info":[{"award-number":["61673125"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Auton Robot"],"published-print":{"date-parts":[[2018,8]]},"DOI":"10.1007\/s10514-017-9684-3","type":"journal-article","created":{"date-parts":[[2017,11,16]],"date-time":"2017-11-16T20:24:00Z","timestamp":1510863840000},"page":"1169-1185","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":32,"title":["BoCNF: efficient image matching with Bag of ConvNet features for scalable and robust visual place recognition"],"prefix":"10.1007","volume":"42","author":[{"given":"Yi","family":"Hou","sequence":"first","affiliation":[]},{"given":"Hong","family":"Zhang","sequence":"additional","affiliation":[]},{"given":"Shilin","family":"Zhou","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2017,11,16]]},"reference":[{"doi-asserted-by":"crossref","unstructured":"Arandjelovic, R., & Zisserman, A. (2013). All about VLAD. In IEEE conference on computer vision and pattern recognition (CVPR) (pp. 1578\u20131585).","key":"9684_CR1","DOI":"10.1109\/CVPR.2013.207"},{"unstructured":"Babenko, A., & Lempitsky, V. (2015). Aggregating deep convolutional features for image retrieval. In IEEE international conference on computer vision (ICCV).","key":"9684_CR2"},{"unstructured":"Badino, H., Huber, D., & Kanade T. (2011). The CMU visual localization data set. http:\/\/3dvis.ri.cmu.edu\/data-sets\/localization .","key":"9684_CR3"},{"doi-asserted-by":"crossref","unstructured":"Bay, H., Tuytelaars, T., & Van Gool, L. (2006). SURF: Speeded up robust features. In European conference on computer vision (ECCV) (Vol. 3951, pp. 404\u2013417).","key":"9684_CR4","DOI":"10.1007\/11744023_32"},{"unstructured":"Chen, Z., Lam, O., Jacobson, A., & M. Milford (2014). Convolutional neural network-based place recognition. In Australasian conference on robotics and automation (ACRA) (pp. 2\u20134).","key":"9684_CR5"},{"doi-asserted-by":"crossref","unstructured":"Cheng, M.-M., Zhang, Z., Lin, W.-Y., & Torr, P. (2014). BING: Binarized normed gradients for objectness estimation at 300fps. In IEEE conference on computer vision and pattern recognition (CVPR) (pp. 3286\u20133293).","key":"9684_CR6","DOI":"10.1109\/CVPR.2014.414"},{"issue":"9","key":"9684_CR7","doi-asserted-by":"crossref","first-page":"1100","DOI":"10.1177\/0278364910385483","volume":"30","author":"M Cummins","year":"2011","unstructured":"Cummins, M., & Newman, P. (2011). Appearance-only SLAM at large scale with FAB-MAP 2.0. The International Journal of Robotics Research, 30(9), 1100\u20131123.","journal-title":"The International Journal of Robotics Research"},{"doi-asserted-by":"crossref","unstructured":"Dalal, N., & Triggs B. (2005). Histograms of oriented gradients for human detection. In International conference on computer vision and pattern recognition (CVPR) (pp. 886\u2013893).","key":"9684_CR8","DOI":"10.1109\/CVPR.2005.177"},{"unstructured":"Gionis, A., Indyk, P., & Motwani, R. (1999). Similarity search in high dimensions via hashing. In International conference on very large data bases, San Francisco, CA (pp. 518\u2013529).","key":"9684_CR9"},{"doi-asserted-by":"crossref","unstructured":"Glover, A., Maddern, W., Milford, M., & Wyeth, G. (2010). FAB-MAP + RatSLAM: appearance-based SLAM for multiple times of day. In IEEE international conference on robotics and automation (ICRA) (pp. 3507\u20133512).","key":"9684_CR10","DOI":"10.1109\/ROBOT.2010.5509547"},{"doi-asserted-by":"crossref","unstructured":"Glover, A., Maddern, W., Warren, M., Reid, S., Milford, M., & Wyeth, G. (2012). OpenFABMAP: An open source toolbox for appearance-based loop closure detection. In IEEE international conference on robotics and automation (ICRA) (pp. 4730\u20134735).","key":"9684_CR11","DOI":"10.1109\/ICRA.2012.6224843"},{"issue":"4","key":"9684_CR12","doi-asserted-by":"crossref","first-page":"814","DOI":"10.1109\/TPAMI.2015.2465908","volume":"38","author":"J Hosang","year":"2016","unstructured":"Hosang, J., Benenson, R., Doll\u00e1r, P., & Schiele, B. (2016). What makes for effective detection proposals? IEEE Transactions on Pattern Analysis and Machine Intelligence, 38(4), 814\u2013830.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"doi-asserted-by":"crossref","unstructured":"Hou, Y., Zhang, H., & Zhou, S. (2015). Convolutional neural network-based image representation for visual loop closure detection. In IEEE international conference on information and automation (ICIA) (pp. 2238\u20132245).","key":"9684_CR13","DOI":"10.1109\/ICInfA.2015.7279659"},{"doi-asserted-by":"crossref","unstructured":"Hou, Y., Zhang, H., Zhou, S., & Zou H. (2017). Efficient ConvNet feature extraction with multiple RoI pooling for landmark-based visual localization of autonomous vehicles. In: Mobile information systems (Vol. 2017) (in press).","key":"9684_CR14","DOI":"10.1155\/2017\/8104386"},{"doi-asserted-by":"crossref","unstructured":"J\u00e9gou, H., Douze, M., & Schmid, C. (2008). Hamming embedding and weak geometric consistency for large scale image search. In European conference on computer vision (ECCV) (pp. 304\u2013317).","key":"9684_CR15","DOI":"10.1007\/978-3-540-88682-2_24"},{"doi-asserted-by":"crossref","unstructured":"J\u00e9gou, H., Douze, M., Schmid, C., & P\u00e9rez, P. (2010). Aggregating local descriptors into a compact image representation. In IEEE conference on computer vision and pattern recognition (CVPR) (pp. 3304\u20133311).","key":"9684_CR16","DOI":"10.1109\/CVPR.2010.5540039"},{"unstructured":"Kalantidis, Y., Mellina, C., & Osindero, S. (2015). Cross-dimensional weighting for aggregated deep convolutional features. In: European conference on computer vision (ECCV) (pp. 685\u2013701).","key":"9684_CR17"},{"doi-asserted-by":"crossref","unstructured":"Kosecka, J., & Li, F. (2004). Vision based topological Markov localization. In IEEE international conference on robotics and automation (ICRA) (Vol. 2, pp. 1481\u20131486).","key":"9684_CR18","DOI":"10.1109\/ROBOT.2004.1308033"},{"unstructured":"Krizhevsky, A., Sutskever, I., & Hinton, G. (2012). Imagenet classification with deep convolutional neural networks. In Advances in neural information processing systems (NIPS) (pp. 1097\u20131105).","key":"9684_CR19"},{"unstructured":"Li, F., & Kosecka, J. (2006). Probabilistic location recognition using reduced feature set. In IEEE international conference on robotics and automation (ICRA) (pp. 3405\u20133410).","key":"9684_CR20"},{"unstructured":"Liu, Y., & Zhang, H. (2012). Visual loop closure detection with a compact image descriptor. In IEEE\/RSJ international conference on intelligent robots and systems (IROS) (pp. 1051\u20131056).","key":"9684_CR21"},{"doi-asserted-by":"crossref","unstructured":"Liu, Y. & Zhang, H. (2013). Towards improving the efficiency of sequence-based SLAM. In IEEE international conference on mechatronics and automation (ICMA) (pp. 1261\u20131266).","key":"9684_CR22","DOI":"10.1109\/ICMA.2013.6618095"},{"unstructured":"Liu, Y., Feng, R., & Zhang, H. (2015). Keypoint matching by outlier pruning with consensus constraint. In IEEE international conference on robotics and automation (ICRA) (pp. 5481\u20135486).","key":"9684_CR23"},{"key":"9684_CR24","doi-asserted-by":"crossref","first-page":"91","DOI":"10.1023\/B:VISI.0000029664.99615.94","volume":"60","author":"D Lowe","year":"2004","unstructured":"Lowe, D. (2004). Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision, 60, 91\u2013110.","journal-title":"International Journal of Computer Vision"},{"issue":"1","key":"9684_CR25","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1109\/TRO.2015.2496823","volume":"32","author":"S Lowry","year":"2016","unstructured":"Lowry, S., S\u00fcenderhauf, N., Newman, P., Leonard, J., Cox, D., Corke, P., et al. (2016). Visual place recognition: A survey. IEEE Transactions on Robotics, 32(1), 1\u201319.","journal-title":"IEEE Transactions on Robotics"},{"unstructured":"Mapillary. https:\/\/www.mapillary.com .","key":"9684_CR26"},{"issue":"7","key":"9684_CR27","doi-asserted-by":"crossref","first-page":"766","DOI":"10.1177\/0278364913490323","volume":"32","author":"M Milford","year":"2013","unstructured":"Milford, M. (2013). Vision-based place recognition: how low can you go? The International Journal of Robotics Research, 32(7), 766\u2013789.","journal-title":"The International Journal of Robotics Research"},{"doi-asserted-by":"crossref","unstructured":"Milford, M., & Wyeth, G. (2012). SeqSLAM: Visual route-based navigation for sunny summer days and stormy winter nights. In IEEE international conference on robotics and automation (ICRA) (pp. 1643\u20131649).","key":"9684_CR28","DOI":"10.1109\/ICRA.2012.6224623"},{"doi-asserted-by":"crossref","unstructured":"Naseer, T., Spinello, L., Burgard, W., & Stachniss, C. (2014). Robust visual robot localization across seasons using network flows. In The AAAI conference on artificial intelligence.","key":"9684_CR29","DOI":"10.1609\/aaai.v28i1.9057"},{"doi-asserted-by":"crossref","unstructured":"Neubert, P., & Protzel, P. (2015). Local region detector + CNN based landmarks for practical place recognition in changing environments. In European conference on mobile robots (ECMR) (pp. 1\u20136).","key":"9684_CR30","DOI":"10.1109\/ECMR.2015.7324051"},{"issue":"3","key":"9684_CR31","doi-asserted-by":"crossref","first-page":"145","DOI":"10.1023\/A:1011139631724","volume":"42","author":"A Oliva","year":"2001","unstructured":"Oliva, A., & Torralba, A. (2001). Modeling the shape of the scene: a holistic representation of the spatial envelope. International Journal of Computer Vision, 42(3), 145\u2013175.","journal-title":"International Journal of Computer Vision"},{"doi-asserted-by":"crossref","unstructured":"Pepperell, E., Corke, P., & Milford, M. (2014). All-environment visual place recognition with SMART. In IEEE international conference on robotics and automation (ICRA) (pp. 1612\u20131618).","key":"9684_CR32","DOI":"10.1109\/ICRA.2014.6907067"},{"doi-asserted-by":"crossref","unstructured":"Perronnin, F., & Dance, C. (2007). Fisher kernels on visual vocabularies for image categorization. In IEEE conference on computer vision and pattern recognition (CVPR) (pp. 1\u20138).","key":"9684_CR33","DOI":"10.1109\/CVPR.2007.383266"},{"doi-asserted-by":"crossref","unstructured":"Perronnin, F., S\u00e1nchez, J., & Mensink, T. (2010). Improving the fisher kernel for large-scale image classification. In European conference on computer vision (ECCV) (pp. 143\u2013156).","key":"9684_CR34","DOI":"10.1007\/978-3-642-15561-1_11"},{"doi-asserted-by":"crossref","unstructured":"Philbin, J., Chum, O., Isard, M., Sivic, J., & Zisserman, A. (2007). Object retrieval with large vocabularies and fast spatial matching. In IEEE conference on computer vision and pattern recognition (CVPR) (pp. 1\u20138).","key":"9684_CR35","DOI":"10.1109\/CVPR.2007.383172"},{"unstructured":"Singh, G., & Kosecka, J. (2010). Visual loop closing using gist descriptors in manhattan world. In IEEE international conference on robotics and automation (ICRA) omnidirectional robot vision workshop.","key":"9684_CR36"},{"doi-asserted-by":"crossref","unstructured":"Sivic, J., & Zisserman, A. (2003). Video Google: A text retrieval approach to object matching in videos. In IEEE international conference on computer vision (ICCV) (pp. 1470\u20131477).","key":"9684_CR37","DOI":"10.1109\/ICCV.2003.1238663"},{"doi-asserted-by":"crossref","unstructured":"S\u00fcenderhauf, N., & Protzel, P. (2011). BRIEF-Gist\u2014Closing the loop by simple means. In IEEE\/RSJ international conference on intelligent robots and systems (IROS) (pp. 1234\u20131241).","key":"9684_CR38","DOI":"10.1109\/IROS.2011.6094921"},{"doi-asserted-by":"crossref","unstructured":"S\u00fcenderhauf, N., Dayoub, F., Shirazi, S., Upcroft, B., & M. Milford (2015a). On the performance of ConvNet features for place recognition. In IEEE international conference on intelligent robots and systems (IROS).","key":"9684_CR39","DOI":"10.1109\/IROS.2015.7353986"},{"unstructured":"S\u00fcenderhauf, N., Neubert, P., & Protzel, P. (2013). Are we there yet? Challenging seqslam on a 3000 km journey across all four seasons. In IEEE international conference on robotics and automation (ICRA) workshop on long-term autonomy.","key":"9684_CR40"},{"doi-asserted-by":"crossref","unstructured":"S\u00fcenderhauf, N., Shirazi, S., Jacobson, A., Dayoub, F., Pepperell, E., Upcroft, B., & Milford, M. (2015b). Place recognition with ConvNet landmarks: viewpoint-robust, condition-robust, training-free. In Robotics: science and systems (RSS), Rome.","key":"9684_CR41","DOI":"10.15607\/RSS.2015.XI.022"},{"doi-asserted-by":"crossref","unstructured":"Zhang, H. (2011). BoRF: Loop-closure detection with scale invariant visual features. In IEEE international conference on robotics and automation (ICRA) (pp. 3125\u20133130).","key":"9684_CR42","DOI":"10.1109\/ICRA.2011.5980273"},{"doi-asserted-by":"crossref","unstructured":"Zhang, H., Han, F., & Wang, H. (2016). Robust multimodal sequence-based loop closure detection via structured sparsity. In Robotics: Science and systems (RSS).","key":"9684_CR43","DOI":"10.15607\/RSS.2016.XII.043"},{"unstructured":"Zheng, L., Yang, Y., & Tian, Q. (2016). SIFT meets CNN: a decade survey of instance retrieval. In IEEE transactions on pattern analysis and machine intelligence (vol. PP, no. 99, pp. 1\u20131).","key":"9684_CR44"},{"doi-asserted-by":"crossref","unstructured":"Zitnick, C. L., & Doll\u00e1r, P. (2014). Edge boxes: Locating object proposals from edges. In European conference on computer vision (ECCV) (pp. 391\u2013405).","key":"9684_CR45","DOI":"10.1007\/978-3-319-10602-1_26"}],"container-title":["Autonomous Robots"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s10514-017-9684-3\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10514-017-9684-3.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s10514-017-9684-3.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,8,7]],"date-time":"2022-08-07T14:04:06Z","timestamp":1659881046000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s10514-017-9684-3"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2017,11,16]]},"references-count":45,"journal-issue":{"issue":"6","published-print":{"date-parts":[[2018,8]]}},"alternative-id":["9684"],"URL":"https:\/\/doi.org\/10.1007\/s10514-017-9684-3","relation":{},"ISSN":["0929-5593","1573-7527"],"issn-type":[{"type":"print","value":"0929-5593"},{"type":"electronic","value":"1573-7527"}],"subject":[],"published":{"date-parts":[[2017,11,16]]}}}