{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,3,28]],"date-time":"2025-03-28T00:06:54Z","timestamp":1743120414136,"version":"3.40.3"},"publisher-location":"Cham","reference-count":47,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783030012601"},{"type":"electronic","value":"9783030012618"}],"license":[{"start":{"date-parts":[[2018,1,1]],"date-time":"2018-01-01T00:00:00Z","timestamp":1514764800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2018,1,1]],"date-time":"2018-01-01T00:00:00Z","timestamp":1514764800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2018]]},"DOI":"10.1007\/978-3-030-01261-8_30","type":"book-chapter","created":{"date-parts":[[2018,10,8]],"date-time":"2018-10-08T16:14:51Z","timestamp":1539015291000},"page":"506-522","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":17,"title":["DOCK: Detecting Objects by Transferring Common-Sense Knowledge"],"prefix":"10.1007","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-8066-6835","authenticated-orcid":false,"given":"Krishna Kumar","family":"Singh","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0003-4042-5874","authenticated-orcid":false,"given":"Santosh","family":"Divvala","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7249-2380","authenticated-orcid":false,"given":"Ali","family":"Farhadi","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-9863-1270","authenticated-orcid":false,"given":"Yong Jae","family":"Lee","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2018,10,6]]},"reference":[{"key":"30_CR1","unstructured":"Toothbrush. http:\/\/cocodataset.org#explore?id=315486"},{"key":"30_CR2","doi-asserted-by":"crossref","unstructured":"Arbel\u00e1ez, P., Pont-Tuset, J., Barron, J., Marques, F., Malik, J.: Multiscale combinatorial grouping. In: CVPR (2014)","DOI":"10.1109\/CVPR.2014.49"},{"key":"30_CR3","doi-asserted-by":"crossref","unstructured":"Aytar, Y., Zisserman, A.: Tabula rasa: model transfer for object category detection. In: ICCV (2011)","DOI":"10.1109\/ICCV.2011.6126504"},{"key":"30_CR4","doi-asserted-by":"crossref","unstructured":"Bilen, H., Pedersoli, M., Namboodiri, V., Tuytelaars, T., Gool, L.V.: Object classification with adaptable regions. In: CVPR (2014)","DOI":"10.1109\/CVPR.2014.468"},{"key":"30_CR5","doi-asserted-by":"crossref","unstructured":"Bilen, H., Vedaldi, A.: Weakly supervised deep detection networks. In: CVPR (2016)","DOI":"10.1109\/CVPR.2016.311"},{"key":"30_CR6","doi-asserted-by":"crossref","unstructured":"Chatfield, K., Simonyan, K., Vedaldi, A., Zisserman, A.: Return of the devil in the details: delving deep into convolutional nets. In: BMVC (2014)","DOI":"10.5244\/C.28.6"},{"key":"30_CR7","unstructured":"Chowdhury, S.N., Tandon, N., Ferhatosmanoglu, H., Weikum, G.: VISIR: visual and semantic image label refinement. In: WSDM (2018)"},{"issue":"1","key":"30_CR8","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s11263-011-0439-x","volume":"95","author":"C Desai","year":"2011","unstructured":"Desai, C., Ramanan, D., Fowlkes, C.: Discriminative models for multi-class object layout. IJCV 95(1), 1\u201312 (2011)","journal-title":"IJCV"},{"key":"30_CR9","doi-asserted-by":"crossref","unstructured":"Divvala, S.K., Hoiem, D., Hays, J.H., Efros, A.A., Hebert, M.: An empirical study of context in object detection. In: CVPR (2009)","DOI":"10.1109\/CVPR.2009.5206532"},{"key":"30_CR10","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"362","DOI":"10.1007\/978-3-319-10578-9_24","volume-title":"Computer Vision \u2013 ECCV 2014","author":"C Doersch","year":"2014","unstructured":"Doersch, C., Gupta, A., Efros, A.A.: Context as supervisory signal: discovering objects with predictable context. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014. LNCS, vol. 8691, pp. 362\u2013377. Springer, Cham (2014). https:\/\/doi.org\/10.1007\/978-3-319-10578-9_24"},{"key":"30_CR11","doi-asserted-by":"crossref","unstructured":"Donahue, J., Hoffman, J., Rodner, E., Saenko, K., Darrell, T.: Semi-supervised domain adaptation with instance constraints. In: CVPR (2013)","DOI":"10.1109\/CVPR.2013.92"},{"key":"30_CR12","unstructured":"Everingham, M., Van Gool, L., Williams, C.K.I., Winn, J., Zisserman, A.: The PASCAL Visual Object Classes Challenge 2012 (VOC2012) Results. http:\/\/www.pascal-network.org\/challenges\/VOC\/voc2012\/workshop\/index.html"},{"key":"30_CR13","doi-asserted-by":"crossref","unstructured":"Fang, Y., Kuan, K., Lin, J., Tan, C., Chandrasekhar, V.: Object detection meets knowledge graphs. In: IJCAI (2017)","DOI":"10.24963\/ijcai.2017\/230"},{"key":"30_CR14","doi-asserted-by":"crossref","unstructured":"Farhadi, A., Endres, I., Hoiem, D., Forsyth, D.: Describing objects by their attributes. In: CVPR (2009)","DOI":"10.1109\/CVPR.2009.5206772"},{"key":"30_CR15","doi-asserted-by":"crossref","unstructured":"Gidaris, S., Komodakis, N.: Object detection via a multi-region and semantic segmentation-aware CNN model. In: ICCV (2015)","DOI":"10.1109\/ICCV.2015.135"},{"key":"30_CR16","doi-asserted-by":"crossref","unstructured":"Girshick, R.: Fast R-CNN. In: ICCV (2015)","DOI":"10.1109\/ICCV.2015.169"},{"key":"30_CR17","unstructured":"Hoffman, J., et al.: LSDA: Large scale detection through adaptation. In: NIPS (2014)"},{"key":"30_CR18","doi-asserted-by":"crossref","unstructured":"Hoffman, J., Pathak, D., Darrell, T., Saenko, K.: Detector discovery in the wild: joint multiple instance and representation learning. In: CVPR (2015)","DOI":"10.1109\/CVPR.2015.7298906"},{"issue":"1","key":"30_CR19","doi-asserted-by":"publisher","first-page":"32","DOI":"10.1007\/s11263-016-0981-7","volume":"123","author":"R Krishna","year":"2017","unstructured":"Krishna, R., et al.: Visual genome: connecting language and vision using crowdsourced dense image annotations. IJCV 123(1), 32\u201373 (2017)","journal-title":"IJCV"},{"issue":"2","key":"30_CR20","doi-asserted-by":"publisher","first-page":"346","DOI":"10.1109\/TPAMI.2011.122","volume":"34","author":"YJ Lee","year":"2012","unstructured":"Lee, Y.J., Grauman, K.: Object-graphs for context-aware visual category discovery. TPAMI 34(2), 346\u2013358 (2012)","journal-title":"TPAMI"},{"key":"30_CR21","doi-asserted-by":"crossref","unstructured":"Lim, J.J., Salakhutdinov, R.R., Torralba, A.: Transfer learning by borrowing examples for multiclass object detection. In: NIPS (2011)","DOI":"10.1109\/CVPR.2011.5995720"},{"key":"30_CR22","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"740","DOI":"10.1007\/978-3-319-10602-1_48","volume-title":"Computer Vision \u2013 ECCV 2014","author":"T-Y Lin","year":"2014","unstructured":"Lin, T.-Y., et al.: Microsoft COCO: common objects in context. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014. LNCS, vol. 8693, pp. 740\u2013755. Springer, Cham (2014). https:\/\/doi.org\/10.1007\/978-3-319-10602-1_48"},{"issue":"4","key":"30_CR23","doi-asserted-by":"publisher","first-page":"211","DOI":"10.1023\/B:BTTJ.0000047600.45421.6d","volume":"22","author":"H Liu","year":"2004","unstructured":"Liu, H., Singh, P.: ConceptNet - a practical commonsense reasoning tool-kit. BT Technol. J. 22(4), 211\u2013226 (2004)","journal-title":"BT Technol. J."},{"key":"30_CR24","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"852","DOI":"10.1007\/978-3-319-46448-0_51","volume-title":"Computer Vision \u2013 ECCV 2016","author":"C Lu","year":"2016","unstructured":"Lu, C., Krishna, R., Bernstein, M., Fei-Fei, L.: Visual relationship detection with language priors. In: Leibe, B., Matas, J., Sebe, N., Welling, M. (eds.) ECCV 2016. LNCS, vol. 9905, pp. 852\u2013869. Springer, Cham (2016). https:\/\/doi.org\/10.1007\/978-3-319-46448-0_51"},{"key":"30_CR25","doi-asserted-by":"crossref","unstructured":"Marino, K., Salakhutdinov, R., Gupta, A.: The more you know: using knowledge graphs for image classification. In: CVPR (2017)","DOI":"10.1109\/CVPR.2017.10"},{"key":"30_CR26","unstructured":"Mikolov, T., Sutskever, I., Chen, K., Corrado, G.S., Dean, J.: Distributed representations of words and phrases and their compositionality. In: NIPS (2013)"},{"issue":"11","key":"30_CR27","doi-asserted-by":"publisher","first-page":"39","DOI":"10.1145\/219717.219748","volume":"38","author":"GA Miller","year":"1995","unstructured":"Miller, G.A.: WordNet: a lexical database for English. Commun. ACM 38(11), 39\u201341 (1995)","journal-title":"Commun. ACM"},{"key":"30_CR28","doi-asserted-by":"crossref","unstructured":"Mottaghi, R., et al.: The role of context for object detection and semantic segmentation in the wild. In: CVPR (2014)","DOI":"10.1109\/CVPR.2014.119"},{"key":"30_CR29","doi-asserted-by":"publisher","first-page":"217","DOI":"10.1016\/j.artint.2012.07.001","volume":"193","author":"R Navigli","year":"2012","unstructured":"Navigli, R., Ponzetto, S.P.: BabelNet: the automatic construction, evaluation and application of a wide-coverage multilingual semantic network. Artif. Intell. 193, 217\u2013250 (2012)","journal-title":"Artif. Intell."},{"key":"30_CR30","doi-asserted-by":"crossref","unstructured":"Plummer, B.A., Mallya, A., Cervantes, C.M., Hockenmaier, J., Lazebnik, S.: Phrase localization and visual relationship detection with comprehensive linguistic cues. In: ICCV (2017)","DOI":"10.1109\/ICCV.2017.213"},{"key":"30_CR31","doi-asserted-by":"crossref","unstructured":"Rabinovich, A., Vedaldi, A., Galleguillos, C., Wiewiora, E., Belongie, S.: Objects in context. In: ICCV (2007)","DOI":"10.1109\/ICCV.2007.4408986"},{"key":"30_CR32","doi-asserted-by":"crossref","unstructured":"Rochan, M., Wang, Y.: Weakly supervised localization of novel objects using appearance transfer. In: CVPR (2015)","DOI":"10.1109\/CVPR.2015.7299060"},{"key":"30_CR33","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/978-3-642-33709-3_1","volume-title":"Computer Vision \u2013 ECCV 2012","author":"O Russakovsky","year":"2012","unstructured":"Russakovsky, O., Lin, Y., Yu, K., Fei-Fei, L.: Object-centric spatial pooling for image classification. In: Fitzgibbon, A., Lazebnik, S., Perona, P., Sato, Y., Schmid, C. (eds.) ECCV 2012. LNCS, pp. 1\u201315. Springer, Heidelberg (2012). https:\/\/doi.org\/10.1007\/978-3-642-33709-3_1"},{"key":"30_CR34","doi-asserted-by":"publisher","first-page":"211","DOI":"10.1007\/s11263-015-0816-y","volume":"115","author":"O Russakovsky","year":"2015","unstructured":"Russakovsky, O., et al.: ImageNet large scale visual recognition challenge. IJCV 115, 211\u2013252 (2015)","journal-title":"IJCV"},{"key":"30_CR35","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/978-3-642-35749-7_1","volume-title":"Trends and Topics in Computer Vision","author":"O Russakovsky","year":"2012","unstructured":"Russakovsky, O., Fei-Fei, L.: Attribute learning in large-scale datasets. In: Kutulakos, K.N. (ed.) ECCV 2010. LNCS, vol. 6553, pp. 1\u201314. Springer, Heidelberg (2012). https:\/\/doi.org\/10.1007\/978-3-642-35749-7_1"},{"key":"30_CR36","doi-asserted-by":"crossref","unstructured":"Salakhutdinov, R., Torralba, A., Tenenbaum, J.: Learning to share visual appearance for multiclass object detection. In: CVPR (2011)","DOI":"10.1109\/CVPR.2011.5995720"},{"key":"30_CR37","doi-asserted-by":"crossref","unstructured":"Shi, Z., Siva, P., Xiang, T.: Transfer learning by ranking for weakly supervised object annotation. In: BMVC (2012)","DOI":"10.5244\/C.26.78"},{"key":"30_CR38","doi-asserted-by":"crossref","unstructured":"Tandon, N., de Melo, G., Suchanek, F., Weikum, G.: WebChild: Harvesting and organizing commonsense knowledge from the web. In: WSDM (2014)","DOI":"10.1145\/2556195.2556245"},{"key":"30_CR39","doi-asserted-by":"crossref","unstructured":"Tang, Y., Wang, J., Gao, B., Dellandr\u00e9a, E., Gaizauskas, R., Chen, L.: Large scale semi-supervised object detection using visual and semantic knowledge transfer. In: CVPR (2016)","DOI":"10.1109\/CVPR.2016.233"},{"key":"30_CR40","doi-asserted-by":"crossref","unstructured":"Wang, Y.X., Hebert, M.: Model recommendation: generating object detectors from few samples. In: CVPR (2015)","DOI":"10.1109\/CVPR.2015.7298770"},{"key":"30_CR41","doi-asserted-by":"crossref","unstructured":"Wu, Q., Wang, P., Shen, C., Dick, A., van den Hengel, A.: Ask me anything: free-form visual question answering based on knowledge from external sources. In: CVPR (2016)","DOI":"10.1109\/CVPR.2016.500"},{"key":"30_CR42","doi-asserted-by":"publisher","first-page":"3","DOI":"10.1007\/s11263-014-0748-y","volume":"119","author":"J Xiao","year":"2016","unstructured":"Xiao, J., Ehinger, K.A., Hays, J., Torralba, A., Oliva, A.: Sun database: exploring a large collection of scene categories. IJCV 119, 3\u201322 (2016)","journal-title":"IJCV"},{"key":"30_CR43","doi-asserted-by":"publisher","first-page":"2367","DOI":"10.1109\/TPAMI.2013.2296528","volume":"36","author":"J Xu","year":"2014","unstructured":"Xu, J., Ramos, S., V\u00e1zquez, D., L\u00f3pez, A.M.: Domain adaptation of deformable part-based models. PAMI 36, 2367\u20132380 (2014)","journal-title":"PAMI"},{"key":"30_CR44","doi-asserted-by":"crossref","unstructured":"Yatskar, M., Zettlemoyer, L., Farhadi, A.: Situation recognition: visual semantic role labeling for image understanding. In: CVPR (2016)","DOI":"10.1109\/CVPR.2016.597"},{"key":"30_CR45","unstructured":"Zhou, B., Lapedriza, A., Xiao, J., Torralba, A., Oliva, A.: Learning deep features for scene recognition using places database. In: NIPS (2014)"},{"key":"30_CR46","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"408","DOI":"10.1007\/978-3-319-10605-2_27","volume-title":"Computer Vision \u2013 ECCV 2014","author":"Y Zhu","year":"2014","unstructured":"Zhu, Y., Fathi, A., Fei-Fei, L.: Reasoning about object affordances in a knowledge base representation. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014. LNCS, vol. 8690, pp. 408\u2013424. Springer, Cham (2014). https:\/\/doi.org\/10.1007\/978-3-319-10605-2_27"},{"key":"30_CR47","unstructured":"Zhu, Y., Zhang, C., R\u00e9, C., Fei-Fei, L.: Building a large-scale multimodal knowledge base system for answering visual queries. arXiv preprint (2015)"}],"container-title":["Lecture Notes in Computer Science","Computer Vision \u2013 ECCV 2018"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-030-01261-8_30","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,10,8]],"date-time":"2022-10-08T00:39:03Z","timestamp":1665189543000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-030-01261-8_30"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018]]},"ISBN":["9783030012601","9783030012618"],"references-count":47,"URL":"https:\/\/doi.org\/10.1007\/978-3-030-01261-8_30","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2018]]},"assertion":[{"value":"6 October 2018","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"ECCV","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"European Conference on Computer Vision","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Munich","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Germany","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2018","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"8 September 2018","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"14 September 2018","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"15","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"eccv2018","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/eccv2018.org\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"This content has been made available to all.","name":"free","label":"Free to read"}]}}