{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,10,30]],"date-time":"2025-10-30T01:57:34Z","timestamp":1761789454856},"reference-count":43,"publisher":"Springer Science and Business Media LLC","issue":"24","license":[{"start":{"date-parts":[[2018,6,14]],"date-time":"2018-06-14T00:00:00Z","timestamp":1528934400000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"funder":[{"DOI":"10.13039\/501100001409","name":"Department of Science and Technology, Ministry of Science and Technology","doi-asserted-by":"publisher","award":["INSPIRE Faculty Award (IVR No.: 201700008258)"],"award-info":[{"award-number":["INSPIRE Faculty Award (IVR No.: 201700008258)"]}],"id":[{"id":"10.13039\/501100001409","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"published-print":{"date-parts":[[2018,12]]},"DOI":"10.1007\/s11042-018-6247-3","type":"journal-article","created":{"date-parts":[[2018,6,14]],"date-time":"2018-06-14T04:04:47Z","timestamp":1528949087000},"page":"31991-32011","update-policy":"http:\/\/dx.doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":18,"title":["Automatic image annotation: the quirks and what works"],"prefix":"10.1007","volume":"77","author":[{"given":"Ayushi","family":"Dutta","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yashaswi","family":"Verma","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"C. V.","family":"Jawahar","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2018,6,14]]},"reference":[{"key":"6247_CR1","unstructured":"Ahn LV, Dabbish L (2004) Labeling images with a computer game. In: ACM SIGCHI Conference on human factors in computing systems"},{"issue":"3","key":"6247_CR2","doi-asserted-by":"publisher","first-page":"394","DOI":"10.1109\/TPAMI.2007.61","volume":"29","author":"G Carneiro","year":"2007","unstructured":"Carneiro G, Chan AB, Moreno PJ, Vasconcelos N (2007) Supervised learning of semantic classes for image annotation and retrieval. IEEE Trans Pattern Anal Mach Intell 29(3):394\u2013410","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"6247_CR3","unstructured":"Chen M, Zheng A, Weinberger KQ (2013) Fast image tagging. In: ICML"},{"key":"6247_CR4","doi-asserted-by":"crossref","unstructured":"Chua TS, Tang J, Hong R, Li H, Luo Z, Zheng Y (2009) NUS-WIDE: A real-world web image database from National University of Singapore. In: ACM CIVR","DOI":"10.1145\/1646396.1646452"},{"key":"6247_CR5","doi-asserted-by":"publisher","DOI":"10.1017\/CBO9780511801389","volume-title":"An Introduction to Support Vector Machines: And Other Kernel-based Learning Methods","author":"N Cristianini","year":"2000","unstructured":"Cristianini N, Shawe-Taylor J (2000) An Introduction to Support Vector Machines: And Other Kernel-based Learning Methods. Cambridge University Press, Cambridge"},{"key":"6247_CR6","doi-asserted-by":"crossref","unstructured":"Devlin J, Cheng H, Fang H, Gupta S, Deng L, He X, Zweig G, Mitchell M (2015) Language models for image captioning: The quirks and what works. In: ACL","DOI":"10.3115\/v1\/P15-2017"},{"key":"6247_CR7","doi-asserted-by":"crossref","unstructured":"Duygulu P, Barnard K, de Freitas JFG, Forsyth DA (2002) Object recognition as machine translation: Learning a lexicon for a fixed image vocabulary. In: ECCV","DOI":"10.1007\/3-540-47979-1_7"},{"key":"6247_CR8","unstructured":"Feng SL, Manmatha R, Lavrenko V (2004) Multiple Bernoulli relevance models for image and video annotation. In: CVPR"},{"key":"6247_CR9","doi-asserted-by":"crossref","unstructured":"Fu H, Zhang Q, Qiu G (2012) Random forest for image annotation. In: ECCV, pp 86\u201399","DOI":"10.1007\/978-3-642-33783-3_7"},{"key":"6247_CR10","unstructured":"Gong Y, Jia Y, Leung TK, Toshev A, Ioffe S (2014) Deep convolutional ranking for multilabel image annotation. In: ICLR"},{"key":"6247_CR11","unstructured":"Grubinger M, Clough PD, M\u00fcller H, Deselaers T (2006) The IAPR benchmark: A new evaluation resource for visual information systems. In: International Conference on Language Resources and Evaluation. \n                    http:\/\/www-i6.informatik.rwth-aachen.de\/imageclef\/resources\/iaprtc12.tgz"},{"key":"6247_CR12","doi-asserted-by":"crossref","unstructured":"Guillaumin M, Mensink T, Verbeek J, Schmid C (2009) TagProp: Discriminative metric learning in nearest neighbour models for image auto-annotation. In: ICCV","DOI":"10.1109\/ICCV.2009.5459266"},{"key":"6247_CR13","unstructured":"Gupta A, Verma Y, Jawahar CV (2012) Choosing linguistics over vision to describe images. In: AAAI"},{"issue":"12","key":"6247_CR14","doi-asserted-by":"publisher","first-page":"2639","DOI":"10.1162\/0899766042321814","volume":"16","author":"DR Hardoon","year":"2004","unstructured":"Hardoon DR, Szedmak S, Shawe-Taylor J (2004) Canonical correlation analysis: An overview with application to learning methods. Neural Comput 16(12):2639\u20132664","journal-title":"Neural Comput"},{"key":"6247_CR15","doi-asserted-by":"crossref","unstructured":"He K, Zhang X, Ren S, Sun J (2016) Deep residual learning for image recognition. In: CVPR","DOI":"10.1109\/CVPR.2016.90"},{"key":"6247_CR16","doi-asserted-by":"crossref","unstructured":"Hu H, Zhou GT, Deng Z, Liao Z, Mori G (2016) Learning structured inference neural networks with label relations. In: CVPR","DOI":"10.1109\/CVPR.2016.323"},{"key":"6247_CR17","doi-asserted-by":"crossref","unstructured":"Johnson J, Ballan L, Fei-Fei L (2015) Love thy neighbors: Image annotation by exploiting image metadata. In: ICCV","DOI":"10.1109\/ICCV.2015.525"},{"key":"6247_CR18","doi-asserted-by":"crossref","unstructured":"Kalayeh MM, Idrees H, Shah M (2014) NMF-KNN: Image annotation using weighted multi-view non-negative matrix factorization. In: CVPR","DOI":"10.1109\/CVPR.2014.31"},{"key":"6247_CR19","unstructured":"Kuznetsova P, Ordonez V, Berg AC, Berg TL, Choi Y (2012) Collective generation of natural image descriptions. In: ACL"},{"issue":"1","key":"6247_CR20","doi-asserted-by":"publisher","first-page":"276","DOI":"10.1109\/TIP.2016.2624140","volume":"26","author":"Z Li","year":"2016","unstructured":"Li Z, Tang J (2016) Weakly supervised deep matrix factorization for social image understanding. IEEE Trans Image Process 26(1):276\u2013288","journal-title":"IEEE Trans Image Process"},{"issue":"7","key":"6247_CR21","doi-asserted-by":"publisher","first-page":"1310","DOI":"10.1109\/TMM.2009.2030598","volume":"11","author":"X Li","year":"2009","unstructured":"Li X, Snoek CGM, Worring M (2009) Learning social tag relevance by neighbor voting. Trans Multi 11(7):1310\u20131322","journal-title":"Trans Multi"},{"issue":"10","key":"6247_CR22","doi-asserted-by":"publisher","first-page":"2700","DOI":"10.1016\/j.patcog.2013.03.016","volume":"46","author":"Z Li","year":"2013","unstructured":"Li Z, Liu J, Xu C, Lu H (2013) Mlrank: Multi-correlation learning to rank for image annotation. Pattern Recogn 46(10):2700\u20132710","journal-title":"Pattern Recogn"},{"issue":"10","key":"6247_CR23","doi-asserted-by":"publisher","first-page":"2085","DOI":"10.1109\/TPAMI.2015.2400461","volume":"37","author":"Z Li","year":"2015","unstructured":"Li Z, Liu J, Tang J, Lu H (2015) Robust structured subspace learning for data representation. IEEE Trans Pattern Anal Mach Intell 37(10):2085\u20132098","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"6247_CR24","doi-asserted-by":"crossref","unstructured":"Li Y, Song Y, Luo J (2017) Improving pairwise ranking for multi-label image classification. In: CVPR","DOI":"10.1109\/CVPR.2017.199"},{"key":"6247_CR25","doi-asserted-by":"crossref","unstructured":"Lin TY, Maire M, Belongie S, Hays J, Perona P, Ramanan D, Dollar P, Zitnic CL (2014) Microsoft COCO: Common objects in contex. In: ECCV","DOI":"10.1007\/978-3-319-10602-1_48"},{"key":"6247_CR26","doi-asserted-by":"crossref","unstructured":"Liu F, Xiang T, Hospedales TM, Yang W, Sun C (2017) Semantic regularisation for recurrent image annotation. In: CVPR","DOI":"10.1109\/CVPR.2017.443"},{"key":"6247_CR27","doi-asserted-by":"crossref","unstructured":"Makadia A, Pavlovic V, Kumar S (2008) A new baseline for image annotation. In: ECCV","DOI":"10.1007\/978-3-540-88690-7_24"},{"issue":"1","key":"6247_CR28","doi-asserted-by":"publisher","first-page":"88","DOI":"10.1007\/s11263-010-0338-6","volume":"90","author":"A Makadia","year":"2010","unstructured":"Makadia A, Pavlovic V, Kumar S (2010) Baselines for image annotation. Int J Comput Vis 90(1):88\u2013105","journal-title":"Int J Comput Vis"},{"issue":"4","key":"6247_CR29","doi-asserted-by":"publisher","first-page":"209","DOI":"10.1007\/s13735-014-0063-y","volume":"3","author":"S Moran","year":"2014","unstructured":"Moran S, Lavrenko V (2014) A sparse kernel relevance model for automatic image annotation. Int J Multimed Inf Retr 3(4):209\u2013219","journal-title":"Int J Multimed Inf Retr"},{"key":"6247_CR30","unstructured":"Mori Y, Takahashi H, Oka R (1999) Image-to-word transformation based on dividing and vector quantizing images with words. In: MISRM\u201999 First international workshop on multimedia intelligent storage and retrieval management"},{"key":"6247_CR31","unstructured":"Platt JC (2000) Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods. In: Advances in large margin classifiers"},{"key":"6247_CR32","unstructured":"Ren Z, Jin H, Lin ZL, Fang C, Yuille AL (2015) Multi-instance visual-semantic embedding. CoRR arXiv:\n                    1512.06963"},{"issue":"3","key":"6247_CR33","doi-asserted-by":"publisher","first-page":"211","DOI":"10.1007\/s11263-015-0816-y","volume":"115","author":"O Russakovsky","year":"2015","unstructured":"Russakovsky O, Deng J, Su H, Krause J, Satheesh S, Ma S, Huang Z, Karpathy A, Khosla A, Bernstein M, Berg AC, Fei-Fei L (2015) Imagenet large scale visual recognition challenge. Int J Comput Vis 115(3):211\u2013252","journal-title":"Int J Comput Vis"},{"key":"6247_CR34","doi-asserted-by":"crossref","unstructured":"Szegedy C, Liu W, Jia Y, Sermanet P, Reed S, Anguelov D, Erhan D, Vanhoucke V, Rabinovich A (2015) Going deeper with convolutions. In: CVPR","DOI":"10.1109\/CVPR.2015.7298594"},{"key":"6247_CR35","unstructured":"Uricchio T, Ballan L, Seidenari L, Bimbo AD (2016) Automatic image annotation via label transfer in the semantic space. CoRR arXiv:\n                    1605.04770"},{"key":"6247_CR36","doi-asserted-by":"crossref","unstructured":"Verma Y, Jawahar CV (2012) Image annotation using metric learning in semantic neighbourhoods. In: ECCV","DOI":"10.1007\/978-3-642-33712-3_60"},{"key":"6247_CR37","doi-asserted-by":"crossref","unstructured":"Verma Y, Jawahar CV (2013) Exploring SVM for image annotation in presence of confusing labels. In: BMVC","DOI":"10.5244\/C.27.25"},{"issue":"1","key":"6247_CR38","doi-asserted-by":"publisher","first-page":"126","DOI":"10.1007\/s11263-016-0927-0","volume":"121","author":"Y Verma","year":"2017","unstructured":"Verma Y, Jawahar CV (2017) Image annotation by propagating labels from semantic neighbourhoods. Int J Comput Vis 121(1):126\u2013148","journal-title":"Int J Comput Vis"},{"key":"6247_CR39","doi-asserted-by":"crossref","unstructured":"Verma Y, Gupta A, Mannem P, Jawahar CV (2013) Generating image descriptions using semantic similarities in the output space. In: CVPR Workshop","DOI":"10.1109\/CVPRW.2013.50"},{"key":"6247_CR40","doi-asserted-by":"crossref","unstructured":"Wang J, Yang Y, Mao J, Huang Z, Huang C, Xu W (2016) CNN-RNN: A unified framework for multi-label image classification. In: CVPR","DOI":"10.1109\/CVPR.2016.251"},{"key":"6247_CR41","unstructured":"Weston J, Bengio S, Usunier N (2011) WSABIE: Scaling up to large vocabulary image annotation. In: IJCAI"},{"key":"6247_CR42","doi-asserted-by":"crossref","unstructured":"Zhang S, Huang J, Huang Y, Yu Y, Li H, Metaxas DN (2010) Automatic image annotation using group sparsity. In: CVPR, pp 3312\u20133319","DOI":"10.1109\/CVPR.2010.5540036"},{"issue":"99","key":"6247_CR43","doi-asserted-by":"publisher","first-page":"1819","DOI":"10.1109\/TKDE.2013.39","volume":"26","author":"M Zhang","year":"2014","unstructured":"Zhang M, Zhou Z (2014) A review on multi-label learning algorithms. IEEE Trans Knowl Data Eng 26(99):1819\u20131837","journal-title":"IEEE Trans Knowl Data Eng"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s11042-018-6247-3\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-018-6247-3.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-018-6247-3.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,6,13]],"date-time":"2019-06-13T23:11:02Z","timestamp":1560467462000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s11042-018-6247-3"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018,6,14]]},"references-count":43,"journal-issue":{"issue":"24","published-print":{"date-parts":[[2018,12]]}},"alternative-id":["6247"],"URL":"https:\/\/doi.org\/10.1007\/s11042-018-6247-3","relation":{},"ISSN":["1380-7501","1573-7721"],"issn-type":[{"value":"1380-7501","type":"print"},{"value":"1573-7721","type":"electronic"}],"subject":[],"published":{"date-parts":[[2018,6,14]]},"assertion":[{"value":"24 August 2017","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"17 April 2018","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"6 June 2018","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"14 June 2018","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}