{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,5,2]],"date-time":"2025-05-02T07:10:02Z","timestamp":1746169802738,"version":"3.40.4"},"publisher-location":"Cham","reference-count":29,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783319037301"},{"type":"electronic","value":"9783319037318"}],"license":[{"start":{"date-parts":[[2013,1,1]],"date-time":"2013-01-01T00:00:00Z","timestamp":1356998400000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2013]]},"DOI":"10.1007\/978-3-319-03731-8_61","type":"book-chapter","created":{"date-parts":[[2013,12,9]],"date-time":"2013-12-09T13:16:08Z","timestamp":1386594968000},"page":"658-668","source":"Crossref","is-referenced-by-count":0,"title":["High-Level Video Semantic Concept Detection Based on Multi-level Feature Representations"],"prefix":"10.1007","author":[{"given":"Lijuan","family":"Liu","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Haojie","family":"Li","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Fuming","family":"Sun","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yaomin","family":"Yin","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Chenxin","family":"Liu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","reference":[{"key":"61_CR1","doi-asserted-by":"crossref","first-page":"1349","DOI":"10.1109\/34.895972","volume":"22","author":"A.W.M. Smeulders","year":"2000","unstructured":"Smeulders, A.W.M., Worring, M., Santini, S., Gupta, A., Jain, R.: Content Based Image Retrieval at The End of The Early Years. J. IEEE Trans. PAMI 22, 1349\u20131380 (2000)","journal-title":"J. IEEE Trans. PAMI"},{"key":"61_CR2","doi-asserted-by":"crossref","unstructured":"Tang, J., Yan, S., Hong, R., Qi, G.J., Chua, T.S.: Inferring Semantic Concepts from Community-Contributed Images and Noisy Tags. In: Proc. ACM Conf. Multimedia, pp. 223\u2013232 (2009)","DOI":"10.1145\/1631272.1631305"},{"key":"61_CR3","doi-asserted-by":"crossref","unstructured":"Snoek, C.G.M., Worring, M., Gemert, J.C., Geusebroek, J.M., Smeulders, A.W.: The Challenge Problem for Automated Detection of 101 Semantic Concepts in Multimedia. In: Proc. ACM Conf. Multimedia, pp. 421\u2013430 (2006)","DOI":"10.1145\/1180639.1180727"},{"key":"61_CR4","doi-asserted-by":"crossref","first-page":"975","DOI":"10.1109\/TMM.2012.2185041","volume":"14","author":"M. Wang","year":"2012","unstructured":"Wang, M., Hong, R., Li, G., Zha, Z.J., Yan, S., Chua, T.S.: Event Driven Web Video Summarization by Tag Localization and Key-Shot Identification. J. IEEE Trans. on Multimedia 14, 975\u2013985 (2012)","journal-title":"J. IEEE Trans. on Multimedia"},{"key":"61_CR5","doi-asserted-by":"crossref","first-page":"43","DOI":"10.1109\/TMM.2011.2168198","volume":"14","author":"S. Tang","year":"2012","unstructured":"Tang, S., Zheng, Y.T., Wang, Y., Chua, T.S.: Sparse Ensemble Learning for Concept Detection. J. IEEE Trans. on Multimedia 14, 43\u201354 (2012)","journal-title":"J. IEEE Trans. on Multimedia"},{"key":"61_CR6","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1145\/1126004.1126005","volume":"2","author":"M.S. Lew","year":"2006","unstructured":"Lew, M.S., Sebe, N., Dheraba, C.: Content-Based Multimedia Information Retrieval: State of the Art and Challenges. J. TOMCCAP 2, 1\u201319 (2006)","journal-title":"J. TOMCCAP"},{"key":"61_CR7","doi-asserted-by":"crossref","unstructured":"Sivic, J., Zisserman, A.: Video Google: A Text Retrieval Approach to Object Matching in Videos. In: ICCV, vol. 2, pp. 1470\u20131477 (2003)","DOI":"10.1109\/ICCV.2003.1238663"},{"key":"61_CR8","unstructured":"Csurka, G., Dance, C.R., Fan, L., Willamowski, J., Bray, C.: Visual Categorization with Bags of Keypoints. In: ECCV Workshop, pp. 1\u201322 (2004)"},{"key":"61_CR9","doi-asserted-by":"crossref","unstructured":"Quelhas, P., Monay, F., Odobez, J.M.: Modeling Scenes with Local Descriptors and Latent Aspects. In: ICCV, vol. 1, pp. 883\u2013890 (2005)","DOI":"10.1109\/ICCV.2005.152"},{"key":"61_CR10","doi-asserted-by":"crossref","unstructured":"Fei-Fei, L., Perona, P.: A Bayesian Hierarchical Model for Learning Natural Scene Categories. In: Proc. CVPR, vol. 2, pp. 524\u2013531 (2005)","DOI":"10.1109\/CVPR.2005.16"},{"key":"61_CR11","unstructured":"Farquhar, J., Szedmak, S., Meng, H., Shawe-Taylor, J.: Improving \u201cBag-of-Keypoints\u201d Image Categorisation. J. Technical report, University of Southampton (2005)"},{"key":"61_CR12","doi-asserted-by":"crossref","unstructured":"Perronnin, F., Dance, C.R., Csurka, G., Bressan, M.: Adapted vocabularies for generic visual categorization. In: Leonardis, A., Bischof, H., Pinz, A. (eds.) ECCV 2006. LNCS, vol. 3954, pp. 464\u2013475. Springer, Heidelberg (2006)","DOI":"10.1007\/11744085_36"},{"key":"61_CR13","doi-asserted-by":"crossref","unstructured":"Jiang, Y.G., Ngo, C.W., Yang, J.: Towards Optimal Bag-of-Features for Object Categorization and Semantic Video Retrieval. In: CIVR 2007, pp. 494\u2013501 (2007)","DOI":"10.1145\/1282280.1282352"},{"key":"61_CR14","doi-asserted-by":"crossref","unstructured":"Bosch, A., Zisserman, A., Munoz, X.: Image Classifcation Using Random Forests and Ferns. In: Proc. ICCV, pp. 1\u20138 (2007)","DOI":"10.1109\/ICCV.2007.4409066"},{"key":"61_CR15","doi-asserted-by":"crossref","first-page":"37","DOI":"10.1007\/s00530-012-0265-1","volume":"19","author":"H. Li","year":"2013","unstructured":"Li, H., Wang, X., Tang, J., Zhao, C.: Combining Global and Local Matching of Multiple Features for Precise Retrieval of Item Images. J. ACM\/Springer Multimedia System Journal 19, 37\u201349 (2013)","journal-title":"J. ACM\/Springer Multimedia System Journal"},{"key":"61_CR16","unstructured":"Jaakkola, T.S., Haussler, D.: Exploiting Generative Models in Discriminative Classifiers. Advances in Neural Information Processing Systems 11, 487\u2013493 (1999)"},{"key":"61_CR17","unstructured":"Jaakkola, T.S., Haussler, D.: Probabilistic kernel regression models. In: Proceedings of the 1999 Conference on AI and Statistics (1999)"},{"key":"61_CR18","doi-asserted-by":"crossref","unstructured":"Jegou, H., Douze, M., Schmid, C., Perez, P.: Aggregating local descriptors into a compact image representation. In: CVPR, pp. 3304\u20133311 (2010)","DOI":"10.1109\/CVPR.2010.5540039"},{"key":"61_CR19","doi-asserted-by":"crossref","unstructured":"Perronnin, F., Dance, C.: Fisher Kernels on Visual Vocabularies for Image Categorization. In: CVPR 2007, pp. 1\u20138 (2007)","DOI":"10.1109\/CVPR.2007.383266"},{"key":"61_CR20","doi-asserted-by":"crossref","unstructured":"Sun, C., Nevatia, R.: Large-scale Web Video Event Classification by use of Fisher Vectors. In: WACV, pp. 15\u201322 (2013)","DOI":"10.1109\/WACV.2013.6474994"},{"key":"61_CR21","doi-asserted-by":"crossref","unstructured":"Csurka, G., Perronnin, F.: Fisher Vectors: Beyond Bag-of-Visual-Words Image Representations. In: Richard, P., Braz, J. (eds.) VISIGRAPP 2010. CCIS, vol. 229, pp. 28\u201342. Springer, Heidelberg (2011)","DOI":"10.1007\/978-3-642-25382-9_2"},{"key":"61_CR22","doi-asserted-by":"crossref","first-page":"117","DOI":"10.1109\/83.892448","volume":"10","author":"A. Vailaya","year":"2001","unstructured":"Vailaya, A., Figueiredo, M.A.T., Jain, A.K., Zhang, H.J.: Image Classification for Content-based Indexing. J. IEEE Transactions on Image Processing 10, 117\u2013130 (2001)","journal-title":"J. IEEE Transactions on Image Processing"},{"key":"61_CR23","unstructured":"Naphade, M.R.: A Probabilistic Framework for Mapping Audio-visual Features to High-Level Semantics in Terms of Concepts and Context. Dissertation of the University of Illinois at Urbana-Champaign (2001)"},{"key":"61_CR24","unstructured":"Hinton, G.E., Krizhevsky, A., Sutskever, L.: ImageNet Classification with Deep Convolutional Neural Networks. J. NIPS, 1106\u20131114 (2012)"},{"key":"61_CR25","unstructured":"Blei, D.M., Ng, A.Y., Jordan, M.I.: Latent Dirichlet Allocation. J. JMLR, 993\u20131022 (2003)"},{"key":"61_CR26","first-page":"28","volume":"7","author":"M. Lienou","year":"2010","unstructured":"Lienou, M., Maitre, H., Datcu, M.: Semantic Annotation of Satellite Images Using Latent Dirichlet Allocation. J. IEEE 7, 28\u201332 (2010)","journal-title":"J. IEEE"},{"key":"61_CR27","doi-asserted-by":"crossref","unstructured":"Snoek, C., Worring, M., Smeulders, A.: Early Versus Late Fusion in Semantic Video Analysis. In: Proc. ACM Int. Conf. Multimedia, Singapore, pp. 399\u2013402 (2005)","DOI":"10.1145\/1101149.1101236"},{"key":"61_CR28","unstructured":"Tang, S., Li, J.T., Li, M., Xie, C., Liu, Y.Z.: TRECVID 2008 High-Level Feature Extraction By MCG-ICT-CAS. In: Proc. TRECVID 2008 Workshop, Gaithesburg, USA (2008)"},{"key":"61_CR29","unstructured":"TREC Video Retrieval Evaluation, http:\/\/trecvid.nist.gov\/"}],"container-title":["Lecture Notes in Computer Science","Advances in Multimedia Information Processing \u2013 PCM 2013"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-319-03731-8_61","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,5,1]],"date-time":"2025-05-01T03:32:51Z","timestamp":1746070371000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-319-03731-8_61"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2013]]},"ISBN":["9783319037301","9783319037318"],"references-count":29,"URL":"https:\/\/doi.org\/10.1007\/978-3-319-03731-8_61","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2013]]}}}