{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,10]],"date-time":"2025-12-10T08:39:32Z","timestamp":1765355972280},"reference-count":48,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2015,6]]},"DOI":"10.1109\/cvpr.2015.7298872","type":"proceedings-article","created":{"date-parts":[[2015,10,15]],"date-time":"2015-10-15T22:42:06Z","timestamp":1444948926000},"source":"Crossref","is-referenced-by-count":216,"title":["DevNet: A Deep Event Network for multimedia event detection and evidence recounting"],"prefix":"10.1109","author":[{"given":"Chuang","family":"Gan","sequence":"first","affiliation":[]},{"family":"Naiyan Wang","sequence":"additional","affiliation":[]},{"given":"Yi","family":"Yang","sequence":"additional","affiliation":[]},{"family":"Dit-Yan Yeung","sequence":"additional","affiliation":[]},{"given":"Alexander G.","family":"Hauptmann","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref39","article-title":"Designing deep networks for surface normal estimation","author":"wang","year":"2015","journal-title":"CVPR"},{"key":"ref38","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2013.441"},{"key":"ref33","article-title":"Very deep convolutional networks for large-scale image recognition","author":"simonyan","year":"2015","journal-title":"ICLRE"},{"key":"ref32","article-title":"Two-stream convolutional networks for action recognition in videos","author":"simonyan","year":"2014","journal-title":"Ivip"},{"key":"ref31","article-title":"Deep inside convolutional networks: Visualising image classification models and saliency maps","author":"simonyan","year":"2013","journal-title":"arXiv preprint arXiv 1312 6034"},{"key":"ref30","first-page":"540","article-title":"Category-specific video summarization","author":"potapov","year":"2014","journal-title":"ECCV"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2011.5995407"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-642-41136-6_11"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2014.329"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1145\/2578726.2578757"},{"key":"ref10","doi-asserted-by":"crossref","DOI":"10.1609\/aaai.v29i1.9800","article-title":"Exploring semantic inter-class relationships (SIR) for zero-shot action recognition","author":"gan","year":"2015","journal-title":"AAAI"},{"key":"ref40","first-page":"523","article-title":"Deep joint task learning for generic object extraction","author":"wang","year":"2014","journal-title":"NIPS"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2014.81"},{"key":"ref12","article-title":"Creating summaries from user videos","author":"gygli","year":"2014","journal-title":"ECCV"},{"key":"ref13","first-page":"346","article-title":"Spatial pyramid pooling in deep convolutional networks for visual recognition","author":"he","year":"2014","journal-title":"ECCV"},{"key":"ref14","article-title":"Caffe: An open source convolutional architecture for fast feature embedding","author":"jia","year":"2013"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1007\/s13735-012-0024-2"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2014.223"},{"key":"ref17","first-page":"1097","article-title":"Imagenet classification with deep convolutional neural networks","author":"krizhevsky","year":"2012","journal-title":"Ivip"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-10578-9_44"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2014.288"},{"key":"ref28","first-page":"1789","article-title":"Knowledge adaptation with partially shared features for event detection using few exemplars","author":"ma","year":"2014"},{"key":"ref4","author":"chen","year":"2009","journal-title":"MoSIFT Recognizing human actions in surveillance videos"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2013.350"},{"key":"ref3","article-title":"Return of the devil in the details: Delving deep into convolutional nets","author":"chatfield","year":"2014","journal-title":"BMVC"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1007\/11744047_33"},{"key":"ref29","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2013.228"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2005.177"},{"key":"ref8","article-title":"Visualizing higher-layer features of a deep network","author":"erhan","year":"2009","journal-title":"Dept IRO Universit&#x00E9; de Montr&#x00E9;al Tech Rep"},{"key":"ref7","first-page":"248","article-title":"Imagenet: A large-scale hierarchical image database","author":"deng","year":"2009","journal-title":"CVPR"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1145\/1961189.1961199"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2012.231"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2001.937505"},{"key":"ref46","author":"yu","year":"0","journal-title":"Informedia TRECVID 2014 MED and MER"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1007\/s11263-005-1838-7"},{"key":"ref45","doi-asserted-by":"publisher","DOI":"10.1145\/2393347.2396386"},{"key":"ref48","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2014.360"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2013.6639343"},{"key":"ref47","first-page":"818","article-title":"Visualizing and understanding convolutional networks","author":"zeiler","year":"2014","journal-title":"ECCV"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2008.4587756"},{"key":"ref42","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2014.341"},{"key":"ref24","first-page":"3","article-title":"Discovering important people and objects for egocentric video summarization","author":"lee","year":"2012","journal-title":"CVPR"},{"key":"ref41","article-title":"CNN: Single-label to multi-label","author":"wei","year":"2014","journal-title":"arXiv preprint arXiv 1406 5726"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/5.726791"},{"key":"ref44","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2013.456"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1023\/B:VISI.0000029664.99615.94"},{"key":"ref43","article-title":"A discriminative CNN video representation for event detection","author":"xu","year":"2015","journal-title":"CVPR"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/WACV.2013.6475038"}],"event":{"name":"2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)","location":"Boston, MA, USA","start":{"date-parts":[[2015,6,7]]},"end":{"date-parts":[[2015,6,12]]}},"container-title":["2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/7293313\/7298593\/07298872.pdf?arnumber=7298872","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,8,15]],"date-time":"2023-08-15T11:36:31Z","timestamp":1692099391000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/7298872\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2015,6]]},"references-count":48,"URL":"https:\/\/doi.org\/10.1109\/cvpr.2015.7298872","relation":{},"subject":[],"published":{"date-parts":[[2015,6]]}}}