{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,20]],"date-time":"2026-02-20T23:59:25Z","timestamp":1771631965904,"version":"3.50.1"},"reference-count":37,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2015,6]]},"DOI":"10.1109\/cvpr.2015.7298810","type":"proceedings-article","created":{"date-parts":[[2015,10,15]],"date-time":"2015-10-15T22:42:06Z","timestamp":1444948926000},"page":"1993-2001","source":"Crossref","is-referenced-by-count":8,"title":["Ranking and retrieval of image sequences from multiple paragraph queries"],"prefix":"10.1109","author":[{"family":"Gunhee Kim","sequence":"first","affiliation":[]},{"family":"Seungwhan Moon","sequence":"additional","affiliation":[]},{"given":"Leonid","family":"Sigal","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref33","doi-asserted-by":"publisher","DOI":"10.1109\/CSSE.2008.571"},{"key":"ref32","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-642-41644-6_38"},{"key":"ref31","doi-asserted-by":"publisher","DOI":"10.1109\/ISCIS.2009.5291818"},{"key":"ref30","article-title":"Using Latent Semantic Analysis in Text Summarization and Summary Evaluation","author":"steinberger","year":"2004","journal-title":"ISIMP"},{"key":"ref37","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2013.211"},{"key":"ref36","doi-asserted-by":"publisher","DOI":"10.1145\/1390156.1390310"},{"key":"ref35","doi-asserted-by":"publisher","DOI":"10.1145\/1553374.1553523"},{"key":"ref34","doi-asserted-by":"publisher","DOI":"10.1109\/JPROC.2010.2050411"},{"key":"ref10","doi-asserted-by":"crossref","first-page":"853","DOI":"10.1613\/jair.3994","article-title":"Framing Image Description as a Ranking Task: Data, Models and Evaluation Metrics","volume":"47","author":"hodosh","year":"2013","journal-title":"JAIR"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1145\/1150402.1150429"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1007\/s10994-009-5108-8"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1145\/1126004.1126008"},{"key":"ref14","article-title":"Deep Fragment Embeddings for Bidirectional Image Sentence Mapping","author":"karpathy","year":"2014","journal-title":"NIPS"},{"key":"ref15","article-title":"Using Latent Semantic Analysis for Extractive Summarization","author":"kireyev","year":"2008","journal-title":"TAC"},{"key":"ref16","article-title":"Unifying Visual-Semantic Embeddings with Multimodal Neural Language Models","author":"kiros","year":"2015","journal-title":"TACL"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2011.5995466"},{"key":"ref18","article-title":"Image Retrieval with Structured Object Queries Using Latent Ranking SVM","author":"lan","year":"2012","journal-title":"ECCV"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1016\/S0020-0255(97)00044-3"},{"key":"ref28","doi-asserted-by":"publisher","DOI":"10.1145\/2578726.2578767"},{"key":"ref4","first-page":"993","article-title":"Latent Dirichlet Allocation","volume":"3","author":"blei","year":"2003","journal-title":"JMLR"},{"key":"ref27","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2011.5995329"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1145\/1143844.1143859"},{"key":"ref6","doi-asserted-by":"crossref","first-page":"457","DOI":"10.1613\/jair.1523","article-title":"LexRank: Graph-based Lexical Centrality As Salience in Text Summarization","volume":"22","author":"erkan","year":"2004","journal-title":"JAIR"},{"key":"ref29","article-title":"Grounded Compositional Semantics for Finding and Describing Images with Sentences","author":"socher","year":"2013","journal-title":"TACL"},{"key":"ref5","article-title":"Latent Semantic Analysis for Text Segmentation","author":"choi","year":"2001","journal-title":"EMNLP"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2012.118"},{"key":"ref7","article-title":"Every Picture Tells a Story: Generating Sentences from Images","author":"farhadi","year":"2010","journal-title":"ECCV"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1023\/A:1007506220214"},{"key":"ref9","article-title":"Improving Image-Sentence Embeddings U sing Large Weakly Annotated Photo Collections","author":"gong","year":"2014","journal-title":"ECCV"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1016\/S0306-4573(02)00021-3"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1145\/1526709.1526720"},{"key":"ref22","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2014.340"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.1145\/1645953.1646003"},{"key":"ref24","article-title":"Im2 Text: Describing Images Using 1 Million Captioned Photographs","author":"ordonez","year":"2011","journal-title":"NIPS"},{"key":"ref23","article-title":"NLTK: The Natural Language Toolkit","author":"loper","year":"2002","journal-title":"ETMTNLP02"},{"key":"ref26","doi-asserted-by":"publisher","DOI":"10.1145\/182.358466"},{"key":"ref25","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2011.5995711"}],"event":{"name":"2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)","location":"Boston, MA, USA","start":{"date-parts":[[2015,6,7]]},"end":{"date-parts":[[2015,6,12]]}},"container-title":["2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/7293313\/7298593\/07298810.pdf?arnumber=7298810","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,8,31]],"date-time":"2019-08-31T16:16:13Z","timestamp":1567268173000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/7298810\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2015,6]]},"references-count":37,"URL":"https:\/\/doi.org\/10.1109\/cvpr.2015.7298810","relation":{},"subject":[],"published":{"date-parts":[[2015,6]]}}}