{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,7]],"date-time":"2024-09-07T01:20:12Z","timestamp":1725672012278},"reference-count":14,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2017,12]]},"DOI":"10.1109\/vcip.2017.8305114","type":"proceedings-article","created":{"date-parts":[[2018,3,1]],"date-time":"2018-03-01T16:58:45Z","timestamp":1519923525000},"page":"1-4","source":"Crossref","is-referenced-by-count":1,"title":["Learning multi-view embedding in joint space for bidirectional image-text retrieval"],"prefix":"10.1109","author":[{"given":"Lu","family":"Ran","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Wenmin","family":"Wang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"crossref","DOI":"10.1613\/jair.3994","article-title":"Framing image description as a ranking task: data, models and evaluation metrics","author":"hodosh","year":"2013","journal-title":"Journal of Artificial Intelligence Research"},{"key":"ref11","article-title":"Very deep convolutional networks for large-scale image recognition","author":"simonyan","year":"2014","journal-title":"CoRR"},{"key":"ref12","article-title":"Improving word representations via global context and multiple word prototypes","author":"huang","year":"2012","journal-title":"ACL"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2015.7299073"},{"key":"ref14","article-title":"Faster R-CNN: Towards realtime object detection with region proposal networks","author":"ren","year":"2015","journal-title":"NIPS"},{"key":"ref4","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2015.7298966"},{"key":"ref3","article-title":"Are you talking to a machine? dataset and methods for multilingual image question","author":"gao","year":"2015","journal-title":"NIPS"},{"key":"ref6","article-title":"Devise: a deep visual-semantic embedding model","author":"frome","year":"2013","journal-title":"NIPS"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-46475-6_17"},{"journal-title":"Deep fragment embeddings for bidirectional image sentence mapping","year":"2014","author":"karpathy","key":"ref8"},{"key":"ref7","doi-asserted-by":"crossref","DOI":"10.1162\/tacl_a_00177","article-title":"Grounded compositional semantics for finding and describing images with sentences","author":"socher","year":"2014","journal-title":"TACL"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.494"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2015.7298932"},{"key":"ref9","article-title":"Collecting image annotations using amazon's mechanical turk","author":"rashtchian","year":"2010","journal-title":"NAACL"}],"event":{"name":"2017 IEEE Visual Communications and Image Processing (VCIP)","start":{"date-parts":[[2017,12,10]]},"location":"St. Petersburg, FL","end":{"date-parts":[[2017,12,13]]}},"container-title":["2017 IEEE Visual Communications and Image Processing (VCIP)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8301388\/8305018\/08305114.pdf?arnumber=8305114","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2020,10,28]],"date-time":"2020-10-28T18:13:22Z","timestamp":1603908802000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/8305114\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2017,12]]},"references-count":14,"URL":"https:\/\/doi.org\/10.1109\/vcip.2017.8305114","relation":{},"subject":[],"published":{"date-parts":[[2017,12]]}}}