{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,5]],"date-time":"2024-09-05T09:20:19Z","timestamp":1725528019104},"reference-count":23,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2017,3]]},"DOI":"10.1109\/icassp.2017.7952691","type":"proceedings-article","created":{"date-parts":[[2017,6,20]],"date-time":"2017-06-20T17:35:36Z","timestamp":1497980136000},"page":"2921-2925","source":"Crossref","is-referenced-by-count":1,"title":["Cross-modality matching based on Fisher Vector with neural word embeddings and deep image features"],"prefix":"10.1109","author":[{"given":"Liang","family":"Han","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Wenmin","family":"Wang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Mengdi","family":"Fan","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ronggang","family":"Wang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1023\/B:VISI.0000029664.99615.94"},{"key":"ref11","article-title":"Histograms of oriented gradients for human detection","author":"dalal","year":"2013","journal-title":"CVPR"},{"key":"ref12","article-title":"Very deep convolutional networks for large-scale image recognition","author":"simonyan","year":"2014","journal-title":"Computer Science"},{"key":"ref13","article-title":"Imagenet classification with deep convolutional neural networks","author":"krizhevsky","year":"2012","journal-title":"NIPS"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2007.383266"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2015.7299073"},{"key":"ref16","article-title":"Decaf: A deep convolutional activation feature for generic visual recognition","author":"donahue","year":"2013","journal-title":"Computer Science"},{"key":"ref17","doi-asserted-by":"publisher","DOI":"10.1109\/TCYB.2016.2519449"},{"key":"ref18","article-title":"Collecting image annotations using amazon's mechanical turk","author":"rashtchian","year":"2010","journal-title":"Proc of Creating Speech and Language Data with Amazon's Mechanical Turk"},{"key":"ref19","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2013.261"},{"key":"ref4","article-title":"Word2visualvec: cross-media retrieval by visual feature prediction","author":"dong","year":"2016","journal-title":"CVPR"},{"journal-title":"Zero-shot learning by convex combination of semantic embeddings","year":"2013","author":"norouzi","key":"ref3"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2012.6247923"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1145\/1873951.1873987"},{"key":"ref8","article-title":"Latent dirichlet allocation","author":"blei","year":"2003","journal-title":"Journal of Machine Learning Research"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1145\/2671188.2749403"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1145\/2647868.2656402"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1145\/2733373.2809929"},{"key":"ref9","article-title":"Efficient estimation of word representations in vector space","author":"mikolov","year":"2013","journal-title":"Computer Science"},{"key":"ref20","doi-asserted-by":"publisher","DOI":"10.1109\/ICASSP.2012.6288383"},{"key":"ref22","article-title":"Cluster canonical correlation analysis","author":"rasiwasia","year":"2014","journal-title":"AISTATS"},{"key":"ref21","article-title":"Coupled feature mapping and correlational mining for cross-media retrieval","author":"fan","year":"2016","journal-title":"In ICME"},{"key":"ref23","article-title":"On the role of correlation and abstraction in cross-modal multimedia retrieval","author":"pereira","year":"2013","journal-title":"IEEE Transactions on Software Engineering"}],"event":{"name":"2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)","start":{"date-parts":[[2017,3,5]]},"location":"New Orleans, LA","end":{"date-parts":[[2017,3,9]]}},"container-title":["2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/7943262\/7951776\/07952691.pdf?arnumber=7952691","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2017,8,29]],"date-time":"2017-08-29T14:45:05Z","timestamp":1504017905000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/7952691\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2017,3]]},"references-count":23,"URL":"https:\/\/doi.org\/10.1109\/icassp.2017.7952691","relation":{},"subject":[],"published":{"date-parts":[[2017,3]]}}}