{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,30]],"date-time":"2024-10-30T00:05:19Z","timestamp":1730246719491,"version":"3.28.0"},"reference-count":23,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2017,9]]},"DOI":"10.1109\/icip.2017.8296600","type":"proceedings-article","created":{"date-parts":[[2018,2,22]],"date-time":"2018-02-22T17:03:23Z","timestamp":1519319003000},"page":"1842-1846","source":"Crossref","is-referenced-by-count":10,"title":["A cascaded long short-term memory (LSTM) driven generic visual question answering (VQA)"],"prefix":"10.1109","author":[{"given":"Iqbal","family":"Chowdhury","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Kien","family":"Nguyen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Clinton","family":"Fookes","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Sridha","family":"Sridharan","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"ref10","article-title":"ABC-CNN: an attention based convolutional neural network for visual question answering","volume":"abs 1511 5960","author":"chen","year":"2015","journal-title":"CoRR"},{"key":"ref11","article-title":"Very deep convolutional networks for large-scale image recognition","volume":"abs 1409 1556","author":"simonyan","year":"2014","journal-title":"CoRR"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P16-1231"},{"key":"ref13","article-title":"word2vec explained: deriving mikolov et al's negative-sampling word-embedding method","author":"goldberg","year":"2014","journal-title":"Arxiv preprint arXiv"},{"key":"ref14","article-title":"Learning to execute","volume":"abs 1410 4615","author":"zaremba","year":"2014","journal-title":"CoRR"},{"key":"ref15","article-title":"Image captioning and visual question answering based on attributes and their related external knowledge","volume":"abs 1603 2814","author":"wu","year":"2016","journal-title":"CoRR"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.538"},{"key":"ref17","first-page":"3567","article-title":"Learning to answer questions from image using convolutional neural network","author":"ma","year":"2016","journal-title":"Proc of the Thirtieth AAAI Conference on Artificial Intelligence"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2016.29"},{"key":"ref19","first-page":"2397","article-title":"Dynamic memory networks for visual and textual question answering","author":"xiong","year":"2016","journal-title":"Proceedings of the 33nd International Conference on Machine Learning ICML 2016"},{"key":"ref4","first-page":"647","article-title":"Decaf: A deep convolutional activation feature for generic visual recognition","author":"vinyals","year":"2014","journal-title":"ICML"},{"journal-title":"Principal Component Analysis","year":"2002","author":"jolliffe","key":"ref3"},{"key":"ref6","article-title":"Towards a visual turing challenge","volume":"abs 1410 8027","author":"malinowski","year":"2014","journal-title":"CoRR"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1162\/neco.1997.9.8.1735"},{"key":"ref8","first-page":"1","article-title":"Ask your neurons: A neural-based approach to answering questions about images","author":"rohrbach","year":"2015","journal-title":"ICCV"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1073\/pnas.1422953112"},{"key":"ref2","article-title":"Microsoft COCO: common objects in context","volume":"abs 1405 312","author":"lin","year":"2014","journal-title":"CoRR"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1007\/s11263-015-0816-y"},{"key":"ref9","first-page":"1682","article-title":"A multi-world approach to question answering about real-world scenes based on uncertain input","author":"malinowski","year":"2014","journal-title":"NIPS"},{"key":"ref20","article-title":"Image question answering using convolutional neural network with dynamic parameter prediction","volume":"abs 1511 5756","author":"noh","year":"2015","journal-title":"CoRR"},{"key":"ref22","article-title":"Stacked attention networks for image question answering","volume":"abs 1511 2274","author":"yang","year":"2015","journal-title":"CoRR"},{"key":"ref21","article-title":"Ask me anything: Free-form visual question answering based on knowledge from external sources","volume":"abs 1511 6973","author":"wu","year":"2015","journal-title":"CoRR"},{"key":"ref23","article-title":"Visual question answering: A survey of methods and datasets","volume":"abs 1607 5910","author":"qi","year":"2016","journal-title":"CoRR"}],"event":{"name":"2017 IEEE International Conference on Image Processing (ICIP)","start":{"date-parts":[[2017,9,17]]},"location":"Beijing","end":{"date-parts":[[2017,9,20]]}},"container-title":["2017 IEEE International Conference on Image Processing (ICIP)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/8267582\/8296222\/08296600.pdf?arnumber=8296600","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2018,4,11]],"date-time":"2018-04-11T17:13:28Z","timestamp":1523466808000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/8296600\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2017,9]]},"references-count":23,"URL":"https:\/\/doi.org\/10.1109\/icip.2017.8296600","relation":{},"subject":[],"published":{"date-parts":[[2017,9]]}}}