{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,30]],"date-time":"2024-10-30T09:58:11Z","timestamp":1730282291391,"version":"3.28.0"},"reference-count":13,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2015,9]]},"DOI":"10.1109\/mfi.2015.7295798","type":"proceedings-article","created":{"date-parts":[[2015,10,13]],"date-time":"2015-10-13T18:08:24Z","timestamp":1444759704000},"page":"133-138","source":"Crossref","is-referenced-by-count":4,"title":["Multimodal object recognition from visual and audio sequences"],"prefix":"10.1109","author":[{"given":"Weipeng","family":"He","sequence":"first","affiliation":[]},{"given":"Haojun","family":"Guan","sequence":"additional","affiliation":[]},{"given":"Jianwei","family":"Zhang","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/TASSP.1975.1162650"},{"key":"ref11","doi-asserted-by":"publisher","DOI":"10.1109\/34.291449"},{"key":"ref12","doi-asserted-by":"publisher","DOI":"10.1109\/TSMCC.2007.893280"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1007\/s00530-010-0182-0"},{"key":"ref4","first-page":"3818","article-title":"Bag of multimodal hierarchical dirichlet processes: Model of complex conceptual structure for intelligent robots","year":"2012","journal-title":"2012 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS)"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/IROS.2007.4399634"},{"key":"ref6","article-title":"Discovering object categories in image collections","author":"sivic","year":"2005","journal-title":"MIT Tech Rep"},{"key":"ref5","first-page":"22","article-title":"Visual categorization with bags of keypoints","volume":"1","author":"csurka","year":"2004","journal-title":"Workshop on Statistical Learning in Computer Vision ECCV"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/5.18626"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1023\/B:VISI.0000029664.99615.94"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2014.6907696"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1109\/ICRA.2011.5980417"},{"journal-title":"Fundamentals of speech recognition","year":"1993","author":"rabiner","key":"ref9"}],"event":{"name":"2015 IEEE International Conference on Multisensor Fusion and Integration for Intelligent Systems (MFI)","start":{"date-parts":[[2015,9,14]]},"location":"San Diego, CA, USA","end":{"date-parts":[[2015,9,16]]}},"container-title":["2015 IEEE International Conference on Multisensor Fusion and Integration for Intelligent Systems (MFI)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/7292194\/7295735\/07295798.pdf?arnumber=7295798","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2017,3,24]],"date-time":"2017-03-24T21:46:57Z","timestamp":1490392017000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/7295798\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2015,9]]},"references-count":13,"URL":"https:\/\/doi.org\/10.1109\/mfi.2015.7295798","relation":{},"subject":[],"published":{"date-parts":[[2015,9]]}}}