{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,30]],"date-time":"2024-10-30T00:05:25Z","timestamp":1730246725451,"version":"3.28.0"},"reference-count":9,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"DOI":"10.1109\/icip.2004.1421580","type":"proceedings-article","created":{"date-parts":[[2005,4,19]],"date-time":"2005-04-19T15:05:35Z","timestamp":1113923135000},"page":"2383-2386","source":"Crossref","is-referenced-by-count":15,"title":["Discovering meaningful multimedia patterns with audio-visual concepts and associated text"],"prefix":"10.1109","volume":"4","author":[{"given":"L.","family":"Xie","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"L.","family":"Kennedy","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"S.-F.","family":"Chang","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"A.","family":"Divakarun","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"H.","family":"Sun","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"C.-Y.","family":"Lin","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"journal-title":"Vision A Computational Investigation into the Human Representation of Visual Information","year":"1982","author":"marr","key":"3"},{"key":"2","article-title":"The IBM semantic concept detection frame-work","author":"amir","year":"2003","journal-title":"Trec Video Retrieval Evaluation"},{"key":"1","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4757-6928-9_10"},{"journal-title":"Trec Video Retrieval Evaluation","year":"2001","key":"7"},{"key":"6","article-title":"Associating video frames with text","author":"duygulu","year":"2003","journal-title":"Multimedia Information Retrieval Workshop in Conjuction with SIGIR 2003"},{"key":"5","article-title":"Object recognition as machine translation: Learning a lexicon for a fixed image vocabulary","author":"duygulu","year":"2002","journal-title":"ECCV"},{"key":"4","first-page":"263","article-title":"The mathematics of statistical machine translation: Parameter estimation","volume":"19","author":"brown","year":"1993","journal-title":"Computational Linguistics"},{"journal-title":"Speech and Language Processing","year":"2000","author":"jurafsky","key":"9"},{"journal-title":"MontyTagger Commonsense-informed Part-of-speech Tagging","year":"0","author":"liu","key":"8"}],"event":{"name":"2004 International Conference on Image Processing, 2004. ICIP '04.","location":"Singapore"},"container-title":["2004 International Conference on Image Processing, 2004. ICIP '04."],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx5\/9716\/30679\/01421580.pdf?arnumber=1421580","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2017,3,14]],"date-time":"2017-03-14T14:19:18Z","timestamp":1489501158000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/1421580\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[null]]},"references-count":9,"URL":"https:\/\/doi.org\/10.1109\/icip.2004.1421580","relation":{},"subject":[]}}