{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,6,29]],"date-time":"2025-06-29T04:41:09Z","timestamp":1751172069450},"reference-count":9,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"DOI":"10.1109\/iros.2004.1389768","type":"proceedings-article","created":{"date-parts":[[2005,4,1]],"date-time":"2005-04-01T20:16:50Z","timestamp":1112386610000},"page":"2404-2410","source":"Crossref","is-referenced-by-count":13,"title":["Robust speech interface based on audio and video information fusion for humanoid HRP-2"],"prefix":"10.1109","volume":"3","author":[{"family":"Isao Ham","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"F.","family":"Asano","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Y.","family":"Kawai","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"F.","family":"Kanchiro","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"K.","family":"Yamamoto","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"H.","family":"Asoh","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"family":"Jun Ogata","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"N.","family":"Ichintura","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"H.","family":"Hirukawa","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"263","reference":[{"key":"3","doi-asserted-by":"crossref","first-page":"2257","DOI":"10.21437\/Eurospeech.2003-631","article-title":"Detection and separation of speech segment using audio and video information fusion","author":"asano","year":"2003","journal-title":"Proc EUROSPEECH"},{"key":"2","first-page":"386","article-title":"Fusion of audio and video information for detecting speech events","author":"asano","year":"2003","journal-title":"Proc FUSION 2003"},{"key":"1","doi-asserted-by":"publisher","DOI":"10.7210\/jrsj.22.1004"},{"key":"7","doi-asserted-by":"publisher","DOI":"10.1109\/TAP.1986.1143830"},{"key":"6","doi-asserted-by":"publisher","DOI":"10.1109\/TPAMI.2003.1195991"},{"key":"5","first-page":"1424","article-title":"Real-time auditory and visual multiple-object tracking for humanoid","author":"nakadai","year":"2001","journal-title":"Proc IJCAI"},{"key":"4","doi-asserted-by":"publisher","DOI":"10.1155\/S1110865704402303"},{"key":"9","doi-asserted-by":"publisher","DOI":"10.1121\/1.412224"},{"key":"8","doi-asserted-by":"publisher","DOI":"10.1121\/1.412224"}],"event":{"name":"2004 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS) (IEEE Cat. No.04CH37566)","acronym":"IROS-04","location":"Sendai, Japan"},"container-title":["2004 IEEE\/RSJ International Conference on Intelligent Robots and Systems (IROS) (IEEE Cat. No.04CH37566)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx5\/9577\/30277\/01389768.pdf?arnumber=1389768","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,1,24]],"date-time":"2024-01-24T13:07:27Z","timestamp":1706101647000},"score":1,"resource":{"primary":{"URL":"http:\/\/ieeexplore.ieee.org\/document\/1389768\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[null]]},"references-count":9,"URL":"https:\/\/doi.org\/10.1109\/iros.2004.1389768","relation":{},"subject":[]}}