{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,5]],"date-time":"2025-11-05T18:45:24Z","timestamp":1762368324702,"version":"build-2065373602"},"reference-count":41,"publisher":"Tsinghua University Press","issue":"2","content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Comp. Visual. Med."],"published-print":{"date-parts":[[2015,6]]},"DOI":"10.1007\/s41095-015-0015-3","type":"journal-article","created":{"date-parts":[[2015,8,15]],"date-time":"2015-08-15T13:14:22Z","timestamp":1439644462000},"page":"129-141","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":10,"title":["Semantic movie summarization based on string of IE-RoleNets"],"prefix":"10.26599","volume":"1","author":[{"given":"Wen","family":"Qu","sequence":"first","affiliation":[{"name":"School of Information Science and Engineering, Northeastern University, Shenyang 110819, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yifei","family":"Zhang","sequence":"additional","affiliation":[{"name":"School of Information Science and Engineering, Northeastern University, Shenyang 110819, China; Key Laboratory of Medical Image Computing (Northeastern University), Ministry of Education, Shenyang 110819, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Daling","family":"Wang","sequence":"additional","affiliation":[{"name":"School of Information Science and Engineering, Northeastern University, Shenyang 110819, China; Key Laboratory of Medical Image Computing (Northeastern University), Ministry of Education, Shenyang 110819, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Shi","family":"Feng","sequence":"additional","affiliation":[{"name":"School of Information Science and Engineering, Northeastern University, Shenyang 110819, China; Key Laboratory of Medical Image Computing (Northeastern University), Ministry of Education, Shenyang 110819, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ge","family":"Yu","sequence":"additional","affiliation":[{"name":"School of Information Science and Engineering, Northeastern University, Shenyang 110819, China; Key Laboratory of Medical Image Computing (Northeastern University), Ministry of Education, Shenyang 110819, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"11138","reference":[{"issue":"2","key":"15_CR1","doi-asserted-by":"crossref","first-page":"79","DOI":"10.1109\/MSP.2006.1621451","volume":"23","author":"Y. Li","year":"2006","unstructured":"Li, Y.; Lee, S.-H.; Yeh, C.-H.; Kuo, C.-C. J. Techniques for movie content analysis and skimming: Tutorial and overview on video abstraction techniques. IEEE Singnal Processing Magazine Vol. 23, No. 2, 79\u201389, 2006.","journal-title":"IEEE Singnal Processing Magazine"},{"issue":"7","key":"15_CR2","doi-asserted-by":"crossref","first-page":"1553","DOI":"10.1109\/TMM.2013.2267205","volume":"15","author":"G. Evangelopoulos","year":"2013","unstructured":"Evangelopoulos, G.; Zlatintsi, A.; Potamianos, A.; Maragos, P.; Rapantzikos, K.; Skoumas, G.; Avrithis, Y. Multimodal saliency and fusion for movie summarization based on aural, visual, and textual attention. IEEE Transactions on Multimedia Vol. 15, No. 7, 1553\u20131568, 2013.","journal-title":"IEEE Transactions on Multimedia"},{"key":"15_CR3","first-page":"2528","volume-title":"15th IEEE International Conference on Image Processing","author":"G. Evangelopulos","year":"2008","unstructured":"Evangelopulos, G.; Rapantzikos, K.; Potamianos, A.; Maragos, P. Zlatintsi, A.; Avrithis, Y. Movie summarization based on audiovisual saliency detection. In: 15th IEEE International Conference on Image Processing, 2528\u20132531, 2008."},{"issue":"2","key":"15_CR4","doi-asserted-by":"crossref","first-page":"256","DOI":"10.1109\/TMM.2008.2009684","volume":"11","author":"C.-Y. Weng","year":"2009","unstructured":"Weng, C.-Y.; Chu, W.-T.; Wu, J.-L. RoleNet: Movie analysis from the perspective of social networks. IEEE Transactionns on Multimedia Vol. 11, No. 2, 256\u2013271, 2009.","journal-title":"IEEE Transactionns on Multimedia"},{"issue":"11","key":"15_CR5","doi-asserted-by":"crossref","first-page":"1927","DOI":"10.1109\/TCSVT.2013.2269186","volume":"23","author":"C.-M. Tsai","year":"2013","unstructured":"Tsai, C.-M.; Kang L.-W.; Lin, C.-W.; Lin, W. Scene-based movie summarization via role-community networks. IEEE Transactions on Circuits and System for Video Technology Vol. 23, No. 11, 1927\u20131940, 2013.","journal-title":"IEEE Transactions on Circuits and System for Video Technology"},{"key":"15_CR6","doi-asserted-by":"crossref","first-page":"855","DOI":"10.1145\/1873951.1874096","volume-title":"Proceedings of the international conference on Multimedia","author":"J. Sang","year":"2010","unstructured":"Sang, J.; Xu, C. Character-based movie summarization. In: Proceedings of the international conference on Multimedia, 855\u2013858, 2010."},{"issue":"1","key":"15_CR7","doi-asserted-by":"crossref","first-page":"143","DOI":"10.1109\/TMM.2004.840618","volume":"7","author":"A. Hanjalic","year":"2005","unstructured":"Hanjalic, A.; Xu, L.-Q. Affective video content representation and modeling. IEEE Transactions on Multimedia Vol. 7, No. 1, 143\u2013154, 2005.","journal-title":"IEEE Transactions on Multimedia"},{"issue":"2","key":"15_CR8","doi-asserted-by":"crossref","first-page":"127","DOI":"10.1145\/1142020.1142023","volume":"2","author":"X. Shao","year":"2006","unstructured":"Shao, X.; Xu, C.; Maddage, N. C.; Tian, Q.; Kankanhalli, M. S.; Jin, J. S. Automatic summarization of music videos. ACM Transactions on Multimedia Computing, Communications, and Applications Vol. 2, No. 2, 127\u2013148, 2006.","journal-title":"ACM Transactions on Multimedia Computing, Communications, and Applications"},{"issue":"4","key":"15_CR9","doi-asserted-by":"crossref","first-page":"575","DOI":"10.1109\/TMM.2004.830811","volume":"6","author":"N. Babaguchi","year":"2004","unstructured":"Babaguchi, N.; Kawai, Y.; Ogura, T.; Kitahashi, T. Personalized abstraction of broadcasted American football video by highlight selection. IEEE Transactions on Multimedia Vol. 6, No. 4, 575\u2013586, 2004.","journal-title":"IEEE Transactions on Multimedia"},{"key":"15_CR10","first-page":"1170","volume-title":"IEEE International Conference on Multimedia and Expo","author":"Y. Takahashi","year":"2005","unstructured":"Takahashi, Y.; Nitta, N.; Babaguchi, N. Video summarization for large sports video archives. In: IEEE International Conference on Multimedia and Expo, 1170\u20131173, 2005."},{"issue":"2","key":"15_CR11","doi-asserted-by":"crossref","first-page":"455","DOI":"10.1109\/TMM.2013.2291967","volume":"16","author":"F. Chen","year":"2014","unstructured":"Chen, F.; De Vleeschouwer, C.; Cavallaro, A. Resource allocation for personalized video summarization. IEEE Transactions on Multimedia Vol. 16, No. 2, 455\u2013469, 2014.","journal-title":"IEEE Transactions on Multimedia"},{"key":"15_CR12","first-page":"1473","volume-title":"IEEE International Conference on Multimedia and Expo","author":"I. Ide","year":"2006","unstructured":"Ide, I.; Mo, H.; Katayama, N.; Satoh, S. Exploiting topic thread structures in a news video archive for the semi-automatic generation of video summaries. In: IEEE International Conference on Multimedia and Expo, 1473\u20131476, 2006."},{"key":"15_CR13","doi-asserted-by":"crossref","first-page":"412","DOI":"10.1145\/641007.641092","volume-title":"Proceedings of the tenth ACM international conference on Multimedia","author":"Y. Wang","year":"2002","unstructured":"Wang, Y; Zhao, P.; Zhang, D.; Li, M.; Zhang, H. MyVideos: A system for home video management. In: Proceedings of the tenth ACM international conference on Multimedia, 412\u2013413, 2002."},{"key":"15_CR14","first-page":"5","volume-title":"IEEE International Conference on Acoustics, Speech, and Signal Processing","author":"M. Zhao","year":"2003","unstructured":"Zhao, M.; Bu, J.; Chen, C. Audio and video combined for home video abstraction. In: IEEE International Conference on Acoustics, Speech, and Signal Processing, Vol. 5, V-620-3, 2003."},{"key":"15_CR15","first-page":"1517","volume-title":"IEEE International Conference on Multimedia and Expo","author":"X. Qiu","year":"2008","unstructured":"Qiu, X.; Jiang, S. Liu, H.; Huang, Q.; Cao, L. Spatialtemporal attention analysis for home video. In: IEEE International Conference on Multimedia and Expo, 1517\u20131520, 2008."},{"key":"15_CR16","first-page":"1346","volume-title":"IEEE Conference on Computer Vision and Pattern Recognition","author":"Y. J. Lee","year":"2012","unstructured":"Lee, Y. J.; Ghosh, J.; Grauman, K. Discovering important people and objects for egocentric video summarization. In: IEEE Conference on Computer Vision and Pattern Recognition, 1346\u20131353, 2012."},{"key":"15_CR17","doi-asserted-by":"crossref","first-page":"251","DOI":"10.1145\/1026711.1026752","volume-title":"Proceedings of the 6th ACM SIGMM international workshop on Multimedia information retrieval","author":"H.-W. Chen","year":"2004","unstructured":"Chen, H.-W.; Kuo, J.-H.; Chu, W.-T.; Wu, J.- T. Action movies segmentation and summarization based on tempo analysis. In: Proceedings of the 6th ACM SIGMM international workshop on Multimedia information retrieval, 251\u2013258, 2004."},{"issue":"2","key":"15_CR18","doi-asserted-by":"crossref","first-page":"295","DOI":"10.1109\/TMM.2008.2009703","volume":"11","author":"B.-W. Chen","year":"2009","unstructured":"Chen, B.-W.; Wang, J.-C.; Wang, J.-F. A novel video summarization based on mining the story structure and semantic relations among concept entities. IEEE Transactions on Multimedia Vol. 11, No. 2, 295\u2013312, 2009.","journal-title":"IEEE Transactions on Multimedia"},{"issue":"8","key":"15_CR19","doi-asserted-by":"crossref","first-page":"751","DOI":"10.1049\/iet-spr.2011.0182","volume":"6","author":"S. Zhu","year":"2012","unstructured":"Zhu, S.; Zhao, Y.; Liang, Z.; Jing, X. Movie abstraction via the progress of the storyline. IET Signal Processing Vol. 6, No. 8, 751\u2013762, 2012.","journal-title":"IET Signal Processing"},{"key":"15_CR20","doi-asserted-by":"crossref","first-page":"389","DOI":"10.1007\/978-3-642-11301-7_40","volume":"5916","author":"R. Ren","year":"2010","unstructured":"Ren, R.; Misra, H.; Jose, J. M. Semantic based adaptive movie summarization. Lecture Notes in Computer Science Vol. 5916, 389\u2013399, 2010.","journal-title":"Lecture Notes in Computer Science"},{"key":"15_CR21","volume-title":"The Screenwriter\u2019s Bible: A Complete Guide to Writing, Formatting, and Selling Your Script","author":"D. Trottier","year":"1998","unstructured":"Trottier, D. The Screenwriter\u2019s Bible: A Complete Guide to Writing, Formatting, and Selling Your Script. Silman-James Press, 1998."},{"key":"15_CR22","doi-asserted-by":"crossref","first-page":"177","DOI":"10.1007\/3-540-64594-2_94","volume":"1425","author":"Y. Yusoff","year":"1998","unstructured":"Yusoff, Y.; Christmas, W.; Kittler, J. A study on automatic shot change detection. Lecture Notes in Computer Science Vol. 1425, 177\u2013189, 1998.","journal-title":"Lecture Notes in Computer Science"},{"issue":"3","key":"15_CR23","doi-asserted-by":"crossref","first-page":"5976","DOI":"10.1016\/j.eswa.2008.07.009","volume":"36","author":"S. Zhu","year":"2009","unstructured":"Zhu, S.; Liu, Y. Automatic scene detection for advanced story retrieval. Expert Systems with Applications Vol. 36, No. 3, 5976\u20135986, 2009.","journal-title":"Expert Systems with Applications"},{"key":"15_CR24","first-page":"2879","volume-title":"IEEE Conference on Computer Vision and Pattern Recognition","author":"X. Zhu","year":"2012","unstructured":"Zhu, X; Ramanan, D. Face detection, pose estimation, and landmark localization in the wild. In: IEEE Conference on Computer Vision and Pattern Recognition, 2879\u20132886, 2012."},{"issue":"7","key":"15_CR25","doi-asserted-by":"crossref","first-page":"711","DOI":"10.1109\/34.598228","volume":"19","author":"P. N. Belhumeur","year":"1997","unstructured":"Belhumeur, P. N.; Hespanha, J. P.; Kriegman, D. J. Eigenfaces vs. fisherfaces: Recognition using class specific linear projection. IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 19, No. 7, 711\u2013720, 1997.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"key":"15_CR26","first-page":"92.1","volume-title":"Proceedings of the British Machine Vision Conference","author":"M. Everingham","year":"2006","unstructured":"Everingham, M.; Sivic, J.; Zisserman, A. \u201cHello! My name is \u2026 Buffy\u201d\u2014automatic naming of characters in TVvideo. In: Proceedings of the British Machine Vision Conference, 92.1\u201392.10, 2006."},{"issue":"4","key":"15_CR27","doi-asserted-by":"crossref","first-page":"357","DOI":"10.1109\/TASSP.1980.1163420","volume":"28","author":"S. Davis","year":"1980","unstructured":"Davis, S.; Mermelstein, P. Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Transactions on Acoustics, Speech and Signal Processing Vol. 28, No. 4, 357\u2013366, 1980.","journal-title":"IEEE Transactions on Acoustics, Speech and Signal Processing"},{"issue":"12","key":"15_CR28","doi-asserted-by":"crossref","first-page":"2441","DOI":"10.1109\/TPAMI.2012.24","volume":"34","author":"A. Patron-Perez","year":"2012","unstructured":"Patron-Perez, A.; Marszalek, M.; Reid, I.; Zisserman, A. Structured learning of human interactions in TV shows. IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 34, No. 12, 2441\u20132453, 2012.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"key":"15_CR29","first-page":"1","volume-title":"IEEE Conference on Computer Vision and Pattern Recognition","author":"I. Laptev","year":"2008","unstructured":"Laptev, I.; Marszalek, M.; Schmid, C.; Rozenfeld, B. Learning realistic human actions from movies. In: IEEE Conference on Computer Vision and Pattern Recognition, 1\u20138, 2008."},{"issue":"9","key":"15_CR30","doi-asserted-by":"crossref","first-page":"1627","DOI":"10.1109\/TPAMI.2009.167","volume":"32","author":"P. F. Felzenszwalb","year":"2009","unstructured":"Felzenszwalb, P. F.; Girshick, R. B.; McAllester, D.; Ramanan D. Object detection with discriminatively trained partbased models. IEEE Transactions on Pattern Analysis and Machine Intelligence Vol. 32, No. 9, 1627\u20131645, 2009.","journal-title":"IEEE Transactions on Pattern Analysis and Machine Intelligence"},{"issue":"5","key":"15_CR31","doi-asserted-by":"crossref","first-page":"674","DOI":"10.1109\/TCSVT.2011.2129870","volume":"21","author":"Y.-G. Jiang","year":"2011","unstructured":"Jiang Y.-G.; Li, Z.; Chang, S.-F. Modeling scene and object contexts for human action retrieval with few examples. IEEE Transactions on Circuits and Systems for Video Technology Vol. 21, No. 5, 674\u2013681, 2011.","journal-title":"IEEE Transactions on Circuits and Systems for Video Technology"},{"key":"15_CR32","doi-asserted-by":"crossref","first-page":"65","DOI":"10.1109\/ICASSP.2009.4959521","volume-title":"IEEE International Conference on Acoustics, Speech and Signal Processing","author":"T. Giannakopoulos","year":"2009","unstructured":"Giannakopoulos, T.; Pikrakis, A.; Theodoridis, S. A dimensional approach to emotion recognition of speech from movies. In: IEEE International Conference on Acoustics, Speech and Signal Processing, 65\u201368, 2009."},{"issue":"8","key":"15_CR33","doi-asserted-by":"crossref","first-page":"2140","DOI":"10.1016\/j.sigpro.2012.06.026","volume":"93","author":"M. Xu","year":"2013","unstructured":"Xu, M.; Xu, C.; He, X.; Jin, J. S.; Luo, S.; Rui, Y. Hierarchical affective content analysis in arousal and valence dimensions. Signal Processing Vol. 93, No. 8, 2140\u20132150, 2013.","journal-title":"Signal Processing"},{"key":"15_CR34","volume-title":"Emotion in the Human Face","author":"P. Ekman","year":"1982","unstructured":"Ekman, P. Emotion in the Human Face. Cambridge University Press, 1982."},{"key":"15_CR35","first-page":"993","volume-title":"IEEE International Conference on Acoustics, Speech and Signal Processing","author":"R. Srivastava","year":"2012","unstructured":"Srivastava, R.; Yan, S.; Sim, T; Roy, S. Recognizing emotions of characters in movies. In: IEEE International Conference on Acoustics, Speech and Signal Processing, 993\u2013996, 2012."},{"issue":"2","key":"15_CR36","doi-asserted-by":"crossref","first-page":"277","DOI":"10.1109\/76.752095","volume":"9","author":"F. Lavagetto","year":"1999","unstructured":"Lavagetto, F. The facial animation engine: Toward a high-level interface for the design of MPEG-4 compliant animated faces. IEEE Transactions on Circuits and System for Video Technology Vol. 9, No. 2, 277\u2013289, 1999.","journal-title":"IEEE Transactions on Circuits and System for Video Technology"},{"issue":"5","key":"15_CR37","doi-asserted-by":"crossref","first-page":"846","DOI":"10.1109\/TMM.2008.922870","volume":"10","author":"A. Pikrakis","year":"2008","unstructured":"Pikrakis, A.; Giannakopoulos, T.; Theodoridis, S. A speech\/music discriminator of radio recordings based on dynamic programming and Bayesian networks. IEEE Transactions on Multimedia Vol. 10, No. 5, 846\u2013857, 2008.","journal-title":"IEEE Transactions on Multimedia"},{"issue":"1","key":"15_CR38","doi-asserted-by":"crossref","first-page":"32","DOI":"10.1109\/79.911197","volume":"18","author":"R. Cowie","year":"2001","unstructured":"Cowie, R.; Douglas-Cowie, E.; Tsapatsoulis, N.; Votsis, G.; Kollias, S.; Fellenz, W.; Taylor, J. G. Emotion recognition in human\u2013computer interaction. IEEE Signal Processing Magazine Vol. 18, No. 1, 32\u201380, 2001","journal-title":"IEEE Signal Processing Magazine"},{"key":"15_CR39","volume-title":"ISCA Workshop on Speech and Emotion: A Conceptual Framework for Research","author":"S. McGilloway","year":"2000","unstructured":"McGilloway, S.; Cowie, R.; Douglas-Cowie, E.; Gielen, S.; Westerdijk, M.; Stroeve, S. Approaching automatic recognition of emotion from voice: A rough benchmark. In: ISCA Workshop on Speech and Emotion: A Conceptual Framework for Research, 2000. Available at http:\/\/www.isca-speech.org\/archive_open\/archive_papers\/speech_emotion\/spem 207.pdf."},{"issue":"1","key":"15_CR40","doi-asserted-by":"crossref","first-page":"43","DOI":"10.1109\/TASSP.1978.1163055","volume":"26","author":"H. Sakoe","year":"1978","unstructured":"Sakoe, H.; Chiba, S. Dynamic programming algorithm optimization for spoken word recognition. IEEE Transactions on Acoustics, Speech and Signal Processing Vol. 26, No. 1, 43\u201349, 1978.","journal-title":"IEEE Transactions on Acoustics, Speech and Signal Processing"},{"issue":"1","key":"15_CR41","doi-asserted-by":"crossref","first-page":"3","DOI":"10.1145\/1198302.1198305","volume":"3","author":"B. T. Truong","year":"2007","unstructured":"Truong, B. T.; Venkatesh, S. Video abstraction: A systematic review and classification. ACM Transactions on Multimedia Computing, Communications, and Applications Vol. 3, No. 1, Article No. 3, 2007.","journal-title":"ACM Transactions on Multimedia Computing, Communications, and Applications"}],"container-title":["Computational Visual Media"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx8\/10750449\/10897397\/10897402.pdf?arnumber=10897402","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,11,5]],"date-time":"2025-11-05T18:38:23Z","timestamp":1762367903000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/10897402\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2015,6]]},"references-count":41,"journal-issue":{"issue":"2"},"URL":"https:\/\/doi.org\/10.1007\/s41095-015-0015-3","relation":{},"ISSN":["2096-0662","2096-0433"],"issn-type":[{"type":"electronic","value":"2096-0662"},{"type":"print","value":"2096-0433"}],"subject":[],"published":{"date-parts":[[2015,6]]}}}