{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,12,4]],"date-time":"2025-12-04T14:31:06Z","timestamp":1764858666413,"version":"3.40.4"},"reference-count":93,"publisher":"Springer Science and Business Media LLC","issue":"5","license":[{"start":{"date-parts":[[2013,2,22]],"date-time":"2013-02-22T00:00:00Z","timestamp":1361491200000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":["Multimedia Systems"],"published-print":{"date-parts":[[2013,10]]},"DOI":"10.1007\/s00530-013-0306-4","type":"journal-article","created":{"date-parts":[[2013,2,21]],"date-time":"2013-02-21T04:07:49Z","timestamp":1361419669000},"page":"427-454","source":"Crossref","is-referenced-by-count":73,"title":["State-of-the-art and future challenges in video scene detection: a survey"],"prefix":"10.1007","volume":"19","author":[{"given":"Manfred","family":"Del Fabro","sequence":"first","affiliation":[]},{"given":"Laszlo","family":"B\u00f6sz\u00f6rmenyi","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2013,2,22]]},"reference":[{"issue":"4","key":"306_CR1","doi-asserted-by":"crossref","first-page":"472","DOI":"10.1109\/TMM.2002.802016","volume":"4","author":"B. Adams","year":"2002","unstructured":"Adams, B., Dorai, C., Venkatesh, S.: Toward automatic extraction of expressive elements from motion pictures: tempo. IEEE Trans. Multimed. 4(4), 472\u2013481 (2002)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR2","unstructured":"Aner, A., Kender, J.: Video Summaries through mosaic-based shot and scene clustering. In: Heyden, A., Sparr, G., Nielsen, M., Johansen P. (eds.) Computer Vision ECCV 2002, Lecture Notes in Computer Science, vol. 2353, Chap. 26, pp. 45\u201349. Springer, Berlin (2006)"},{"issue":"7","key":"306_CR3","doi-asserted-by":"crossref","first-page":"1325","DOI":"10.1109\/TMM.2008.2004911","volume":"10","author":"S. Arifin","year":"2008","unstructured":"Arifin, S., Cheung, P.Y.K.: Affective level video segmentation by utilizing the Pleasure-Arousal-dominance information. IEEE Trans. Multimed. 10(7), 1325\u20131341 (2008)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR4","doi-asserted-by":"crossref","unstructured":"Ariki, Y., Kumano, M., Tsukada, K.: Highlight scene extraction in real time from baseball live video. In: Proceedings of the 5th ACM SIGMM International Workshop on Multimedia Information Retrieval, MIR \u201903, pp. 209\u2013214. ACM, New York, NY, USA (2003)","DOI":"10.1145\/973264.973297"},{"key":"306_CR5","unstructured":"Benini, S., Xu, L.Q., Leonardi, R.: Identifying video content consistency by vector quantization. In: Proceedings of the 2005 International Workshop on Image Analysis for Multimedia Interactive Services (WIAMIS 2005) (2005)"},{"key":"306_CR6","doi-asserted-by":"crossref","unstructured":"Bredin, H.: Segmentation of tv shows into scenes using speaker diarization and speech recognition. In: IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2012, pp. 2377\u20132380 (2012)","DOI":"10.1109\/ICASSP.2012.6288393"},{"key":"306_CR7","unstructured":"Cao, J.R.: Algorithm of scene segmentation based on svm for scenery documentary. In: Third International Conference on Natural Computation, 2007 (ICNC 2007), vol. 3, pp. 95\u201398 (2007)"},{"key":"306_CR8","unstructured":"Chaisorn, L., Chua, T.S., Lee, C.H.: The segmentation of news video into story units. In: IEEE International Conference on Multimedia and Expo, 2002. ICME \u201902, 2002, vol. 1, pp. 73\u201376 (2002)"},{"issue":"1","key":"306_CR9","doi-asserted-by":"crossref","first-page":"89","DOI":"10.1109\/TMM.2008.2008924","volume":"11","author":"V.T. Chasanis","year":"2009","unstructured":"Chasanis, V.T., Likas, A.C., Galatsanos, N.P.: Scene detection in videos using shot clustering and sequence alignment. IEEE Trans. Multimed. 11(1), 89\u2013100 (2009)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR10","unstructured":"Chen, L., Ozsu, M.: Rule-based scene extraction from video. In: Proceedings of 2002 International Conference on Image Processing (2002)"},{"key":"306_CR11","doi-asserted-by":"crossref","first-page":"1056","DOI":"10.1016\/j.patcog.2007.07.024","volume":"41","author":"L.H. Chen","year":"2008","unstructured":"Chen, L.H., Lai, Y.C., Mark Liao, H.Y.: Movie scene segmentation using background information. Pattern Recognit. 41, 1056\u20131065 (2008)","journal-title":"Pattern Recogn."},{"key":"306_CR12","unstructured":"Chen, S.C., Shyu, M.L., Liao, W., Zhang, C.: Scene change detection by audio and video clues, pp. 365\u2013368"},{"key":"306_CR13","unstructured":"Cheng, W., Lu, J.: Video scene oversegmentation reduction by tempo analysis. In: Fourth International Conference on Natural Computation, 2008 (ICNC \u201908), vol. 4, pp. 296\u2013300 (2008)"},{"issue":"1","key":"306_CR14","doi-asserted-by":"crossref","first-page":"93","DOI":"10.1016\/j.jvcir.2010.10.008","volume":"22","author":"W.T. Chu","year":"2011","unstructured":"Chu, W.T., Li, C.J., Tseng, S.C.: Travelmedia: an intelligent management system for media captured in travel. J. Vis. Commun. Image Represent. 22(1), 93\u2013104 (2011)","journal-title":"J. Vis. Commun. Image Represent."},{"key":"306_CR15","doi-asserted-by":"crossref","unstructured":"Chu, W.T., Lin, C.C., Yu, J.Y.: Using cross-media correlation for scene detection in travel videos. In: Proceedings of the ACM International Conference on Image and Video Retrieval, CIVR \u201909. ACM, New York, NY, USA (2009)","DOI":"10.1145\/1646396.1646420"},{"key":"306_CR16","doi-asserted-by":"crossref","unstructured":"Cour, T., Jordan, C., Miltsakaki, E., Taskar, B.: Movie\/script: alignment and parsing of video and text transcription. In: Forsyth, D., Torr, P., Zisserman, A. (eds.) Computer Vision ECCV 2008, Lecture Notes in Computer Science, vol. 5305, Chap. 12, pp. 158\u2013171. Springer, Berlin (2008)","DOI":"10.1007\/978-3-540-88693-8_12"},{"key":"306_CR17","doi-asserted-by":"crossref","unstructured":"Del Fabro, M., B\u00f6sz\u00f6rmenyi, L.: Video scene detection based on recurring motion patterns. In: Second International Conferences on Advances in Multimedia (MMEDIA), pp. 113\u2013118 (2010)","DOI":"10.1109\/MMEDIA.2010.26"},{"key":"306_CR18","doi-asserted-by":"crossref","unstructured":"Del Fabro, M., B\u00f6sz\u00f6rmenyi, L.: Summarization and presentation of real-life events using community-contributed content. In: Schoeffmann, K., Merialdo, B., Hauptmann, A., Ngo, C.W., Andreopoulos, Y., Breiteneder, C. (eds.) Advances in Multimedia Modeling, Lecture Notes in Computer Science, vol. 7131, pp. 630\u2013632. Springer, Berlin (2012)","DOI":"10.1007\/978-3-642-27355-1_60"},{"key":"306_CR19","doi-asserted-by":"crossref","unstructured":"Del Fabro, M., Sobe, A., B\u00f6sz\u00f6rmenyi, L.: Summarization of real-life events based on community-contributed content. In: The Fourth International Conferences on Advances in Multimedia, pp. 119\u2013126. IARIA (2012)","DOI":"10.1007\/978-3-642-27355-1_60"},{"issue":"2","key":"306_CR20","doi-asserted-by":"crossref","first-page":"325","DOI":"10.1007\/s11042-009-0325-5","volume":"47","author":"M. Ellouze","year":"2010","unstructured":"Ellouze, M., Boujemaa, N., Alimi, A.: Scene pathfinder: unsupervised clustering techniques for movie scenes extraction. Multimed. Tools Appl. 47(2), 325\u2013346 (2010)","journal-title":"Multimedia Tools and Applications"},{"key":"306_CR21","unstructured":"Ercolessi, P., Bredin, H., S\u00e9nac, C., Joly, P.: Segmenting TV series into scenes using speaker diarization. In: WIAMIS 2011: 12th International Workshop on Image Analysis for Multimedia Interactive Services. Delft, The Netherlands (2011)"},{"key":"306_CR22","doi-asserted-by":"crossref","unstructured":"Friedland, G., Gottlieb, L., Janin, A.: Joke-o-mat: browsing sitcoms punchline by punchline. In: Proceedings of the Seventeen ACM International Conference on Multimedia, MM \u201909, pp. 1115\u20131116. ACM, New York, NY, USA (2009)","DOI":"10.1145\/1631272.1631525"},{"issue":"6","key":"306_CR23","doi-asserted-by":"crossref","first-page":"539","DOI":"10.1109\/TCSVT.2003.813428","volume":"13","author":"D. Gatica-Perez","year":"2003","unstructured":"Gatica-Perez, D., Loui, A., Sun, M.T.: Finding structure in home videos by probabilistic hierarchical clustering. IEEE Trans. Circuits Syst. Video Technol. 13(6), 539\u2013 548 (2003)","journal-title":"Circuits and Systems for Video Technology, IEEE Transactions on"},{"key":"306_CR24","doi-asserted-by":"crossref","unstructured":"Goela, N., Wilson, K., Niu, F., Divakaran, A., Otsuka, I.: An SVM framework for Genre-Independent scene change detection. In: IEEE International Conference on Multimedia and Expo, pp. 532\u2013535 (2007)","DOI":"10.1109\/ICME.2007.4284704"},{"key":"306_CR25","doi-asserted-by":"crossref","unstructured":"Gu, Z., Mei, T., Hua, X.S., Wu, X., Li, S.: EMS: Energy Minimization Based Video Scene Segmentation. In: IEEE International Conference on Multimedia and Expo, pp. 520\u2013523 (2007)","DOI":"10.1109\/ICME.2007.4284701"},{"key":"306_CR26","unstructured":"Han, B., Wu, W.: Video scene segmentation using a novel boundary evaluation criterion and dynamic programming. In: IEEE International Conference on Multimedia and Expo (ICME), 2011, pp. 1\u20136 (2011)"},{"issue":"4","key":"306_CR27","doi-asserted-by":"crossref","first-page":"580","DOI":"10.1109\/76.767124","volume":"9","author":"A. Hanjalic","year":"1999","unstructured":"Hanjalic, A., Lagendijk, R.L., Biemond, J.: Automated high-level movie segmentation for advanced video-retrieval systems. IEEE Trans. Circuits Syst. Video Technol. 9(4), 580\u2013588 (1999)","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"306_CR28","unstructured":"Hauptmann, A., Witbrock, M.: Story segmentation and detection of commercials in broadcast news video. In: Proceedings. IEEE International Forum on Research and Technology Advances in Digital Libraries, 1998. ADL 98, pp. 168\u2013179 (1998)"},{"key":"306_CR29","unstructured":"Hsu, W.H.M., Chang, S.F.: Generative, discriminative, and ensemble learning on multi-modal perceptual fusion toward news video story segmentation. In: IEEE International Conference on Multimedia and Expo, 2004. ICME \u201904, vol. 2, pp. 1091\u20131094 (2004)"},{"issue":"3","key":"306_CR30","doi-asserted-by":"crossref","first-page":"538","DOI":"10.1109\/TMM.2005.843346","volume":"7","author":"J. Huang","year":"2005","unstructured":"Huang, J., Liu, Z., Wang, Y.: Joint scene classification and segmentation based on hidden markov model. IEEE Trans. Multimed. 7(3), 538\u2013550 (2005)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR31","doi-asserted-by":"crossref","unstructured":"Huang, J., Liu, Z., Yao, W.: Integration of audio and visual information for content-based video segmentation. In: International Conference on Image Processing, ICIP 98, vol. 3, pp. 526\u2013529 (1998)","DOI":"10.1109\/ICIP.1998.727252"},{"key":"306_CR32","doi-asserted-by":"crossref","unstructured":"Janin, A., Gottlieb, L., Friedland, G.: Joke-o-Mat HD: browsing sitcoms with human derived transcripts. In: Proceedings of the International Conference on Multimedia, MM \u201910, pp. 1591\u20131594. ACM, New York, NY, USA (2010)","DOI":"10.1145\/1873951.1874295"},{"key":"306_CR33","unstructured":"Javed, O., Rasheed, Z., Shah, M.: A framework for segmentation of talk and game shows. In: Eighth IEEE International Conference on Computer Vision, ICCV 2001, (2001)"},{"key":"306_CR34","unstructured":"Katz, E., Klein, F., Nolen, R.: The film encyclopedia. Film Encyclopedia. HarperPerennial (1998). http:\/\/books.google.com\/books?id=jhx0QgAACAAJ"},{"key":"306_CR35","doi-asserted-by":"crossref","unstructured":"Kender, J., Yeo, B.L.: Video scene segmentation via continuous video coherence. In: Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 367\u2013373 (1998)","DOI":"10.1109\/CVPR.1998.698632"},{"issue":"1-3","key":"306_CR36","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1016\/S0925-2312(98)00030-7","volume":"21","author":"T. Kohonen","year":"1998","unstructured":"Kohonen, T.: The self-organizing map. Neurocomputing 21(1\u20133), 1\u20136 (1998)","journal-title":"Neurocomputing"},{"key":"306_CR37","unstructured":"Kwon, Y.M., Song, C.J., Kim, I.J.: A new approach for high level video structuring. In: IEEE International Conference on Multimedia and Expo, ICME 2000. (2000)"},{"issue":"4","key":"306_CR38","doi-asserted-by":"crossref","first-page":"785","DOI":"10.1109\/TMM.2007.893337","volume":"9","author":"M. Kyperountas","year":"2007","unstructured":"Kyperountas, M., Kotropoulos, C., Pitas, I.: Enhanced Eigen-Audioframes for audiovisual scene change detection. IEEE Trans. Multimed. 9(4), 785\u2013797 (2007)","journal-title":"Multimedia, IEEE Transactions on"},{"key":"306_CR39","doi-asserted-by":"crossref","unstructured":"Liang, C., Zhang, Y., Cheng, J., Xu, C., Lu, H.: A novel role-based movie scene segmentation method. In: Muneesawang, P., Wu, F., Kumazawa, I., Roeksabutr, A., Liao, M., Tang, X. (eds.) Advances in Multimedia Information Processing\u2014PCM 2009, Lecture Notes in Computer Science, vol. 5879, Chap. 82, pp. 917\u2013922. Springer, Berlin (2009)","DOI":"10.1007\/978-3-642-10467-1_82"},{"key":"306_CR40","doi-asserted-by":"crossref","unstructured":"Lienbart, R., Pfeiffer, S., Effelsberg, W.: Scene determination based on video and audio features. In: IEEE International Conference on Multimedia Computing and Systems, vol. 1, pp. 685\u2013690 (1999)","DOI":"10.1109\/MMCS.1999.779282"},{"key":"306_CR41","unstructured":"Lin, T., Zhang, H.J., Shi, Q.Y.: Video scene extraction by force competition. In: IEEE International Conference on Multimedia and Expo, p. 192 (2001)"},{"issue":"3","key":"306_CR42","doi-asserted-by":"crossref","first-page":"415","DOI":"10.1016\/j.cviu.2008.08.002","volume":"113","author":"C. Liu","year":"2009","unstructured":"Liu, C., Huang, Q., Jiang, S., Xing, L., Ye, Q., Gao, W.: A framework for flexible summarization of racquet sports video using multiple modalities. Comput. Vis. Image Underst. 113(3), 415\u2013424 (2009)","journal-title":"Comput. Vis. Image Underst."},{"key":"306_CR43","unstructured":"Lu, L., Cai, R., Hanjalic, A.: Audio elements based auditory scene segmentation. In: IEEE International Conference on Acoustics, Speech and Signal Processing, 2006. ICASSP 2006 Proceedings, vol. 5, p. V (2006)"},{"issue":"7","key":"306_CR44","doi-asserted-by":"crossref","first-page":"504","DOI":"10.1109\/TSA.2002.804546","volume":"10","author":"L. Lu","year":"2002","unstructured":"Lu, L., Zhang, H.J., Jiang, H.: Content analysis for audio classification and segmentation. IEEE Trans. Speech Audio Process. 10(7), 504\u2013516 (2002)","journal-title":"IEEE Transactions on Speech and Audio Processing"},{"key":"306_CR45","doi-asserted-by":"crossref","unstructured":"Mitrovi\u0107, D., Hartlieb, S., Zeppelzauer, M., Zaharieva, M.: Scene segmentation in artistic archive documentaries. In: Leitner, G., Hitz, M., Holzinger, A. (eds.) HCI in Work and Learning, Life and Leisure, Lecture Notes in Computer Science, vol. 6389, Chap. 27, pp. 400\u2013410. Springer, Berlin (2010)","DOI":"10.1007\/978-3-642-16607-5_27"},{"key":"306_CR46","volume-title":"How to Read a Film: The World of Movies, Media, Multimedia: Language, History, Theory, 3 edn","author":"J. Monaco","year":"2000","unstructured":"Monaco, J.: How to Read a Film: The World of Movies, Media, Multimedia: Language, History, Theory, 3 edn. Oxford University Press, USA (2000)"},{"issue":"2","key":"306_CR47","doi-asserted-by":"crossref","first-page":"296","DOI":"10.1109\/TCSVT.2004.841694","volume":"15","author":"C.W. Ngo","year":"2005","unstructured":"Ngo, C.W., Ma, Y.F., Zhang, H.J.: Video summarization and scene detection by graph modeling. IEEE Trans. Circuits Syst. Video Technol. 15(2), 296\u2013305 (2005)","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"issue":"2","key":"306_CR48","doi-asserted-by":"crossref","first-page":"127","DOI":"10.1023\/A:1020341931699","volume":"50","author":"C.W. Ngo","year":"2002","unstructured":"Ngo, C.W., Pong, T.C., Zhang, H.J.: Motion-based video representation for scene change detection. Int. J. Comput. Vis. 50(2), 127\u2013142 (2002)","journal-title":"Int. J. Comput. Vision"},{"key":"306_CR49","unstructured":"Nitanda, N., Haseyama, M., Kitajima, H.: Audio signal segmentation and classification for scene-cut detection. In: IEEE International Symposium on Circuits and Systems, 2005. ISCAS 2005, Vol. 4, pp. 4030\u2013 4033 (2005)"},{"key":"306_CR50","doi-asserted-by":"crossref","unstructured":"Niu, F., Goela, N., Divakaran, A., Abdel-Mottaleb, M.: Audio scene segmentation for video with generic content. In: Society of Photo-Optical Instrumentation Engineers (SPIE) Conference Series. Presented at the Society of Photo-Optical Instrumentation Engineers (SPIE) Conference, vol. 6820 (2008)","DOI":"10.1117\/12.760267"},{"key":"306_CR51","doi-asserted-by":"crossref","unstructured":"Odobez, J.M., Gatica-Perez, D., Guillemot, M.: Spectral structuring of home videos. In: Bakker, E., Lew, M., Huang, T., Sebe, N., Zhou, X. (eds.) Image and Video Retrieval, Lecture Notes in Computer Science, vol. 2728, Chap. 31, pp. 85\u201390. Springer, Berlin (2003)","DOI":"10.1007\/3-540-45113-7_31"},{"key":"306_CR52","unstructured":"Over, P., Awad, G., Fiscus, J., Antonishek, B., Michel, M., Smeaton, A.F., Kraaij, W., Quenot, G.: Trecvid 2010\u2014an overview of the goals, tasks, data, evaluation mechanisms and metrics. In: Proceedings of TRECVID 2010. NIST, USA (2010)"},{"key":"306_CR53","doi-asserted-by":"crossref","unstructured":"Parshin, V., Paradzinets, A., Chen, L.: Multimodal data fusion for video scene segmentation. In: Bres, S., Laurini, R. (eds.) Visual Information and Information Systems, Lecture Notes in Computer Science, vol. 3736, pp. 279\u2013289. Springer, Berlin (2006)","DOI":"10.1007\/11590064_25"},{"key":"306_CR54","doi-asserted-by":"crossref","unstructured":"Petersohn, C.: Temporal video structuring for preservation and annotation of video content. In: 16th IEEE International Conference on Image Processing (ICIP), 2009, pp. 93\u201396 (2009)","DOI":"10.1109\/ICIP.2009.5414114"},{"key":"306_CR55","unstructured":"Poulisse, G., Moens, M.: Unsupervised scene detection in olympic video using multi-modal chains. In: 9th International Workshop on Content-Based Multimedia Indexing (CBMI), 2011, pp. 103\u2013108 (2011)"},{"key":"306_CR56","doi-asserted-by":"crossref","unstructured":"Rasheed, Z., Shah, M.: Scene Detection in Hollywood Movies and TV Shows. IEEE Computer Society, Los Alamitos, CA, USA, p. 343 (2003)","DOI":"10.1109\/CVPR.2003.1211489"},{"issue":"6","key":"306_CR57","doi-asserted-by":"crossref","first-page":"1097","DOI":"10.1109\/TMM.2005.858392","volume":"7","author":"Z. Rasheed","year":"2005","unstructured":"Rasheed, Z., Shah, M.: Detection and representation of scenes in videos. IEEE Trans. Multimed. 7(6), 1097\u20131105 (2005)","journal-title":"IEEE Trans. Multimedia"},{"issue":"5","key":"306_CR58","doi-asserted-by":"crossref","first-page":"359","DOI":"10.1007\/s005300050138","volume":"7","author":"Y. Rui","year":"1999","unstructured":"Rui, Y., Huang, T.S., Mehrotra, S.: Constructing table-of-content for videos. Multimed. Syst. 7(5), 359\u2013368 (1999)","journal-title":"Multimedia Syst."},{"issue":"5","key":"306_CR59","doi-asserted-by":"crossref","first-page":"277","DOI":"10.1007\/s00530-008-0145-x","volume":"14","author":"U. Sakarya","year":"2008","unstructured":"Sakarya, U., Telatar, Z.: Graph-based multilevel temporal video segmentation. Multimed. Syst. 14(5), 277\u2013290 (2008)","journal-title":"Multimedia Syst."},{"key":"306_CR60","unstructured":"Sakarya, U., Telatar, Z.: Video scene detection using dominant sets. In: 15th IEEE International Conference on Image Processing, 2008. ICIP 2008, pp. 73\u201376 (2008)"},{"issue":"10","key":"306_CR61","doi-asserted-by":"crossref","first-page":"774","DOI":"10.1016\/j.image.2010.10.001","volume":"25","author":"U. Sakarya","year":"2010","unstructured":"Sakarya, U., Telatar, Z.: Video scene detection using graph-based representations. Signal Process. Image Commun. 25(10), 774\u2013783 (2010)","journal-title":"Signal Processing: Image Communication"},{"key":"306_CR62","doi-asserted-by":"crossref","unstructured":"Sang, J., Xu, C.: Character-based movie summarization. In: Proceedings of the International Conference on Multimedia, MM \u201910, pp. 855\u2013858. ACM, New York, NY, USA (2010)","DOI":"10.1145\/1873951.1874096"},{"key":"306_CR63","doi-asserted-by":"crossref","unstructured":"Schoeffmann, K., Lux, M., Taschwer, M., Boeszoermenyi, L.: Visualization of video motion in context of video browsing. In: Proceedings of the IEEE International Conference on Multimedia and Expo. IEEE, New York, USA (2009)","DOI":"10.1109\/ICME.2009.5202582"},{"key":"306_CR64","doi-asserted-by":"crossref","unstructured":"Schoeffmann, K., Taschwer, M., Boeszoermenyi, L.: The video explorer: a tool for navigation and searching within a single video based on fast content analysis. In: MMSys 10: Proceedings of the First Annual ACM SIGMM Conference on Multimedia Systems, p. 247\u2013258. ACM, New York, NY, USA (2010)","DOI":"10.1145\/1730836.1730867"},{"issue":"8","key":"306_CR65","doi-asserted-by":"crossref","first-page":"888","DOI":"10.1109\/34.868688","volume":"22","author":"J. Shi","year":"2000","unstructured":"Shi, J., Malik, J.: Normalized cuts and image segmentation. IEEE Trans. Pattern Anal. Mach. Intell. 22(8), 888\u2013905 (2000)","journal-title":"Pattern Analysis and Machine Intelligence, IEEE Transactions on"},{"issue":"6","key":"306_CR66","doi-asserted-by":"crossref","first-page":"904","DOI":"10.1109\/TCSVT.2011.2181231","volume":"22","author":"P. Sidiropoulos","year":"2012","unstructured":"Sidiropoulos, P., Mezaris, V., Kompatsiaris, I., Kittler, J.: Differential edit distance: a metric for scene segmentation evaluation. IEEE Transa. Circuits Syst. Video Technol. 22(6), 904\u2013914 (2012)","journal-title":"Circuits and Systems for Video Technology, IEEE Transactions on"},{"issue":"8","key":"306_CR67","doi-asserted-by":"crossref","first-page":"1163","DOI":"10.1109\/TCSVT.2011.2138830","volume":"21","author":"P. Sidiropoulos","year":"2011","unstructured":"Sidiropoulos, P., Mezaris, V., Kompatsiaris, I., Meinedo, H., Bugalho, M., Trancoso, I.: Temporal video segmentation to scenes using High-Level audiovisual features. IEEE Trans. Circuits Syst. Video Technol. 21(8), 1163\u20131177 (2011)","journal-title":"Circuits and Systems for Video Technology, IEEE Transactions on"},{"key":"306_CR68","doi-asserted-by":"crossref","unstructured":"Sidiropoulos, P., Mezaris, V., Kompatsiaris, I., Meinedo, H., Trancoso, I.: Multi-modal scene segmentation using scene transition graphs. In: Proceedings of the Seventeen ACM International Conference on Multimedia, MM \u201909, pp. 665\u2013668. ACM, New York, NY, USA (2009)","DOI":"10.1145\/1631272.1631383"},{"key":"306_CR69","doi-asserted-by":"crossref","unstructured":"Song, Y., Ogawa, T., Haseyama, M.: MCMC-based scene segmentation method using structure of video. In: IEEE International Symposium on Communications and Information Technologies (ISCIT), pp. 862\u2013866 (2010)","DOI":"10.1109\/ISCIT.2010.5665107"},{"key":"306_CR70","unstructured":"Sundaram, H., Chang, S.F.: Video scene segmentation using video and audio features. In: IEEE International Conference on Multimedia and Expo, 2000. ICME 2000 (2000)"},{"issue":"4","key":"306_CR71","doi-asserted-by":"crossref","first-page":"482","DOI":"10.1109\/TMM.2002.802017","volume":"4","author":"H. Sundaram","year":"2002","unstructured":"Sundaram, H., Chang, S.F.: Computable scenes and structures in films. IEEE Trans. Multimed. 4(4), 482\u2013491 (2002)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR72","volume-title":"The Wisdom of Crowds","author":"J. Surowiecki","year":"2005","unstructured":"Surowiecki, J.: The Wisdom of Crowds. Anchor, New York (2005)"},{"issue":"4","key":"306_CR73","doi-asserted-by":"crossref","first-page":"517","DOI":"10.1109\/TMM.2004.830810","volume":"6","author":"W. Tavanapong","year":"2004","unstructured":"Tavanapong, W., Zhou, J.: Shot Clustering Techniques for Story Browsing. IEEE Trans. Multimed. 6(4), 517\u2013527 (2004)","journal-title":"IEEE Trans. Multimedia"},{"issue":"1","key":"306_CR74","doi-asserted-by":"crossref","first-page":"3+","DOI":"10.1145\/1198302.1198305","volume":"3","author":"B.T. Truong","year":"2007","unstructured":"Truong, B.T., Venkatesh, S.: Video abstraction: a systematic review and classification. ACM Trans. Multimed. Comput. Commun. Appl. 3(1), 3+ (2007)","journal-title":"ACM Trans. Multimedia Comput. Commun. Appl."},{"issue":"1","key":"306_CR75","doi-asserted-by":"crossref","first-page":"5","DOI":"10.1109\/TCSVT.2002.808084","volume":"13","author":"B.T. Truong","year":"2003","unstructured":"Truong, B.T., Venkatesh, S., Dorai, C.: Scene extraction in motion pictures. IEEE Trans. Circuits Syst. Video Technol. 13(1), 5\u201315 (2003)","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"306_CR76","doi-asserted-by":"crossref","unstructured":"Velivelli, A., Ngo, C.W., Huang, T.S.: Detection of documentary scene changes by Audio-Visual fusion image and video retrieval. In: Bakker, E.M., Lew, M.S., Huang, T.S., Sebe, N., Zhou, X.S. (eds.) Image and Video Retrieval, Lecture Notes in Computer Science, vol. 2728, Chap. 23, pp. 227\u2013238. Springer, Berlin (2003)","DOI":"10.1007\/3-540-45113-7_23"},{"issue":"4","key":"306_CR77","doi-asserted-by":"crossref","first-page":"492","DOI":"10.1109\/TMM.2002.802021","volume":"4","author":"J. Vendrig","year":"2002","unstructured":"Vendrig, J., Worring, M.: Systematic evaluation of logical story unit segmentation. IEEE Trans. Multimed. 4(4), 492\u2013499 (2002)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR78","doi-asserted-by":"crossref","unstructured":"Vinciarelli, A., Favre, S.: Broadcast news story segmentation using social network analysis and hidden markov models. In: Proceedings of the 15th International Conference on Multimedia, MULTIMEDIA \u201907, pp. 261\u2013264. ACM, New York, NY, USA (2007)","DOI":"10.1145\/1291233.1291287"},{"issue":"3","key":"306_CR79","doi-asserted-by":"crossref","first-page":"393","DOI":"10.1109\/TMM.2008.917362","volume":"10","author":"J. Wang","year":"2008","unstructured":"Wang, J., Duan, L., Liu, Q., Lu, H., Jin, J.S.: A multimodal scheme for program segmentation and representation in broadcast video streams. IEEE Trans. Multimed. 10(3), 393\u2013408 (2008)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR80","doi-asserted-by":"crossref","unstructured":"Wang, X., Wang, S., Xuejun, S., Gabbouj, M.: A shot clustering based algorithm for scene segmentation. In: International Conference on Computational Intelligence and Security Workshops, CISW 2007, pp. 259\u2013252 (2007)","DOI":"10.1109\/CISW.2007.4425486"},{"issue":"2","key":"306_CR81","doi-asserted-by":"crossref","first-page":"256","DOI":"10.1109\/TMM.2008.2009684","volume":"11","author":"C.Y. Weng","year":"2009","unstructured":"Weng, C.Y., Chu, W.T., Wu, J.L.: RoleNet: Movie analysis from the perspective of social networks. IEEE Trans. Multimed. 11(2), 256\u2013271 (2009)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR82","doi-asserted-by":"crossref","unstructured":"Wengang, C., De, X.: A novel approach of generating video scene structure. In: TENCON 2003. Conference on Convergent Technologies for Asia-Pacific Region, vol. 1, pp. 350\u2013 353 (2003)","DOI":"10.1109\/TENCON.2003.1273343"},{"key":"306_CR83","doi-asserted-by":"crossref","unstructured":"Wilson, K.W., Divakaran, A.: Discriminative genre-independent audio-visual scene change detection. SPIE, p. 725502 (2009)","DOI":"10.1117\/12.805624"},{"issue":"7","key":"306_CR84","doi-asserted-by":"crossref","first-page":"767","DOI":"10.1016\/j.patrec.2004.01.005","volume":"25","author":"L. Xie","year":"2004","unstructured":"Xie, L.: Structure analysis of soccer video with domain knowledge and hidden markov models. Pattern Recognit. Lett. 25(7), 767\u2013775 (2004)","journal-title":"Pattern Recogn. Lett."},{"key":"306_CR85","doi-asserted-by":"crossref","unstructured":"Ya\u015faro\u011flu, Y., Alatan, A.: Summarizing video: Content, features, and HMM topologies. In: Garc\u00eda, N., Salgado, L., Mart\u00ednez, J.M. (eds.) Visual Content Processing and Representation, Lecture Notes in Computer Science, vol. 2849, Chap. 15, pp. 101\u2013110. Springer, Berlin (2003)","DOI":"10.1007\/978-3-540-39798-4_15"},{"issue":"1","key":"306_CR86","doi-asserted-by":"crossref","first-page":"94","DOI":"10.1006\/cviu.1997.0628","volume":"71","author":"M. Yeung","year":"1998","unstructured":"Yeung, M., Yeo, B.L., Liu, B.: Segmentation of video by clustering and graph analysis. Comput. Vis. Image Underst. 71(1), 94\u2013109 (1998)","journal-title":"Comput. Vis. Image Underst."},{"issue":"4","key":"306_CR87","doi-asserted-by":"crossref","first-page":"686","DOI":"10.1109\/TMM.2006.876299","volume":"8","author":"Y. Zhai","year":"2006","unstructured":"Zhai, Y., Shah, M.: Video scene segmentation using markov chain monte carlo. IEEE Trans. Multimed. 8(4), 686\u2013697 (2006)","journal-title":"IEEE Trans. Multimedia"},{"key":"306_CR88","doi-asserted-by":"crossref","unstructured":"Zhai, Y., Yilmaz, A., Shah, M.: Story segmentation in news videos using visual and text cues. In: Leow, W.K., Lew, M., Chua, T.S., Ma, W.Y., Chaisorn, L., Bakker, E. (eds.) Image and Video Retrieval, Lecture Notes in Computer Science, vol. 3568, Chap. 13, pp. 92\u2013102. Springer, Berlin (2005)","DOI":"10.1007\/11526346_13"},{"key":"306_CR89","unstructured":"Zhang, Z., Li, B., Lu, H., Xue, X.: Scene segmentation based on video structure and spectral methods. In: 10th International Conference on Control, Automation, Robotics and Vision, 2008. ICARCV 2008, pp. 1093\u20131096 (2008)"},{"key":"306_CR90","doi-asserted-by":"crossref","unstructured":"Zhao, L., Yang, S.Q., Feng, B.: Video scene detection using slide windows method based on temporal constrain shot similarity. In: IEEE International Conference on Multimedia and Expo, ICME 2001, pp. 1171\u2013 1174 (2001)","DOI":"10.1109\/ICME.2001.1237936"},{"key":"306_CR91","doi-asserted-by":"crossref","unstructured":"Zhao, Y., Wang, T., Wang, P., Hu, W., Du, Y., Zhang, Y., Xu, G.: Scene segmentation and categorization using ncuts. In: IEEE Conference on Computer Vision and Pattern Recognition, CVPR \u201907, pp. 1\u20137 (2007)","DOI":"10.1109\/CVPR.2007.383489"},{"key":"306_CR92","doi-asserted-by":"crossref","unstructured":"Zhou, J., Tavanapong, W.: Shot Weave: A shot clustering technique for story browsing for large video databases. In: Chaudhri, A., Unland, R., Djeraba, C., Lindner, W. (eds.) XML-Based Data Management and Multimedia Engineering EDBT 2002 Workshops, Lecture Notes in Computer Science, vol. 2490, Chap. 17, pp. 529\u2013533. Springer, Berlin (2002)","DOI":"10.1007\/3-540-36128-6_17"},{"issue":"2","key":"306_CR93","doi-asserted-by":"crossref","first-page":"183","DOI":"10.1007\/s11042-008-0233-0","volume":"42","author":"S. Zhu","year":"2009","unstructured":"Zhu, S., Liu, Y.: Video scene segmentation and semantic representation using a novel scheme. Multimed. Tools Appl. 42(2), 183\u2013205 (2009)","journal-title":"Multimedia Tools and Applications"}],"container-title":["Multimedia Systems"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-013-0306-4.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1007\/s00530-013-0306-4\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-013-0306-4","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,4,29]],"date-time":"2025-04-29T21:49:42Z","timestamp":1745963382000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/s00530-013-0306-4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2013,2,22]]},"references-count":93,"journal-issue":{"issue":"5","published-print":{"date-parts":[[2013,10]]}},"alternative-id":["306"],"URL":"https:\/\/doi.org\/10.1007\/s00530-013-0306-4","relation":{},"ISSN":["0942-4962","1432-1882"],"issn-type":[{"type":"print","value":"0942-4962"},{"type":"electronic","value":"1432-1882"}],"subject":[],"published":{"date-parts":[[2013,2,22]]}}}