{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,3,31]],"date-time":"2026-03-31T21:49:51Z","timestamp":1774993791707,"version":"3.50.1"},"reference-count":358,"publisher":"Springer Science and Business Media LLC","issue":"10","license":[{"start":{"date-parts":[[2023,3,13]],"date-time":"2023-03-13T00:00:00Z","timestamp":1678665600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2023,3,13]],"date-time":"2023-03-13T00:00:00Z","timestamp":1678665600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Artif Intell Rev"],"published-print":{"date-parts":[[2023,10]]},"DOI":"10.1007\/s10462-023-10429-z","type":"journal-article","created":{"date-parts":[[2023,3,26]],"date-time":"2023-03-26T22:16:42Z","timestamp":1679869002000},"page":"11473-11633","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":19,"title":["A comprehensive study of automatic video summarization techniques"],"prefix":"10.1007","volume":"56","author":[{"given":"Deeksha","family":"Gupta","sequence":"first","affiliation":[]},{"given":"Akashdeep","family":"Sharma","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2023,3,13]]},"reference":[{"key":"10429_CR1","doi-asserted-by":"crossref","unstructured":"Abd-Almageed, W. (2008). Online, simultaneous shot boundary detection and key frame extraction for sports videos using rank tracing. In: 2008 15th IEEE International Conference on Image Processing. IEEE, pp 3200\u20133203","DOI":"10.1109\/ICIP.2008.4712476"},{"issue":"1","key":"10429_CR2","doi-asserted-by":"crossref","first-page":"1","DOI":"10.1109\/TPAMI.2012.9","volume":"34","author":"R Achanta","year":"2012","unstructured":"Achanta R, Shaji A, Smith K, Lucchi A, Fua P, Susstrunk S (2012) SLIC superpixels compared to state-of-the-art superpixel methods. IEEE Trans Pattern Anal Mach Intell 34(1):1\u20138","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"10429_CR3","doi-asserted-by":"publisher","unstructured":"Agyeman R, Muhammad R, Choi GS (2019) Soccer video summarization using deep learning. In: Proceedings\u20142nd International Conference on Multimedia Information Processing and Retrieval, MIPR 2019, pp 270\u2013273. https:\/\/doi.org\/10.1109\/MIPR.2019.00055","DOI":"10.1109\/MIPR.2019.00055"},{"key":"10429_CR4","doi-asserted-by":"publisher","unstructured":"Ai X, Song Y, Li Z (2018) Unsupervised video summarization based on consistent clip generation. In: 2018 IEEE 4th International Conference on Multimedia Big Data, BigMM 2018, pp 1\u20137. https:\/\/doi.org\/10.1109\/BigMM.2018.8499188","DOI":"10.1109\/BigMM.2018.8499188"},{"key":"10429_CR5","doi-asserted-by":"publisher","unstructured":"Aktar R, AliAkbarpour H, Bunyak F, Kazic T, Seetharaman G, Palaniappan K (2018) Geospatial content summarization of UAV aerial imagery using mosaicking. In: Proceedings of SPIE 10645, Geospatial Informatics, Motion Imagery, and Network Analytics VIII, 106450I, April, 18. https:\/\/doi.org\/10.1117\/12.2309417","DOI":"10.1117\/12.2309417"},{"issue":"24","key":"10429_CR6","doi-asserted-by":"publisher","first-page":"35119","DOI":"10.1007\/s11042-019-08067-1","volume":"78","author":"MS Alam","year":"2019","unstructured":"Alam MS, Natesha BV, Ashwin TS, Guddeti RMR (2019) UAV based cost-effective real-time abnormal event detection using edge computing. Multimed Tools Appl 78(24):35119\u201335134. https:\/\/doi.org\/10.1007\/s11042-019-08067-1","journal-title":"Multimed Tools Appl"},{"key":"10429_CR7","doi-asserted-by":"publisher","unstructured":"Alcantarilla PF, Nuevo J, Bartoli A (2013) Fast explicit diffusion for accelerated features in nonlinear scale spaces. In: BMVC 2013\u2014Electronic Proceedings of the British Machine Vision Conference 2013. https:\/\/doi.org\/10.5244\/C.27.13","DOI":"10.5244\/C.27.13"},{"issue":"11","key":"10429_CR8","doi-asserted-by":"publisher","first-page":"2189","DOI":"10.1109\/TPAMI.2012.28","volume":"34","author":"B Alexe","year":"2012","unstructured":"Alexe B, Deselaers T, Ferrari V (2012) Measuring the objectness of image windows. IEEE Trans Pattern Anal Mach Intell 34(11):2189\u20132202. https:\/\/doi.org\/10.1109\/TPAMI.2012.28","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"4","key":"10429_CR9","doi-asserted-by":"publisher","first-page":"397","DOI":"10.1016\/j.patrec.2011.08.007","volume":"33","author":"J Almeida","year":"2012","unstructured":"Almeida J, Leite NJ, Torres RDS (2012) VISON: VIdeo Summarization for ONline applications. Pattern Recogn Lett 33(4):397\u2013409. https:\/\/doi.org\/10.1016\/j.patrec.2011.08.007","journal-title":"Pattern Recogn Lett"},{"issue":"1","key":"10429_CR10","first-page":"54","volume":"2","author":"AM Amel","year":"2010","unstructured":"Amel AM, Abdessalem BA, Abdellatif M (2010) Video shot boundary detection using motion activity descriptor. J Telecommun 2(1):54\u201359","journal-title":"J Telecommun"},{"key":"10429_CR11","doi-asserted-by":"crossref","unstructured":"Anirudh R, Masroor A, Turaga P (2016) Diversity promoting online sampling for streaming video summarization. In: 2016 IEEE International Conference on Image Processing (ICIP), pp 2\u20136","DOI":"10.1109\/ICIP.2016.7532976"},{"key":"10429_CR12","doi-asserted-by":"crossref","unstructured":"Apostolidis E (2021) Combining global and local attention with positional encoding for video summarization. In: IEEE International Symposium on Multimedia (ISM)","DOI":"10.1109\/ISM52913.2021.00045"},{"key":"10429_CR13","doi-asserted-by":"publisher","unstructured":"Apostolidis E, Metsai AI, Adamantidou E, Mezaris V, Patras I (2019) A stepwise, label-based approach for improving the adversarial training in unsupervised video summarization. In: AI4TV 2019\u2014Proceedings of the 1st International Workshop on AI for Smart TV Content Production, Access and Delivery, Co-Located with MM 2019, pp 17\u201325. https:\/\/doi.org\/10.1145\/3347449.3357482","DOI":"10.1145\/3347449.3357482"},{"key":"10429_CR14","doi-asserted-by":"crossref","unstructured":"Apostolidis E, Adamantidou E, Metsai AI, Mezaris V, Patras I (2020a) AC-SUM-GAN: connecting actor-critic and generative adversarial networks for unsupervised video summarization. IEEE Trans Circuits Syst Video Technol 1\u201315","DOI":"10.1109\/TCSVT.2020.3037883"},{"key":"10429_CR15","doi-asserted-by":"publisher","unstructured":"Apostolidis E, Adamantidou E, Metsai AI, Mezaris V, Patras I (2020b) Unsupervised video summarization via attention-driven adversarial learning. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 11961 LNCS(Mmm), pp 492\u2013504. https:\/\/doi.org\/10.1007\/978-3-030-37731-1_40","DOI":"10.1007\/978-3-030-37731-1_40"},{"issue":"11","key":"10429_CR16","doi-asserted-by":"publisher","first-page":"1838","DOI":"10.1109\/JPROC.2021.3117472","volume":"109","author":"E Apostolidis","year":"2021","unstructured":"Apostolidis E, Adamantidou E, Metsai AI, Mezaris V, Patras I (2021) Video summarization using deep neural networks: a survey. Proc IEEE 109(11):1838\u20131863. https:\/\/doi.org\/10.1109\/JPROC.2021.3117472","journal-title":"Proc IEEE"},{"key":"10429_CR17","doi-asserted-by":"publisher","unstructured":"Apostolidis E, Balaouras G, Mezaris V, Patras I (2022) Summarizing videos using concentrated attention and considering the uniqueness and diversity of the video frames. In: Proceedings of the 2022 International Conference on Multimedia Retrieval, pp 407\u2013415. https:\/\/doi.org\/10.1145\/3512527.3531404","DOI":"10.1145\/3512527.3531404"},{"issue":"5","key":"10429_CR18","doi-asserted-by":"publisher","first-page":"5381","DOI":"10.1007\/s12652-020-02025-8","volume":"12","author":"N Archana","year":"2021","unstructured":"Archana N, Malmurugan N (2021) Multi-edge optimized LSTM RNN for video summarization. J Ambient Intell Humaniz Comput 12(5):5381\u20135395. https:\/\/doi.org\/10.1007\/s12652-020-02025-8","journal-title":"J Ambient Intell Humaniz Comput"},{"key":"10429_CR19","doi-asserted-by":"crossref","unstructured":"Asadi E, Charkari NM (2012) Video summarization using fuzzy C-means clustering. In: 20th Iranian Conference on Electrical Engineering (ICEE2012). IEEE, pp 690\u2013694","DOI":"10.1109\/IranianCEE.2012.6292442"},{"issue":"1","key":"10429_CR20","doi-asserted-by":"publisher","first-page":"3","DOI":"10.2174\/2213275911666180719111118","volume":"11","author":"MK Asha Paul","year":"2018","unstructured":"Asha Paul MK, Kavitha J, Jansi Rani PA (2018) Key-frame extraction techniques: a review. Recent Patents Comput Sci 11(1):3\u201316. https:\/\/doi.org\/10.2174\/2213275911666180719111118","journal-title":"Recent Patents Comput Sci"},{"issue":"1","key":"10429_CR21","doi-asserted-by":"publisher","first-page":"56","DOI":"10.1016\/j.patrec.2010.08.004","volume":"32","author":"S Avila","year":"2011","unstructured":"Avila S, Eliza S, De Avila F, Paula A, Lopes BL Jr, De Albuquerque A (2011) VSUMM: a mechanism designed to produce static video summaries and a novel evaluation method. Pattern Recogn Lett 32(1):56\u201368. https:\/\/doi.org\/10.1016\/j.patrec.2010.08.004","journal-title":"Pattern Recogn Lett"},{"issue":"6","key":"10429_CR22","doi-asserted-by":"publisher","first-page":"2139","DOI":"10.1109\/TSMC.2018.2804766","volume":"50","author":"D Avola","year":"2020","unstructured":"Avola D, Cinque L, Foresti GL, Martinel N, Pannone D, Piciarelli C (2020) A UAV video dataset for mosaicking and change detection from low-altitude flights. IEEE Trans Syst Man Cybern: Syst 50(6):2139\u20132149. https:\/\/doi.org\/10.1109\/TSMC.2018.2804766","journal-title":"IEEE Trans Syst Man Cybern: Syst"},{"key":"10429_CR23","doi-asserted-by":"publisher","unstructured":"Avola D, Foresti GL, Martinel N, Micheloni C, Pannone D, Piciarelli C (2017) Real-time incremental and geo-referenced mosaicking by small-scale uavs. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 10484 LNCS, pp 694\u2013705. https:\/\/doi.org\/10.1007\/978-3-319-68560-1_62","DOI":"10.1007\/978-3-319-68560-1_62"},{"key":"10429_CR24","first-page":"01","volume":"2020","author":"MR Banwaskar","year":"2020","unstructured":"Banwaskar MR, Rajurkar AM (2020) Creating video summary using speeded up robust features. Appl Comput vis Image Process Proc ICCET 2020:01","journal-title":"Appl Comput vis Image Process Proc ICCET"},{"issue":"9","key":"10429_CR25","doi-asserted-by":"publisher","first-page":"14459","DOI":"10.1007\/s11042-020-10460-0","volume":"80","author":"M Basavarajaiah","year":"2021","unstructured":"Basavarajaiah M, Sharma P (2021) GVSUM: generic video summarization using deep visual features. Multimed Tools Appl 80(9):14459\u201314476. https:\/\/doi.org\/10.1007\/s11042-020-10460-0","journal-title":"Multimed Tools Appl"},{"key":"10429_CR26","doi-asserted-by":"publisher","first-page":"509","DOI":"10.1109\/TIP.2004.826126","volume":"24","author":"S Belongie","year":"2002","unstructured":"Belongie S, Malik J, Puzicha J (2002) Shape matching and object recognition using shape contexts. IEEE Trans Pattern Anal Mach Intell 24:509. https:\/\/doi.org\/10.1109\/TIP.2004.826126","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"issue":"January 2010","key":"10429_CR27","doi-asserted-by":"publisher","first-page":"223","DOI":"10.1007\/978-1-60327-241-4_13","volume":"609","author":"A Ben-Hur","year":"2010","unstructured":"Ben-Hur A, Weston J (2010) A user\u2019s guide to support vector machines. Methods Mol Biol (clifton, N.J.) 609(January 2010):223\u2013239. https:\/\/doi.org\/10.1007\/978-1-60327-241-4_13","journal-title":"Methods Mol Biol (clifton, N.J.)"},{"issue":"March 2019","key":"10429_CR28","doi-asserted-by":"publisher","first-page":"21397","DOI":"10.1109\/ACCESS.2018.2825106","volume":"6","author":"C Bi","year":"2018","unstructured":"Bi C, Yuan Y, Zhang J, Shi Y, Xiang Y, Wang Y, Zhang R (2018) Dynamic mode decomposition based video shot detection. IEEE Access 6(March 2019):21397\u201321407. https:\/\/doi.org\/10.1109\/ACCESS.2018.2825106","journal-title":"IEEE Access"},{"key":"10429_CR29","doi-asserted-by":"publisher","first-page":"1395","DOI":"10.1109\/ICCV.2005.28","volume":"II","author":"M Blank","year":"2005","unstructured":"Blank M, Gorelick L, Shechtman E, Irani M, Basri R (2005) Actions as space-time shapes. Proc IEEE Int Conf Comput vis II:1395\u20131402. https:\/\/doi.org\/10.1109\/ICCV.2005.28","journal-title":"Proc IEEE Int Conf Comput vis"},{"key":"10429_CR30","unstructured":"Bleakley K, Vert J-P (2011) The group fused Lasso for multiple change-point detection. 1\u201325. https:\/\/arXiv.org\/1106.4199"},{"key":"10429_CR31","doi-asserted-by":"publisher","unstructured":"Boutsidis C, Mahoney MW, Drineas P (2009) An improved approximation algorithm for the column subset selection problem. In: Proceedings of the Annual ACM-SIAM Symposium on Discrete Algorithms, pp. 968\u2013977. https:\/\/doi.org\/10.1137\/1.9781611973068.105","DOI":"10.1137\/1.9781611973068.105"},{"key":"10429_CR32","unstructured":"Breszcz M, Breckon TP, Cowling I (2011) Real-time mosaicing from unconstrained video imagery for UAV applications. In: Proceedings of the 26th International Unmanned Air Vehicle Systems Conference, pp 1\u201315. http:\/\/breckon.eu\/toby\/publications\/papers\/breszcz11uavmosaic.pdf. Accessed 25 March 2011"},{"issue":"2","key":"10429_CR33","doi-asserted-by":"publisher","first-page":"324","DOI":"10.1137\/S0097539790190144","volume":"23","author":"AZ Broder","year":"1994","unstructured":"Broder AZ, Karlin AR, Raghavan P, Upfal E (1994) Trading space for time in undirected s-t connectivity. SIAM J Comput 23(2):324\u2013334. https:\/\/doi.org\/10.1137\/S0097539790190144","journal-title":"SIAM J Comput"},{"key":"10429_CR34","doi-asserted-by":"crossref","unstructured":"Cai S, Zuo W, Davis LS, Zhang L (2018) Weakly-supervised Video Summarization using Variational Encoder-Decoder and Web Prior. In: Proceedings of the European Conference on Computer Vision (ECCV), pp 184\u2013200","DOI":"10.1007\/978-3-030-01264-9_12"},{"key":"10429_CR35","doi-asserted-by":"publisher","DOI":"10.1007\/s00371-017-1432-3","author":"FF Chamasemani","year":"2017","unstructured":"Chamasemani FF, Khalid F (2017) Video abstraction using density-based clustering algorithm. Vis Comput. https:\/\/doi.org\/10.1007\/s00371-017-1432-3","journal-title":"Vis Comput"},{"issue":"2","key":"10429_CR36","doi-asserted-by":"publisher","first-page":"295","DOI":"10.1109\/TMM.2008.2009703","volume":"11","author":"BW Chen","year":"2009","unstructured":"Chen BW, Wang JC, Wang JF (2009) A novel video summarization based on mining the story-structure and semantic relations among concept entities. IEEE Trans Multimed 11(2):295\u2013312. https:\/\/doi.org\/10.1109\/TMM.2008.2009703","journal-title":"IEEE Trans Multimed"},{"issue":"3","key":"10429_CR37","doi-asserted-by":"publisher","first-page":"212","DOI":"10.1504\/IJCVR.2014.062936","volume":"4","author":"Y Chen","year":"2014","unstructured":"Chen Y, Zhang B (2014) Surveillance video summarisation by jointly applying moving object detection and tracking. Int J Comput vis Robot 4(3):212\u2013234. https:\/\/doi.org\/10.1504\/IJCVR.2014.062936","journal-title":"Int J Comput vis Robot"},{"key":"10429_CR38","doi-asserted-by":"publisher","unstructured":"Chen J, Zou Y, Wang Y (2016) Wireless capsule endoscopy video summarization: a learning approach based on Siamese neural network and support vector machine. In: Proceedings\u2014International Conference on Pattern Recognition, pp 1303\u20131308. https:\/\/doi.org\/10.1109\/ICPR.2016.7899817","DOI":"10.1109\/ICPR.2016.7899817"},{"key":"10429_CR39","doi-asserted-by":"publisher","unstructured":"Chen J, Wang Y, Chen Z, Zou Y (2017) Sequence-guided siamese neural network for video summarization of unmanned aerial vehicles. In: International Conference on Digital Signal Processing, DSP, 2017-Augus. https:\/\/doi.org\/10.1109\/ICDSP.2017.8096070","DOI":"10.1109\/ICDSP.2017.8096070"},{"key":"10429_CR40","doi-asserted-by":"publisher","unstructured":"Chen Y, Tao L, Wang X, Yamasaki T (2019a) Weakly supervised video summarization by hierarchical reinforcement learning. In: 1st ACM International Conference on Multimedia in Asia, MMAsia 2019a. https:\/\/doi.org\/10.1145\/3338533.3366583","DOI":"10.1145\/3338533.3366583"},{"key":"10429_CR41","doi-asserted-by":"publisher","unstructured":"Choi J, Oh TH, Kweon IS (2018a) Contextually customized video summaries via natural language. In: Proceedings\u20142018a IEEE Winter Conference on Applications of Computer Vision, WACV 2018, 2018-Janua, pp 1718\u20131726. https:\/\/doi.org\/10.1109\/WACV.2018.00191","DOI":"10.1109\/WACV.2018.00191"},{"issue":"7","key":"10429_CR42","doi-asserted-by":"publisher","first-page":"1443","DOI":"10.1109\/TMM.2007.906602","volume":"9","author":"C Choudary","year":"2007","unstructured":"Choudary C, Liu T (2007) Summarization of visual content in instructional videos. IEEE Trans Multimed 9(7):1443\u20131455. https:\/\/doi.org\/10.1109\/TMM.2007.906602","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR43","doi-asserted-by":"publisher","unstructured":"Chu WS, Song Y, Jaimes A (2015) Video co-summarization: video summarization by visual co-occurrence. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 07\u201312-June, pp 3584\u20133592. https:\/\/doi.org\/10.1109\/CVPR.2015.7298981","DOI":"10.1109\/CVPR.2015.7298981"},{"key":"10429_CR44","unstructured":"Cisco (2020) Cisco Annual Internet Report (2018\u20132023). Cisco, 1\u201341. http:\/\/grs.cisco.com\/grsx\/cust\/grsCustomerSurvey.html?SurveyCode=4153&ad_id=US-BN-SEC-M-CISCOASECURITYRPT-ENT&KeyCode=000112137. Accessed 10 July 2021"},{"issue":"12","key":"10429_CR45","doi-asserted-by":"publisher","first-page":"17457","DOI":"10.1007\/s11042-022-12442-w","volume":"81","author":"K Cizmeciler","year":"2022","unstructured":"Cizmeciler K, Erdem E, Erdem A (2022) Leveraging semantic saliency maps for query-specific video summarization. Multimed Tools Appl 81(12):17457\u201317482. https:\/\/doi.org\/10.1007\/s11042-022-12442-w","journal-title":"Multimed Tools Appl"},{"issue":"1","key":"10429_CR46","doi-asserted-by":"publisher","first-page":"66","DOI":"10.1109\/TMM.2011.2166951","volume":"14","author":"Y Cong","year":"2012","unstructured":"Cong Y, Yuan J, Luo J (2012) Towards scalable summarization of consumer videos via sparse dictionary selection. IEEE Trans Multimed 14(1):66\u201375. https:\/\/doi.org\/10.1109\/TMM.2011.2166951","journal-title":"IEEE Trans Multimed"},{"issue":"1","key":"10429_CR47","doi-asserted-by":"publisher","first-page":"185","DOI":"10.1109\/TIP.2016.2619260","volume":"26","author":"Y Cong","year":"2017","unstructured":"Cong Y, Liu J, Sun G, You Q, Li Y, Luo J (2017) Adaptive greedy dictionary selection for web media summarization. IEEE Trans Image Process 26(1):185\u2013195. https:\/\/doi.org\/10.1109\/TIP.2016.2619260","journal-title":"IEEE Trans Image Process"},{"issue":"March","key":"10429_CR48","doi-asserted-by":"publisher","first-page":"64920I","DOI":"10.1117\/12.702790","volume":"6492","author":"F Crete","year":"2007","unstructured":"Crete F, Dolmiere T, Ladret P, Nicolas M (2007) The blur effect: perception and estimation with a new no-reference perceptual blur metric. Hum vis Electron Imaging XII 6492(March):64920I. https:\/\/doi.org\/10.1117\/12.702790","journal-title":"Hum vis Electron Imaging XII"},{"issue":"4","key":"10429_CR49","doi-asserted-by":"publisher","first-page":"338","DOI":"10.1080\/00401706.1994.10485840","volume":"36","author":"A Cutler","year":"1994","unstructured":"Cutler A (1994) Archetypal analysis. Technometrics 36(4):338\u2013347","journal-title":"Technometrics"},{"issue":"September 2020","key":"10429_CR50","doi-asserted-by":"publisher","first-page":"103960","DOI":"10.1016\/j.micpro.2021.103960","volume":"83","author":"DM Davids","year":"2021","unstructured":"Davids DM, Christopher CS (2021) An efficient video summarization for surveillance system using normalized k-means and quick sort method. Microprocess Microsyst 83(September 2020):103960. https:\/\/doi.org\/10.1016\/j.micpro.2021.103960","journal-title":"Microprocess Microsyst"},{"key":"10429_CR51","doi-asserted-by":"crossref","unstructured":"Davila K, Zanibbi R (2017) Whiteboard video summarization via spatio-temporal conflict minimization. In: 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). IEEE, p 1","DOI":"10.1109\/ICDAR.2017.66"},{"key":"10429_CR52","doi-asserted-by":"publisher","first-page":"104469","DOI":"10.1109\/ACCESS.2021.3099427","volume":"9","author":"K Davila","year":"2021","unstructured":"Davila K, Xu F, Setlur S, Govindaraju V (2021) FCN-lecturenet: extractive summarization of whiteboard and chalkboard lecture videos. IEEE Access 9:104469\u2013104484. https:\/\/doi.org\/10.1109\/ACCESS.2021.3099427","journal-title":"IEEE Access"},{"issue":"11","key":"10429_CR53","doi-asserted-by":"publisher","first-page":"6373","DOI":"10.1007\/s11042-015-2576-7","volume":"75","author":"DP Dogra","year":"2016","unstructured":"Dogra DP, Ahmed A, Bhaskar H (2016) Smart video summarization using mealy machine-based trajectory modelling for surveillance applications. Multimed Tools Appl 75(11):6373\u20136401. https:\/\/doi.org\/10.1007\/s11042-015-2576-7","journal-title":"Multimed Tools Appl"},{"issue":"7","key":"10429_CR54","doi-asserted-by":"publisher","first-page":"1031","DOI":"10.1016\/j.jvcir.2012.06.013","volume":"23","author":"N Ejaz","year":"2012","unstructured":"Ejaz N, Tariq TB, Baik SW (2012) Adaptive key frame extraction for video summarization using an aggregation mechanism. J vis Commun Image Represent 23(7):1031\u20131040. https:\/\/doi.org\/10.1016\/j.jvcir.2012.06.013","journal-title":"J vis Commun Image Represent"},{"issue":"January","key":"10429_CR55","doi-asserted-by":"publisher","first-page":"559","DOI":"10.1002\/jemt.22205","volume":"563","author":"N Ejaz","year":"2013","unstructured":"Ejaz N, Mehmood I, Baik SW (2013a) MRT Letter: visual attention driven framework for hysteroscopy video abstraction. Microsc Res Tech 563(January):559\u2013563. https:\/\/doi.org\/10.1002\/jemt.22205","journal-title":"Microsc Res Tech"},{"issue":"1","key":"10429_CR56","doi-asserted-by":"publisher","first-page":"34","DOI":"10.1016\/j.image.2012.10.002","volume":"28","author":"N Ejaz","year":"2013","unstructured":"Ejaz N, Mehmood I, Wook Baik S (2013b) Efficient visual attention based framework for extracting key frames from videos. Signal Process Image Commun 28(1):34\u201344. https:\/\/doi.org\/10.1016\/j.image.2012.10.002","journal-title":"Signal Process Image Commun"},{"key":"10429_CR57","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1186\/s13640-018-0280-z","volume":"2018","author":"N Ejaz","year":"2018","unstructured":"Ejaz N, Baik SW, Majeed H, Chang H, Mehmood I (2018) Multi-scale contrast and relative motion-based key frame extraction. EURASIP J Image Video Process 2018:1","journal-title":"EURASIP J Image Video Process"},{"key":"10429_CR58","doi-asserted-by":"publisher","unstructured":"Elfeki M, Borji A (2019) Video summarization via actionness ranking. In: Proceedings\u20142019 IEEE Winter Conference on Applications of Computer Vision, WACV 2019, pp 754\u2013763. https:\/\/doi.org\/10.1109\/WACV.2019.00085","DOI":"10.1109\/WACV.2019.00085"},{"key":"10429_CR59","doi-asserted-by":"crossref","unstructured":"Elfeki M, Wang L, Borji A (2022) Multi-stream dynamic video summarization. In: 2022 IEEE\/CVF Winter Conference on Applications of Computer Vision (WACV), pp 185\u2013195","DOI":"10.1109\/WACV51458.2022.00026"},{"key":"10429_CR60","doi-asserted-by":"publisher","unstructured":"Elhamifar E, Sapiro G, Vidal R (2012) See all by looking at a few: sparse modeling for finding representative objects. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 1600\u20131607. https:\/\/doi.org\/10.1109\/CVPR.2012.6247852","DOI":"10.1109\/CVPR.2012.6247852"},{"key":"10429_CR61","doi-asserted-by":"publisher","unstructured":"Elhamifar E, De Paolis Kaluza MC (2017) Online summarization via submodular and convex optimization. In: Proceedings\u201430th IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2017, 2017-Janua, pp 1818\u20131826. https:\/\/doi.org\/10.1109\/CVPR.2017.197","DOI":"10.1109\/CVPR.2017.197"},{"key":"10429_CR62","doi-asserted-by":"publisher","unstructured":"Emam AZ, Ali YA, Ben Ismail MM (2015) Adaptive features extraction for Capsule Endoscopy (CE) video summarization. In: Proceedings\u2014International Conference on Computer Vision and Image Analysis Applications, ICCVIA 2015, October. https:\/\/doi.org\/10.1109\/ICCVIA.2015.7351879","DOI":"10.1109\/ICCVIA.2015.7351879"},{"issue":"6","key":"10429_CR63","doi-asserted-by":"publisher","first-page":"7947","DOI":"10.1007\/s11042-016-3433-z","volume":"76","author":"P Etezadifar","year":"2017","unstructured":"Etezadifar P, Farsi H (2017) Scalable video summarization via sparse dictionary learning and selection simultaneously. Multimed Tools Appl 76(6):7947\u20137971. https:\/\/doi.org\/10.1007\/s11042-016-3433-z","journal-title":"Multimed Tools Appl"},{"key":"10429_CR64","doi-asserted-by":"publisher","unstructured":"Evangelopoulos G, Rapantzikos K, Potamianos A, Maragos P, Zlatintsi A, Avrithis Y (2008) Movie summarization based on audiovisual saliency detection. In: Proceedings\u2014International Conference on Image Processing, ICIP, May 2014, pp 2528\u20132531. https:\/\/doi.org\/10.1109\/ICIP.2008.4712308","DOI":"10.1109\/ICIP.2008.4712308"},{"issue":"7","key":"10429_CR65","doi-asserted-by":"publisher","first-page":"1553","DOI":"10.1109\/TMM.2013.2267205","volume":"15","author":"G Evangelopoulos","year":"2013","unstructured":"Evangelopoulos G, Zlatintsi A, Potamianos A, Maragos P, Rapantzikos K, Skoumas G, Avrithis Y (2013) Multimodal saliency and fusion for movie summarization based on aural, visual, and textual attention. IEEE Trans Multimed 15(7):1553\u20131568. https:\/\/doi.org\/10.1109\/TMM.2013.2267205","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR66","doi-asserted-by":"publisher","unstructured":"Fajtl J, Sokeh HS, Argyriou V, Monekosso D, Remagnino P (2019) Summarizing Videos with Attention. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 11367 LNCS, pp 39\u201354. https:\/\/doi.org\/10.1007\/978-3-030-21074-8_4","DOI":"10.1007\/978-3-030-21074-8_4"},{"key":"10429_CR67","doi-asserted-by":"publisher","unstructured":"Fathi A, Li Y, Rehg JM (2012) Learning to recognize daily actions using gaze. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 7572 LNCS(PART 1), pp 314\u2013327. https:\/\/doi.org\/10.1007\/978-3-642-33718-5_23","DOI":"10.1007\/978-3-642-33718-5_23"},{"issue":"6","key":"10429_CR68","first-page":"1299","volume":"330","author":"P Felzenszwalb","year":"2014","unstructured":"Felzenszwalb P, McAllester D, Ramanan D (2014) A Discriminatively trained, multiscale, deformable part model. Proc IEEE Comput Soc Conf Comput vis Pattern Recogn 330(6):1299\u20131305","journal-title":"Proc IEEE Comput Soc Conf Comput vis Pattern Recogn"},{"key":"10429_CR69","doi-asserted-by":"publisher","unstructured":"Feng L, Kuang Z, Li Z, Zhang W (2018) Extractive video summarizer with memory augmented neural networks. In: MM 2018\u2014Proceedings of the 2018 ACM Multimedia Conference, pp 976\u2013983. https:\/\/doi.org\/10.1145\/3240508.3240651","DOI":"10.1145\/3240508.3240651"},{"key":"10429_CR70","unstructured":"Fernandes P, Allamanis M, Brockschmidt M (2019) Structured neural summarization. In: 7th International Conference on Learning Representations, ICLR 2019, 2018, pp 1\u201318"},{"key":"10429_CR71","doi-asserted-by":"publisher","first-page":"19","DOI":"10.1016\/j.patrec.2020.12.016","volume":"143","author":"H Fu","year":"2021","unstructured":"Fu H, Wang H (2021) Self-attention binary neural tree for video summarization. Pattern Recogn Lett 143:19\u201326. https:\/\/doi.org\/10.1016\/j.patrec.2020.12.016","journal-title":"Pattern Recogn Lett"},{"issue":"7","key":"10429_CR72","doi-asserted-by":"publisher","first-page":"717","DOI":"10.1109\/TMM.2010.2052025","volume":"12","author":"Y Fu","year":"2010","unstructured":"Fu Y, Guo Y, Zhu Y, Liu F, Song C, Zhou Z, Member S (2010) Multi-view video summarization. IEEE Trans Multimed 12(7):717\u2013729. https:\/\/doi.org\/10.1109\/TMM.2010.2052025","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR73","doi-asserted-by":"publisher","unstructured":"Fu TJ, Tai SH, Chen HT (2019) Attentive and adversarial learning for video summarization. In: Proceedings\u20142019 IEEE Winter Conference on Applications of Computer Vision, WACV 2019, pp 1579\u20131587. https:\/\/doi.org\/10.1109\/WACV.2019.00173","DOI":"10.1109\/WACV.2019.00173"},{"issue":"1","key":"10429_CR74","doi-asserted-by":"publisher","first-page":"47","DOI":"10.1007\/s11042-009-0307-7","volume":"46","author":"M Furini","year":"2010","unstructured":"Furini M, Geraci F, Montangero M, Pellegrini M (2010) STIMO: STIll and MOving video storyboard for the web scenario. Multimed Tools Appl 46(1):47\u201369. https:\/\/doi.org\/10.1007\/s11042-009-0307-7","journal-title":"Multimed Tools Appl"},{"key":"10429_CR75","unstructured":"Garcia A, Boix X, Lim J, Tan A (2017) Active video summarization: customized summaries via on-line interaction with the user. In: Thirty-First AAAI Conference on Artificial Intelligence, pp 4046\u20134052"},{"issue":"1","key":"10429_CR76","doi-asserted-by":"publisher","first-page":"160","DOI":"10.1016\/j.media.2011.06.008","volume":"16","author":"W Gavi\u00e3o","year":"2012","unstructured":"Gavi\u00e3o W, Scharcanski J, Frahm JM, Pollefeys M (2012) Hysteroscopy video summarization and browsing by estimating the physician\u2019s attention on video segments. Med Image Anal 16(1):160\u2013176. https:\/\/doi.org\/10.1016\/j.media.2011.06.008","journal-title":"Med Image Anal"},{"key":"10429_CR77","unstructured":"Ghauri JA, Hakimov S, Ewerth R (2020) Classification of important segments in educational videos using multimodal features. In: CEUR Workshop Proceedings, p 2699"},{"issue":"1","key":"10429_CR78","doi-asserted-by":"publisher","first-page":"69","DOI":"10.1007\/s11554-006-0001-1","volume":"1","author":"C Gianluigi","year":"2006","unstructured":"Gianluigi C, Raimondo S (2006) An innovative algorithm for key frame extraction in video summarization. J Real-Time Image Proc 1(1):69\u201388. https:\/\/doi.org\/10.1007\/s11554-006-0001-1","journal-title":"J Real-Time Image Proc"},{"issue":"January","key":"10429_CR79","first-page":"2069","volume":"3","author":"B Gong","year":"2014","unstructured":"Gong B, Chao WL, Grauman K, Sha F (2014) Diverse sequential subset selection for supervised video summarization. Adv Neural Inf Process Syst 3(January):2069\u20132077","journal-title":"Adv Neural Inf Process Syst"},{"key":"10429_CR80","unstructured":"Gonuguntla N, Mandal B, Puhan N (2019) Enhanced deep video summarization network. In: 30th British Machine Vision Conference, pp 1\u20139"},{"key":"10429_CR81","doi-asserted-by":"publisher","first-page":"333","DOI":"10.1007\/978-981-16-3067-5_25","volume":"778","author":"D Gupta","year":"2021","unstructured":"Gupta D, Sharma A (2021) Attentive convolution network-based video summarization. Lecture Notes Electr Eng 778:333\u2013346. https:\/\/doi.org\/10.1007\/978-981-16-3067-5_25","journal-title":"Lecture Notes Electr Eng"},{"key":"10429_CR82","doi-asserted-by":"crossref","unstructured":"Gygli M, Van Gool L (2015) Video summarization by learning submodular mixtures of objectives. In: IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp 3090\u20133098","DOI":"10.1109\/CVPR.2015.7298928"},{"key":"10429_CR83","doi-asserted-by":"publisher","unstructured":"Gygli M, Grabner H, Riemenschneider H, Van Gool L (2014) Creating summaries from user videos. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 8695 LNCS(PART 7), pp 505\u2013520. https:\/\/doi.org\/10.1007\/978-3-319-10584-0_33","DOI":"10.1007\/978-3-319-10584-0_33"},{"issue":"9","key":"10429_CR84","first-page":"1674","volume":"10","author":"NJ Habeeb","year":"2016","unstructured":"Habeeb NJ, Mohammed RS, Abbass MK (2016) Surveillance video summarization based on histogram differencing and sum conditional variance. Int J Comput Inf Eng 10(9):1674\u20131679","journal-title":"Int J Comput Inf Eng"},{"issue":"11","key":"10429_CR85","first-page":"2109","volume":"4","author":"HA Habib","year":"2005","unstructured":"Habib HA, Mufti M (2005) Gesture recognition based framework for video lecture handout generation: a video summarization application. WSEAS Trans Syst 4(11):2109\u20132114","journal-title":"WSEAS Trans Syst"},{"key":"10429_CR86","doi-asserted-by":"publisher","unstructured":"Han B, Hamm J, Sim J (2011) Personalized video summarization with human in the loop. In: 2011 IEEE Workshop on Applications of Computer Vision, WACV 2011, pp 51\u201357. https:\/\/doi.org\/10.1109\/WACV.2011.5711483","DOI":"10.1109\/WACV.2011.5711483"},{"key":"10429_CR87","doi-asserted-by":"publisher","first-page":"128","DOI":"10.1016\/j.neucom.2013.11.052","volume":"144","author":"J Han","year":"2014","unstructured":"Han J, Ji X, Hu X, Han J, Liu T (2014) Clustering and retrieval of video shots based on natural stimulus fMRI. Neurocomputing 144:128\u2013137. https:\/\/doi.org\/10.1016\/j.neucom.2013.11.052","journal-title":"Neurocomputing"},{"issue":"23","key":"10429_CR88","doi-asserted-by":"publisher","first-page":"25039","DOI":"10.1007\/s11042-017-4485-4","volume":"76","author":"MX Han","year":"2017","unstructured":"Han MX, Hu HM, Liu Y, Zhang C, Tian RP, Zheng J (2017) An auto-encoder-based summarization algorithm for unstructured videos. Multimed Tools Appl 76(23):25039\u201325056. https:\/\/doi.org\/10.1007\/s11042-017-4485-4","journal-title":"Multimed Tools Appl"},{"key":"10429_CR89","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1155\/2019\/3581419","volume":"2019","author":"IU Haq","year":"2019","unstructured":"Haq IU, Ullah A, Muhammad K, Lee MY, Baik SW (2019) Personalized movie summarization using deep CNN-assisted facial expression recognition. Complexity 2019:1\u201310","journal-title":"Complexity"},{"key":"10429_CR90","first-page":"35","volume":"13","author":"J Harel","year":"1994","unstructured":"Harel J, Radmann C, Perona P (1994) Graph-based visual saliency Medgg. Adv Neural Inf Process Syst 13:35\u201354","journal-title":"Adv Neural Inf Process Syst"},{"key":"10429_CR91","doi-asserted-by":"publisher","unstructured":"Hari R, Wilscy M (2015) Event detection in cricket videos using intensity projection profile of Umpire gestures. In: 11th IEEE India Conference: Emerging Trends and Innovation in Technology, INDICON 2014, pp 30\u201335. https:\/\/doi.org\/10.1109\/INDICON.2014.7030519","DOI":"10.1109\/INDICON.2014.7030519"},{"key":"10429_CR92","doi-asserted-by":"publisher","unstructured":"He X, Hua Y, Song T, Zhang Z, Xue Z, Ma R, Robertson N, Guan H (2019) Unsupervised video summarization with attentive conditional generative adversarial networks. In: MM 2019\u2014Proceedings of the 27th ACM International Conference on Multimedia, pp 2296\u20132304. https:\/\/doi.org\/10.1145\/3343031.3351056","DOI":"10.1145\/3343031.3351056"},{"key":"10429_CR93","doi-asserted-by":"publisher","unstructured":"Hesham M, Hani B, Fouad N, Amer E (2018) Smart trailer: automatic generation of movie trailer using only subtitles. In: Proceedings of IWDRL 2018: 2018 1st International Workshop on Deep and Representation Learning, pp 26\u201330. https:\/\/doi.org\/10.1109\/IWDRL.2018.8358211","DOI":"10.1109\/IWDRL.2018.8358211"},{"key":"10429_CR94","doi-asserted-by":"publisher","unstructured":"Ho HI, Chiu WC, Wang YCF (2018) Summarizing first-person videos from third persons\u2019 points of views. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 11219 LNCS, pp 72\u201389. https:\/\/doi.org\/10.1007\/978-3-030-01267-0_5","DOI":"10.1007\/978-3-030-01267-0_5"},{"issue":"17","key":"10429_CR95","doi-asserted-by":"publisher","first-page":"22083","DOI":"10.1007\/s11042-017-5479-y","volume":"77","author":"T Hu","year":"2018","unstructured":"Hu T, Li Z (2018) Video summarization via exploring the global and local importance. Multimed Tools Appl 77(17):22083\u201322098. https:\/\/doi.org\/10.1007\/s11042-017-5479-y","journal-title":"Multimed Tools Appl"},{"issue":"6","key":"10429_CR96","doi-asserted-by":"publisher","first-page":"797","DOI":"10.1109\/TSMCC.2011.2109710","volume":"41","author":"W Hu","year":"2011","unstructured":"Hu W, Xie N, Li L, Zeng X, Maybank S (2011) A survey on visual content-based video indexing and retrieval. IEEE Trans Syst Man Cybern Part C Appl Rev 41(6):797\u2013819. https:\/\/doi.org\/10.1109\/TSMCC.2011.2109710","journal-title":"IEEE Trans Syst Man Cybern Part C Appl Rev"},{"key":"10429_CR97","doi-asserted-by":"publisher","DOI":"10.1016\/j.knosys.2019.07.027","author":"D Huang","year":"2019","unstructured":"Huang D, Cai X, Wang CD (2019) Unsupervised feature selection with multi-subspace randomization and collaboration. Knowl-Based Syst. https:\/\/doi.org\/10.1016\/j.knosys.2019.07.027","journal-title":"Knowl-Based Syst"},{"key":"10429_CR98","doi-asserted-by":"publisher","unstructured":"Huang JH, Worring M (2020) Query-controllable video summarization. In: ICMR 2020\u2014Proceedings of the 2020 International Conference on Multimedia Retrieval, pp 242\u2013250. https:\/\/doi.org\/10.1145\/3372278.3390695","DOI":"10.1145\/3372278.3390695"},{"issue":"4","key":"10429_CR99","doi-asserted-by":"publisher","first-page":"2592","DOI":"10.1109\/TII.2019.2937905","volume":"16","author":"T Hussain","year":"2020","unstructured":"Hussain T, Muhammad K, Ser JD, Baik SW, De Albuquerque VHC (2020a) Intelligent embedded vision for summarization of multiview videos in IIoT. IEEE Trans Ind Inf 16(4):2592\u20132602. https:\/\/doi.org\/10.1109\/TII.2019.2937905","journal-title":"IEEE Trans Ind Inf"},{"issue":"1","key":"10429_CR100","doi-asserted-by":"publisher","first-page":"77","DOI":"10.1109\/TII.2019.2929228","volume":"16","author":"T Hussain","year":"2020","unstructured":"Hussain T, Muhammad K, Ullah A, Cao Z, Baik SW, De Albuquerque VHC (2020b) Cloud-assisted multiview video summarization using CNN and bidirectional LSTM. IEEE Trans Ind Inf 16(1):77\u201386. https:\/\/doi.org\/10.1109\/TII.2019.2929228","journal-title":"IEEE Trans Ind Inf"},{"key":"10429_CR101","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2020.107567","author":"T Hussain","year":"2021","unstructured":"Hussain T, Muhammad K, Ding W, Lloret J, Wook S, Hugo V, Albuquerque CD (2021a) A comprehensive survey of multi-view video summarization. Pattern Recogn J. https:\/\/doi.org\/10.1016\/j.patcog.2020.107567","journal-title":"Pattern Recogn J"},{"issue":"12","key":"10429_CR102","doi-asserted-by":"publisher","first-page":"9634","DOI":"10.1109\/JIOT.2020.3027483","volume":"8","author":"T Hussain","year":"2021","unstructured":"Hussain T, Muhammad K, Ullah A, Ser JD, Gandomi AH, Sajjad M, Baik SW, De Albuquerque VHC (2021b) Multiview summarization and activity recognition meet edge computing in IoT environments. IEEE Internet Things J 8(12):9634\u20139644. https:\/\/doi.org\/10.1109\/JIOT.2020.3027483","journal-title":"IEEE Internet Things J"},{"key":"10429_CR103","doi-asserted-by":"publisher","unstructured":"Ide I, Zhang Y, Tanishige R, Doman K, Kawanishi Y, Deguchi D, Murase H (2017) Summarization of News Videos Considering the Consistency of Auditory and Visual Contents. In: Proceedings\u20142017 IEEE International Symposium on Multimedia, ISM 2017, 2017-Janua, pp 193\u2013199. https:\/\/doi.org\/10.1109\/ISM.2017.33","DOI":"10.1109\/ISM.2017.33"},{"key":"10429_CR104","doi-asserted-by":"publisher","unstructured":"Ioannis K, Tsevas S, Maglogiannis I, Iakovidis DK (2010) Enabling distributed summarization of wireless capsule endoscopy video. In: 2010 IEEE International Conference on Imaging Systems and Techniques, IST 2010\u2014Proceedings, pp 17\u201321. https:\/\/doi.org\/10.1109\/IST.2010.5548478","DOI":"10.1109\/IST.2010.5548478"},{"key":"10429_CR105","doi-asserted-by":"publisher","DOI":"10.4018\/ijmdem.2014040103","author":"J Iparraguirre","year":"2014","unstructured":"Iparraguirre J, Nacional UT, Delrieux CA (2014) Online video summarization based on local features. Int J Multimed Data Eng Manage. https:\/\/doi.org\/10.4018\/ijmdem.2014040103","journal-title":"Int J Multimed Data Eng Manage"},{"key":"10429_CR106","doi-asserted-by":"publisher","unstructured":"Itti L, Koch C, Niebur E (1998) A model of saliency-based visual attention for rapid scene analysis. In: 1254 IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 20, issue no. 11, pp 295\u2013297. https:\/\/doi.org\/10.1111\/j.1463-1318.2005.00780.x","DOI":"10.1111\/j.1463-1318.2005.00780.x"},{"issue":"2","key":"10429_CR107","doi-asserted-by":"publisher","first-page":"193","DOI":"10.1007\/s10844-016-0441-4","volume":"49","author":"H Jacob","year":"2017","unstructured":"Jacob H, P\u00e1dua FLC, Lacerda A, Pereira ACM (2017) A video summarization approach based on the emulation of bottom-up mechanisms of visual attention. J Intell Inf Syst 49(2):193\u2013211. https:\/\/doi.org\/10.1007\/s10844-016-0441-4","journal-title":"J Intell Inf Syst"},{"key":"10429_CR108","unstructured":"Jappie Z, Torpey D, Celik T (2020) SummaryNet: a multi-stage deep learning model for automatic video summarisation. https:\/\/arXiv.org\/2002.09424"},{"key":"10429_CR109","doi-asserted-by":"publisher","unstructured":"Javed A, Bajwa KB, Malik H, Irtaza A, Malunood MT (2017) A hybrid approach for summarization of cricket videos. In: 2016 IEEE International Conference on Consumer Electronics-Asia, ICCE-Asia 2016, May 2019. https:\/\/doi.org\/10.1109\/ICCE-Asia.2016.7804835","DOI":"10.1109\/ICCE-Asia.2016.7804835"},{"issue":"8","key":"10429_CR110","doi-asserted-by":"publisher","first-page":"2899","DOI":"10.1007\/s10489-019-01410-x","volume":"49","author":"A Javed","year":"2019","unstructured":"Javed A, Irtaza A, Khaliq Y, Malik H, Tariq M (2019a) Replay and key-events detection for sports video summarization using confined elliptical local ternary patterns and extreme learning machine. Appl Intell 49(8):2899\u20132917","journal-title":"Appl Intell"},{"issue":"4","key":"10429_CR111","doi-asserted-by":"publisher","first-page":"615","DOI":"10.1049\/iet-ipr.2018.5589","volume":"13","author":"A Javed","year":"2019","unstructured":"Javed A, Irtaza A, Malik H, Mahmood MT, Adnan S (2019b) Multimodal framework based on audio-visual features for summarisation of cricket videos. IET Image Proc 13(4):615\u2013622. https:\/\/doi.org\/10.1049\/iet-ipr.2018.5589","journal-title":"IET Image Proc"},{"key":"10429_CR112","doi-asserted-by":"publisher","DOI":"10.1186\/s13640-016-0122-9","author":"D Jeong","year":"2017","unstructured":"Jeong D, Yoo HJ, Cho NI (2017) Open Access A static video summarization method based on the sparse coding of features and representativeness of frames. EURASIP J Image Video Process. https:\/\/doi.org\/10.1186\/s13640-016-0122-9","journal-title":"EURASIP J Image Video Process"},{"key":"10429_CR113","doi-asserted-by":"crossref","unstructured":"Jesorsky O, Kirchberg KJ, Frischholz RW (2001) Robust face detection using the Hausdorff Distance. Gesture 90\u201395.","DOI":"10.1007\/3-540-45344-X_14"},{"key":"10429_CR114","doi-asserted-by":"publisher","first-page":"114","DOI":"10.1016\/j.sigpro.2018.01.028","volume":"148","author":"Z Ji","year":"2018","unstructured":"Ji Z, Zhang Y, Pang Y, Li X (2018) Hypergraph dominant set based multi-video summarization. Signal Process 148:114\u2013123. https:\/\/doi.org\/10.1016\/j.sigpro.2018.01.028","journal-title":"Signal Process"},{"key":"10429_CR115","doi-asserted-by":"publisher","first-page":"152","DOI":"10.1016\/j.ins.2018.09.050","volume":"478","author":"Z Ji","year":"2019","unstructured":"Ji Z, Ma Y, Pang Y, Li X (2019a) Query-aware sparse coding for web multi-video summarization. Inf Sci 478:152\u2013166. https:\/\/doi.org\/10.1016\/j.ins.2018.09.050","journal-title":"Inf Sci"},{"key":"10429_CR116","doi-asserted-by":"publisher","first-page":"406","DOI":"10.1016\/j.neucom.2018.12.038","volume":"332","author":"Z Ji","year":"2019","unstructured":"Ji Z, Zhang Y, Pang Y, Li X, Pan J (2019b) Multi-video summarization with query-dependent weighted archetypal analysis. Neurocomputing 332:406\u2013416. https:\/\/doi.org\/10.1016\/j.neucom.2018.12.038","journal-title":"Neurocomputing"},{"key":"10429_CR117","doi-asserted-by":"publisher","first-page":"200","DOI":"10.1016\/j.neucom.2020.04.132","volume":"405","author":"Z Ji","year":"2020","unstructured":"Ji Z, Jiao F, Pang Y, Shao L (2020a) Deep attentive and semantic preserving video summarization. Neurocomputing 405:200\u2013207. https:\/\/doi.org\/10.1016\/j.neucom.2020.04.132","journal-title":"Neurocomputing"},{"issue":"6","key":"10429_CR118","doi-asserted-by":"publisher","first-page":"1709","DOI":"10.1109\/TCSVT.2019.2904996","volume":"30","author":"Z Ji","year":"2020","unstructured":"Ji Z, Xiong K, Pang Y, Li X (2020b) Video summarization with attention-based encoder-decoder networks. IEEE Trans Circuits Syst Video Technol 30(6):1709\u20131717. https:\/\/doi.org\/10.1109\/TCSVT.2019.2904996","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"10429_CR119","doi-asserted-by":"publisher","first-page":"131","DOI":"10.1016\/j.patrec.2020.04.011","volume":"135","author":"Z Ji","year":"2020","unstructured":"Ji Z, Zhao Y, Pang Y, Li X (2020c) Cross-modal guidance based auto-encoder for multi-video summarization. Pattern Recogn Lett 135:131\u2013137. https:\/\/doi.org\/10.1016\/j.patrec.2020.04.011","journal-title":"Pattern Recogn Lett"},{"issue":"4","key":"10429_CR120","doi-asserted-by":"publisher","first-page":"1765","DOI":"10.1109\/TNNLS.2020.2991083","volume":"32","author":"Z Ji","year":"2021","unstructured":"Ji Z, Zhao Y, Pang Y, Li X, Han J (2021) Deep attentive video summarization with distribution consistency learning. IEEE Trans Neural Netw Learn Syst 32(4):1765\u20131775. https:\/\/doi.org\/10.1109\/TNNLS.2020.2991083","journal-title":"IEEE Trans Neural Netw Learn Syst"},{"key":"10429_CR121","doi-asserted-by":"publisher","unstructured":"Jiang X (2009) Feature extraction for image recognition and computer vision. In: Proceedings\u20142009 2nd IEEE International Conference on Computer Science and Information Technology, ICCSIT 2009, pp. 1\u201315. https:\/\/doi.org\/10.1109\/ICCSIT.2009.5235014","DOI":"10.1109\/ICCSIT.2009.5235014"},{"key":"10429_CR122","doi-asserted-by":"publisher","unstructured":"Jiang P, Han Y (2019) Hierarchical variational network for user-diversified & query-focused video summarization. In: ICMR 2019\u2014Proceedings of the 2019 ACM International Conference on Multimedia Retrieval, pp 202\u2013206. https:\/\/doi.org\/10.1145\/3323873.3325040","DOI":"10.1145\/3323873.3325040"},{"key":"10429_CR123","doi-asserted-by":"publisher","unstructured":"Jin H, Song Y, Yatani K (2017) ElasticPlay: interactive video summarization with dynamic time budgets. In: MM 2017\u2014Proceedings of the 2017 ACM Multimedia Conference, pp 1164\u20131172. https:\/\/doi.org\/10.1145\/3123266.3123393","DOI":"10.1145\/3123266.3123393"},{"key":"10429_CR124","doi-asserted-by":"publisher","unstructured":"Jodoin JP, Bilodeau GA, Saunier N (2014) Urban tracker: multiple object tracking in urban mixed traffic. In: 2014 IEEE Winter Conference on Applications of Computer Vision, WACV 2014, pp 885\u2013892. https:\/\/doi.org\/10.1109\/WACV.2014.6836010","DOI":"10.1109\/WACV.2014.6836010"},{"key":"10429_CR125","doi-asserted-by":"crossref","unstructured":"Joho H, Jose J (2009) Exploiting facial expressions for affective video summarisation. In: Proceedings of the ACM International Conference on Image and Video Retrieval, 2009(Civr)","DOI":"10.1145\/1646396.1646435"},{"key":"10429_CR126","doi-asserted-by":"publisher","unstructured":"Jung Y, Cho D, Kim D, Woo S, Kweon IS (2019) Discriminative feature learning for unsupervised video summarization. In: 33rd AAAI Conference on Artificial Intelligence, AAAI 2019, 31st Innovative Applications of Artificial Intelligence Conference, IAAI 2019 and the 9th AAAI Symposium on Educational Advances in Artificial Intelligence, EAAI 2019, pp 8537\u20138544. https:\/\/doi.org\/10.1609\/aaai.v33i01.33018537","DOI":"10.1609\/aaai.v33i01.33018537"},{"key":"10429_CR127","doi-asserted-by":"publisher","unstructured":"Jung Y, Cho D, Woo S, Kweon IS (2020) Global-and-Local Relative Position Embedding for Unsupervised Video Summarization. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 12370 LNCS, pp 167\u2013183. https:\/\/doi.org\/10.1007\/978-3-030-58595-2_11","DOI":"10.1007\/978-3-030-58595-2_11"},{"key":"10429_CR128","doi-asserted-by":"publisher","unstructured":"Kanehira A, Van Gool L, Ushiku Y, Harada T (2018) Viewpoint-Aware Video Summarization. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 7435\u20137444. https:\/\/doi.org\/10.1109\/CVPR.2018.00776","DOI":"10.1109\/CVPR.2018.00776"},{"issue":"3","key":"10429_CR129","doi-asserted-by":"publisher","first-page":"286","DOI":"10.1016\/j.ipm.2014.12.001","volume":"51","author":"R Kannan","year":"2015","unstructured":"Kannan R, Ghinea G, Swaminathan S (2015) What do you wish to see? A summarization system for movies based on user preferences. Inf Process Manage 51(3):286\u2013305. https:\/\/doi.org\/10.1016\/j.ipm.2014.12.001","journal-title":"Inf Process Manage"},{"key":"10429_CR130","doi-asserted-by":"publisher","unstructured":"Kato K, Ide I, Deguchi D, Murase H (2014) Estimation of the representative story transition in a chronological semantic structure of news topics. In: ICMR 2014\u2014Proceedings of the ACM International Conference on Multimedia Retrieval 2014, pp 487\u2013490. https:\/\/doi.org\/10.1145\/2578726.2578800","DOI":"10.1145\/2578726.2578800"},{"key":"10429_CR131","doi-asserted-by":"publisher","unstructured":"Kato K, Ide I, Deguchi D, Murase H (2015) Generation of a video summary on a news topic based on SNS responses to news stories. In: CrowdMM 2015 - Proceedings of the 4th International Workshop on Crowdsourcing for Multimedia, Co-Located with MM 2015, pp 21\u201326. https:\/\/doi.org\/10.1145\/2810188.2810189","DOI":"10.1145\/2810188.2810189"},{"key":"10429_CR132","doi-asserted-by":"publisher","unstructured":"Katti H, Yadati K, Kankanhalli M, Tat-Seng C (2011) Affective video summarization and story board generation using pupillary dilation and eye gaze. In: Proceedings\u20142011 IEEE InternationalSymposium on Multimedia, ISM 2011, pp 319\u2013326. https:\/\/doi.org\/10.1109\/ISM.2011.57","DOI":"10.1109\/ISM.2011.57"},{"key":"10429_CR133","doi-asserted-by":"publisher","unstructured":"Kaushal V, Kothawade S, Iyer R, Ramakrishnan G (2020) Realistic video summarization through VISIOCITY: a new benchmark and evaluation framework. In: AI4TV 2020\u2014Proceedings of the 2nd International Workshop on AI for Smart TV Content Production, Access and Delivery, pp 37\u201344. https:\/\/doi.org\/10.1145\/3422839.3423064","DOI":"10.1145\/3422839.3423064"},{"issue":"11","key":"10429_CR134","first-page":"256","volume":"6","author":"YS Khan","year":"2015","unstructured":"Khan YS (2015) Video summarization: survey on event detection and summarization in soccer videos. Int J Adv Comput Sci Appl (IJACSA) 6(11):256\u2013259","journal-title":"Int J Adv Comput Sci Appl (IJACSA)"},{"issue":"3","key":"10429_CR135","doi-asserted-by":"publisher","first-page":"1945","DOI":"10.1007\/s11063-020-10200-3","volume":"52","author":"AA Khan","year":"2020","unstructured":"Khan AA, Shao J, Ali W, Tumrani S (2020) Content-aware summarization of broadcast sports videos: an audio-visual feature extraction approach. Neural Process Lett 52(3):1945\u20131968. https:\/\/doi.org\/10.1007\/s11063-020-10200-3","journal-title":"Neural Process Lett"},{"key":"10429_CR136","doi-asserted-by":"publisher","unstructured":"Khosla A, Hamid R, Lin CJ, Sundaresan N (2013) Large-scale video summarization using web-image priors. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 2698\u20132705. https:\/\/doi.org\/10.1109\/CVPR.2013.348","DOI":"10.1109\/CVPR.2013.348"},{"issue":"1","key":"10429_CR137","doi-asserted-by":"publisher","first-page":"1","DOI":"10.4218\/etrij.02.0102.0101","volume":"24","author":"JG Kim","year":"2002","unstructured":"Kim JG, Chang HS, Kim YT, Kang K, Kim M, Kim J, Kim HM (2002) Multimodal approach for summarizing and indexing news video. ETRI J 24(1):1\u201311. https:\/\/doi.org\/10.4218\/etrij.02.0102.0101","journal-title":"ETRI J"},{"issue":"1","key":"10429_CR138","doi-asserted-by":"publisher","first-page":"27","DOI":"10.1007\/s11042-010-0544-9","volume":"54","author":"MH Kolekar","year":"2011","unstructured":"Kolekar MH (2011) Bayesian belief network based broadcast sports video indexing. Multimed Tools Appl 54(1):27\u201354. https:\/\/doi.org\/10.1007\/s11042-010-0544-9","journal-title":"Multimed Tools Appl"},{"key":"10429_CR139","doi-asserted-by":"publisher","unstructured":"Koutras P, Maragos P (2019) SUSiNet: see, understand and summarize it. In: IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops, 2019-June, pp 809\u2013819. https:\/\/doi.org\/10.1109\/CVPRW.2019.00109","DOI":"10.1109\/CVPRW.2019.00109"},{"key":"10429_CR140","doi-asserted-by":"publisher","unstructured":"Koutras P, Zlatintsi A., Iosif E, Katsamanis A, Maragos P, Potamianos A (2015) Predicting audio-visual salient events based on visual, audio and text modalities for movie summarization. In: Proceedings\u2014International Conference on Image Processing, ICIP, 2015-Decem, pp 4361\u20134365. https:\/\/doi.org\/10.1109\/ICIP.2015.7351630","DOI":"10.1109\/ICIP.2015.7351630"},{"issue":"8","key":"10429_CR141","doi-asserted-by":"publisher","first-page":"1166","DOI":"10.1109\/TMM.2015.2443558","volume":"17","author":"SK Kuanar","year":"2015","unstructured":"Kuanar SK, Ranga KB, Chowdhury AS (2015) Multi-view video summarization using bipartite matching constrained optimum-path forest clustering. IEEE Trans Multimed 17(8):1166\u20131173","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR142","doi-asserted-by":"publisher","first-page":"2437","DOI":"10.1109\/ICIP.2011.6116136","volume":"1","author":"M Kumar","year":"2011","unstructured":"Kumar M, Loui AC (2011) Key frame extraction from consumer videos using sparse representation. Proc Int Conf Image Process ICIP 1:2437\u20132440. https:\/\/doi.org\/10.1109\/ICIP.2011.6116136","journal-title":"Proc Int Conf Image Process ICIP"},{"key":"10429_CR143","doi-asserted-by":"publisher","unstructured":"Kumar K, Shrimankar DD, Singh N (2017) Event BAGGING: a novel event summarization approach in multiview surveillance videos. In: Proceedings of 2017 International Conference on Innovations in Electronics, Signal Processing and Communication, IESC 2017, April, pp 106\u2013111. https:\/\/doi.org\/10.1109\/IESPC.2017.8071874","DOI":"10.1109\/IESPC.2017.8071874"},{"key":"10429_CR144","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-017-4642-9","author":"K Kumar","year":"2018","unstructured":"Kumar K, Shrimankar DD, Singh N (2018a) Eratosthenes sieve based key-frame extraction technique for event summarization in videos. Multimed Tools Appl. https:\/\/doi.org\/10.1007\/s11042-017-4642-9","journal-title":"Multimed Tools Appl"},{"key":"10429_CR145","doi-asserted-by":"publisher","first-page":"383","DOI":"10.1007\/978-981-10-8633-5","volume-title":"Recent findings in intelligent computing techniques","author":"K Kumar","year":"2018","unstructured":"Kumar K, Shrimankar DD, Singh N (2018b) SOMES\u202f: an efficient SOM technique for event summarization in multi-view surveillance videos. In: Sa PK, Bakshi S (eds) Recent findings in intelligent computing techniques. Springer, Singapore, pp 383\u2013389. https:\/\/doi.org\/10.1007\/978-981-10-8633-5"},{"key":"10429_CR146","doi-asserted-by":"publisher","unstructured":"Lai PK, Decombas M, Moutet K, Laganiere R (2016) Video summarization of surveillance cameras. In: 2016 13th IEEE International Conference on Advanced Video and Signal Based Surveillance, AVSS 2016, August, pp 286\u2013294. https:\/\/doi.org\/10.1109\/AVSS.2016.7738018","DOI":"10.1109\/AVSS.2016.7738018"},{"key":"10429_CR147","doi-asserted-by":"publisher","unstructured":"Lal S, Duggal S, Sreedevi I (2019) Online video summarization: predicting future to better summarize present. In: Proceedings - 2019 IEEE Winter Conference on Applications of Computer Vision, WACV 2019, pp 471\u2013480. https:\/\/doi.org\/10.1109\/WACV.2019.00056","DOI":"10.1109\/WACV.2019.00056"},{"key":"10429_CR148","doi-asserted-by":"publisher","first-page":"106971","DOI":"10.1016\/j.knosys.2021.106971","volume":"222","author":"L Lan","year":"2021","unstructured":"Lan L, Ye C (2021) Recurrent generative adversarial networks for unsupervised WCE video summarization. Knowl Based Syst 222:106971. https:\/\/doi.org\/10.1016\/j.knosys.2021.106971","journal-title":"Knowl Based Syst"},{"key":"10429_CR149","doi-asserted-by":"publisher","unstructured":"Lee YJ, Ghosh J, Grauman K (2012) Discovering important people and objects for egocentric video summarization. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 1346\u20131353. https:\/\/doi.org\/10.1109\/CVPR.2012.6247820","DOI":"10.1109\/CVPR.2012.6247820"},{"issue":"7","key":"10429_CR150","doi-asserted-by":"publisher","first-page":"2126","DOI":"10.1109\/TCSVT.2018.2860797","volume":"29","author":"J Lei","year":"2019","unstructured":"Lei J, Luan Q, Song X, Liu X, Tao D, Song M (2019) Action parsing-driven video summarization based on reinforcement learning. IEEE Trans Circuits Syst Video Technol 29(7):2126\u20132137. https:\/\/doi.org\/10.1109\/TCSVT.2018.2860797","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"issue":"October","key":"10429_CR151","doi-asserted-by":"publisher","first-page":"86","DOI":"10.1007\/978-3-319-69911-0_7","volume":"785","author":"M Leszczuk","year":"2017","unstructured":"Leszczuk M, Grega M, Ko\u017abia\u0142 A, Gliwski J, Wasieczko K, Sma\u00efli K (2017) Video summarization framework for newscasts and reports\u2014work in progress. Commun Comput Inf Sci 785(October):86\u201397. https:\/\/doi.org\/10.1007\/978-3-319-69911-0_7","journal-title":"Commun Comput Inf Sci"},{"issue":"1","key":"10429_CR152","doi-asserted-by":"publisher","first-page":"199","DOI":"10.1007\/s11042-014-2287-5","volume":"75","author":"Y Li","year":"2016","unstructured":"Li Y, Merialdo B (2016) Multimedia maximal marginal relevance for multi-video summarization. Multimed Tools Appl 75(1):199\u2013220. https:\/\/doi.org\/10.1007\/s11042-014-2287-5","journal-title":"Multimed Tools Appl"},{"key":"10429_CR153","doi-asserted-by":"publisher","unstructured":"Li Z, Yang L (2021) Weakly supervised deep reinforcement learning for video summarization with semantically meaningful reward. In: IEEE Winter Conference on Applications of Computer Vision (WACV), pp 3239\u20133247. https:\/\/doi.org\/10.1109\/WACV48630.2021.00328.","DOI":"10.1109\/WACV48630.2021.00328"},{"key":"10429_CR154","doi-asserted-by":"publisher","unstructured":"Li P, Guo Y, Sun H (2011) Multi-keyframe abstraction from videos. In 2011 18th IEEE International Conference on Image Processing, IEEE, November 2016, pp 2473\u20132476. https:\/\/doi.org\/10.1109\/ICIP.2011.6116162","DOI":"10.1109\/ICIP.2011.6116162"},{"key":"10429_CR155","doi-asserted-by":"publisher","DOI":"10.5772\/59029","author":"J Li","year":"2014","unstructured":"Li J, Yang T, Yu J, Lu Z, Lu P, Jia X, Chen W (2014) Fast aerial video stitching. Int J Adv Robot Syst. https:\/\/doi.org\/10.5772\/59029","journal-title":"Int J Adv Robot Syst"},{"issue":"8","key":"10429_CR156","doi-asserted-by":"publisher","first-page":"3652","DOI":"10.1109\/TIP.2017.2695887","volume":"26","author":"X Li","year":"2017","unstructured":"Li X, Zhao B, Lu X, Member S (2017) A general framework for edited video and raw video summarization. IEEE Trans Image Process 26(8):3652\u20133664","journal-title":"IEEE Trans Image Process"},{"issue":"6","key":"10429_CR157","doi-asserted-by":"publisher","first-page":"902","DOI":"10.1631\/FITEE.2000429","volume":"22","author":"P Li","year":"2021","unstructured":"Li P, Tang C, Xu X (2021a) Video summarization with a graph convolutional attention network. Front Inf Technol Electron Eng 22(6):902\u2013913. https:\/\/doi.org\/10.1631\/FITEE.2000429","journal-title":"Front Inf Technol Electron Eng"},{"key":"10429_CR158","doi-asserted-by":"publisher","first-page":"107677","DOI":"10.1016\/j.patcog.2020.107677","volume":"111","author":"P Li","year":"2021","unstructured":"Li P, Ye Q, Zhang L, Yuan L, Xu X, Shao L (2021b) Exploring global diverse attention via pairwise temporal relation for video summarization. Pattern Recogn 111:107677. https:\/\/doi.org\/10.1016\/j.patcog.2020.107677","journal-title":"Pattern Recogn"},{"key":"10429_CR159","doi-asserted-by":"publisher","DOI":"10.1145\/3485472","author":"W Li","year":"2022","unstructured":"Li W, Pan G, Wang C, Xing Z, Han Z (2022) From coarse to fine: hierarchical structure-aware video summarization. ACM Trans Multimed Comput Commun Appl. https:\/\/doi.org\/10.1145\/3485472","journal-title":"ACM Trans Multimed Comput Commun Appl"},{"key":"10429_CR160","doi-asserted-by":"publisher","DOI":"10.3390\/e23080982","author":"B Liang","year":"2021","unstructured":"Liang B, Li N, He Z, Wang Z, Fu Y, Lu T (2021) News video summarization combining surf and color histogram features. Entropy. https:\/\/doi.org\/10.3390\/e23080982","journal-title":"Entropy"},{"key":"10429_CR161","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2022.108840","author":"G Liang","year":"2022","unstructured":"Liang G, Lv Y, Li S, Zhang S, Zhang Y (2022) Video summarization with a convolutional attentive adversarial network. Pattern Recogn. https:\/\/doi.org\/10.1016\/j.patcog.2022.108840","journal-title":"Pattern Recogn"},{"key":"10429_CR162","doi-asserted-by":"crossref","unstructured":"Liao M, Shi B, Bai X, Wang X, Liu W (2017) TextBoxes: a fast text detector with a single deep neural network. In: 31st AAAI Conference on Artificial Intelligence, AAAI 2017, pp 4161\u20134167","DOI":"10.1609\/aaai.v31i1.11196"},{"key":"10429_CR163","doi-asserted-by":"publisher","unstructured":"Lin CC, Pankanti S, Smith J (2015) Accurate coverage summarization of UAV videos. In: Proceedings\u2014Applied Imagery Pattern Recognition Workshop, 2015-Febru(February). https:\/\/doi.org\/10.1109\/AIPR.2014.7041923","DOI":"10.1109\/AIPR.2014.7041923"},{"key":"10429_CR164","doi-asserted-by":"publisher","unstructured":"Lin R, Xiao J, Fan J (2019) NeXtVLAD: an efficient neural network to aggregate frame-level features for large-scale video classification. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 11132 LNCS, pp 206\u2013218. https:\/\/doi.org\/10.1007\/978-3-030-11018-5_19","DOI":"10.1007\/978-3-030-11018-5_19"},{"key":"10429_CR165","doi-asserted-by":"publisher","unstructured":"Lin T, Zhao X, Su H, Wang C, Yang M (2018). BSN: boundary sensitive network for temporal action proposal generation. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 11208 LNCS(Cmic), pp 3\u201321. https:\/\/doi.org\/10.1007\/978-3-030-01225-0_1","DOI":"10.1007\/978-3-030-01225-0_1"},{"key":"10429_CR166","unstructured":"Liu T (2020) Compare and select: video summarization with multi-agent reinforcement learning. http:\/\/arXiv.org\/2007.14552"},{"issue":"2","key":"10429_CR167","doi-asserted-by":"publisher","first-page":"1737","DOI":"10.1007\/s11042-018-6305-x","volume":"78","author":"H Liu","year":"2019","unstructured":"Liu H, Fang B, Sun F, Zhang X (2019a) Interactive video summarization with human intentions. Multimed Tools Appl 78(2):1737\u20131755","journal-title":"Multimed Tools Appl"},{"key":"10429_CR168","doi-asserted-by":"publisher","unstructured":"Liu YT, Li YJ, Yang FE, Chen SF, Wang YCF (2019b) Learning hierarchical self-attention for video summarization. In: Proceedings\u2014International Conference on Image Processing, ICIP, 2019b-Septe, pp 3377\u20133381. https:\/\/doi.org\/10.1109\/ICIP.2019.8803639","DOI":"10.1109\/ICIP.2019.8803639"},{"key":"10429_CR169","doi-asserted-by":"publisher","unstructured":"Liu T, Meng Q, Vlontzos A, Tan J, Rueckert D, Kainz B (2020) Ultrasound video summarization using deep reinforcement learning. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 12263 LNCS, pp 483\u2013492. https:\/\/doi.org\/10.1007\/978-3-030-59716-0_46","DOI":"10.1007\/978-3-030-59716-0_46"},{"key":"10429_CR170","doi-asserted-by":"publisher","first-page":"1573","DOI":"10.1109\/TIP.2022.3143699","volume":"31","author":"T Liu","year":"2022","unstructured":"Liu T, Meng Q, Huang JJ, Vlontzos A, Rueckert D, Kainz B (2022) Video summarization through reinforcement learning with a 3D spatio-temporal U-net. IEEE Trans Image Process 31:1573\u20131586. https:\/\/doi.org\/10.1109\/TIP.2022.3143699","journal-title":"IEEE Trans Image Process"},{"key":"10429_CR171","doi-asserted-by":"publisher","first-page":"13","DOI":"10.1016\/j.cmpb.2018.07.004","volume":"165","author":"C Loukas","year":"2018","unstructured":"Loukas C, Varytimidis C, Rapantzikos K, Kanakis MA (2018) Keyframe extraction from laparoscopic videos based on visual saliency detection. Comput Methods Programs Biomed 165:13\u201323. https:\/\/doi.org\/10.1016\/j.cmpb.2018.07.004","journal-title":"Comput Methods Programs Biomed"},{"key":"10429_CR172","doi-asserted-by":"publisher","unstructured":"Lu Z, Grauman K (2013) Story-driven summarization for egocentric video. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 2714\u20132721. https:\/\/doi.org\/10.1109\/CVPR.2013.350","DOI":"10.1109\/CVPR.2013.350"},{"issue":"5","key":"10429_CR173","doi-asserted-by":"publisher","first-page":"6309","DOI":"10.1007\/s11042-016-3263-z","volume":"76","author":"G Lu","year":"2017","unstructured":"Lu G, Zhou Y, Li X, Yan P (2017) Unsupervised, efficient and scalable key-frame selection for automatic summarization of surveillance videos. Multimed Tools Appl 76(5):6309\u20136331. https:\/\/doi.org\/10.1007\/s11042-016-3263-z","journal-title":"Multimed Tools Appl"},{"key":"10429_CR174","unstructured":"Lucas BD, Kanade T (1981) Iterative image registration technique with an application to stereo vision. In: Proceedings of Imaging Understanding Workshop, 2(April 1981), pp 121\u2013130."},{"issue":"2","key":"10429_CR175","doi-asserted-by":"publisher","first-page":"289","DOI":"10.1109\/TCSVT.2008.2009241","volume":"19","author":"J Luo","year":"2009","unstructured":"Luo J, Papin C, Costello K (2009) Key frames from personal video clips: from humans to computers. IEEE Trans Circuits Syst Video Technol 19(2):289\u2013301","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"issue":"2\u20133","key":"10429_CR176","doi-asserted-by":"publisher","first-page":"521","DOI":"10.1007\/s11042-009-0353-1","volume":"46","author":"M Lux","year":"2010","unstructured":"Lux M, Marques O, Sch\u00f6ffmann K, B\u00f6sz\u00f6rmenyi L, Lajtai G (2010) A novel tool for summarization of arthroscopic videos. Multimed Tools Appl 46(2\u20133):521\u2013544. https:\/\/doi.org\/10.1007\/s11042-009-0353-1","journal-title":"Multimed Tools Appl"},{"key":"10429_CR177","doi-asserted-by":"publisher","unstructured":"Ma YF, Lu L, Zhang HJ, Li M (2002) A user attention model for video summarization. In: Proceedings of the ACM International Multimedia Conference and Exhibition, pp 533\u2013542. https:\/\/doi.org\/10.1145\/641113.641116","DOI":"10.1145\/641113.641116"},{"issue":"c","key":"10429_CR178","doi-asserted-by":"publisher","first-page":"11763","DOI":"10.1109\/ACCESS.2019.2891834","volume":"7","author":"M Ma","year":"2019","unstructured":"Ma M, Mei S, Wan S, Wang Z, Feng D (2019) Video summarization via nonlinear sparse dictionary selection. IEEE Access 7(c):11763\u201311774. https:\/\/doi.org\/10.1109\/ACCESS.2019.2891834","journal-title":"IEEE Access"},{"key":"10429_CR179","doi-asserted-by":"publisher","first-page":"197","DOI":"10.1016\/j.neucom.2019.07.108","volume":"378","author":"M Ma","year":"2020","unstructured":"Ma M, Mei S, Wan S, Hou J, Wang Z, Feng DD (2020) Video summarization via block sparse dictionary selection. Neurocomputing 378:197\u2013209. https:\/\/doi.org\/10.1016\/j.neucom.2019.07.108","journal-title":"Neurocomputing"},{"issue":"5","key":"10429_CR180","doi-asserted-by":"publisher","first-page":"1686","DOI":"10.1109\/JBHI.2020.3019198","volume":"25","author":"M Ma","year":"2021","unstructured":"Ma M, Mei S, Wan S, Wang Z, Ge Z, Lam V, Feng D (2021) Keyframe extraction from laparoscopic videos via diverse and weighted dictionary selection. IEEE J Biomed Health Inform 25(5):1686\u20131698. https:\/\/doi.org\/10.1109\/JBHI.2020.3019198","journal-title":"IEEE J Biomed Health Inform"},{"issue":"12","key":"10429_CR181","doi-asserted-by":"publisher","first-page":"5828","DOI":"10.1109\/TIP.2016.2615289","volume":"25","author":"I Mademlis","year":"2016","unstructured":"Mademlis I, Tefas A, Nikolaidis N, Pitas I (2016) Multimodal stereoscopic movie summarization conforming to narrative characteristics. IEEE Trans Image Process 25(12):5828\u20135840. https:\/\/doi.org\/10.1109\/TIP.2016.2615289","journal-title":"IEEE Trans Image Process"},{"key":"10429_CR182","doi-asserted-by":"publisher","unstructured":"Mahasseni B, Lam M, Todorovic S (2017) Unsupervised Video Summarization with Adversarial LSTM Networks. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017-Janua, pp 202\u2013211. https:\/\/doi.org\/10.1109\/CVPR.2017.318","DOI":"10.1109\/CVPR.2017.318"},{"key":"10429_CR183","doi-asserted-by":"publisher","first-page":"319","DOI":"10.1016\/j.ins.2017.12.020","volume":"432","author":"I Mademlis","year":"2018","unstructured":"Mademlis I, Tefas A, Pitas I (2018a) A salient dictionary learning framework for activity video summarization via key-frame extraction. Inf Sci 432:319\u2013331. https:\/\/doi.org\/10.1016\/j.ins.2017.12.020","journal-title":"Inf Sci"},{"key":"10429_CR184","doi-asserted-by":"publisher","unstructured":"Mademlis I, Tefas A, Pitas I (2018b) Summarization of human activity videos using a salient dictionary. In: Proceedings\u2014International Conference on Image Processing, ICIP, 2017-Septe, pp 625\u2013629. https:\/\/doi.org\/10.1109\/ICIP.2017.8296356","DOI":"10.1109\/ICIP.2017.8296356"},{"key":"10429_CR185","doi-asserted-by":"publisher","unstructured":"Mahmoud KM, Ghanem NM, Ismail MA (2013a) VGRAPH: an effective approach for generating static video summaries. In: 2013a IEEE International Conference on Computer Vision Workshops, 2013, pp 811\u2013818. https:\/\/doi.org\/10.1109\/ICCVW.2013.111","DOI":"10.1109\/ICCVW.2013.111"},{"key":"10429_CR186","doi-asserted-by":"crossref","unstructured":"Mahmoud KM, Ismail MA, Ghanem NM (2013b) VSCAN: an enhanced video summarization using density-based spatial clustering. In: International Conference on Image Analysis and Processing. Springer, Berlin, Heidelberg, pp 733\u2013742","DOI":"10.1007\/978-3-642-41181-6_74"},{"key":"10429_CR187","doi-asserted-by":"crossref","unstructured":"Marsza\u0142ek M, Laptev I, Schmid C (2009) Actions in context. In: Computer Vision and Pattern Recognition, IEEE, i, pp 2929\u20132936.","DOI":"10.1109\/CVPR.2009.5206557"},{"key":"10429_CR188","unstructured":"Mathe J (2017) Automated shot detection software (p. https:\/\/github.com\/johmathe\/Shotdetect. Accessed 1 March 2022"},{"key":"10429_CR189","doi-asserted-by":"crossref","unstructured":"Mathews RP, Panicker MR, Hareendranathan AR, Chen YT, Jaremko JL, Buchanan B, Narayan KV, Mathews G (2021) Unsupervised multi-latent space reinforcement learning framework for video summarization in ultrasound imaging. https:\/\/arXiv.org\/2109.01309v1","DOI":"10.1016\/j.simpa.2021.100185"},{"key":"10429_CR190","doi-asserted-by":"publisher","first-page":"393","DOI":"10.1016\/j.neucom.2015.05.126","volume":"174","author":"I Mehmood","year":"2016","unstructured":"Mehmood I, Sajjad M, Rho S, Baik SW (2016) Divide-and-conquer based summarization framework for extracting affective video content. Neurocomputing 174:393\u2013403. https:\/\/doi.org\/10.1016\/j.neucom.2015.05.126","journal-title":"Neurocomputing"},{"key":"10429_CR191","doi-asserted-by":"publisher","unstructured":"Mei S, Guan G, Wang Z, He M, Hua XS, Dagan Feng D (2014) L2,0 constrained sparse dictionary selection for video summarization. In: Proceedings - IEEE International Conference on Multimedia and Expo, 2014-Septe(Septmber). https:\/\/doi.org\/10.1109\/ICME.2014.6890179","DOI":"10.1109\/ICME.2014.6890179"},{"issue":"2","key":"10429_CR192","doi-asserted-by":"publisher","first-page":"522","DOI":"10.1016\/j.patcog.2014.08.002","volume":"48","author":"S Mei","year":"2015","unstructured":"Mei S, Guan G, Wang Z, Wan S, He M, Dagan Feng D (2015) Video summarization via minimum sparse reconstruction. Pattern Recogn 48(2):522\u2013533. https:\/\/doi.org\/10.1016\/j.patcog.2014.08.002","journal-title":"Pattern Recogn"},{"issue":"c","key":"10429_CR193","doi-asserted-by":"publisher","first-page":"732","DOI":"10.1109\/TMM.2020.2987683","volume":"23","author":"S Mei","year":"2021","unstructured":"Mei S, Ma M, Wan S, Hou J, Wang Z, Feng DD (2021) Patch based video summarization with block sparse representation. IEEE Trans Multimed 23(c):732\u2013747. https:\/\/doi.org\/10.1109\/TMM.2020.2987683","journal-title":"IEEE Trans Multimed"},{"issue":"3","key":"10429_CR194","doi-asserted-by":"publisher","first-page":"790","DOI":"10.1016\/j.compeleceng.2012.11.020","volume":"39","author":"E Mendi","year":"2013","unstructured":"Mendi E, Clemente HB, Bayrak C (2013) Sports video summarization based on motion analysis. Comput Electr Eng 39(3):790\u2013796. https:\/\/doi.org\/10.1016\/j.compeleceng.2012.11.020","journal-title":"Comput Electr Eng"},{"key":"10429_CR195","doi-asserted-by":"publisher","unstructured":"Messaoud S, Lourentzou I, Boughoula A, Zehni M, Zhao Z, Zhai C, Schwing AG (2021) DeepQAMVS: query-Aware Hierarchical Pointer Networks for Multi-Video Summarization. In: SIGIR 2021\u2014Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval (Vol. 1, Issue 1). Association for Computing Machinery. https:\/\/doi.org\/10.1145\/3404835.3462959","DOI":"10.1145\/3404835.3462959"},{"key":"10429_CR196","doi-asserted-by":"publisher","first-page":"59768","DOI":"10.1109\/ACCESS.2018.2872685","volume":"6","author":"J Mohan","year":"2018","unstructured":"Mohan J, Nair MS (2018) Dynamic summarization of videos based on descriptors in space-time video volumes and sparse autoencoder. IEEE Access 6:59768\u201359778. https:\/\/doi.org\/10.1109\/ACCESS.2018.2872685","journal-title":"IEEE Access"},{"issue":"2","key":"10429_CR197","doi-asserted-by":"publisher","first-page":"121","DOI":"10.1016\/j.jvcir.2007.04.002","volume":"19","author":"AG Money","year":"2008","unstructured":"Money AG, Agius H (2008) Video summarisation: a conceptual framework and survey of the state of the art. J vis Commun Image Represent 19(2):121\u2013143. https:\/\/doi.org\/10.1016\/j.jvcir.2007.04.002","journal-title":"J vis Commun Image Represent"},{"key":"10429_CR198","doi-asserted-by":"publisher","DOI":"10.1145\/1823746.1823751","author":"AG Money","year":"2010","unstructured":"Money AG, Agius H (2010) ELVIS: entertainment-led video summaries. ACM Trans Multimed Comput Commun Appl. https:\/\/doi.org\/10.1145\/1823746.1823751","journal-title":"ACM Trans Multimed Comput Commun Appl"},{"key":"10429_CR199","doi-asserted-by":"publisher","DOI":"10.1186\/s40064-016-3171-8","author":"K Muhammad","year":"2016","unstructured":"Muhammad K, Ahmad J, Sajjad M, Baik SW (2016) Visual saliency models for summarization of diagnostic hysteroscopy videos in healthcare systems. Springerplus. https:\/\/doi.org\/10.1186\/s40064-016-3171-8","journal-title":"Springerplus"},{"key":"10429_CR200","doi-asserted-by":"publisher","first-page":"161","DOI":"10.1016\/j.bspc.2016.11.011","volume":"33","author":"K Muhammad","year":"2017","unstructured":"Muhammad K, Sajjad M, Young M, Wook S (2017) Efficient visual attention driven framework for key frames extraction from hysteroscopy videos. Biomed Signal Process Control 33:161\u2013168. https:\/\/doi.org\/10.1016\/j.bspc.2016.11.011","journal-title":"Biomed Signal Process Control"},{"key":"10429_CR201","doi-asserted-by":"publisher","first-page":"370","DOI":"10.1016\/j.patrec.2018.08.003","volume":"130","author":"K Muhammad","year":"2020","unstructured":"Muhammad K, Hussain T, Baik SW (2020) Efficient CNN based summarization of surveillance videos for resource-constrained devices. Pattern Recogn Lett 130:370\u2013375. https:\/\/doi.org\/10.1016\/j.patrec.2018.08.003","journal-title":"Pattern Recogn Lett"},{"key":"10429_CR202","doi-asserted-by":"publisher","first-page":"219","DOI":"10.1007\/s00799-005-0129-9","volume":"6","author":"P Mundur","year":"2006","unstructured":"Mundur P, Rao Y, Yesha Y (2006) Keyframe-based video summarization using Delaunay clustering. Int J Digit Libr 6:219\u2013232. https:\/\/doi.org\/10.1007\/s00799-005-0129-9","journal-title":"Int J Digit Libr"},{"key":"10429_CR203","doi-asserted-by":"publisher","first-page":"23273","DOI":"10.1007\/s11042-018-5671-8","volume":"77","author":"AS Murugan","year":"2018","unstructured":"Murugan AS, Devi KS, Sivaranjani A, Srinivasan P (2018) A study on various methods used for video summarization and moving object detection for video surveillance applications. Multimed Tools Appl 77:23273","journal-title":"Multimed Tools Appl"},{"key":"10429_CR204","doi-asserted-by":"publisher","DOI":"10.1007\/s12652-022-04112-4","author":"MS Nair","year":"2022","unstructured":"Nair MS, Mohan J (2022) VSMCNN-dynamic summarization of videos using salient features from multi-CNN model. J Ambient Intell Humaniz Comput. https:\/\/doi.org\/10.1007\/s12652-022-04112-4","journal-title":"J Ambient Intell Humaniz Comput"},{"key":"10429_CR205","doi-asserted-by":"publisher","unstructured":"Narasimhan H, Satheesh S, Sriram D (2010) Automatic summarization of cricket video events using genetic algorithm. In: Proceedings of the 12th Annual Genetic and Evolutionary Computation Conference, GECCO \u201910\u2014Companion Publication, pp 2051\u20132054. https:\/\/doi.org\/10.1145\/1830761.1830858","DOI":"10.1145\/1830761.1830858"},{"issue":"1","key":"10429_CR206","doi-asserted-by":"publisher","first-page":"27","DOI":"10.18178\/joig.6.1.27-32","volume":"6","author":"MH Nasir","year":"2018","unstructured":"Nasir MH, Javed A, Irtaza A, Malik H, Mahmood MT (2018) Event detection and summarization of cricket videos. J Image Gr 6(1):27\u201332. https:\/\/doi.org\/10.18178\/joig.6.1.27-32","journal-title":"J Image Gr"},{"key":"10429_CR207","doi-asserted-by":"publisher","unstructured":"Natsev A, Smith JR, Te\u0161i\u0107 J, Xie L, Yan R (2008) IBM multimedia analysis and retrieval system. In: CIVR 2008\u2014Proceedings of the International Conference on Content-Based Image and Video Retrieval, pp 553\u2013554. https:\/\/doi.org\/10.1145\/1386352.1386427","DOI":"10.1145\/1386352.1386427"},{"issue":"1","key":"10429_CR208","doi-asserted-by":"publisher","first-page":"125","DOI":"10.1007\/s10107-012-0629-5","volume":"140","author":"Y Nesterov","year":"2013","unstructured":"Nesterov Y (2013) Gradient methods for minimizing composite functions. Math Program 140(1):125\u2013161. https:\/\/doi.org\/10.1007\/s10107-012-0629-5","journal-title":"Math Program"},{"key":"10429_CR209","doi-asserted-by":"publisher","unstructured":"Ng JYH, Hausknecht M, Vijayanarasimhan S, Vinyals O, Monga R, Toderici G (2015) Beyond short snippets: deep networks for video classification. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 07\u201312-June, pp 4694\u20134702. https:\/\/doi.org\/10.1109\/CVPR.2015.7299101","DOI":"10.1109\/CVPR.2015.7299101"},{"issue":"12","key":"10429_CR210","doi-asserted-by":"publisher","first-page":"2991","DOI":"10.1109\/TCYB.2015.2493558","volume":"46","author":"L Nie","year":"2016","unstructured":"Nie L, Hong R, Zhang L, Xia Y, Tao D, Sebe N (2016) Perceptual attributes optimization for multivideo summarization. IEEE Trans Cybern 46(12):2991\u20133003. https:\/\/doi.org\/10.1109\/TCYB.2015.2493558","journal-title":"IEEE Trans Cybern"},{"key":"10429_CR211","doi-asserted-by":"crossref","unstructured":"Oh S, Hoogs A, Perera A, Cuntoor N, Chen C, Lee JT, Mukherjee S, Aggarwal JK, Lee H, Davis L, Swears E, Wang X, Ji Q, Reddy K, Shah M, Vondrick C, Pirsiavash H, Ramanan D, Yuen J, et al (2011) A large-scale benchmark dataset for event recognition in surveillance video. In: CVPR 2011, IEEE, vol 2, pp 3153\u20133160","DOI":"10.1109\/CVPR.2011.5995586"},{"key":"10429_CR212","unstructured":"Oosterhuis H, Ravi S, Com SG, Bendersky M, Com BG (2016a) Semantic video trailers. ArXiv"},{"key":"10429_CR213","unstructured":"Otani M, Nakashima Y, Rahtu E, Yokoya N (2016) Video summarization using deep semantic features. In: Asian Conference on Computer Vision. Springer, Cham, pp 1\u201316"},{"key":"10429_CR214","doi-asserted-by":"publisher","unstructured":"Otani M, Nakashima Y, Rahtu E, Heikkila J (2019b) Rethinking the evaluation of video summaries. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2019b-June, pp 7588\u20137596. https:\/\/doi.org\/10.1109\/CVPR.2019.00778","DOI":"10.1109\/CVPR.2019.00778"},{"issue":"1","key":"10429_CR215","doi-asserted-by":"publisher","first-page":"165","DOI":"10.1109\/JSTSP.2014.2331916","volume":"9","author":"S-H Ou","year":"2015","unstructured":"Ou S-H, Lee C-H, Somayazulu VS, Chen Y, Chien S (2015) On-line multi-view video summarization for wireless video sensor network. IEEE J Select Topics Signal Process 9(1):165\u2013179","journal-title":"IEEE J Select Topics Signal Process"},{"key":"10429_CR216","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-00764-5","volume-title":"Video clip growth: a general algorithm for multi-view video summarization","author":"G Pan","year":"2018","unstructured":"Pan G, Qu X, Lv L, Guo S, Sun D (2018) Video clip growth: a general algorithm for multi-view video summarization, vol 1. Springer, Berlin. https:\/\/doi.org\/10.1007\/978-3-030-00764-5"},{"key":"10429_CR217","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1186\/s13634-019-0611-y","volume":"2019","author":"G Pan","year":"2019","unstructured":"Pan G, Zheng Y, Zhang R, Han Z, Sun D, Qu X (2019) A bottom-up summarization algorithm for videos in the wild. EURASIP J Adv Signal Process 2019:1\u201311","journal-title":"EURASIP J Adv Signal Process"},{"key":"10429_CR218","doi-asserted-by":"publisher","first-page":"43611","DOI":"10.1109\/ACCESS.2022.3163414","volume":"10","author":"Y Pan","year":"2022","unstructured":"Pan Y, Huang O, Ye Q, Li Z, Wang W, Li G, Chen Y (2022) Exploring global diversity and local context for video summarization. IEEE Access 10:43611\u201343622. https:\/\/doi.org\/10.1109\/ACCESS.2022.3163414","journal-title":"IEEE Access"},{"key":"10429_CR219","doi-asserted-by":"publisher","unstructured":"Panda R, Roy-Chowdhury AK (2017a) Collaborative summarization of topic-related videos. In: Proceedings\u201430th IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2017a, 2017a-Janua, pp 4274\u20134283. https:\/\/doi.org\/10.1109\/CVPR.2017.455","DOI":"10.1109\/CVPR.2017.455"},{"issue":"9","key":"10429_CR220","doi-asserted-by":"publisher","first-page":"2010","DOI":"10.1109\/TMM.2017.2708981","volume":"19","author":"R Panda","year":"2017","unstructured":"Panda R, Roy-Chowdhury AK (2017b) Multi-view surveillance video summarization via joint embedding and sparse optimization. IEEE Trans Multimed 19(9):2010\u20132021. https:\/\/doi.org\/10.1109\/TMM.2017.2708981","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR221","doi-asserted-by":"crossref","unstructured":"Panda R, Das A, Roy-chowdhury AK (2016) Video summarization in a multi-view camera network. In: 2016 23rd International Conference on Pattern Recognition (ICPR), IEEE, vol 3, pp 2971\u20132976","DOI":"10.1109\/ICPR.2016.7900089"},{"issue":"10","key":"10429_CR222","doi-asserted-by":"publisher","first-page":"4712","DOI":"10.1109\/TIP.2017.2708902","volume":"26","author":"R Panda","year":"2017","unstructured":"Panda R, Mithun NC, Roy-Chowdhury AK (2017) Diversity-aware multi-video summarization. IEEE Trans Image Process 26(10):4712\u20134724. https:\/\/doi.org\/10.1109\/TIP.2017.2708902","journal-title":"IEEE Trans Image Process"},{"key":"10429_CR223","doi-asserted-by":"publisher","unstructured":"Park J, Lee J, Kim IJ, Sohn K (2020) SumGraph: video summarization via recursive graph modeling. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 12370 LNCS, pp 647\u2013663. https:\/\/doi.org\/10.1007\/978-3-030-58595-2_39","DOI":"10.1007\/978-3-030-58595-2_39"},{"issue":"6","key":"10429_CR224","doi-asserted-by":"publisher","first-page":"1856","DOI":"10.1109\/TCSVT.2018.2844780","volume":"29","author":"M Paul","year":"2019","unstructured":"Paul M, Musfequs Salehin M (2019) Spatial and motion saliency prediction method using eye tracker data for video summarization. IEEE Trans Circuits Syst Video Technol 29(6):1856\u20131867. https:\/\/doi.org\/10.1109\/TCSVT.2018.2844780","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"issue":"2","key":"10429_CR225","doi-asserted-by":"publisher","first-page":"64","DOI":"10.1109\/MMUL.2009.65","volume":"17","author":"J Peng","year":"2010","unstructured":"Peng J, Xiao-Lin Q (2010) Keyframe-based video summary using visual attention clues. IEEE Multimed 17(2):64\u201373. https:\/\/doi.org\/10.1109\/MMUL.2009.65","journal-title":"IEEE Multimed"},{"issue":"3","key":"10429_CR226","doi-asserted-by":"publisher","first-page":"539","DOI":"10.1109\/TMM.2011.2131638","volume":"13","author":"WT Peng","year":"2011","unstructured":"Peng WT, Chu WT, Chang CH, Chou CN, Huang WJ, Chang WY, Hung YP (2011) Editing by viewing: automatic home video summarization by viewing behavior analysis. IEEE Trans Multimed 13(3):539\u2013550. https:\/\/doi.org\/10.1109\/TMM.2011.2131638","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR227","doi-asserted-by":"crossref","unstructured":"Phaphuangwittayakul A, Guo Y, Ying F, Xu W, Zheng Z (2021) Self-attention recurrent summarization network with reinforcement learning for video summarization task Department of Computer Science and Engineering , East China University of Science and Technology , China National Engineering Laboratory for Big Data D. In: IEEE International Conference on Multimedia and Expo (ICME), Icdi","DOI":"10.1109\/ICME51207.2021.9428142"},{"key":"10429_CR228","doi-asserted-by":"publisher","unstructured":"Pirsiavash H, Ramanan D (2012) Detecting activities of daily living in first-person camera views. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 2847\u20132854. https:\/\/doi.org\/10.1109\/CVPR.2012.6248010","DOI":"10.1109\/CVPR.2012.6248010"},{"key":"10429_CR229","doi-asserted-by":"crossref","unstructured":"Potapov D, Douze M, Harchaoui Z, Schmid C, Potapov D, Douze M, Harchaoui Z, Category-specific CS, Fleet D, Pajdla T, Schiele B, Tuytelaars T, European E, Potapov D, Douze M, Harchaoui Z, Schmid C (2014) Category-specific video summarization. In: European Conference on Computer Vision. Springer, Cham, pp 540\u2013555","DOI":"10.1007\/978-3-319-10599-4_35"},{"key":"10429_CR230","doi-asserted-by":"publisher","first-page":"102672","DOI":"10.1016\/j.jvcir.2019.102672","volume":"65","author":"H Qayyum","year":"2019","unstructured":"Qayyum H, Majid M, Haq EU, Anwar SM (2019) Generation of personalized video summaries by detecting viewer\u2019s emotion using electroencephalography. J vis Commun Image Represent 65:102672. https:\/\/doi.org\/10.1016\/j.jvcir.2019.102672","journal-title":"J vis Commun Image Represent"},{"issue":"6","key":"10429_CR231","doi-asserted-by":"publisher","first-page":"1","DOI":"10.3390\/s20061702","volume":"20","author":"M Rafiq","year":"2020","unstructured":"Rafiq M, Rafiq G, Agyeman R, Jin SI, Choi GS (2020) Scene classification for sports video summarization using transfer learning. Sensors (switzerland) 20(6):1\u201318. https:\/\/doi.org\/10.3390\/s20061702","journal-title":"Sensors (switzerland)"},{"key":"10429_CR232","doi-asserted-by":"publisher","unstructured":"Rahman MR, Shah S, Subhlok J (2020) Visual summarization of lecture video segments for enhanced navigation. In: Proceedings\u20142020 IEEE International Symposium on Multimedia, ISM 2020, pp 154\u2013157. https:\/\/doi.org\/10.1109\/ISM.2020.00033","DOI":"10.1109\/ISM.2020.00033"},{"key":"10429_CR233","doi-asserted-by":"publisher","unstructured":"Raikwar SC, Bhatnagar C, Jalal AS (2015) A framework for key frame extraction from surveillance video. In: Proceedings\u20145th IEEE International Conference on Computer and Communication Technology, ICCCT 2014, pp 297\u2013300. https:\/\/doi.org\/10.1109\/ICCCT.2014.7001508","DOI":"10.1109\/ICCCT.2014.7001508"},{"issue":"6","key":"10429_CR234","doi-asserted-by":"publisher","first-page":"1097","DOI":"10.1109\/TMM.2005.858392","volume":"7","author":"Z Rasheed","year":"2005","unstructured":"Rasheed Z, Shah M (2005) Detection and representation of scenes in videos. IEEE Trans Multimed 7(6):1097\u20131105. https:\/\/doi.org\/10.1109\/TMM.2005.858392","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR235","doi-asserted-by":"publisher","unstructured":"Ravi A, Venugopal H, Paul S, Tizhoosh HR (2019) A dataset and preliminary results for umpire pose detection using SVM classification of deep features. In: Proceedings of the 2018 IEEE Symposium Series on Computational Intelligence, SSCI 2018, pp 1396\u20131402. https:\/\/doi.org\/10.1109\/SSCI.2018.8628877","DOI":"10.1109\/SSCI.2018.8628877"},{"key":"10429_CR236","doi-asserted-by":"publisher","unstructured":"Ren J, Jiang J, Eckes C (2008) Hierarchical modeling and adaptive clustering for real-time summarization of rush videos in trecvid\u201908. In: MM\u201908 - Proceedings of the 2008 ACM International Conference on Multimedia, with Co-Located Symposium and Workshops, pp 26\u201330. https:\/\/doi.org\/10.1145\/1463563.1463566","DOI":"10.1145\/1463563.1463566"},{"issue":"6","key":"10429_CR237","doi-asserted-by":"publisher","first-page":"1137","DOI":"10.1109\/TPAMI.2016.2577031","volume":"39","author":"S Ren","year":"2017","unstructured":"Ren S, He K, Girshick R, Sun J (2017) Faster R-CNN: towards real-time object detection with region proposal networks. IEEE Trans Pattern Anal Mach Intell 39(6):1137\u20131149. https:\/\/doi.org\/10.1109\/TPAMI.2016.2577031","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"10429_CR238","doi-asserted-by":"crossref","unstructured":"Rochan M, Wang Y (2019) Learning video summarization using unpaired data. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, June, pp 7894\u20137903.","DOI":"10.1109\/CVPR.2019.00809"},{"key":"10429_CR239","doi-asserted-by":"publisher","unstructured":"Rochan M, Ye L, Wang Y (2018b) Video summarization using fully convolutional sequence networks. In: Proceedings of the European Conference on Computer Vision (ECCV), pp 347\u2013363. https:\/\/doi.org\/10.1007\/978-3-030-01258-8_22","DOI":"10.1007\/978-3-030-01258-8_22"},{"key":"10429_CR240","unstructured":"Roy-chowdhury AK (2017) Weakly supervised summarization of web videos (supplementary material). In: The IEEE International Conference on Computer Vision (ICCV), vol. 3, issue no. c. http:\/\/cse.iitkgp.ac.in\/~adas\/papers\/ICCV_2017_Summarization.pdf"},{"key":"10429_CR241","doi-asserted-by":"publisher","unstructured":"Sahrawat D, Agarwal M, Sinha S, Adhikary A, Agarwal M, Shah RR, Zimmermann R (2019) Video summarization using global attention with memory network and LSTM. In: Proceedings - 2019 IEEE 5th International Conference on Multimedia Big Data, BigMM 2019, pp 231\u2013236. https:\/\/doi.org\/10.1109\/BigMM.2019.00-20","DOI":"10.1109\/BigMM.2019.00-20"},{"key":"10429_CR242","doi-asserted-by":"crossref","unstructured":"Salehin M, Paul M (2015) Summarizing surveillance video by saliency transition and moving object information. In: International Conference on Digital Image Computing: Techniques and Applications (DICTA). IEEE.","DOI":"10.1109\/DICTA.2015.7371311"},{"issue":"11","key":"10429_CR243","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1371\/journal.pone.0181636","volume":"12","author":"M Salehin","year":"2017","unstructured":"Salehin M, Paul M, Kabir MA (2017) Video summarization using line segments, angles and conic parts. PLoS ONE 12(11):1\u201322","journal-title":"PLoS ONE"},{"key":"10429_CR244","doi-asserted-by":"crossref","unstructured":"Saquil Y, Chen D, He Y, Li C, Yang Y-L (2021) Multiple pairwise ranking networks for personalized video summarization. In: Proceedings of the IEEE\/CVF International Conference on Computer Vision, pp 1718\u20131727","DOI":"10.1109\/ICCV48922.2021.00174"},{"key":"10429_CR245","doi-asserted-by":"publisher","unstructured":"Scharcanski J, Gavi\u00e3o W (2006) Hierarchical summarization of diagnostic hysteroscopy videos. In: Proceedings\u2014International Conference on Image Processing, ICIP, pp 129\u2013132. https:\/\/doi.org\/10.1109\/ICIP.2006.312376","DOI":"10.1109\/ICIP.2006.312376"},{"issue":"1309","key":"10429_CR246","doi-asserted-by":"publisher","first-page":"21","DOI":"10.1098\/rspb.1991.0045","volume":"244","author":"GL Scott","year":"1991","unstructured":"Scott GL, Longuet-Higgins HC (1991) An algorithm for associating the features of two images. Proc R Soc b: Biol Sci 244(1309):21\u201326. https:\/\/doi.org\/10.1098\/rspb.1991.0045","journal-title":"Proc R Soc b: Biol Sci"},{"key":"10429_CR247","doi-asserted-by":"publisher","unstructured":"Selvaraju RR, Cogswell M, Das A, Vedantam R, Parikh D, Batra D (2017) Grad-CAM: visual explanations from deep networks via gradient-based localization. In: Proceedings of the IEEE International Conference on Computer Vision, 2017-Octob, pp 618\u2013626. https:\/\/doi.org\/10.1109\/ICCV.2017.74","DOI":"10.1109\/ICCV.2017.74"},{"issue":"1","key":"10429_CR248","doi-asserted-by":"publisher","first-page":"85","DOI":"10.2298\/CSIS1001085S","volume":"7","author":"J Shao","year":"2010","unstructured":"Shao J, Jiang D, Wang M, Chen H, Yao L (2010) Multi-video summarization using complex graph clustering and mining. Comput Sci Inf Syst 7(1):85\u201397. https:\/\/doi.org\/10.2298\/CSIS1001085S","journal-title":"Comput Sci Inf Syst"},{"key":"10429_CR249","doi-asserted-by":"publisher","unstructured":"Shao D, Zhao Y, Dai B, Lin D (2020) FineGym: a hierarchical video dataset for fine-grained action understanding. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 2613\u20132622. https:\/\/doi.org\/10.1109\/CVPR42600.2020.00269","DOI":"10.1109\/CVPR42600.2020.00269"},{"key":"10429_CR250","doi-asserted-by":"crossref","unstructured":"Sharghi A, Laurel JS (2017). Query-focused video summarization\u202f: dataset , evaluation , and a memory network based approach. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 4788\u20134797.","DOI":"10.1109\/CVPR.2017.229"},{"key":"10429_CR251","doi-asserted-by":"crossref","unstructured":"Sharghi A, Gong B, Shah M (2016) Query-focused extractive video summarization. In: European Conference on Computer Vision. Springer, Cham, pp 1\u201318","DOI":"10.1007\/978-3-319-46484-8_1"},{"key":"10429_CR252","doi-asserted-by":"publisher","unstructured":"Shaw P, Uszkoreit J, Vaswani A (2018) Self-attention with relative position representations. In: NAACL HLT 2018\u20132018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies\u2014Proceedings of the Conference, vol. 2, pp 464\u2013468. https:\/\/doi.org\/10.18653\/v1\/n18-2074","DOI":"10.18653\/v1\/n18-2074"},{"issue":"4067","key":"10429_CR253","doi-asserted-by":"publisher","first-page":"143","DOI":"10.1117\/12.386587","volume":"2000","author":"T Shin","year":"2000","unstructured":"Shin T, Kim J, Kim J, An B-H (2000) Statistical approach to shot-boundary detection in an MPEG-2-compressed video sequence. Vis Commun Image Process 2000(4067):143. https:\/\/doi.org\/10.1117\/12.386587","journal-title":"Vis Commun Image Process"},{"issue":"6","key":"10429_CR254","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/2816795.2818123","volume":"34","author":"HV Shin","year":"2015","unstructured":"Shin HV, Berthouzoz F, Li W, Durand F (2015) Visual transcripts. ACM Trans Gr 34(6):1\u201310. https:\/\/doi.org\/10.1145\/2816795.2818123","journal-title":"ACM Trans Gr"},{"issue":"6","key":"10429_CR255","doi-asserted-by":"publisher","first-page":"745","DOI":"10.1007\/s00530-020-00684-3","volume":"26","author":"H Shingrakhia","year":"2020","unstructured":"Shingrakhia H, Patel H (2020) Emperor Penguin optimized event recognition and summarization for cricket highlight generation. Multimed Syst 26(6):745\u2013759. https:\/\/doi.org\/10.1007\/s00530-020-00684-3","journal-title":"Multimed Syst"},{"key":"10429_CR256","doi-asserted-by":"publisher","DOI":"10.1007\/s00371-021-02111-8","author":"H Shingrakhia","year":"2021","unstructured":"Shingrakhia H, Patel H (2021) SGRNN-AM and HRF-DBN: a hybrid machine learning model for cricket video summarization. Vis Comput. https:\/\/doi.org\/10.1007\/s00371-021-02111-8","journal-title":"Vis Comput"},{"issue":"8","key":"10429_CR257","doi-asserted-by":"publisher","first-page":"853","DOI":"10.1109\/TMM.2010.2058795","volume":"12","author":"N Shroff","year":"2010","unstructured":"Shroff N, Turaga P, Chellappa R (2010) Video prcis: highlighting diverse aspects of videos. IEEE Trans Multimed 12(8):853\u2013868. https:\/\/doi.org\/10.1109\/TMM.2010.2058795","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR258","doi-asserted-by":"publisher","unstructured":"Shukla P, Sadana H, Bansal A, Verma D, Elmadjian C, Raman B, Turk M (2018) Automatic cricket highlight generation using event-driven and excitement-based features. In: IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops, 2018-June, pp 1881\u20131889. https:\/\/doi.org\/10.1109\/CVPRW.2018.00233","DOI":"10.1109\/CVPRW.2018.00233"},{"issue":"November 2020","key":"10429_CR259","doi-asserted-by":"publisher","first-page":"102991","DOI":"10.1016\/j.jvcir.2020.102991","volume":"74","author":"A Singh Parihar","year":"2021","unstructured":"Singh Parihar A, Pal J, Sharma I (2021) Multiview video summarization using video partitioning and clustering. J vis Commun Image Represent 74(November 2020):102991. https:\/\/doi.org\/10.1016\/j.jvcir.2020.102991","journal-title":"J vis Commun Image Represent"},{"issue":"4","key":"10429_CR260","doi-asserted-by":"publisher","first-page":"411","DOI":"10.1016\/j.cviu.2009.03.011","volume":"114","author":"AF Smeaton","year":"2010","unstructured":"Smeaton AF, Over P, Doherty AR (2010) Video shot boundary detection: seven years of TRECVid activity. Comput vis Image Underst 114(4):411\u2013418. https:\/\/doi.org\/10.1016\/j.cviu.2009.03.011","journal-title":"Comput vis Image Underst"},{"key":"10429_CR261","doi-asserted-by":"publisher","unstructured":"Song Y, Vallmitjana J, Stent A, Jaimes A (2015) TVSum: summarizing web videos using titles. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 07\u201312-June, pp 5179\u20135187. https:\/\/doi.org\/10.1109\/CVPR.2015.7299154","DOI":"10.1109\/CVPR.2015.7299154"},{"key":"10429_CR262","doi-asserted-by":"publisher","first-page":"66","DOI":"10.1016\/j.neucom.2015.07.131","volume":"187","author":"X Song","year":"2016","unstructured":"Song X, Sun L, Lei J, Tao D, Yuan G, Song M (2016) Event-based large scale surveillance video summarization. Neurocomputing 187:66\u201374. https:\/\/doi.org\/10.1016\/j.neucom.2015.07.131","journal-title":"Neurocomputing"},{"key":"10429_CR263","unstructured":"Soomro K, Zamir AR, Shah M (2012) UCF101: a dataset of 101 human actions classes from videos in the wild. November. http:\/\/arXiv.org\/1212.0402"},{"key":"10429_CR264","unstructured":"Spachos D, Zlatintsi A (2008) MUSCLE movie database: a multimodal corpus with rich annotation for dialogue and saliency detection. In: Programme of the Workshop on Multimodal Corpora, vol. 16. http:\/\/users.uoi.gr\/cs01702\/MargaritaKotti\/MypublicationsPDFs\/Musclemovie.pdf"},{"key":"10429_CR265","doi-asserted-by":"publisher","first-page":"340","DOI":"10.1016\/j.jvcir.2019.06.004","volume":"62","author":"MU Sreeja","year":"2019","unstructured":"Sreeja MU, Kovoor BC (2019) Towards genre-specific frameworks for video summarisation: a survey. J vis Commun Image Represent 62:340\u2013358. https:\/\/doi.org\/10.1016\/j.jvcir.2019.06.004","journal-title":"J vis Commun Image Represent"},{"key":"10429_CR266","doi-asserted-by":"publisher","first-page":"812","DOI":"10.1016\/j.procs.2016.06.065","volume":"89","author":"M Srinivas","year":"2016","unstructured":"Srinivas M, Pai MMM, Pai RM (2016) An improved algorithm for video summarization\u2014a rank based approach. Procedia Procedia Comput Sci 89:812\u2013819. https:\/\/doi.org\/10.1016\/j.procs.2016.06.065","journal-title":"Procedia Procedia Comput Sci"},{"key":"10429_CR267","doi-asserted-by":"publisher","first-page":"113341","DOI":"10.1016\/j.eswa.2020.113341","volume":"149","author":"BN Subudhi","year":"2020","unstructured":"Subudhi BN, Veerakumar T, Esakkirajan S, Chaudhury S (2020) Automatic lecture video skimming using shot categorization and contrast based features. Expert Syst Appl 149:113341. https:\/\/doi.org\/10.1016\/j.eswa.2020.113341","journal-title":"Expert Syst Appl"},{"key":"10429_CR268","unstructured":"Sukhwani, M., & Kothari, R. (2017). A parameterized approach to personalized variable length summarization of soccer matches. 1\u20136. http:\/\/arXiv.org\/1706.09193"},{"key":"10429_CR269","doi-asserted-by":"crossref","unstructured":"Sun K, Zhu J, Lei Z, Hou X, Zhang Q, Duan J, Qiu G, Hou X, Lei Z, Zhang Q, Qiu G (2017) Learning deep semantic attributes for user video summarization. In: IEEE International Conference on Multimedia and Expo (ICME), July","DOI":"10.1109\/ICME.2017.8019411"},{"key":"10429_CR270","doi-asserted-by":"crossref","unstructured":"Sung YL, Hong CY, Hsu YC, Liu TL (2020) Video summarization with anchors and multi-head attention. In: IEEE International Conference on Image Processing (ICIP), pp 2396\u20132400","DOI":"10.1109\/ICIP40778.2020.9191178"},{"key":"10429_CR271","doi-asserted-by":"publisher","first-page":"13691","DOI":"10.1109\/ACCESS.2020.3044759","volume":"9","author":"B Sushma","year":"2021","unstructured":"Sushma B, Aparna P (2021) Summarization of wireless capsule endoscopy video using deep feature matching and motion analysis. IEEE Access 9:13691\u201313703. https:\/\/doi.org\/10.1109\/ACCESS.2020.3044759","journal-title":"IEEE Access"},{"key":"10429_CR272","doi-asserted-by":"publisher","unstructured":"Vajda S, Rothacker L, Fink GA (2011) a camera-based interactive whiteboard reading system. In: 4th International Workshop on Camera-Based Document Analysis and Recognition, June, pp 91\u201396. https:\/\/doi.org\/10.1007\/978-3-642-29364-1","DOI":"10.1007\/978-3-642-29364-1"},{"key":"10429_CR273","doi-asserted-by":"publisher","unstructured":"Tao H, Huang TS (1998) Connected vibrations: a modal analysis approach for non-rigid motion tracking. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp 735\u2013740. https:\/\/doi.org\/10.1109\/CVPR.1998.698685","DOI":"10.1109\/CVPR.1998.698685"},{"key":"10429_CR274","doi-asserted-by":"crossref","unstructured":"Tejero-de-Pablos A, Nakashima Y, Sato T, Yokoya N (2016) Human action recognition-based video summarization for rgb-d personal sports video. In: Proceedings of the IEEE International Conference on Multimedia and Expo.","DOI":"10.1109\/ICME.2016.7552938"},{"issue":"8","key":"10429_CR275","doi-asserted-by":"publisher","first-page":"2000","DOI":"10.1109\/TMM.2018.2794265","volume":"20","author":"A Tejero-de-pablos","year":"2018","unstructured":"Tejero-de-pablos A, Nakashima Y, Sato T, Yokoya N, Linna M, Rahtu E (2018) Summarization of user-generated sports video by using deep action recognition features. IEEE Trans Multimed 20(8):2000\u20132011. https:\/\/doi.org\/10.1109\/TMM.2018.2794265","journal-title":"IEEE Trans Multimed"},{"issue":"9","key":"10429_CR276","doi-asserted-by":"publisher","first-page":"2944","DOI":"10.1109\/TITS.2017.2769719","volume":"19","author":"SS Thomas","year":"2018","unstructured":"Thomas SS, Gupta S, Subramanian VK (2018) Event detection on roads using perceptual video summarization. IEEE Trans Intell Transp Syst 19(9):2944\u20132954. https:\/\/doi.org\/10.1109\/TITS.2017.2769719","journal-title":"IEEE Trans Intell Transp Syst"},{"key":"10429_CR277","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-021-10977-yA","author":"V Tiwari","year":"2021","unstructured":"Tiwari V, Bhatnagar C (2021) A survey of recent work on video summarization: approaches and techniques. Multimed Tools Appl. https:\/\/doi.org\/10.1007\/s11042-021-10977-yA","journal-title":"Multimed Tools Appl"},{"key":"10429_CR278","unstructured":"Trinh H, Li J, Miyazawa S, Moreno J, Pankanti S (2012) Efficient UAV video event summarization. In: Proceedings of the 21st International Conference on Pattern Recognition (ICPR2012) IEEE, pp 2226\u20132229"},{"issue":"1","key":"10429_CR279","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/1198302.1198305","volume":"3","author":"BATU Truong","year":"2007","unstructured":"Truong BATU, Venkatesh S (2007) Video abstraction: a systematic review and classification. ACM Trans Multimed Comput Commun Appl 3(1):1\u201337. https:\/\/doi.org\/10.1145\/1198302.1198305","journal-title":"ACM Trans Multimed Comput Commun Appl"},{"issue":"11","key":"10429_CR280","doi-asserted-by":"publisher","first-page":"1927","DOI":"10.1109\/TCSVT.2013.2269186","volume":"23","author":"CM Tsai","year":"2013","unstructured":"Tsai CM, Kang LW, Lin CW, Lin W (2013) Scene-based movie summarization via role-community networks. IEEE Trans Circuits Syst Video Technol 23(11):1927\u20131940. https:\/\/doi.org\/10.1109\/TCSVT.2013.2269186","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"10429_CR281","doi-asserted-by":"publisher","DOI":"10.1155\/2021\/9566628","author":"CH Tseng","year":"2021","unstructured":"Tseng CH, Hsieh CC, Jwo DJ, Wu JH, Sheu RK, Chen LC (2021) Person retrieval in video surveillance using deep learning-based instance segmentation. J Sens. https:\/\/doi.org\/10.1155\/2021\/9566628","journal-title":"J Sens"},{"key":"10429_CR282","doi-asserted-by":"publisher","unstructured":"Urala Kota B, Davila K, Stone A, Setlur S, Govindaraju V (2018) Automated detection of handwritten whiteboard content in lecture videos for summarization. In: Proceedings of International Conference on Frontiers in Handwriting Recognition, ICFHR, 2018-Augus, pp 19\u201324. https:\/\/doi.org\/10.1109\/ICFHR-2018.2018.00013","DOI":"10.1109\/ICFHR-2018.2018.00013"},{"issue":"3","key":"10429_CR283","doi-asserted-by":"publisher","first-page":"221","DOI":"10.1007\/s10032-019-00327-y","volume":"22","author":"B Urala Kota","year":"2019","unstructured":"Urala Kota B, Davila K, Stone A, Setlur S, Govindaraju V (2019) Generalized framework for summarization of fixed-camera lecture videos by detecting and binarizing handwritten content. Int J Doc Anal Recogn 22(3):221\u2013233. https:\/\/doi.org\/10.1007\/s10032-019-00327-y","journal-title":"Int J Doc Anal Recogn"},{"key":"10429_CR284","doi-asserted-by":"crossref","unstructured":"Vald\u00e9s V, Mart\u00ednez JM (2007) On-line video skimming based on histogram similarity. In: Proceedings of the International Workshop on TRECVID Video Summarization, TVS \u201907, Co-Located with the ACM Multimedia 2007, MM\u201907, pp 94\u201398","DOI":"10.1145\/1290031.1290049"},{"key":"10429_CR285","doi-asserted-by":"publisher","unstructured":"Vald\u00e9s V, Mart\u00ednez JM (2008) Binary tree based on-line video summarization. In: MM\u201908\u2014Proceedings of the 2008 ACM International Conference on Multimedia, with Co-Located Symposium and Workshops, pp 134\u2013138. https:\/\/doi.org\/10.1145\/1463563.1463588","DOI":"10.1145\/1463563.1463588"},{"issue":"3","key":"10429_CR286","doi-asserted-by":"publisher","first-page":"795","DOI":"10.1007\/s11042-011-0774-5","volume":"59","author":"V Vald\u00e9s","year":"2012","unstructured":"Vald\u00e9s V, Mart\u00ednez JM (2012) On-line video abstract generation of multimedia news. Multimed Tools Appl 59(3):795\u2013832. https:\/\/doi.org\/10.1007\/s11042-011-0774-5","journal-title":"Multimed Tools Appl"},{"key":"10429_CR287","doi-asserted-by":"publisher","unstructured":"Varghese EB, Thampi SM (2021) Visual attention based cognitive informative frame extraction method for smart crowd surveillance. In: 2021 IEEE Conference on Norbert Wiener in the 21st Century: Being Human in a Global Village, 21CW 2021. https:\/\/doi.org\/10.1109\/21CW48944.2021.9532519","DOI":"10.1109\/21CW48944.2021.9532519"},{"key":"10429_CR288","doi-asserted-by":"publisher","unstructured":"Vasudevan AB, Gygli M, Volokitin A, Van Gool L (2017) Query-adaptive video summarization via quality-aware relevance estimation. In: MM 2017 - Proceedings of the 2017 ACM Multimedia Conference, pp 582\u2013590. https:\/\/doi.org\/10.1145\/3123266.3123297","DOI":"10.1145\/3123266.3123297"},{"issue":"1-40","key":"10429_CR289","doi-asserted-by":"publisher","first-page":"10","DOI":"10.5244\/c.16.40","volume":"40","author":"J Vermaak","year":"2013","unstructured":"Vermaak J, Perez P, Blake A, Gangnet M (2013) Rapid summarisation and browsing of video sequences. BMVC 40(1\u201340):10. https:\/\/doi.org\/10.5244\/c.16.40","journal-title":"BMVC"},{"key":"10429_CR290","unstructured":"Vezhnevets V, Degtiareva A (2003) Robust and accurate eye contour extraction. In: Proceeding of the Conference {GraphiCon}, pp 81\u201384"},{"issue":"2","key":"10429_CR291","doi-asserted-by":"publisher","first-page":"359","DOI":"10.1007\/s11042-009-0402-9","volume":"50","author":"R Vezzani","year":"2010","unstructured":"Vezzani R, Cucchiara R (2010) Video surveillance online repository (ViSOR): an integrated framework. Multimed Tools Appl 50(2):359\u2013380. https:\/\/doi.org\/10.1007\/s11042-009-0402-9","journal-title":"Multimed Tools Appl"},{"key":"10429_CR292","doi-asserted-by":"publisher","unstructured":"Viguier R, Lin CC, Aliakbarpour H, Bunyak F, Pankanti S, Seetharaman G, Palaniappan K (2015) Automatic video content summarization using geospatial mosaics of aerial imagery. In: Proceedings\u20142015 IEEE International Symposium on Multimedia, ISM 2015, pp 249\u2013253. https:\/\/doi.org\/10.1109\/ISM.2015.124","DOI":"10.1109\/ISM.2015.124"},{"issue":"2\u20133","key":"10429_CR293","doi-asserted-by":"publisher","first-page":"137","DOI":"10.1112\/jlms\/s2-30.3.419","volume":"57","author":"P Viola","year":"2004","unstructured":"Viola P, Jones MJ (2004) Robust real-time face detection PAUL. Int J Comput vis 57(2\u20133):137\u2013154. https:\/\/doi.org\/10.1112\/jlms\/s2-30.3.419","journal-title":"Int J Comput vis"},{"key":"10429_CR294","doi-asserted-by":"crossref","unstructured":"Vivekraj VK, Sen D, Raman B (2019) Video skimming: taxonomy and comprehensive survey. ACM Comput Surv 52(5).","DOI":"10.1145\/3347712"},{"key":"10429_CR295","unstructured":"Vovk V, Nouretdinov I, Gammerman A (2003) Testing exchangeability on-line. In: Proceedings, Twentieth International Conference on Machine Learning, vol. 2, pp 768\u2013775"},{"issue":"1","key":"10429_CR296","doi-asserted-by":"publisher","first-page":"76","DOI":"10.1109\/TMM.2011.2165531","volume":"14","author":"F Wang","year":"2012","unstructured":"Wang F, Ngo CW (2012) Summarizing rushes videos by motion, object, and event understanding. IEEE Trans Multimed 14(1):76\u201387. https:\/\/doi.org\/10.1109\/TMM.2011.2165531","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR297","doi-asserted-by":"publisher","unstructured":"Wang J, Wang Y, Zhang Z (2011) Visual saliency based aerial video summarization by online scene classification. In: Sixth International Conference on Image and Graphics Visual, pp 2\u20137. https:\/\/doi.org\/10.1109\/ICIG.2011.43","DOI":"10.1109\/ICIG.2011.43"},{"issue":"4","key":"10429_CR298","doi-asserted-by":"publisher","first-page":"975","DOI":"10.1109\/TMM.2012.2185041","volume":"14","author":"M Wang","year":"2012","unstructured":"Wang M, Hong R, Li G, Zha ZJ, Yan S, Chua TS (2012) Event driven web video summarization by tag localization and key-shot identification. IEEE Trans Multimed 14(4):975\u2013985. https:\/\/doi.org\/10.1109\/TMM.2012.2185041","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR299","doi-asserted-by":"publisher","unstructured":"Wang L, Fang X, Guo Y, Fu Y (2016) Multi-view metric learning for multi-view video summarization. In: Proceedings\u20142016 International Conference on Cyberworlds, CW 2016, pp 179\u2013182. https:\/\/doi.org\/10.1109\/CW.2016.38","DOI":"10.1109\/CW.2016.38"},{"key":"10429_CR300","doi-asserted-by":"publisher","unstructured":"Wang J, Wang W, Wang Z, Wang L, Feng D, Tan T (2019a) Stacked memory network for video summarization. In: MM 2019a\u2014Proceedings of the 27th ACM International Conference on Multimedia, pp 836\u2013844. https:\/\/doi.org\/10.1145\/3343031.3350992","DOI":"10.1145\/3343031.3350992"},{"key":"10429_CR301","doi-asserted-by":"publisher","first-page":"40","DOI":"10.1145\/3317640.3317658","volume":"1477","author":"L Wang","year":"2019","unstructured":"Wang L, Zhu Y, Pan H (2019b) Unsupervised reinforcement learning for video summarization reward function. ACM Int Conf Proc Ser Part F 1477:40\u201344. https:\/\/doi.org\/10.1145\/3317640.3317658","journal-title":"ACM Int Conf Proc Ser Part F"},{"key":"10429_CR302","doi-asserted-by":"publisher","unstructured":"Wang L, Liu D, Puri R, Metaxas DN (2020a) Learning trailer moments in full-length movies with co-contrastive attention. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 12363 LNCS, pp 300\u2013316. https:\/\/doi.org\/10.1007\/978-3-030-58523-5_18","DOI":"10.1007\/978-3-030-58523-5_18"},{"key":"10429_CR303","doi-asserted-by":"publisher","first-page":"33875","DOI":"10.1007\/s11042-020-08690-3","volume":"79","author":"X Wang","year":"2020","unstructured":"Wang X, Nie X, Liu X, Wang B, Yin Y (2020b) Modality correlation-based video summarization. Multimed Tools Appl 79:33875","journal-title":"Multimed Tools Appl"},{"key":"10429_CR304","doi-asserted-by":"crossref","unstructured":"Wei H, Ni B, Yan Y, Yu H, Yang X (2018) video summarization via semantic attended networks. In: Proceedings of the AAAI Conference on Artificial Intelligence, vol. 32, issue no. 1, pp 216\u2013223","DOI":"10.1609\/aaai.v32i1.11297"},{"issue":"2","key":"10429_CR305","doi-asserted-by":"publisher","first-page":"247","DOI":"10.1007\/s11263-006-0027-7","volume":"75","author":"B Wu","year":"2007","unstructured":"Wu B, Nevatia R (2007) Detection and tracking of multiple, partially occluded humans by Bayesian combination of edgelet based part detectors. Int J Comput vis 75(2):247\u2013266. https:\/\/doi.org\/10.1007\/s11263-006-0027-7","journal-title":"Int J Comput vis"},{"key":"10429_CR306","doi-asserted-by":"publisher","DOI":"10.1007\/s11042-016-3569-x","author":"J Wu","year":"2016","unstructured":"Wu J, Zhong S, Jiang J (2016) A novel clustering method for static video summarization. Multimed Tools Appl. https:\/\/doi.org\/10.1007\/s11042-016-3569-x","journal-title":"Multimed Tools Appl"},{"issue":"22","key":"10429_CR307","doi-asserted-by":"publisher","first-page":"29245","DOI":"10.1007\/s11042-018-5953-1","volume":"77","author":"J Wu","year":"2018","unstructured":"Wu J, Zhong S, Ma Z, Heinen SJ, Jiang J (2018) Foveated convolutional neural networks for video summarization. Multimed Tools Appl 77(22):29245\u201329267. https:\/\/doi.org\/10.1007\/s11042-018-5953-1","journal-title":"Multimed Tools Appl"},{"key":"10429_CR308","doi-asserted-by":"publisher","unstructured":"Wu J, Zhong SH, Liu Y (2019) MVSGCN: a novel graph convolutional network for multi-video summarization. In: MM 2019\u2014Proceedings of the 27th ACM International Conference on Multimedia, pp 827\u2013835. https:\/\/doi.org\/10.1145\/3343031.3350938","DOI":"10.1145\/3343031.3350938"},{"key":"10429_CR309","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2020.107382","author":"J Wu","year":"2020","unstructured":"Wu J, Zhong S, Liu Y (2020) Dynamic graph convolutional network for multi-video summarization. Pattern Recogn. https:\/\/doi.org\/10.1016\/j.patcog.2020.107382","journal-title":"Pattern Recogn"},{"key":"10429_CR310","doi-asserted-by":"crossref","unstructured":"Wu G, Lin J, Silva CT (2022) IntentVizor: towards generic query guided interactive video summarization. https:\/\/arXiv.org\/2109.14834v2","DOI":"10.1109\/CVPR52688.2022.01025"},{"key":"10429_CR311","doi-asserted-by":"publisher","unstructured":"Xiang Y, Alahi A, Savarese S (2015) Learning to track: Online multi-object tracking by decision making. In: Proceedings of the IEEE International Conference on Computer Vision, 2015 Inter, pp 4705\u20134713. https:\/\/doi.org\/10.1109\/ICCV.2015.534","DOI":"10.1109\/ICCV.2015.534"},{"key":"10429_CR312","doi-asserted-by":"publisher","first-page":"5889","DOI":"10.1109\/TIP.2020.2985868","volume":"29","author":"S Xiao","year":"2020","unstructured":"Xiao S, Zhao Z, Zhang Z, Guan Z, Cai D (2020a) Query-biased self-attentive network for query-focused video summarization. IEEE Trans Image Process 29:5889\u20135899","journal-title":"IEEE Trans Image Process"},{"key":"10429_CR313","doi-asserted-by":"publisher","unstructured":"Xiao S, Zhao Z, Zhang Z, Yan X, Yang M (2020b) Convolutional hierarchical attention network for query-focused video summarization. In: AAAI 2020b - 34th AAAI Conference on Artificial Intelligence, pp 12426\u201312433. https:\/\/doi.org\/10.1609\/aaai.v34i07.6929","DOI":"10.1609\/aaai.v34i07.6929"},{"key":"10429_CR314","doi-asserted-by":"publisher","unstructured":"Xu F, Davila K, Setlur S, Govindaraju V (2019) Content extraction from lecture video via speaker action classification based on pose information. In: Proceedings of the International Conference on Document Analysis and Recognition, ICDAR, pp 1047\u20131054. https:\/\/doi.org\/10.1109\/ICDAR.2019.00171","DOI":"10.1109\/ICDAR.2019.00171"},{"key":"10429_CR315","unstructured":"Xu L, Neufeld J, Larson B, Schuurmans D (2005) Maximum margin clustering. Adv Neural Inf Process Syst"},{"key":"10429_CR316","doi-asserted-by":"publisher","unstructured":"Xu J, Mukherjee L, Li Y, Warner J, Rehg JM, Singh V (2015) Gaze-enabled egocentric video summarization via constrained submodular maximization. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 07\u201312-June, pp 2235\u20132244. https:\/\/doi.org\/10.1109\/CVPR.2015.7298836","DOI":"10.1109\/CVPR.2015.7298836"},{"key":"10429_CR317","doi-asserted-by":"publisher","unstructured":"Yadav K, Gandhi A, Biswas A, Shrivastava K, Srivastava S, Deshmukh O (2016) ViZig: anchor points based navigation and summarization in educational videos. In: International Conference on Intelligent User Interfaces, Proceedings IUI, 07\u201310-Marc, pp 407\u2013418. https:\/\/doi.org\/10.1145\/2856767.2856788","DOI":"10.1145\/2856767.2856788"},{"key":"10429_CR318","doi-asserted-by":"crossref","unstructured":"Yal\u0131n\u0131z G, Ikizler-Cinbis N (2019) Unsupervised Video Summarization with Independently Recurrent Neural Networks. In: 27th Signal Processing and Communications Applications Conference (SIU), pp 1\u20134","DOI":"10.1109\/SIU.2019.8806603"},{"issue":"23","key":"10429_CR319","doi-asserted-by":"publisher","first-page":"1","DOI":"10.3390\/s20236941","volume":"20","author":"X Yan","year":"2020","unstructured":"Yan X, Gilani SZ, Feng M, Zhang L, Qin H, Mian A (2020) Self-supervised learning to detect key frames in videos. Sensors (switzerland) 20(23):1\u201318. https:\/\/doi.org\/10.3390\/s20236941","journal-title":"Sensors (switzerland)"},{"key":"10429_CR320","doi-asserted-by":"publisher","unstructured":"Yang H, Wang B, Lin S, Wipf D, Guo M, Guo B (2015) Unsupervised extraction of video highlights via robust recurrent auto-encoders. In: Proceedings of the IEEE International Conference on Computer Vision, 2015 Inter, pp 4633\u20134641. https:\/\/doi.org\/10.1109\/ICCV.2015.526","DOI":"10.1109\/ICCV.2015.526"},{"key":"10429_CR321","doi-asserted-by":"publisher","unstructured":"Yao T, Mei T, Rui Y (2016) Highlight detection with pairwise deep ranking for first-person video summarization. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2016-Decem, pp 982\u2013990. https:\/\/doi.org\/10.1109\/CVPR.2016.112","DOI":"10.1109\/CVPR.2016.112"},{"key":"10429_CR322","first-page":"950","volume":"15","author":"ZY Ye","year":"2003","unstructured":"Ye ZY, Fu W, Zhuang YT (2003) A robust fusion algorithm for shot boundary detection. J Comput Aided Des Comput Gr (In Chinese with English Abstract) 15:950\u2013955","journal-title":"J Comput Aided Des Comput Gr (In Chinese with English Abstract)"},{"key":"10429_CR323","doi-asserted-by":"publisher","unstructured":"Yeh FH, Lee GC, Chen YJ, Liao CH (2014). Robust handwriting extraction and lecture video summarization. In: Proceedings\u20142014 10th International Conference on Intelligent Information Hiding and Multimedia Signal Processing, IIH-MSP 2014, pp 357\u2013360. https:\/\/doi.org\/10.1109\/IIH-MSP.2014.95","DOI":"10.1109\/IIH-MSP.2014.95"},{"key":"10429_CR324","unstructured":"Yeung S, Fathi A, Fei-fei L (2014) VideoSET: video summary evaluation through text. https:\/\/arXiv.org\/1406.5824"},{"key":"10429_CR325","doi-asserted-by":"publisher","DOI":"10.3390\/s21134562","author":"UN Yoon","year":"2021","unstructured":"Yoon UN, Hong MD, Jo GS (2021) Interp-sum: unsupervised video summarization with piecewise linear interpolation. Sensors. https:\/\/doi.org\/10.3390\/s21134562","journal-title":"Sensors"},{"key":"10429_CR326","doi-asserted-by":"publisher","unstructured":"Yuan Y, Meng MQH (2013) Hierarchical key frames extraction for WCE video. In: 2013 IEEE International Conference on Mechatronics and Automation, IEEE ICMA 2013, pp 225\u2013229. https:\/\/doi.org\/10.1109\/ICMA.2013.6617922","DOI":"10.1109\/ICMA.2013.6617922"},{"key":"10429_CR327","doi-asserted-by":"publisher","DOI":"10.1109\/TCSVT.2022.3197819","author":"Y Yuan","year":"2022","unstructured":"Yuan Y, Zhang J (2022) Unsupervised video summarization via deep reinforcement learning with shot-level semantics. IEEE Trans Circuits Syst Video Technol. https:\/\/doi.org\/10.1109\/TCSVT.2022.3197819","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"issue":"2","key":"10429_CR328","doi-asserted-by":"publisher","first-page":"168","DOI":"10.1109\/TCSVT.2006.888023","volume":"17","author":"J Yuan","year":"2007","unstructured":"Yuan J, Wang H, Xiao L, Zheng W, Li J, Lin F, Zhang B (2007) A formal study of shot boundary detection. IEEE Trans Circuits Syst Video Technol 17(2):168\u2013186. https:\/\/doi.org\/10.1109\/TCSVT.2006.888023","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"10429_CR329","doi-asserted-by":"publisher","first-page":"226","DOI":"10.1109\/TCSVT.2017.2771247","volume":"29","author":"Y Yuan","year":"2017","unstructured":"Yuan Y, Mei T, Cui P, Zhu W (2017) Video summarization by learning deep side semantic embedding. IEEE Trans Circuits Syst Video Technol 29:226","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"10429_CR330","doi-asserted-by":"publisher","first-page":"64676","DOI":"10.1109\/ACCESS.2019.2916989","volume":"7","author":"Y Yuan","year":"2019","unstructured":"Yuan Y, Li H, Wang Q (2019) Spatiotemporal modeling for video summarization using convolutional recurrent neural network. IEEE Access 7:64676\u201364685. https:\/\/doi.org\/10.1109\/ACCESS.2019.2916989","journal-title":"IEEE Access"},{"issue":"10","key":"10429_CR331","doi-asserted-by":"publisher","first-page":"2711","DOI":"10.1109\/TMM.2019.2959451","volume":"22","author":"L Yuan","year":"2020","unstructured":"Yuan L, Tay FEH, Li P, Feng J (2020) Unsupervised video summarization with cycle-consistent adversarial LSTM networks. IEEE Trans Multimed 22(10):2711\u20132722. https:\/\/doi.org\/10.1109\/TMM.2019.2959451","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR332","doi-asserted-by":"publisher","unstructured":"Yusoff Y, Christmas W, Kittler J (2000) Video shot cut detection using adaptive thresholding. In: BMVC, November, 37.1\u201337.10. https:\/\/doi.org\/10.5244\/c.14.37","DOI":"10.5244\/c.14.37"},{"key":"10429_CR333","doi-asserted-by":"publisher","unstructured":"Zeng KH, Chen TH, Niebles JC, Sun M (2016b) Title generation for user generated videos. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 9906 LNCS(September), pp. 609\u2013625. https:\/\/doi.org\/10.1007\/978-3-319-46475-6_38","DOI":"10.1007\/978-3-319-46475-6_38"},{"issue":"3","key":"10429_CR334","doi-asserted-by":"publisher","first-page":"418","DOI":"10.1109\/TMM.2016.2520827","volume":"18","author":"Y Zhang","year":"2016","unstructured":"Zhang Y, Zimmermann R (2016) Efficient summarization from multiple georeferenced user-generated videos. IEEE Trans Multimed 18(3):418\u2013431. https:\/\/doi.org\/10.1109\/TMM.2016.2520827","journal-title":"IEEE Trans Multimed"},{"key":"10429_CR335","doi-asserted-by":"publisher","unstructured":"Zhang Y, Wang G, Seo B, Zimmermann R (2012) Multi-video summary and skim generation of sensor-rich videos in geo-space. In: MMSys\u201912\u2014Proceedings of the 3rd Multimedia Systems Conference, pp 53\u201364. https:\/\/doi.org\/10.1145\/2155555.2155565","DOI":"10.1145\/2155555.2155565"},{"key":"10429_CR336","doi-asserted-by":"publisher","unstructured":"Zhang K, Chao WL, Sha F, Grauman K (2016a) Summary transfer: exemplar-based subset selection for video summarization. In: Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2016a-Decem, pp 1059\u20131067. https:\/\/doi.org\/10.1109\/CVPR.2016.120","DOI":"10.1109\/CVPR.2016.120"},{"key":"10429_CR337","doi-asserted-by":"publisher","unstructured":"Zhang K, Chao WL, Sha F, Grauman K (2016b) Video summarization with long short-term memory. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 9911 LNCS. https:\/\/doi.org\/10.1007\/978-3-319-46478-7_47","DOI":"10.1007\/978-3-319-46478-7_47"},{"issue":"11","key":"10429_CR338","doi-asserted-by":"publisher","first-page":"5469","DOI":"10.1109\/TIP.2016.2601493","volume":"25","author":"S Zhang","year":"2016","unstructured":"Zhang S, Zhu Y, Roy-Chowdhury AK (2016c) Context-aware surveillance video summarization. IEEE Trans Image Process 25(11):5469\u20135478. https:\/\/doi.org\/10.1109\/TIP.2016.2601493","journal-title":"IEEE Trans Image Process"},{"key":"10429_CR339","doi-asserted-by":"publisher","unstructured":"Zhang K, Grauman K, Sha F (2018a) Retrospective encoders for video summarization. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 11212 LNCS, pp. 391\u2013408. https:\/\/doi.org\/10.1007\/978-3-030-01237-3_24","DOI":"10.1007\/978-3-030-01237-3_24"},{"key":"10429_CR340","unstructured":"Zhang Y, Kampffmeyer M, Liang X, Tan M, Xing EP (2018b) Query-conditioned three-player adversarial network for video summarization, pp 1\u201313. https:\/\/arXiv.org\/1807.06677v1"},{"key":"10429_CR341","doi-asserted-by":"publisher","first-page":"376","DOI":"10.1016\/j.patrec.2018.07.030","volume":"130","author":"Y Zhang","year":"2018","unstructured":"Zhang Y, Liang X, Zhang D, Tan M, Xing EP (2018c) Unsupervised object-level video summarization with online motion auto-encoder. Pattern Recogn Lett 130:376","journal-title":"Pattern Recogn Lett"},{"key":"10429_CR342","doi-asserted-by":"crossref","unstructured":"Zhang Y, Kampffmeyer M, Liang X, Zhang D, Tan M, Xing EP (2019a) DTR-GAN: dilated temporal relational adversarial network for video summarization. In: Proceedings of the ACM Turing Celebration Conference-China, pp 1\u201312","DOI":"10.1145\/3321408.3322622"},{"issue":"4","key":"10429_CR343","doi-asserted-by":"publisher","first-page":"12","DOI":"10.3390\/app9040750","volume":"9","author":"Y Zhang","year":"2019","unstructured":"Zhang Y, Kampffmeyer M, Zhao X, Tan M (2019b) Deep reinforcement learning for query-conditioned video summarization. Appl Sci (switzerland) 9(4):12\u201315. https:\/\/doi.org\/10.3390\/app9040750","journal-title":"Appl Sci (switzerland)"},{"key":"10429_CR344","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2014.322","author":"B Zhao","year":"2014","unstructured":"Zhao B, Xing EP (2014) Quasi real-time summarization for consumer videos. Proc IEEE Comput Soc Conf Comput vis Pattern Recogn. https:\/\/doi.org\/10.1109\/CVPR.2014.322","journal-title":"Proc IEEE Comput Soc Conf Comput vis Pattern Recogn"},{"key":"10429_CR345","doi-asserted-by":"publisher","unstructured":"Zhao B, Li X, Lu X (2017) Hierarchical recurrent neural network for video summarization. In: MM 2017\u2014Proceedings of the 2017 ACM Multimedia Conference, pp 863\u2013871. https:\/\/doi.org\/10.1145\/3123266.3123328","DOI":"10.1145\/3123266.3123328"},{"key":"10429_CR346","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00773","author":"B Zhao","year":"2018","unstructured":"Zhao B, Li X, Lu X (2018) HSA-RNN: hierarchical structure-adaptive RNN for video summarization. Proc IEEE Comput Soc Conf Comput vis Pattern Recogn. https:\/\/doi.org\/10.1109\/CVPR.2018.00773","journal-title":"Proc IEEE Comput Soc Conf Comput vis Pattern Recogn"},{"key":"10429_CR347","doi-asserted-by":"publisher","first-page":"33417","DOI":"10.1007\/s11042-019-7582-8","volume":"79","author":"Y Zhao","year":"2019","unstructured":"Zhao Y, Guo Y, Sun R, Liu Z, Guo D (2019) Unsupervised video summarization via clustering validity index. Multimed Tools Appl 79:33417","journal-title":"Multimed Tools Appl"},{"issue":"10","key":"10429_CR348","doi-asserted-by":"publisher","first-page":"3989","DOI":"10.1109\/TNNLS.2019.2951680","volume":"31","author":"B Zhao","year":"2020","unstructured":"Zhao B, Li X, Lu X (2020) Property-constrained dual learning for video summarization. IEEE Trans Neural Netw Learn Syst 31(10):3989\u20134000. https:\/\/doi.org\/10.1109\/TNNLS.2019.2951680","journal-title":"IEEE Trans Neural Netw Learn Syst"},{"issue":"c","key":"10429_CR349","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1109\/TPAMI.2021.3072117","volume":"8828","author":"B Zhao","year":"2021","unstructured":"Zhao B, Li H, Lu X, Li X (2021) Reconstructive sequence-graph network for video summarization. IEEE Trans Pattern Anal Mach Intell 8828(c):1\u201310. https:\/\/doi.org\/10.1109\/TPAMI.2021.3072117","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"10429_CR350","doi-asserted-by":"publisher","first-page":"360","DOI":"10.1016\/j.neucom.2021.10.039","volume":"468","author":"B Zhao","year":"2022","unstructured":"Zhao B, Gong M, Li X (2022) Hierarchical multimodal transformer to summarize videos. Neurocomputing 468:360\u2013369. https:\/\/doi.org\/10.1016\/j.neucom.2021.10.039","journal-title":"Neurocomputing"},{"key":"10429_CR351","doi-asserted-by":"publisher","first-page":"224","DOI":"10.1016\/j.neucom.2018.12.040","volume":"332","author":"S Zhong","year":"2019","unstructured":"Zhong S, Wu J, Jiang J (2019) Video summarization via spatio-temporal deep architecture. Neurocomputing 332:224\u2013235. https:\/\/doi.org\/10.1016\/j.neucom.2018.12.040","journal-title":"Neurocomputing"},{"key":"10429_CR352","doi-asserted-by":"publisher","first-page":"663","DOI":"10.1109\/LSP.2021.3066349","volume":"28","author":"R Zhong","year":"2021","unstructured":"Zhong R, Wang R, Zou Y, Hong Z, Hu M (2021) Graph attention networks adjusted Bi-LSTM for video summarization. IEEE Signal Process Lett 28:663\u2013667. https:\/\/doi.org\/10.1109\/LSP.2021.3066349","journal-title":"IEEE Signal Process Lett"},{"issue":"2","key":"10429_CR353","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/3477538","volume":"18","author":"S Zhong","year":"2022","unstructured":"Zhong S, Lin J, Lu J, Science C (2022) Deep semantic and attentive network for unsupervised video summarization. ACM Trans Multimed Comput Commun Appl 18(2):1\u201321","journal-title":"ACM Trans Multimed Comput Commun Appl"},{"key":"10429_CR354","doi-asserted-by":"crossref","unstructured":"Zhou K, Qiao Y, Xiang T (2018) Deep reinforcement learning for unsupervised video summarization with diversity-representativeness reward. In: 32nd AAAI Conference on Artificial Intelligence, AAAI 2018, pp 7582\u20137589","DOI":"10.1609\/aaai.v32i1.12255"},{"key":"10429_CR355","doi-asserted-by":"publisher","first-page":"948","DOI":"10.1109\/TIP.2020.3039886","volume":"30","author":"W Zhu","year":"2021","unstructured":"Zhu W, Lu J, Li J, Zhou J (2021) DSNet: a flexible detect-to-summarize network for video summarization. IEEE Trans Image Process 30:948\u2013962. https:\/\/doi.org\/10.1109\/TIP.2020.3039886","journal-title":"IEEE Trans Image Process"},{"key":"10429_CR356","doi-asserted-by":"publisher","first-page":"3017","DOI":"10.1109\/TIP.2022.3163855","volume":"31","author":"W Zhu","year":"2022","unstructured":"Zhu W, Han Y, Lu J, Member S, Zhou J, Member S (2022a) Relational reasoning over spatial-temporal graphs for video summarization. IEEE Trans Image Process 31:3017\u20133031","journal-title":"IEEE Trans Image Process"},{"key":"10429_CR357","doi-asserted-by":"publisher","first-page":"108312","DOI":"10.1016\/j.patcog.2021.108312","volume":"122","author":"W Zhu","year":"2022","unstructured":"Zhu W, Lu J, Han Y, Zhou J (2022b) Learning multiscale hierarchical attention for video summarization. Pattern Recogn 122:108312. https:\/\/doi.org\/10.1016\/j.patcog.2021.108312","journal-title":"Pattern Recogn"},{"issue":"1","key":"10429_CR358","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1186\/s13640-017-0194-1","volume":"2017","author":"A Zlatintsi","year":"2017","unstructured":"Zlatintsi A, Koutras P, Evangelopoulos G, Malandrakis N, Efthymiou N, Pastra K, Potamianos A, Maragos P (2017) COGNIMUSE: a multimodal video database annotated with saliency, events, semantics and emotion with application to summarization. Eurasip J Image Video Process 2017(1):1\u201324. https:\/\/doi.org\/10.1186\/s13640-017-0194-1","journal-title":"Eurasip J Image Video Process"}],"container-title":["Artificial Intelligence Review"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10462-023-10429-z.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10462-023-10429-z\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10462-023-10429-z.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,8,21]],"date-time":"2023-08-21T08:20:59Z","timestamp":1692606059000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10462-023-10429-z"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2023,3,13]]},"references-count":358,"journal-issue":{"issue":"10","published-print":{"date-parts":[[2023,10]]}},"alternative-id":["10429"],"URL":"https:\/\/doi.org\/10.1007\/s10462-023-10429-z","relation":{},"ISSN":["0269-2821","1573-7462"],"issn-type":[{"value":"0269-2821","type":"print"},{"value":"1573-7462","type":"electronic"}],"subject":[],"published":{"date-parts":[[2023,3,13]]},"assertion":[{"value":"13 March 2023","order":1,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare no competing interests.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Competing interests"}}]}}